Dal "cane volante" di Emma all'umanoide da 5000 dollari che balla ~ Il Diario di Mr Reset

https://gigibeltrame.substack.com/p/dal-cane-volante-di-emma-allumanoide ---------------

Nonostante un caldo asfissiante, la tecnologia non smette di proporre qualcosa di nuovo. Qualcosa però non è andato come il previsto o ipotizzato.

Buona lettura.

Qui la versione podcast automatica della puntata.

Allerta terremoto

Apro con la notizia della settimana, ma vi raffreddo subito.
Alcuni terminali Android hanno anticipato con un messaggio di allerta, l’arrivo del terremoto, salvando certamente più di qualche persona.

Vi raffreddo perché da noi non è attiva la funzione, resta attiva invece quella dello stato su tutti i terminali, quella dei test effettuati qualche tempo fa.

Il problema è il tempo per quanto riguarda i terremoti.

Magari ci saranno accelerazioni, visto che il nostro territorio è ampiamente sismico.

Il fallimento di Emma, l’annunciata AI italiana è un caso da studiare

C’è una seconda notizia interessante e anche in questo caso non propriamente positiva. Il 20 giugno Egomnia, la società romana fondata da Matteo Achilli, ha presentato al pubblico Emma con enfasi e un’ambizione enorme: essere l’AI della sovranità tecnologica italiana, il modello “nato in Italia per gli italiani”. La cosa mi suonava strana fin dall’inizio, un po’ fuori dai “miei radar”, ma poteva starci, mica posso essere su tutto.

Alla fine è durata meno di una settimana prima di finire offline, praticamente non ho nemmeno finito il test completo.

Nel giro di 24 ore Emma-5 era già diventata un caso social, inondata di meme e screenshot imbarazzanti: risposte sbagliate a domande elementari, un cane che vola, un chilo di piume che pesa meno di un chilo di pane, e indicazioni rassicuranti davanti a richieste palesemente pericolose. Oltre 60.000 chat in pochi giorni, poi la sospensione temporanea con un comunicato che parlava di “finalità esplorative e sperimentali”, una precisazione che forse andava fatta molto prima…

Oggettivamente, dopo un po’ di test un po’ più seri della differenza di peso, anche se nella logica Emma faceva acqua da tutte le parti, il modello non era malissimo, scriveva in modo decente, ma non era a livello dei modelli top del mercato, soprattutto perdeva nel confronto con Mistral, quella che si fregia come “l’AI europea” e non è una bella cosa.

Il vero problema di Emma non è tecnico, almeno lo è, a mio avviso, ma non del tutto. Un modello da 550 milioni di parametri con una finestra di contesto di soli 2.048 token è, nel 2026 qualcosa di anacronistico, certamente un test, non un modello da sbandierare ai 4 venti. Ma Achilli l’ha comunicato come se fosse la risposta italiana a GPT, Claude e Mistral, costruendo attorno al progetto una narrazione sproporzionata rispetto alla realtà tecnica, con valutazioni miliardarie dichiarate e partnership che diverse aziende coinvolte non hanno più confermato. Il problema non è che Emma non funzionasse, ma che la credibilità del progetto colasse a picco senza il minimo diritto di replica. Tutti possono sbagliare, ma questo non è solo un errore di valutazione o di comunicazione, è un errore strategico che mina la percezione delle capacità digitali del nostro Paese.

Guardiamo il bicchiere mezzo pieno

La buona notizia è che qualcuno ha provato a fare qualcosa, non è l’unica esperienza, anche al Late Tech Show ne abbiamo parlato. La strada concreta esiste, ed è meno faticosa di quello che sembra vista da lontano.

Il punto di partenza ideale, anche per l’evoluzione di Emma, la 6, sarebbe distillare un modello open source di alto livello già addestrato in multilingua con forte copertura italiana. Pensiamo per esempio all’ottimo Qwen 3 da 7B, forse meglio da 14B di parametri, che parla già molto bene la nostra lingua. A quel punto va addestrato con un dataset di alta qualità in italiano (dati istituzionali, testi giornalistici, documentazione tecnica, conversazioni reali il tutto con una solida validazione e ovviamente accordi di licenza di utilizzo) e a quel punto si esegue il fine tuning, per altro ampiamente spiegato da tanti paper in circolazione. Non servono nemmeno risorse incredibili, io stesso ho realizzato un distillato minimo di Llama per i miei compiti con LLaMA Factory, e posso così assicurare che non sono necessarie infrastrutture di altissimo livello.
Penso che un risultato migliore di Emma sia possibile con uno sforzo limitato, in fondo stanno nascendo un sacco di SML, ossia di small language model che sono specifici per determinati compiti che sono stati creati proprio in questo modo. Ovviamente l’ideale non è un SML, ma un modello che possa anche ragionare, possa avere in input e generare in output contenuto di testo, immagini e suoni.

Conosco almeno 11 tentativi a livello di tesi universitaria che funzionano molto meglio di Emma senza nemmeno aver dichiarato la propria esistenza.

Siamo capaci di fare di meglio, ne sono sicuro, magari anche Egomnia può sorprenderci, anche se d’ora in poi avrà tutti gli occhi puntati addosso.

L’AI è terreno di dominio tecnologico

Anche questa settimana mi trovo a dover parlare di sovranità digitale.

La Casa Bianca ha limitato l’accesso a GPT-5.6, dimostrando che la politica controlla l’AI. Di fatto, Il governo decide chi può utilizzare il modello di intelligenza artificiale americano prima del suo rilascio.

La Casa Bianca ha chiesto a OpenAI di riservare GPT-5.6 ai partner approvati dal governo, uno alla volta e nel frattempo ha riaperto l’uso, molto ristretto, a Mythos di Anthropic.

GPT 5.6 e Claude Mythos: i modelli per pochi eletti e certamente non europei

OpenAI ha rilasciato GPT 5.6, il suo modello più potente in assoluto. La famiglia comprende tre variantii, Soul, Terra e Luna, con una nuova modalità Ultra che coordina più agenti in parallelo per affrontare workflow molto complessi. Su benchmark di ingegneria del software autonomo (Terminal Bench) stabilisce un nuovo stato dell’arte.

Il problema? Non è disponibile al pubblico: solo un gruppo ristretto di partner autorizzati dal governo USA ci ha accesso, almeno per ora.

La battaglia dei processori per l’AI ha nuovi contendenti

OpenAI e Broadcom hanno presentato Jalapeño, il primo processore di intelligenza di OpenAI, progettato per accelerare l’inferenza dei modelli linguistici. Jalapeño è stato realizzato in nove mesi e offre prestazioni per watt migliori rispetto allo stato attuale. “Jalapeño è parte della nostra strategia a lungo termine per rendere più accessibile l’intelligenza artificiale”, ha dichiarato Greg Brockman, presidente di OpenAI. L’obiettivo è rendere l’AI più veloce, affidabile e accessibile a più persone.

Anche IBM punta sui chip … piccolissimi

IBM ha annunciato la prima tecnologia a chip sub-nanometrico, con un nodo a 0,7 nanometri (7 angstrom) e un’architettura 3D chiamata Nano Stack. Su un chip grande come un’unghia si possono ora impacchettare quasi 100 miliardi di transistor, quasi il doppio rispetto ai chip a 2 nanometri del 2021, con guadagni fino al 50% in performance e al 70% in efficienza energetica. La legge di Moore, insomma, non è ancora morta.

Zuckerberg scommette … sulle scommesse

Mark Zuckerberg, amministratore delegato di Meta, ha incaricato un gruppo di lavoro di creare un’app per scommesse sugli eventi futuri, chiamata “Arena”, simile a Polymarket e Kalshi, dove gli utenti potranno accumulare punti anziché scommettere con denaro reale, almeno inizialmente.

Video AI: ByteDance detta ancora legge

ByteDance ha presentato Seedance 2.5, il successore del modello video che ad oggi rimane ancora imbattuto nel settore. La nuova versione porta con sé miglioramenti notevoli: clip fino a 30 secondi, supporto a 50 riferimenti multimodali, editing locale preciso con bounding box, risoluzione fino al 4K e audio nativo integrato. Il lancio ufficiale è atteso per i primi giorni di luglio, quindi tieniti pronta.

ByteDance non si è fermata qui: ha anche annunciato Seed 2.1, un agente AI multimodale orientato alla produttività, capace di analizzare video lunghi, creare slide e generare interfacce web partendo da schizzi, con prestazioni paragonabili a Claude Opus e GPT 5.5 su molti benchmark.

Alibaba aggiorna i video pensando al lip-sync

Alibaba ha invece rilasciato Happy Horse 1.1, un aggiornamento del suo modello video con miglioramenti nel realismo del movimento, nella coerenza dei personaggi e nel lip-sync nativo. Supporta fino a nove immagini di riferimento, formati ultra-wide e diverse lingue. Rispetto a Seedance rimane ancora indietro, ma è un’opzione da tenere d’occhio, anche perché offre crediti gratuiti al momento della registrazione.

Modelli e strumenti open source

Sul fronte open source questa settimana è arrivato Ornith 1.0, una famiglia di modelli specializzati nel coding agentico, ovvero nella capacità di pianificare, usare strumenti, debuggare e lavorare su codebase complesse. Il modello da 397 miliardi di parametri supera DeepSeek V4, che ne ha 1.600 miliardi, su numerosi benchmark, e la versione Q4 da 35B è scaricabile in soli 21 GB, compatibile con GPU di fascia media.

Da segnalare anche Un-0, un generatore di immagini con un’architettura completamente diversa dai modelli di diffusione tradizionali: usa oscillatori accoppiati che si sincronizzano progressivamente per formare un’immagine. Per ora è solo un proof of concept, ma apre la porta a possibili alternative più efficienti alla diffusion. Completamente open source sotto licenza MIT.

Anche Meta ha rilasciato questa settimana AutoData (https://facebookresearch.github.io/RAM/blogs/autodata/), un framework agentivo che automatizza la creazione e il miglioramento di dataset di training per modelli AI: l’agente genera, valuta e si auto-corregge in loop, riducendo drasticamente il lavoro umano nella costruzione dei dati.

Robotica: il robot da 4.900 dollari che balla

Unitree ha presentato il suo robot umanoide più economico, R1, al prezzo di partenza di soli 4.900 dollari. Nonostante sia la versione entry-level rispetto al G1, il robot è capace di mosse acrobatiche complesse, breakdance compresa, con stabilizzazione istantanea dopo ogni salto o rotazione. È un segnale concreto di come i robot fisici stiano diventando accessibili non solo alle grandi aziende.

Per chi lavora nella robotica e nel training di modelli fisici, questa settimana è stato rilasciato anche HIW 500, un dataset open source di oltre 500 ore di teleoperation di robot umanoidi in case reali, con più di 10 terabyte di dati su attività domestiche come aprire il frigo, spazzare, raccogliere oggetti e molto altro. Un contributo enorme per chiunque voglia addestrare modelli robotici nel mondo reale.

Il robot dentista in azione

Quando si è seduti dal dentista non si è mai del tutto sereni, almeno per quanto mi riguarda. Qui un video di un robot dentista, realmente all’opera.

Si sconsiglia la visione a chi è molto sensibile.

Una bella intervista

Ovviamente non sono l’unico a fare belle interviste, ma a parte la battuta (e spero me la concediate), per chiudere vi lascio una bellissima intervista di OpenAI a Pietro Schirano, che avevo conosciuto qualche tempo fa. Davvero interessante.

La puntata di questa settimana del Late Tech Show

Agentic AI & Energia: Francesco Meneghetti (Fabbrica Digitale) ci racconta come sciami di agenti intelligenti stiano rivoluzionando la gestione energetica, affrontando complessità normative e finanziarie con un progetto d'avanguardia tutto italiano.

Le nuove AI Factory: Andrea Faeti (Vertiv) analizza la trasformazione dei data center. Dalla densità di potenza al raffreddamento liquido, vediamo come le infrastrutture passino da semplici "centri dati" a vere e proprie fabbriche di intelligenza, capaci di restituire valore alla comunità (come il calore per il teleriscaldamento).

Bitcoin Hub & talenti: Filippo Farenga ci porta dentro Blox space a Torino, un punto di riferimento per la formazione e la community Bitcoin. Scopriamo perché il talento tecnico è la chiave per costruire nuovi servizi sopra il protocollo e come superare i pregiudizi mainstream.

Qui in versione Youtube con i capitoli.

E gli SmartBreak - Podcast Vita da Ufficio

Ovviamente gli ascolti degli SmartBreak sia live sui miei profili social sia su quelli delle associazioni che lo ripropongono, nonché nel podcast “Vita da Ufficio” non sono minimamente paragonabili a quello del Late Tech Show, ma questa settimana c’è stata una puntata che non solo ha avuto un grande riscontro, ma ha scatenato diverse discussioni.

Se ne avete voglia…

Qui trovate invece i miei libri

Techy e oltre

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro (qui trovi i miei libri, tra cui “Dati & AI” che riscuote sempre successo).

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

Se ti va, contattami a questo link!

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:

Magazine • LinkedIn • Instagram • Facebook • Youtube

Se ti va, iscriviti

Il Diario di Mr Reset

lunedì 29 giugno 2026