Questa settimana il mondo dell’AI ha visto una raffica di annunci che cambiano in modo concreto come costruiamo prodotti, scriviamo codice e integriamo l’intelligenza artificiale nel lavoro di tutti i giorni. Da OpenAI ad Anthropic, da Google a Perplexity, fino agli aggiornamenti su Canva, Davinci Resolve e alle novità nei modelli open source, il tema dominante è chiaro: l’AI sta uscendo dal browser e si sta trasformando in un layer operativo permanente, che vive sul desktop, dentro gli strumenti di sviluppo e persino nei robot che eseguono la nostra to-do list.
Lo stato dell’AI secondo Deloitte
L’intelligenza artificiale (AI) sta accelerando e raggiungendo più persone che mai, con il settore privato che produce oltre il 90% dei modelli di frontiera notevoli nel 2025.
Deloitte ha pubblicato lo stato dell’AI, dicendo che gli Stati Uniti guidano negli investimenti in AI, ma la loro capacità di attirare talenti globali sta calando. L’adozione dell’AI sta diffondendosi a ritmo storico, con i consumatori che derivano valore sostanziale da strumenti spesso accessibili gratuitamente. Tuttavia, la responsabilità dell’AI non sta tenendo il passo con le sue capacità, con incidenti in aumento e un divario tra le capacità tecnologiche e la comprensione etica e sociale.
OpenAI: Codex verso la “super app”
OpenAI ha aggiornato l’app desktop Codex, che di fatto si candida a diventare la super app che unifica chat, immagini, coding e automazione del computer. Nata solo per il Mac per ora (negli USA gli sviluppatori sono prevalentemente Mac), Codex ora può operare in parallelo a quello che stai facendo, vedere lo schermo, cliccare, digitare, usare un browser interno e gestire task ricorrenti, con memoria delle preferenze e capacità di generare immagini via GPT-Image 1.5 direttamente dall’app.
Per l’utente, il salto non è solo di modello, ma di workflow: Codex diventa un IDE/assistente che costruisce, testa e usa le proprie creazioni, mentre tu continui a lavorare in altre app.
Anthropic: Claude Code e il nuovo Opus 4.7
Anthropic ha rilanciato su due fronti: interfaccia e modello.
L’app Claude Code introduce sessioni parallele sugli stessi o diversi repository, con possibilità di “pinnare” thread, editor di file integrato, terminale interno, anteprima HTML/PDF e server locali nel pannello di anteprima. In pratica, ti sposti sempre meno dal contesto dell’app per sviluppare, testare e iterare durante lo sviluppo.
Il nuovo modello Claude Opus 4.7 punta forte sull’agentic coding: sui benchmark SWEBench Pro, Anthropic mostra un salto deciso rispetto a Opus 4.6, posizionandosi tra quest’ultimo e il modello “Mythos preview”, troppo potente per essere rilasciato pubblicamente.
Per i coder il messaggio è esplicito: Opus 4.7 diventa il modello di riferimento per sviluppo software e agenti che lavorano su codice e repository complessi. Per l’utente “generalista”, il cambiamento si percepisce soprattutto in un miglior follow-up delle istruzioni e nella minore necessità di prompt engineering per ottenere ciò che si vuole al primo colpo.
Per capirci, Claude Design usa Opus 4.7, ed è un nuovo prodotto di Anthropic.
Google: Gemini ovunque, Chrome “prompt-first” e TTS avanzato
Google continua a spingere Gemini su più fronti.
App desktop: il Google app per desktop arriva su Windows a livello globale, mentre su Mac è disponibile l’app Gemini for Mac, che replica praticamente tutte le funzioni della versione browser (chat, immagini con Nano Banana, video con Vids/VO, musica, deep research, guided learning) in un’app nativa con cronologia sincronizzata.
Chrome AI Skills: viene introdotta la possibilità di salvare i prompt migliori come “skill” riutilizzabili via comandi slash (/fai questo), trasformando di fatto il browser in una console di comandi AI one-click per task ripetitivi (riassunti, analisi commenti, news review, ecc.), in modo simile a quanto già offre Perplexity Comet che uso da tempo.
Gemini 3.1 Flash TTS: nuovo modello text-to-speech con controlli raffinati sul tono (whisper, panic, laughs, pause) e gestione di dialoghi multi-speaker, disponibile in Vertex AI, Google Vids e AI Studio.
In parallelo, Nano Banana sfrutta meglio la personal intelligence: se collegato a Gmail, Calendar, Drive, Foto, può generare immagini altamente personalizzate a partire dai tuoi dati, anche se l’effetto dipende molto da quanto il tuo account è “ricco” di segnali.
Perplexity “Personal Computer”
Sul fronte “agentic AI”, Perplexity e Canva muovono passi importanti verso flussi sempre più automatizzati.
Perplexity Personal Computer porta il concetto di “computer agentico” sul tuo device: l’agente lavora su Mac mini o altri computer 24/7, orchestrando file locali, iMessage, email, app native e web per completare to-do list complesse in modo continuo e auditabile. L’inferenza resta sul cloud Perplexity, ma l’accesso ai tuoi dati locali rende il sistema molto più operativo, in linea con OpenAI Codex e Claude Co-Work.
Canva AI 2.0 fa un balzo in avanti
Canva AI 2.0 promette una vera piattaforma “prompt to everything”: creazione di campagne social e contenuti complessi a partire da brief in strumenti come Notion o Slack, pianificazione automatica di task (documenti guida, report, presentazioni), apprendimento dello stile visivo dell’utente (es. thumbnail YouTube) e generazione di qualsiasi elemento (grafica, audio, 3D) direttamente in editor, con anche una modalità offline e contenuti didattici mappati ai curricula per la scuola.
Per chi lavora in comunicazione e marketing, è un passo verso un ambiente in cui prompt, design system e automazioni editoriali convergono in un unico strumento.
Modelli open source e modelli specialistici
Accanto ai grandi modelli proprietari, la settimana ha visto nuove uscite interessanti in ambito open source e modelli verticali.
MiniMax Miniax M2.7: modello open source con performance molto elevate su SWEBench Pro (circa 56% nelle metriche di Anthropic), superiori a Opus 4.6 e Gemini sui benchmark di coding, ma con licenza che limita l’uso commerciale.
Qwen 3.6 35B A3B (Alibaba): altro modello open source con buone prestazioni su benchmark di sviluppo, dimensioni (35B parametri) compatibili con deployment su GPU singole di fascia alta, e flessibilità per fine-tuning custom. Il modello gira molto bene, ma le specifiche sono importanti.
GPT-Rosalind (OpenAI): modello di reasoning per life sciences, mirato a biologia, scoperta di medicinali e medicina in generale, con miglioramenti significativi in chimica, genetica, progettazione di esperimenti e uso di strumenti scientifici, accessibile solo a ricercatori autorizzati.
Il quadro che emerge è un ecosistema “a due velocità”: modelli top per usi specialistici, spesso ad accesso ristretto, e una base crescente di modelli open che democratizzano sperimentazione e deployment custom.
Sicurezza a rischio
Sul fronte sicurezza la settimana è stata intensa: un advisory congiunto di FBI, NSA e CISA ha denunciato una nuova ondata di attacchi da parte di attori statali iraniani e russi contro infrastrutture critiche, inclusa la compromissione di migliaia di router domestici per rubare credenziali e token di autenticazione. Parallelamente, analisi su riviste di settore e briefing pubblici parlano apertamente di “nuova era di rischio cyber abilitato dall’AI”, con i mercati finanziari nel mirino.
La parte scomoda è che gli attaccanti stanno usando AI per automatizzare ricognizione, phishing e sfruttamento vulnerabilità più velocemente di quanto molte aziende riescano ad aggiornare le difese. Il pezzo che manca, però, è ancora l’adozione su larga scala di strumenti di “AI difensiva”: modelli che scandagliano codice, configurazioni e traffico in cerca di pattern anomali, invece di limitarsi ai soliti dashboard di allerta.
Immagini, video e strumenti creativi
Sul fronte creativo la settimana è stata altrettanto densa.
Microsoft MAI-Image-2 Efficient: versione più veloce e più economica del modello di generazione immagini di Microsoft, con tempi medi di generazione intorno ai 13–14 secondi e gestione corretta di testi brevi nelle immagini, con l’avvertenza di usare il modello principale MAI-Image-2 per testi lunghi e maggiore dettaglio.
Adobe lancerà il beta pubblico del suo assistente AI Firefly a fine mese, semplificando i flussi di lavoro creativi complessi in un’interfaccia di chat semplice. L’utente digita ciò che desidera e l’AI esegue l’azione dietro le quinte. Secondo Alexandru Costin, vicepresidente di Adobe, “abbiamo coperto l’intero spettro, dalle persone nuove al nostro marchio che possono ottenere risultati complessi semplicemente chiedendo” fino ai professionisti che possono bypassare il lavoro ripetitivo.
Midjourney V8.1: aggiornamento che riporta in auge Midjourney con render nativamente in 2K HD, tre volte più veloce e tre volte più economico rispetto a V8.
Davinci Resolve 21: nuove funzioni AI tra cui “IntelliSearch” (ricerca automatica nei media per oggetti, parole nei dialoghi, volti), che rende più rapido organizzare soprattutto le interviste (me l’ha suggerito la mia video editor), e un “face age transformer” per ringiovanire/invecchiare i soggetti in video tramite AI.
Per chi produce contenuti, questi update significano meno tempo perso nella ricerca dei materiali e più controllo fine su estetica, ritmo e narrativa visiva.
Business e robotica: dal caso Allbirds a Spot “task-doer”
Sul fronte business, la notizia più “da bolla” è il pivot di Allbirds: l’azienda di scarpe ha annunciato di voler diventare “NewBird AI”, smettendo di vendere calzature per dedicarsi all’acquisto e al noleggio di GPU per l’AI. Il titolo, dopo un’IPO da 4 miliardi di dollari nel 2021 e un progressivo tracollo fino alla vendita per 39 milioni, ha reagito con un +600% alla sola notizia del rebranding verso l’AI.
In parallelo, Boston Dynamics ha mostrato un video in cui il robot Spot legge una to-do list da una lavagna (scarpe da sistemare, lattine da riciclare, vestiti da raccogliere, trappole per topi da controllare) e completa in autonomia i vari compiti, fino a “portarsi a spasso” da solo. È un esempio estremamente concreto di come visione, language understanding e controllo motorio si combinino in un agente fisico che esegue istruzioni in casa, quasi come un “OpenAI Codex con le gambe”.
Italia: AI tra industria, formazione e “Physical AI”
Sul fronte italiano, un’analisi di ChannelTech descrive un mercato ICT che entra in fase di maturità: meno hype, più integrazione concreta di AI, cloud ibrido e cybersecurity nei processi delle imprese. Il passaggio chiave è il salto dalla semplice AI generativa alla cosiddetta “Physical AI”, in cui algoritmi, sensori e sistemi fisici lavorano insieme per fabbriche intelligenti, logistica automatizzata e infrastrutture adattive.
In parallelo, Google ha annunciato un programma da 2 milioni di dollari per formare 13 mila studenti universitari italiani sulle competenze AI, stimando un potenziale impatto di circa 160 miliardi di euro sul PIL se il Paese adottasse pienamente queste tecnologie. La parte scomoda: il gap di competenze e la lentezza dei processi di trasformazione rischiano di far perdere una parte importante di questo valore, se imprese e istituzioni non coordinano meglio investimenti e governance.
La maratona robotica cinese
Il backstage della maratona robotica di Pechino, con oltre 70 team in preparazione.
Guarda su Euronews
Autonomia vs. teleoperazione
Morgan Stanley avverte che la maggior parte delle demo di umanoidi è ancora teleoperata, l’autonomia vera rimane il vero ostacolo da superare nel 2026.
Produzione Boston Dynamics Atlas
L’intera produzione 2026 è già esaurita, con i primi lotti destinati a Hyundai e Google DeepMind.
Missione lunare
Vi lascio in bell’articolo sulla missione lunare.
La puntata del Late Tech Show
In questo episodio parliamo di:
Governance e diffusione dell’AI: come le medie e grandi imprese stanno adottando l’IA generativa e quali sono i reali impatti sul business (con Stefano DeNicolai, ITIR Università di Pavia).
Sostenibilità Digitale: il rapporto tra consumatori e microimprese e la necessità di una “sovranità cognitiva” per gestire consapevolmente dati e algoritmi (con Stefano Epifani, Fondazione per la Sostenibilità Digitale).
Soluzioni per l’innovazione: l’importanza delle soft skill, del cloud sovrano e delle piattaforme di IA privata per proteggere i dati sensibili delle aziende (con Marco Salerni, General Manager di S2E).
Un viaggio tra ricerca accademica, istituzioni e consulenza ad alto livello per capire come portare concretamente la digital transformation e la cyber security nel tessuto imprenditoriale italiano.
Anche in versione Youtube con i capitoli.
Lo SmartBreak (e il podcast “Vita da ufficio”)
Non ne sto facendo molti, e anche questa settimana farò parecchia fatica, ci proverò.
Qui trovate invece i miei libri
Techy e oltre
Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro (qui trovi i miei libri, tra cui “Dati & AI” che riscuote sempre successo).
Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.
Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.
Grazie per aver letto questa newsletter, le trovi tutte a questo link.
Se ti va, contattami a questo link!
💁♂️ La Bio
👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube
Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.
Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.
Un blog per parlare di cultura digitale, prodotti, servizi e molto, molto di più.

