martedì 9 giugno 2026

La trappola dei token, la riscossa di Microsoft e l'AI che si riscrive da sola

https://gigibeltrame.substack.com/p/la-trappola-dei-token-la-riscossa ---------------

Anche la settimana appena terminata è stata ricca di annunci, quella attuale partirà col botto partendo da Apple. Insomma, c’è sempre tanto da raccontare.

Qui trovate la versione podcast automatica.

Il costo dei token non è da sottovalutare se si usano gli agenti

Chi mi ha visto mercoledì scorso sa che sto puntando molto nel raccontare alle aziende che bisogna fare molta attenzione a valutare il costo dei token, per altro crescente, e il vantaggio competitivo o di risparmio dei costi.

L’arrivo degli agenti tende a nascondere i costi reali e se per anni si è parlato di TCO e ROI, sembra che tanti si siano dimenticati di questi elementi.

I costi e i vantaggi sono gli unici elementi da considerare per capire se il cambiamento è sostenibile.

Altrimenti basta quello che si ha a disposizione potenziato dall’intelligenza artificiale “standard” degli LLM per ottenere velocità.

Gli agenti funzionano bene per soluzioni standard, per qualcosa di più complesso è molto più difficile che siano efficaci e lo sforzo per rendenderli tali è decisamente enorme.

Tempi duri per i programmatori

Anthropic ha pubblicato un articolo intitolato “When AI builds itself”, in cui afferma che più dell’80% del codice del proprio sistema è stato scritto da Claude, un modello di intelligenza artificiale. Ciò significa che il lavoro di sviluppo dell’AI è in gran parte automatizzato e che i sistemi stanno facendo gran parte del lavoro per costruire i prossimi sistemi. La destinazione di questa tendenza è chiamata miglioramento autosufficiente ricorsivo, ovvero un futuro in cui un sistema di AI possa progettare, addestrare e perfezionare il proprio successore in modo autonomo e con miglioramenti continui.

Il passaporto nel wallet di Google

L’Italia accoglierà l’ID Pass di Google Wallet, una versione digitale dell’identità basata sul passaporto, entro l’estate 2026. Gli utenti potranno conservarla sullo smartphone dopo una procedura di riconoscimento, permettendo di dimostrare requisiti specifici senza condividere dati sensibili.

Il piano MAI di Microsoft: modelli propri per sganciarsi dai partner

Questa settimana Microsoft ha finalmente mostrato in modo chiaro la sua strategia sull’intelligenza artificiale, mettendo sul tavolo una famiglia di nuovi modelli, agenti personali sempre attivi e un forte spostamento verso l’elaborazione locale su dispositivi Windows.

Dal palco di Build, Microsoft ha presentato sette nuovi modelli sviluppati internamente dal team Microsoft AI, segnando un passo deciso verso la riduzione della dipendenza da fornitori esterni come OpenAI. Al centro dell’annuncio c’è un nuovo modello “thinking”, il flagship per ragionamento, che secondo i benchmark interni è preferito rispetto a Claude Sonnet 4.6, pur non raggiungendo ancora il livello dei modelli più avanzati come Opus 4.8.

Accanto al modello di ragionamento, Microsoft ha introdotto MAI Code One Flash, un modello di coding paragonato a Claude Haiku 4.5, con maggiore accuratezza e un uso di token sensibilmente più efficiente. Sul fronte generazione immagini, MAI Image 2.5 era inizialmente il terzo miglior modello text‑to‑image, ora sceso al quarto posto, ma rimane al secondo posto globale per l’editing di immagini, subito dietro GPT Image 2. L’offerta si completa con MAI Transcribe 1.5, presentato come il miglior modello di trascrizione oggi disponibile per accuratezza e velocità, cinque volte più rapido della concorrenza, e MAI Voice 2, un modello di speech generation multilingua che supporta 15 lingue e avrà anche una versione “flash” più leggera.

L’idea di Microsoft è proporre modelli più puliti (a partire dal training senza usare sistemi di provenienza ignota (per usare un eufemismo), trasparenti e legalmente solidi per convincere sviluppatori e aziende a costruire sopra la piattaforma Microsoft.

Scout: l’agente sempre attivo dentro Windows e nell’ecosistema 365

Ma c’è un’altra notizia da tenere d’occhio nella strategia di Microsoft: l’ingresso deciso nel mondo degli agenti, con Microsoft Scout, definito come “always‑on personal agent”. Scout fa parte di una nuova categoria di agenti che è definita come “autopilot”: entità autonome con identità propria, autorizzate ad agire al posto dell’utente, connessi trasversalmente al cloud, al desktop e al web.

Tecnicamente, Scout è costruito sulla tecnologia open source di OpenClaw, ma con una differenza decisiva: l’integrazione profonda nello stack Microsoft, fino al livello del sistema operativo. L’agente può muoversi dentro Windows, gestire app e finestre, e accedere a Teams, Outlook, OneDrive, SharePoint, email, calendario e contatti, orchestrando attività che spaziano dall’organizzazione del lavoro al tracciamento di task di lungo periodo.

Ci sono stati tanti altri annunci, come GitHub Copilot App, un ambiente desktop “agent‑native” che ricorda da vicino CodeX di OpenAI, ma con una differenza sostanziale: la possibilità di scegliere il modello da qualsiasi provider. E Project Solara, una piattaforma per portare agenti AI dentro dispositivi fisici. L’azienda ha mostrato due device di riferimento: un piccolo dispositivo da scrivania che ricorda un’assistente vocale alla Alexa, pensato per interagire con l’agente e visualizzare informazioni come calendario e attività, e un badge con camera e microfono da portare al collo, simile a un badge aziendale evoluto.

Microsoft continua sul Quantum Computing

Sul versante quantistico, Microsoft ha comunicato progressi significativi nello sviluppo di chip per qubit più affidabili, grazie all’uso esteso di sistemi AI interni per orchestrare workflow, automatizzare misure, individuare difetti difficili da rilevare e suggerire nuove soluzioni di design. Il nuovo stack di materiali risulterebbe mille volte più affidabile rispetto alla generazione precedente di qubit, affrontando uno dei limiti principali nell’evoluzione dei computer quantistici: l’estrema fragilità degli stati quantistici. Con questi avanzamenti, Microsoft ora stima di poter arrivare a un computer quantistico scalabile già nel 2029, dimezzando di fatto le previsioni temporali precedenti e rafforzando l’idea che l’AI stia accelerando non solo il software, ma anche la ricerca hardware più avanzata.

Nvidia si lancia nei computer

NVIDIA ha annunciato RTX Spark al COMPUTEX 2026, un superchip che integra CPU e GPU per far girare AI Agents sul laptop senza cloud, con una potenza di 1 petaflop, sufficiente per modelli da 120 miliardi di parametri. Ciò riduce preoccupazioni legate a GDPR e data residency, e offre un costo fisso, senza dipendenza da API esterne. I laptop con RTX Spark arriveranno in autunno 2026 e rappresenteranno un cambio di passo significativo per la produttività personale, potendo utilizzare l’AI in piena privacy dentro i computer.

Gemma 4 12B: l’AI pensata per girare in locale

Per continuare il discorso sull’AI pensata per girare in locale, Google ha allargato la famiglia Gemma con Gemma 4 12B, un modello multimodale “encoder‑free” che accetta testo, immagini e ora anche audio, eliminando i classici encoder separati per le modalità non testuali. Visione e audio entrano direttamente nel modello principale, con un’architettura progettata per efficienza e capacità agentiche su hardware relativamente modesto: il modello può girare offline con 16 GB di VRAM o memoria unificata ed è rilasciato sotto licenza Apache 2, quindi adatto anche a scenari commerciali. Nei benchmark, Gemma 4 12B si avvicina al fratello maggiore da 24B parametri in compiti di conoscenza generale, ragionamento agentico e analisi di immagini, offrendo un buon compromesso tra potenza e portabilità.

AI video che cambia tutto (dai creatori di Tiktok)

ByteDance ha rilasciato Bernini, un modello video “unificato” che lavora con testo, immagini e clip come elementi di base e permette di modificare video esistenti in modo estremamente controllabile. Partendo da una singola clip puoi aggiungere o rimuovere soggetti, cambiare stagione o atmosfera, manipolare la profondità di campo, sostituire lo sfondo o trasformare il girato in uno stile illustrato coerente. Bernini brilla soprattutto quando gli fornisci molte immagini di riferimento: può fondere più asset visivi in un unico output coerente, oppure generare un’orbita video attorno a una scena a partire da foto scattate da diverse angolazioni.

Musica: l’AI diventa strumento vivo

Google ha presentato Magenta Realtime 2, un generatore musicale pensato non come semplice “prompt to song”, ma come vero strumento da suonare in tempo reale. Il modello risponde in circa 200 millisecondi a input MIDI, audio o testuali, rimanendo sincronizzato con quanto suonato da tastiere o altri controlli, e può girare su un normale computer senza GPU. Il salto dalla generazione offline al plugin utilizzabile in DAW apre scenari in cui l’AI diventa un “coproduttore” musicale reattivo, invece di un servizio batch esterno al flusso creativo.

ChatGPT che “sogna” per avere memoria

OpenAI sta introducendo in ChatGPT una nuova modalità di gestione della memoria chiamata “dreaming”. L’idea è superare il concetto di lista di memorie statiche per costruire in background una sintesi dinamica delle informazioni rilevanti, aggiornata nel tempo. In pratica, il sistema diventa più bravo a mantenere allineate preferenze, obiettivi e contesto dell’utente, riducendo errori dovuti a memorie “stantie” (per esempio, continuare a suggerire ristoranti a Singapore quando l’utente è già rientrato a casa) e migliorando accuratezza, factual recall e coerenza lungo interazioni prolungate.

Un fondo pubblico dai guadagni delle big tech AI

Bernie Sanders ha proposto un disegno di legge per creare un fondo sovrano americano per l’intelligenza artificiale, che prevede di dirottare metà del patrimonio azionario delle principali aziende di intelligenza artificiale in un fondo pubblico, condividendo i guadagni con gli americani. Sanders afferma che “l’AI si sta costruendo su una risorsa pubblica molto più preziosa del petrolio: la conoscenza, la creatività e il lavoro accumulati dell’umanità”.

Gli accordi internazionali sull’AI si moltiplicano

Stati Uniti e Giappone hanno ampliato l’accordo di collaborazione sull’AI, includendo accesso ai calcoli e strategia industriale. Regno Unito e Canada hanno siglato un accordo separato sull’AI, considerando l’accesso alle infrastrutture come un fattore di competitività nazionale, simile alla fornitura di energia. “Compute è il nuovo petrolio, e i governi stanno agendo di conseguenza”.

Martin Scorsese sfrutta l’AI per i film

Martin Scorsese utilizza tecnologie come il 3D e il de-aging per migliorare la narrazione cinematografica. La sua collaborazione con Flux gli consente di condividere le sue idee con il team in modo più chiaro e efficiente, riducendo i tempi di produzione senza sacrificare la qualità. Secondo Scorsese, “il cinema è un mezzo giovane, quindi dobbiamo essere aperti alla sua evoluzione”.

Robot umanoidi e modelli per il mondo fisico

Nel mondo della robotica, Deep Robotics ha mostrato nuove demo del suo umanoide DR02, pensato per ambienti industriali e condizioni meteo difficili. Il robot combina forza bruta (sprint, salti, flip) con fine controllo motorio, riuscendo a gestire compiti delicati come azionare interruttori senza danneggiarli, oltre a muoversi su terreni complessi come colline, scalinate e strutture non strutturate. Il posizionamento punta agli scenari “all‑weather” e alle operazioni outdoor dove serve un mix di mobilità, robustezza e precisione.

La guida autonoma secondo Nvidia

Per abilitare robot e veicoli autonomi, NVIDIA ha introdotto Cosmos 3, un foundation model per “physical AI” che integra testo, immagini, video, audio e azioni in un’unica rappresentazione. Il modello può generare video realistici per simulare scenari di guida, creare scene complesse per training di robot manipulatori o editare sequenze video modificando condizioni meteo, oggetti sulla scena o traiettorie. Cosmos 3 viene rilasciato come progetto open, con modelli, script di training, strumenti di deployment e dataset di interazioni fisiche e scenari di guida, in versioni “super” di grandi dimensioni e “nano” più compatte ma comunque pesanti (circa 35 GB per il solo transformer della versione nano).

A completare il quadro simulativo per la guida autonoma arriva OmniDreams, sempre da NVIDIA, che genera video di guida multi‑camera fotorealistici reattivi alle azioni del veicolo. Il sistema accetta frame iniziali, prompt testuali, informazioni di mappa e traiettorie desiderate, producendo sequenze di guida coerenti nei diversi punti di vista e in condizioni anche estreme, come maltempo o oggetti insoliti sulla carreggiata. Con la possibilità di aggiungere o rimuovere elementi (jaywalker, ostacoli, cambi di colore dei veicoli), OmniDreams si presenta come strumento per colmare il gap di dati reali ad alta variabilità che oggi limita l’addestramento dei sistemi di guida autonoma.

BMW punta sugli umanoidi per la produzione

La BMW utilizzerà per la prima volta robot umanoidi nella produzione di auto in Europa, a partire dall’estate. I due robot, chiamati Aeon e creati da Hexagon Robotics, saranno impiegati per alimentare utensili di produzione e per compiti di raccolta e posizionamento di pezzi. Secondo Michael Nikolaides, head of process management e digitalizzazione della BMW, “questo sarà il futuro della produzione automobilistica”. I robot umanoidi possono lavorare per tre ore prima di dover sostituire la batteria, che può essere fatto in circa tre minuti. La loro introduzione potrebbe aiutare a risolvere la carenza di manodopera e a ridurre i compiti ripetitivi e faticosi per gli esseri umani.

La Cina contro gli influencer ricchi

La Cina ha lanciato una campagna contro gli influencer che esibiscono ricchezza estrema online, mirando a conti che mostrano auto di lusso, ville, abiti firmati, gioielli costosi e jet privati. Come dice il governo, il fine è “creare una cultura online più sana” e fermare la glorificazione del materialismo. Wang Hongquanxing, noto come “la Kim Kardashian cinese”, è stato uno degli influencer più famosi coinvolti, noto per le sue esibizioni di lusso che gli hanno fatto guadagnare milioni di follower, ora il suo account è inaccessibile.

La puntata del Late Tech Show

In questa puntata:
OSINT e Intelligenza Artificiale: Insieme a Gianluigi Bonanomi e Gianluca Boccacci, autori del libro "Il nuovo petrolio online", scopriamo come utilizzare i dati pubblici per generare conoscenza e il ruolo fondamentale dell'ethical hacking oggi.
Strategie Cloud e Modernizzazione: Giovanni Carraro di Kyndryl ci spiega l'importanza delle alleanze strategiche e come liberare i dati "intrappolati" nei sistemi legacy.
Piattaforme e Sovranità dei Dati: Con Albert Zammar di Nutanix, approfondiamo il concetto di piattaforma ibrida, la gestione dei carichi di lavoro e la crescente importanza del cloud sovrano.
Networking Professionale: Andrea Failli di BizzyNow racconta come un'app può trasformare un momento solitario (come una cena in trasferta) in un'opportunità di business grazie al matching intelligente.
Tecnologia e Inclusione: Ernesto Di Iorio di (Vection Technologies) presenta un incredibile avatar capace di dialogare nella Lingua dei Segni (LIS), rendendo servizi come trasporti e sanità finalmente accessibili a tutti.

Oppure su Youtube con i capitoli.

Lo SmartBreak (e il podcast “Vita da ufficio”)

Qui l’ultimo disponibile in formato podcast. Provo a farli #live alle 11 sui miei profili social o in quelli di alcune associazioni manageriali, ma con scarsa assiduità…

Qui trovate invece i miei libri

Techy e oltre

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro (qui trovi i miei libri, tra cui “Dati & AI” che riscuote sempre successo).

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

Se ti va, contattami a questo link!

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:

Magazine LinkedInInstagram FacebookYoutube

Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

Condividi

Se ti va, iscriviti gratuitamente!

Share: