Anthropic e il paradosso dell'AI "troppo brava" e DeepSeek e il terremoto dei prezzi ~ Il Diario di Mr Reset

https://gigibeltrame.substack.com/p/anthropic-e-il-paradosso-dellai-troppo ---------------

Ennesima settimana di innovazione molto spinta, con Deepseek che ha preso il sopravvento e preoccupato tante imprese. I modelli Open source di AI stanno iniziando a fare davvero la differenza. Ma prima di immergerci nelle notizie che reputo "da sapere", vi lascio la versione podcast automatica di questa newsletter.

Capire cosa sta succedendo non è facile

Smettiamola di pensare alla tecnologia come a un semplice strumento inerte, un martello che aspetta solo di essere impugnato.

Oggi la tecnologia è un contesto totale che ridisegna i confini tra sicurezza e minaccia, tra stabilità e caos, e se non lo capiamo, siamo fuori dai giochi. Guardare cosa sta succedendo ad Anthropic con il suo nuovo modello, Claude Mythos, aiuta: non era nato per la cybersecurity, era un’intelligenza generale, eppure si è scoperto capace di scovare bug e creare exploit con una facilità disarmante. Ci rendiamo conto del paradosso? Abbiamo creato un medico che, mentre ti diagnostica la malattia, impara istantaneamente come produrre il virus perfetto e il vaccino. È un problema di volumi, di velocità esponenziale: l’AI trova falle più velocemente di quanto noi umani riusciamo a ripararle, lasciando il fianco scoperto ad hacker e avversari. Vi sentite ancora sicuri dietro i vostri firewall?

E non è solo una questione di algoritmi “troppo bravi”, perché il fattore umano resta l’anello debole che scardina ogni difesa.

Mentre Anthropic cercava di capire se Mythos fosse finito nelle mani sbagliate, è emerso che l’accesso non autorizzato è avvenuto tramite un fornitore terzo, un errore umano, un semplice collaboratore. È la prova che possiamo avere la tecnologia più avanzata del pianeta, ma se non adattiamo i nostri processi, se non democratizziamo la cultura della sicurezza, resteremo sempre vulnerabili. Non è l’AI che ci tradisce, siamo noi che non sappiamo ancora gestire la potenza che abbiamo scatenato. È la solita vecchia storia: innovazione vs immobilismo, dove l’immobilismo questa volta rischia di costare carissimo.

I sistemi multi-agente entrano in una nuova era

Un progetto chiamato Recursive Multi-Agent Systems introduce un cambio di paradigma: invece di far comunicare gli agenti AI tramite testo, questi collaborano nello spazio interno, producendo testo soltanto alla fine del processo. Il risultato è una velocità 2,4–4 volte superiore, un utilizzo di token ridotto del 75% e un’accuratezza migliorata di oltre l’8% nei benchmark. Il modello si corregge lavorando si se stesso ad ogni ciclo, comportandosi come un gruppo di esperti che pensa in silenzio prima di parlare.

Nvidia Nemotron 3 Nano Omni

Nvidia ha pubblicato in open source Nemotron 3 Nano Omni, un modello mixture-of-experts da 30 miliardi di parametri totali (solo 3 miliardi attivi durante l’uso) capace di processare simultaneamente video, audio, immagini e testo. Le prestazioni dichiarate includono una capacità 9 volte superiore per il ragionamento video e 7 volte superiore per i task su documenti multipli, rispetto ai modelli precedenti. Gli utenti di OpenClaw sono molto felici.

Claude entra nei software creativi, Moonlake fa lo stesso con Blender

Anthropic ha introdotto i “Claude Connectors”, che permettono all’assistente AI di operare direttamente all’interno di Adobe Creative Cloud, Blender, Autodesk Fusion, Ableton e Canva. Non è un passaggio qualunque, non si tratta di nuove “skill”, è un modo di approcciare le applicazioni in modo differente, sempre per andare sempre più verso un’intelligenza artificiale agentica.

Parallelamente, la startup Moonlake ha sviluppato un agente 3D autonomo che opera dentro Blender come farebbe un umano: clicca, modifica oggetti, aggiusta luci e itera, gestendo anche sequenze lunghe di azioni su scene complesse come corridoi di centri commerciali, capannoni industriali e ambienti outdoor. L’agente è anche in grado di apprendere i flussi di lavoro da un esperto umano per riutilizzarli autonomamente in futuro.

Musk vs Altman

Ha tenuto banco l’apertura di uno dei processi che potrebbe ridisegnare gli scenari dell’intelligenza artificiale. Elon Musk ha testimoniato in tribunale contro OpenAI, accusando il CEO Sam Altman di “aver rubato una charity” (che noi chiameremmo Onlus, ndr) e chiedendo 130 miliardi di dollari di danni. Musk, che è stato co-fondatore originale di OpenAI, accusa Sam Altman e Greg Brockman di aver tradito la missione no-profit originale per inseguire i profitti, e chiede inoltra la loro rimozione nonché la fine dello status di Public Benefit Corporation.

Musk afferma che “se un verdetto permettesse di saccheggiare una charity, l’intera base delle donazioni caritatevoli in America sarà danneggiata”. L’avvocato di OpenAI sostiene che Musk ha intrapreso la causa perché “non ha ottenuto ciò che voleva”.

Dalla testimonianza in aula emerge però un quadro poco favorevole a Musk: secondo i cronisti presenti, si è rifiutato ripetutamente di rispondere con sì o no, ha litigato con gli avvocati e ha dimostrato scarsa credibilità davanti alla giuria.

Anthropic: il caso del billing e le pratiche commerciali opache

Molti utenti hanno scoperto che Claude Code addebita costi extra o blocca le richieste se nel codice compaiono parole come “Hermes” o “OpenClaw”, due seri concorrenti. Un utente abbonato al piano Claude Max da $200 al mese si è visto addebitare quasi $201 in costi extra pur avendo l’86% del piano ancora inutilizzato; Anthropic, dopo che il caso ha raggiunto 1,4 milioni di visualizzazioni su X, ha fatto marcia indietro, offrendo rimborso e un mese di credito aggiuntivo. Il caso solleva interrogativi più ampi sulla coerenza tra l’immagine pubblica di Anthropic come “AI etica” e pratiche di sorveglianza del codice degli utenti.

Google firma con il Pentagono

Google ha firmato un accordo con il Pentagono per l’utilizzo dei propri modelli AI su informazioni classificate, con un contratto che autorizza “qualsiasi scopo governativo legale” senza vincoli espliciti su sorveglianza o armamenti autonomi. Oltre 600 dipendenti di Google avevano firmato una lettera aperta al CEO Sundar Pichai per opporsi a questa decisione, richiamando anche l’accordo originale con DeepMind del 2014 che vietava esplicitamente usi militari e di sorveglianza.

Meta e Manus: accordo più complicato

La Cina ha bloccato l’acquisto di Manus da parte di Meta, valutato 2 miliardi di dollari, a causa di critiche sulla possibile fuga di tecnologie AI verso gli Stati Uniti. Questa decisione mostra una posizione più dura sugli investimenti esteri in aziende strategiche di intelligenza artificiale, alimentando ulteriormente la rivalità tecnologica tra Stati Uniti e Cina. Come affermato da Michael Kratsios, consigliere scientifico della Casa Bianca, le aziende cinesi conducono “campagne di distillazione su larga scala” per copiare i modelli di intelligenza artificiale americani, definita una pratica sistematica per destabilizzare la ricerca e lo sviluppo statunitensi.

DeepSeek V4: open source quasi al vertice

Sempre per restare in tema di Cina, DeepSeek ha rilasciato V4, modello open weight con context window da 1 milione di token e prestazioni vicinissime ai migliori modelli closed source come Claude Opus 4.7 e GPT 5.5. Il prezzo è però ciò che fa più scalpore: $1,74 per milione di token in input e $3,48 in output, contro i $5 di Claude Opus 4.7 e i $5 di GPT 5.5. Ogni volta che DeepSeek pubblica un nuovo modello, i mercati azionari reagiscono, perché dimostra che è possibile ottenere risultati di livello quasi di frontiera spendendo molto meno e, per le aziende, con la possibilità di farlo girare localmente su infrastrutture proprie, garantendo sicurezza e privacy.

Grok 4.3 e Mistral Medium 3.5: nuovi modelli, risultati mediocri

xAI ha rilasciato Grok 4.3 beta con capacità agentiche migliorate, può usare un computer sandbox, lavorare con PowerPoint, PDF e fogli di calcolo, ma i benchmark indipendenti lo collocano sotto i principali modelli open source come Qwen e Kimi K 2.6.

Mistral Medium 3.5, il nuovo modello europeo da 128 miliardi di parametri, mostra risultati eccellenti nei benchmark selezionati dall’azienda ma crolla nella classifica indipendente di Artificial Analysis, risultando significativamente inferiore a DeepSeek V4 e agli altri leader open source, con un prezzo API superiore ai competitor.

Al tempo stesso, però, Mistral ha presentato Mistral Medium 3.5, che introduce agenti di codifica remota in Vibe, con la possibilità di eseguire sessioni in cloud e di avviare task di codifica direttamente da Le Chat. Il nuovo modello è ottimizzato per lavori di lunga durata e può essere eseguito su quattro GPU. È stato rilasciato con una licenza MIT modificata. La modalità “Work” di Le Chat estende queste funzionalità con un agente potente per compiti complessi.

Google, ElevenLabs e Spotify: le novità per consumatori

Gemini ora genera direttamente file in formato PDF, DOCX, XLSX, CSV e Markdown, consentendo di passare da una brainstorming session a un documento completo senza uscire dall’app.

Google Photos lancia una funzione di AI try-on che, analizzando le foto dell’utente, riconosce i capi già posseduti e propone nuovi abbinamenti; arriverà su Android in estate e poi su iOS, ma non è detto che sia utilizzabile in Europa.

ElevenLabs ha lanciato ElevenMusic, una piattaforma per scoprire, remixare e creare musica con l’AI, mentre Spotify introduce il badge “Verified by Spotify” (un segno di spunta verde) per attestare che un artista è una persona reale e non un profilo AI.

Robot umanoidi: demo sempre più impressionanti

Sul fronte della robotica, tre aziende hanno pubblicato dimostrazioni di rilievo. Kinetics AI ha presentato KAI, un robot umanoide con 115 gradi di libertà totali e 36 dedicati alle sole mani, dotato di pelle tattile sull’intero corpo per regolare la forza di presa e reagire al contatto umano.

Robot Era ha mostrato decine di robot L7 al lavoro in un centro logistico per lo smistamento di pacchi, con piani per scalare la flotta a mille unità.

Noitix Robotics e TFBot hanno invece presentato teste robotiche ultra-realistiche con espressioni facciali fluide, microespressioni e pelle sintetica, destinate a interazione sociale, customer service e, nel caso di Ella di TFBot, esplicitamente al mercato della “robot companion”.

E Japan Airlines sposta i bagagli con gli umanoidi

A maggio, la Japan Airlines lancerà un progetto pilota all’aeroporto di Tokyo, utilizzando due robot umanoidi cinesi per spostare i bagagli dei passeggeri.

Le miglia delle Tesla in guida autonoma

Potete andare a questo link per verificare quante miglia sono state percorse dalle Tesla in guida autonoma. Ci sarà da fidarsi?

La puntata della settimana del Late Tech Show

In questa puntata del Late Tech Show, esploriamo le frontiere del digitale tra innovazione, sicurezza e nuove opportunità di business.

Partiamo dall'e-commerce con un'anteprima sul Netcomm Forum insieme a Roberto Liscia, analizzando l'impatto dell'intelligenza artificiale sulle abitudini d'acquisto degli italiani.
Approfondiamo poi il fenomeno TikTok Shop: quali sono le reali opportunità per i brand italiani e come i creator possono scalare la propria presenza a livello internazionale? Ne parliamo con i protagonisti del settore e attraverso il caso studio di Fratelli Guzzini.
Poi passiamo a un tema culturale, tra formazione e trasformazione digitale con DKTS, per capire come le aziende stanno affrontando il tema dell'intelligenza artificiale
Infine, un focus sulla cultura digitale e sulla cyber security. Scopriamo come la formazione e la ricerca siano il vero motore del cambiamento aziendale e conosciamo Lecs, una PMI innovativa italiana che sta rivoluzionando la protezione delle reti aziendali con soluzioni NDR all'avanguardia.

Qui su Youtube con i capitoli.

Lo SmartBreak (e il podcast “Vita da ufficio”)

Qui l’ultimo disponibile in formato podcast. Provo a farli #live alle 11 sui miei profili social o in quelli di alcune associazioni manageriali, ma con scarsa assiduità…

Qui trovate invece i miei libri

Techy e oltre

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro (qui trovi i miei libri, tra cui “Dati & AI” che riscuote sempre successo).

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

Se ti va, contattami a questo link!

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:

Magazine • LinkedIn • Instagram • Facebook • Youtube

Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

E se ti va, condividilo con chi vuoi tu!

Il Diario di Mr Reset

lunedì 4 maggio 2026