Una settimana molto importante per l’AI, quasi assurda!
Qui vi lascio comunque la versione podcast automatica di questa puntata della newsletter.
Invece, in fondo trovate il video di un intervento nel canale di Vincenzo Cosenza con Raffaele Gaito e Piergiorgio Grossi di Credem Banca sul passato, presente e futuro dell’AI, secondo noi.
Vi lascio anche una foto di Andrea Sinopoli al termine dell’evento di Oracle “Data & AI” di qualche giorno fa: sala zeppa dall’inizio alla fine nonostante gli argomenti non fossero agilissimi.
Qualche preoccupazione per il futuro dell’AI
La nuova amministrazione USA propone un approccio radicale all'intelligenza artificiale, accelerando lo sviluppo con la riduzione delle restrizioni. Questo può portare grandi innovazioni, ma anche sollevare questioni non ancora del tutto esplorate.
L'IA non è neutrale, ha sempre le priorità e i bias dei suoi sviluppatori. Senza regole ben definite, c'è il rischio di ignorare l'impatto sociale. La velocità è importante, ma non si può trascurare la sicurezza, un tema nuovo e complesso.
L'adozione dell'IA richiede fiducia, ma l'innovazione a briglie sciolte può portare cadute che minano la percezione pubblica della tecnologia. Il mio è un appello per un equilibrio, per garantire che i benefici dell'innovazione siano bilanciati da una valutazione attenta dei rischi.
Trump ha revocato l'ordine esecutivo di Biden che obbligava le aziende di intelligenza artificiale a condividere i test di sicurezza con il governo USA.
Si parte da qui.
Veniamo alle notizie, un po’ a briglia sciolta.
Il “ragionamento” degli LLM è molto diverso dal nostro cervello
I Large Language Models (LLM) elaborano grandi quantità di testo in parallelo, ma la loro capacità li rende meno simili al cervello umano, che integra le informazioni in modo sequenziale e incrementale. Rendere gli LLM più plausibili dal punto di vista cognitivo non è solo una sfida tecnica, ma una necessità per sviluppare sistemi AI complementari all'intelligenza umana. Un recente studio, pubblicato su Nature Communications, esplora questo tema, dimostrando che il cervello umano integra il contesto linguistico dinamicamente nel tempo, mentre gli LLM lo processano in finestre fisse. Il risultato è che gli LLM prevedono l'attività neurale solo con finestre contestuali brevi, ma un approccio incrementale migliora significativamente le previsioni nelle aree cerebrali di ordine superiore.
Partiamo da Project Stargate
Questo progetto vede la collaborazione tra OpenAI, Oracle e SoftBank, con l'obiettivo di investire 500 miliardi di dollari nei prossimi 4 anni per nuove infrastrutture AI. Questo progetto ha lo scopo di sviluppare nuove medicine, curare il cancro e creare posti di lavoro, oltre a garantire, ma era necessario precisarlo(?), la leadership americana nell'AI. Ci sono preoccupazioni riguardo all'uso militare e di sorveglianza del progetto, ma è importante sottolineare che Microsoft continuerà ad avere accesso alle innovazioni che emergeranno dal progetto. Elon Musk ha espresso scetticismo riguardo al progetto.
Operator di OpenAI per i Computer Using Agents)
OpenAI ha presentato Operato, una nuova piattaforma permette agli utenti di dare istruzioni complesse all'AI, che a sua volta può interagire con interfacce grafiche (GUI) come browser, effettuando azioni come cercare ricette, aggiungere ingredienti al carrello della spesa online o prenotare un tavolo al ristorante. Questa funzione è alimentata da un nuovo modello chiamato CUA (computer using agent) che combina le capacità di visione di GPT-4 con un ragionamento avanzato attraverso l'apprendimento per rinforzo, ossia con il sussidio. Questo operatore è in grado di interagire con le pagine web attraverso degli screenshot dello schermo e svolgere delle azioni come muovere il mouse o scrivere con la tastiera. Al momento è disponibile solo per gli utenti "Pro" di ChatGPT, ma si prevede che verrà estesa agli utenti "Plus". Operator può connettersi direttamente a strumenti come DoorDash, Instacart, Uber Eats, Thumbtack, Uber, Target, Etsy, eBay, Booking.com, Tripadvisor, Hipcamp, Priceline, Reuters, Associated Press, The Atlantic, e molti altri.
Ma la domanda che mi sorge spontanea è: ma come facciamo ad essere sicuri che questo tipo di tecnologie non ci faccia qualche “casino”?
Nel frattempo OpenAI ha annunciato anche il rilascio di 03 mini, che sarà disponibile sia in ChatGPT free che per gli sviluppatori tramite API. Questa mossa sembra essere una risposta all'arrivo di DeepSeek R1, un modello open source cinese che si avvicina alle prestazioni di 01.
OpenAI ha fatto conoscere alcuni miglioramenti a Canvas, la funzionalità di chat di ChatGPT. Ora Canvas funziona anche con il motore di riGenerazione denominato o1, offrendo risposte migliorate e codifica più efficiente. Ciò consente di accedere direttamente al motore. Tutti gli utenti, Pro, Plus, Team, Enterprise ed Edu, potranno sfruttare Canvas, con una anticipata disponibilità per gli utenti Free con presenza del rendering di codici React e HTML che facilita principalmente la funzione di "Projects".
Perplexity Assistant
Perplexity ha lanciato un assistente AI per Android che esegue azioni per conto dell'utente, come cercare ristoranti, fare raccomandazioni di libri, riassumere pagine web e impostare promemoria. La società ha anche lanciato Sonar API, un'API per gli sviluppatori che combina ricerca web in tempo reale con modelli di linguaggio di grandi dimensioni.
Anthropic ha anche aggiunto una nuova funzione che consente agli sviluppatori di citare le fonti quando l'API fornisce informazioni da documenti condivisi.
DeepSeek R1
Questo modello open-source cinese ha prestazioni simili a 01 di OpenAI ed è disponibile su GitHub. È possibile provarlo gratuitamente sul sito DeepSeek.com. Questo modello è in grado di generare codice e risolvere problemi complessi, con un processo di pensiero simile a quello umano. Questo modello potrebbe mettere in discussione il fatto che sia molto difficile fare modelli di questo tipo e gli investitori in Borsa, guardando i dati di questa notte e questa mattina, sono preoccupati. Tutti stanno scommettendo sul successo dell’AI USA che “comanderà il mondo”, ma ci sono progetti che stanno sorprendendo.
Secondo un loro annuncio, l'addestramento del modello è costato circa 5,6 milioni di dollari USA, molto meno di tanti altri modelli che variano da poco più di 100 milioni e 1 miliardo. Capite ora perché chi investe in AI è seriamente preoccupato. Poi bisogna capire se è vero, che è un altro discorso.
Ma a proposito di verità, il problema più grande di DeepSeek è che è vittima della censura cinese. Mercoledì ho dimostrato in un webinar che non racconta i fatti avvenuti in piazza Tienamen, vi lascio il video di Matteo Flora che spiega in modo chiaro e molto meglio di me.
Il modello cinese comunque ragiona molto bene, costa molto poco e batte molti modelli occidentali “tradizionali”.
La battaglia si sta evolvendo.
ByteDance (quella di TikTok), crea app molto interessanti
ByteDance è nell’occhio del ciclone per TikTok negli USA, ma sviluppa molta tecnologia che sta facendo parlare di se.
Da qualche tempo ha preso piede un’ “agente” che si muove all’interno dei siti, un po’ come gli agenti sopra di OpenAI e Perplexity, ed è open source. Si tratta di "UI tars", che è un agente GUI che percepisce gli screenshot dello schermo come input ed esegue interazioni simili a quelle umane come operazioni con mouse e tastiera. Versioni scaricabili per Mac e Windows che stanno riscuotendo molto successo.
Ma ByteDance non finisce qui. Ha lanciato Trae, un ambiente di sviluppo integrato (IDE) basato sull'IA in competizione con strumenti come Visual Studio Code. Trae offre assistenza basata sull'IA e funzionalità avanzate come modalità builder e chat per la scrittura del codice, compatibilità con VS Code e una interfaccia moderna e semplice.
La produzione di video AI ha un nuovo standard
LXT Studio è una piattaforma basata sull'AI che sta rivoluzionando la pre-produzione e lo storyboarding, con funzionalità di motion capture facciale e animazione realistica. Con la funzione di dialogo, i personaggi animati possono parlare con movimenti labiali sincronizzati, offrendo un'esperienza realistica e strumenti di controllo completo sul processo di pre-produzione. LXT Studio offre tempo di calcolo gratuito per completare un intero progetto al mese (1000 secondi di calcolo).
Gemini 2.0 Flash Thinking
Google DeepMind ha presentato un nuovo modello con prestazioni superiori in matematica e scienze, che ottiene risultati migliori grazie a un processo di "pensiero" più lungo dopo il prompt. Questo modello è attualmente in cima alla classifica di Chatbot Arena.
Il modello italiano iGenius cresce
iGenius e NVIDIA hanno reso disponibile Colosseum355B, un modello linguistico da 355 miliardi di parametri capace di lavorare con l'intelligenza artificiale in settori altamente regolamentati. Tale sistema risolve la vera sfida dei settori regolamentati, ovvero l'integrazione di dati sensibili con sistemi centralizzati o aperti. La nuova tecnologia NVIDIA, DGX Cloud, consente alle organizzazioni di creare modelli su larga scala con Continual Pre-Training. Questa notizia importante perchè iGenius è una società italiana senza supporto estero, è stata capace di realizzare prodotti di GenerativeAI e AgenticAI in grado di competere con le Bigtech statunitensi e cinesi.
Internet via satellite in Lombardia
La Lombardia ha avviato la gara per sperimentare la tecnologia satellitare per connessioni a banda ultra-larga. Questo progetto porterebbe a una connessione veloce nelle aree remote, ridurrebbe il divario digitale e aprirà nuove opportunità per imprese e cittadini. La tecnologia satellitare potrebbe essere la soluzione per garantire una connettività uniforme su tutto il territorio. I player coinvolti: Starlink di Elon Musk, in grado di offrire connessione internet satellitare in Italia, ma anche i concorrenti Viasat, Telesat e il progetto Kuiper di Amazon. Vedremo cosa accadrà.
Car sharing italiano a guida autonoma
Brescia è stata scelta come capitale europea del car sharing a guida autonoma grazie a un progetto sperimentale di A2A e del Politecnico di Milano che presenta un kit robo-driver per le automobili. Il progetto, finanziato dal MOST, utilizza una Fiat 500 elettrica per percorrere strade aperte al traffico, analizzando l'interazione tra modelli di guida autonoma e la mobilità urbana.
Capire meglio gli agenti AI
Il report Google '#Agents' esplora la nozione di #agenti nell'intelligenza artificiale generativa, programmi in grado di superare le capacità isolare dei modelli AI generativi, combinando pensiero logico e accesso a risorse esterne per svolgere compiti complessi con autonomia.
La replica della diretta da Vincos
L’avevo annunciato in testa a questa newsletter, qui la potete rivedere integralmente.
La puntata di questa settimana del Late Tech Show
In questa puntata si parla del ruolo cruciale dell'infrastruttura tecnologica nell'era dell'intelligenza artificiale. Interviste Filippo Ligresti di Dell per capire cosa chiedono oggi le imprese e i consumatori anche con l'AI. Con Claudio Bassoli di HPE per p la crescita dei data center e dei High Performance Computing (HPC) e la necessità di sicurezza informatica. Con Anna Barbara di Poli.design si analizza l'influenza dell'AI sul design, l'importanza di combinare intelligenza emotiva e artificiale, e la necessità di formazione continua.
Qui sotto in versione podcast (su Spotify anche video).
SmartBreak
Sono ripartite le live dello SmartBreak alle 11:00, anche se ne sto facendo davvero poche.
I miei libri
LASCIAMI UN MESSAGGIO
Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE
Se non sei ancora iscritto, fallo, mi permetti di comprendere che apprezzi il mio lavoro.
Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.
Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.
Grazie per aver letto questa newsletter, le trovi tutte a questo link.
💁♂️ La Bio
👍 Seguimi su:
Magazine • LinkedIn • Instagram • Facebook • Youtube
Grazie per aver letto Techy di Gigi Beltrame!