lunedì 25 agosto 2025

Robot e gravidanze(!), AI in Excel, da foto a videogame...

Non so voi, ma anche questa settimana è stata un vero e proprio ottovolante di notizie dal mondo dell'AI e della robotica, ma in qualsiasi caso, non riesco ad abituarmi. Ogni giorno sembra di leggere qualcosa che sposta i confini del possibile, dal bizzarro al rivoluzionario.

Ci sarebbe davvero tanto di cui parlare: “robot” che promettono di portare a termine gravidanze, dispositivi con AI integrata, AI nei vostri fogli Excel, e scoperte scientifiche che sembrano uscite da un film di fantascienza.

Ovviamente non c’è tutto, è una mia personale selezione delle notizia che ritengo dobbiate necessariamente conoscere. Ma ditemi voi.

Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

Vi ricordo che c’è anche la versione podcast automatica dei contenuti di questa settimana.

Altman e la bolla dell’AI

Sam Altman ha espresso l'opinione che il settore dell'AI si trovi in una bolla, paragonandola alla bolla di internet. Sebbene l'AI sia fondamentale, ritiene che gli investitori siano eccessivamente entusiasti, suggerendo che un "crash" e una diminuzione delle valutazioni potrebbero verificarsi, ma l'AI, come internet, rimarrà una tecnologia trasformativa con vincitori a lungo termine.

Uno studio del MIT scuote i mercati: “il 95% non vede ritorni dall’AI”

Per seguire quest’onda, propongo una notizia di cui si è parlato già molto, ve lo ripropongo comunque (il link originale è stato spostato, vi lascio questo link). Uno studio MIT ha innescato un sell-off dei titoli tecnologici, rimettendo in discussione la narrativa del ROI sull’AI enterprise.

La realtà, per come la sto vedendo io, è che tanti progetti funzionano, qualcuno salta perché le aspettative erano troppo alte. Ma siccome il settore maggiormente impattato è il marketing, direi che lì i risultati si vedono eccome!

Questa narrativa di fatto viene smentita dai tanti licenziamenti nelle aziende tecnologiche che hanno iniziato a usare l’AI, e poi uno dei settori maggiormente interessati è, sempre per fare un esempio, l’outsourcing, visto che questa settimana Tata Consultancy Services ha licenziato 12.000 persone! Il World Economic Forum stima 92 milioni di lavoratori a rischio, ma 170 milioni di nuovi ruoli emergenti. Sfida: reskilling e “job matching”, ma nei media non conta la realtà ma il sensazionalismo.

Proseguendo sul tema…

L’ondata di unicorni AI tocca 498 aziende per $2,7T (100 nate dal 2023)

Ci sono ora 498 aziende private di intelligenza artificiale, note come unicorni, valutate oltre 1 miliardo di dollari, con un valore totale di 2,7 trilioni di dollari. Secondo CB Insights, 100 di esse sono state fondate dal 2023. Le startup di intelligenza artificiale stanno ricevendo investimenti massicci, risultando in valutazioni elevate e ricchezza per i fondatori e gli investitori. Come afferma il rapporto di Bloomberg, le quattro più grandi aziende private di intelligenza artificiale hanno creato almeno 15 miliardari con un patrimonio netto combinato di 38 miliardi di dollari.

Anthropic verso $170 mld di valutazione; Thinking Machines a $12 mld in pochi mesi Scale-up

L’azienda continua a crescere. Il produttore di Claude mira a un maxi-round che potrebbe triplicarne la valutazione e rafforzare la sfida a OpenAI e Google, con focus su bundle enterprise e integrazione di Claude Code.

OpenAI verso valutazione $500 mld: in vista vendita di $6 mld in azioni da parte di dipendenti Mercati

Dipendenti di OpenAI vendono azioni per 6 miliardi di dollari a un gruppo di investitori, valutando l'azienda a 500 miliardi di dollari. La mossa darà ai dipendenti la possibilità di ottenere liquidità in un mercato del talento ad alta posta nel settore dell'intelligenza artificiale. SoftBank, Thrive e Dragoneer tra i potenziali acquirenti; in parallelo un round da $40 mld. Ricavi attesi: $12,7 mld.

A poche settimane dal rilascio di GPT-5, Sam Altman ha anticipato che GPT-6 arriverà più velocemente del previsto e si concentrerà sulla memoria migliorata. L'obiettivo è permettere a ChatGPT di ricordare le preferenze, le routine e le peculiarità degli utenti per adattarsi e offrire un'esperienza veramente personalizzata, con l'idea che ogni utente avrà una versione unica di ChatGPT.

Google: AI Mode e i nuovi Pixel

Il "Made by Google" di quest'anno è stato uno spettacolo, con un talk show condotto da Jimmy Fallon. Le vere star della serata, però, sono state le integrazioni di Gemini AI, diffuse in ogni aspetto dei nuovi lanci. La linea Pixel 10 (che, esteticamente, rimane fedele ai modelli precedenti) sfoggia funzionalità davvero interessanti.

Ricerca Google con AI Mode: la modalità AI in Ricerca Google ha ricevuto nuove funzionalità "agentic". Ora è possibile fare domande complesse con più vincoli e preferenze, come trovare un ristorante abruzzese per due persone, tra le 8:00 e le 9:00 di sera, vicino al Duomo, e la ricerca fornirà risposte ben organizzate con raccomandazioni. Questa funzione deve essere attivata tramite Google Labs (in arrivo anche da noi).

Google Docs con voce AI: Google Docs ora offre la possibilità di leggere i documenti con una voce AI. Accessibile tramite il menu "Strumenti" > "Audio" > "Ascolta questa scheda", questa funzione (probabilmente disponibile sui piani a pagamento) offre diverse opzioni di voce (narratore, educatore, coach, ecc.) con una qualità audio molto realistica.

Pixel 10 con Chip Tensor G5 e Magic Q: il nuovo smartphone Pixel 10, dotato del chip Tensor G5 co-progettato con Google DeepMind e il modello Gemini Nano dentro il dispositivo per funzionare senza inviare i dati. La funzione "Magic Q" è un AI sempre attivo che monitora l'attività del telefono per offrire consigli e assistenza contestuale. Per esempio, può trovare automaticamente la posizione di un negozio menzionato in un messaggio e suggerire di inviarla subito.

Fotocamera Pixel con consigli AI: la fotocamera del Pixel 10 può fornire consigli in tempo reale per migliorare le foto, suggerendo azioni come "chiedi alla persona di guardare la fotocamera" o "abbassa leggermente la fotocamera", con preview generate dall’intelligenza artificiale.

Traduzione vocale in tempo reale: i telefoni Pixel sono in grado di offrire traduzioni vocali in tempo reale per diverse lingue (italiano, inglese, spagnolo, tedesco, giapponese, francese, hindi, , portoghese, svedese, russo e indonesiano), permettendo conversazioni fluide tra persone che parlano lingue diverse.

Editing di immagini con prompt testuali: le funzionalità di editing delle immagini sui Pixel consentono di modificare le foto con semplici prompt testuali, come "rimuovi il riflesso" o "colorizza questa vecchia foto", probabilmente sfruttando la tecnologia Nano Banana (ne parlo dopo).

Pixel Buds 2A con Gemini: i nuovi Pixel Buds 2A integrano Gemini, l'assistente AI, permettendo agli utenti di interagire con lui semplicemente pronunciando "Ehi Gemini" senza dover prendere il telefono.

Pixel Watch 4 e Fitbit con AI Health Coach: il Pixel Watch 4 e i nuovi Fitbit integrano un AI personal trainer per la salute, offrendo coaching proattivo per il fitness e il sonno, oltre all'assistente Gemini al polso.

Gemini per la casa e Gemini Live: i dispositivi Google Home avranno Gemini integrato. Gemini Live riceverà aggiornamenti con "cues" sullo schermo, come cerchi che evidenziano oggetti in una foto per rispondere a domande (ad esempio, "che condimento uso?" cerchiando un barattolo di spezie). Gemini si connetterà anche a più app Google, inclusi Calendar, Keep, Tasks (già disponibili) e presto anche Messaggi, Telefono e Orologio.

Mirage 2: videogame direttamente da prompt

Mirage 2, la nuova versione del game engine AI UGC, consente di creare demo personalizzabili in stile Red Dead Redemption. Collegandosi al portale di Dynamics Lab, si può accedere alla tecnologia e modificare il mondo di gioco a proprio piacimento, anche con immagini di riferimento personalizzate. Ci sono delle demo già printe, ma è possibile cambiarle e aggiungere interazioni con i personaggi (ho creato un gioco con un’immagine del Duomo di Milano). Il gioco si controlla con i tasti WASD e le frecce direzionali, e si possono effettuare modifiche con prompt dalla casella a destra in tempo reale. Da provare!

Meta sceglie Midjourney per le immagini per i suoi prodotti

Meta ha siglato un accordo con Midjourney per integrare le immagini create dall'AI nei feed di Facebook, Instagram e WhatsApp, con l'obiettivo di portare l'"aesthetic technology" di Midjourney nei modelli interni di Meta. Ciò rientra nella strategia di Meta di investire sull'intelligenza artificiale per raggiungere competitor come OpenAI e Google. L'accordo permetterà agli utenti di creare foto e video con un aspetto professionale senza competenze tecniche, grazie agli strumenti di Midjourney.

Meta sta lavorando ai suoi occhiali smart "Hypernova", con un prezzo atteso di circa 800 dollari per renderli più accessibili. E ha anche riorganizzato la sua divisione AI, consolidando i team sotto Meta Superintelligence Labs. Una mossa che indica quanto puntino forte su questo settore. Hanno anche reso open-source DINOv3, un modello di visione auto-supervisionato da 7 miliardi di parametri, un bel regalo per gli sviluppatori.

Meta sta espandendo la sua funzione di traduzione AI per Instagram e Facebook Reels. Questo sistema utilizza il suono e il tono della voce originale e sincronizza il movimento delle labbra con l'audio tradotto, per un'esperienza più autentica e coinvolgente.

Ma non è tutto oro ciò che luccica. Il Texas sta indagando su Meta e Character AI per presunte affermazioni fuorvianti sulla salute mentale fatte dai loro chatbot. La responsabilità etica dell'AI è un tema caldo, e queste indagini dimostrano che non è più solo una questione teorica.

Envision lancia smart glasses per non vedenti: lettura testi, descrizione ambienti e ricerca web Accessibilità

Envision e Solos hanno lanciato gli occhiali smart Ally Solos per non vedenti e ipovedenti, che possono leggere e tradurre testo, descrivere l'ambiente e riconoscere persone e oggetti. Sono disponibili in pre-ordinazione a $399, con spedizione prevista per ottobre 2025. Gli occhiali utilizzano l'assistente AI "Ally" di Envision, alimentato da modelli di intelligenza artificiale come Meta's Llama e OpenAI's ChatGPT.

Le voci diventano sempre più espressive

ElevenLabs V3 offre voci più espressive e dialoghi multi-speaker illimitati
Nuovi controlli di espressione (emozione, pitch, stile) e supporto a 70+ lingue; agenti conversazionali ibridi testo/voce con “Chat Mode”.

Acrobat Studio con AI

Adobe lancia Acrobat Studio: “PDF Spaces” con assistenti AI
Gestione di collezioni PDF con riassunti, analisi e chat; in avvio supporto focalizzato su documenti in inglese.

Qwen e il fenomeno Nano Banana fanno concorrenza a Photoshop

Qwen Image Edit (di Alibaba) è uno strumento open-source, disponibile con licenza Apache 2.0, permette di modificare immagini in modo conversazionale, proprio come si farebbe con un modello linguistico. Potete caricare un'immagine e dare istruzioni testuali come "cambia l'angolo della persona" o "metti un cappello". Il modello è accessibile gratuitamente tramite il sito qwen.ai cliccando sul pulsante "image edit" una volta effettuato l'accesso. I risultati sono sorprendenti: si possono cambiare abiti, stili (come Ghibli o 3D cartoon) e aggiungere elementi specifici con grande precisione.

Nano Banana (che viene attribuito a Google) è un altro editor di immagini ancora più potente. Sebbene non sia ancora ufficialmente rilasciato, si ritiene che sia un progetto di Google, dato che Logan Kilpatrick (Google AI Studio) e Josh Woodward (VP di Google Labs e Gemini app) hanno lasciato indizi a riguardo e in pratica le funzioni si sono viste in Google Photo e nei nuovi Pixel 10. Nano Banana eccelle nella sostituzione di oggetti specifici (come borse o copertine di libri), nella stilizzazione di parti di un'immagine (ad esempio, trasformare una ciotola di ramen in un'illustrazione anime 2D mantenendo il resto dell'immagine realistico), nella colorizzazione e nell'upscaling di foto in bianco e nero e nella composizione di più immagini in un'unica scena coerente. Al momento, è possibile provare Nano Banana gratuitamente tramite la modalità "battle" di lmarena.ai, anche se potrebbe essere necessario qualche tentativo per far apparire il modello.

Le storie interattive

Runway ML ha lanciato la beta di Runway Game Worlds, un'esperienza narrativa non lineare che genera storie, personaggi e media multimodali in tempo reale, combinando il testo con immagini generate per creare un'esperienza simile a un fumetto interattivo. Hanno anche migliorato le loro funzionalità esistenti, inclusa l'integrazione di modelli di terze parti e la Gen 4 image turbo mode.

Storybook funziona sull'app Gemini e online, generando storie con protagonisti, ambientazioni e stili artistici desiderati. L'utente inserisce un prompt testuale e Gemini crea la struttura narrativa, personaggi e scene. Vengono poi generate illustrazioni con tecnologie come Imagen e combinate con la storia in un libro illustrato, che può essere letto ad alta voce dall'intelligenza artificiale.

Microsoft integra la funzione =COPILOT direttamente in Excel

Microsoft sta portando l'AI direttamente nei vostri fogli di calcolo! La nuova funzione COPILOT permette agli utenti di eseguire attività generative direttamente in Excel. Excel è lo strumento di riferimento per l'analisi dei dati e la reportistica, ma la complessità delle formule può essere un ostacolo. La funzione COPILOT introduce l'intelligenza artificiale nel motore di calcolo di Excel, permettendo di eseguire calcoli e operazioni con un linguaggio naturale, come ad esempio =COPILOT(prompt_part1, [context1], [prompt_part2], [context2], ...), dove prompt_part è la richiesta in linguaggio naturale e context sono i riferimenti ai dati nel foglio. Ciò semplifica l'uso di Excel e consente di ottenere risultati immediatamente utili senza dover ricorrere a formule complesse.

Attualmente disponibile per gli utenti beta con un abbonamento Microsoft 365 Copilot da 30 dollari al mese. Per chi vive di fogli di calcolo, questo è oro.

Tensor svela “Robocar”: prima auto autonoma pensata per uso personale Autonomous

Non ride‑hailing ma proprietà individuale: un cambio di paradigma per la guida autonoma consumer.

Il robot che sente come noi

ALLEX è un robot umanoide sviluppato da WIRobotics, pensato per un impiego generale, con capacità di muoversi e reagire come gli esseri umani. Ha una grande sensibilità e sicurezza, rendendolo adatto all'industria, alla vita quotidiana e all'assistenza. Può percepire forze di 100 grammi-forza e esercitare fino a 40 Newton di forza con le dita, grazie a un sistema innovativo che riduce l'attrito. Il robot ha un peso contenuto, ma può sollevare oltre 3 chilogrammi con una sola mano, dimostrando un rapporto forza-peso superiore a molti robot umanoidi di taglia maggiore. La sua filosofia è quella di creare una piattaforma modulare adattabile a diversi contesti, come la sanità e la cura degli anziani.

DHL investe €630 mln: oltre 1.000 robot in UK entro il 2030, arriva Boston Dynamics Stretch Logistica

DHL Supply Chain investe 637 milioni di euro per espandere le sue strutture e accelerare l'automazione nelle operazioni dei clienti nel Regno Unito e in Irlanda, per sostenere la crescente domanda nel settore dell'e-commerce e della sanità. L'investimento rafforza la posizione del Regno Unito come uno dei principali mercati di DHL.

Impianto dell’embrione umano in “utero” di laboratorio

Non mi era mai capitato di leggere una cosa così, e devo dire che mi ha lasciato abbastanza perplesso. Una società tecnologica cinese, la Kaiwa, ha svelato i piani per il primo "robot surrogato" al mondo. Immaginate un umanoide a grandezza naturale con un utero artificiale incorporato nell'addome, capace di portare un feto a termine per dieci mesi e far nascere un bambino. Previsto per il 2026, è pensato per chi vuole aggirare le esigenze fisiche della gravidanza. Ha già scatenato un dibattito etico enorme, come potete immaginare. Per quanto mi riguarda, è zero dal punto di vista dell'applicazione pratica immediata, ma mi piace segnalare che i limiti della scienza vengono spinti sempre più in là in modi che non avremmo mai immaginato. Prime immagini in tempo reale mostrano un processo più “energico” del previsto; utile a ridurre fallimenti d’impianto.

Tesla Giga Berlin: robot creano un murales

Arte urbana e automazione si incontrano per un progetto di branding su larga scala dell’impianto della Tesla.

Nuovi antibiotici dall'AI

Scienziati del MIT hanno usato l'AI per progettare antibiotici completamente nuovi in grado di uccidere superbatteri resistenti come la gonorrea e lo MRSA (Stafilococco Resistente alla Meticillina). Se funzionasse, sarebbe rivoluzionario.

OK, siamo arrivati in fondo, se ti è piaciuta questa newsletter invita qualche amico a leggerla.

Per il resto ti lascio il link a tutte le puntate del mio podcast, che è in pausa, e ai miei libri.

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.

fammi sapere cosa ne pensi

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro.

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine LinkedInInstagram FacebookYoutube

Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

https://gigibeltrame.substack.com/p/robot-e-gravidanze-ai-in-excel-da

mercoledì 20 agosto 2025

La Digital Transformation 2025 Michele Bonfiglioli - Bonfiglioli Consulting - LeanManagement

Michele Bonfiglioli di @bonfiglioli_group ospite al #LateTechShow per parlare di #LeanManagement e #DigitalTransformation

Contattami per moderazioni, speech e consulenze: https://forms.gle/jtcv577NAd6gLWbi8

💻sito della trasmissione - http://lts.businesscommunity.it
💁‍♂️ La Bio - http://businesscommunity.it/gigi
📚 Scopri i miei libri: https://bit.ly/libridiGigi
📨 newsletter #Techy - https://gigibeltrame.substack.com/
👍 Seguimi su:
• Magazine - http://businesscommunity.it
• LinkedIn - https://it.linkedin.com/in/gigibeltrame
• Instagram - https://www.instagram.com/gigibeltrame
• Facebook - https://www.facebook.com/gigibeltrame
• Youtube - http://bit.ly/lts_ut
🎙️ Spotify - http://bit.ly/ltechshow
🎙️ iTunes - http://bit.ly/gigitechshow
🎙️ Google Podcast - http://bit.ly/lts_gp
🎙️ Amazon Music - http://bit.ly/ltsgigi https://www.youtube.com/shorts/aZKXqoGjYSc

lunedì 18 agosto 2025

Non solo GPT5, ma la corsa per l'AI è folle (e costosa)

L'ultime due settimane sono state senza dubbio molto intense e quindi ho deciso di uscire con #Techy, con uno sforzo non da poco, ma tre/quattro settimane di “pausa” sono troppe! Poche immagini e video, perdonatemi.

L'attenzione si è concentrata su GPT-5 e Google Genie 3, ma oltre a questi giganti, molte altre innovazioni e notizie sono passate un po’ in sordina e vorrei porle alla vostra attenzione, l’ho creata tutta dal telefono, per cui perdonate qualche strafalcione (spero che non ce ne siano, ma dopo un po’ gli occhi vanno in tilt!

Se ti va, iscriviti, non è una newsletter di tecnologia come tutte le altre (almeno spero)

I dubbi sull’AI

Jeffrey Hinton, considerato uno dei "padri fondatori" dell'AI, ha espresso le sue preoccupazioni sulla possibilità che l'AI possa superare l'intelligenza umana e ha sottolineato l'importanza di "addestrare istinti materni" nei modelli per garantire che l'AI rimanga allineata ai valori umani e non si rivolti contro l'umanità.

Un approccio interessante!

GPT-5 non mi sta convincendo, ma è un cambiamento

Il periodo di vacanza non è certo l’ideale per provare un LLM a fondo. Non sono un grande fan di GPT-4o, ma l’impressione non è stata esaltante.

Però ho qualche considerazione da fare.

Con l'avvento di modelli linguistici avanzati come GPT-5, assistiamo a un cambiamento significativo nel modo in cui interagiamo con l'intelligenza artificiale, un'evoluzione che non è per niente banale.

Stiamo passando da un approccio in cui l'utente seleziona e utilizza consapevolmente uno strumento specifico a un utilizzo più fluido e praticamente "invisibile" di un'intelligenza artificiale che si adatta autonomamente al compito da svolgere.

Un passaggio filosoficamente importante. Fino ad ora l'utente doveva possedere una conoscenza specifica di quale modello o strumento utilizzare e di come impiegarlo efficacemente, quindi definire lo scenario, le regole da seguire al fine di ottenere risposte significative.
Da GPT-5 il modello autonomamente è in grado di interpretare il contesto e di selezionare la modalità più appropriata (ad esempio, ragionamento logico, generazione di codice, ricerca di informazioni, analisi visiva) per raggiungere l'obiettivo desiderato.

Questo implica uno spostamento del focus: l'attenzione non è più sull'aspetto tecnico ("quale strumento devo selezionare?"), ma sull'obiettivo finale ("che risultato voglio ottenere?").

Se ci pensate, si passa da essere super specializzati per generare un prompt perfetto per un modello a un sistema che aggiusta da solo il prompt, ma solo se comprende pienamente la richiesta

Provo, con qualche esempio, a chiarire il concetto.

Prima: per creare un'immagine, dovevi aprire un software di fotoritocco specifico, imparare a usare i suoi strumenti (pennelli, livelli, filtri) e poi applicarli.

Adesso: potresti semplicemente dire all'AI "Genera un'immagine di un paesaggio montano al tramonto con uno stile impressionista", e l'AI sceglierebbe autonomamente il modello di generazione di immagini, applicherebbe lo stile e ti presenterebbe il risultato, senza che tu debba conoscere i dettagli tecnici di come è stata creata.

Prima: per risolvere un problema di programmazione, dovevi scegliere il linguaggio di programmazione, l'IDE (ambiente di sviluppo integrato) e le librerie appropriate.

Adesso: potresti descrivere il problema all'AI ("Ho bisogno di un programma Python che analizzi questo dataset e trovi le correlazioni"), e l'AI potrebbe generare il codice, eseguirlo e persino debuggarlo, scegliendo gli strumenti migliori in modo autonomo.

Prima: per fare una ricerca su un argomento complesso, dovevi formulare diverse query, navigare tra i risultati e sintetizzare le informazioni.

Adesso: potresti chiedere all'AI "Riassumi le principali teorie sull'intelligenza artificiale generativa e i loro impatti etici", e l'AI si occuperebbe di ricercare, filtrare e presentarti le informazioni più rilevanti, scegliendo le fonti e le strategie di ricerca più efficaci.

Spero di aver chiarito il mio pensiero, in caso contrario commentate e ditemi la vostra opinione. Ma nel frattempo, vediamo cosa è successo in OpenAI.

Il lancio di GPT-5, l'8 agosto, è stato segnato da problemi tecnici, con l'opzione "Thinking" (pensiero) che reindirizzava spesso a modelli meno capaci, e benchmark inferiori alle aspettative. Sono state riscontrate anche vulnerabilità agli attacchi di prompt injection. Sam Altman ha dovuto correre ai ripari e ha permesso di ripristinare GPT-4o per gli utenti Plus, raddoppiare i limiti di messaggi e migliorare l'interfaccia utente per mostrare il modello attivo.

Altman vuole rendere ChatGPT il più personale possibile senza prendere posizioni ideologiche, e prevede di spendere trilliardi di dollari per costruire data center per sostenere la crescita dell'azienda.

Il CEO Altman sta anche pianificando un'espansione aggressiva nella tecnologia dei dispositivi per i consumatori, nelle interfacce cervello-computer e nei social media.

OpenAI ha pubblicato la sua guida a GPT-5, un documento che va oltre il manuale tecnico, rappresentando forse un salto evolutivo nel campo del prompt engineering, che include design del prompt, dialogo e ragionamento.

Inoltre, ha appena aggiornato l'AI Academy, con 11 corsi gratuiti disponibili, che coprono argomenti come l'ingegneria delle promesse, il ragionamento con ChatGPT, le ricerche approfondite e l'utilizzo di LLM, ChatGPT per scrivere, codificare e analizzare.

Microsoft Copilot 3D

Microsoft ha lanciato Copilot 3D, un nuovo progetto che permette di trasformare qualsiasi immagine in un modello 3D. Non è un modello da testo a 3D, ma prende un'immagine e la converte in un oggetto 3D utilizzabile per lo sviluppo di giochi, modellismo, stampa 3D, web design e realtà virtuale. È disponibile gratuitamente e accessibile tramite un account Microsoft. Il processo è sorprendentemente rapido, impiegando circa 20 secondi per generare un modello 3D da un'immagine.

Generazione video con Perplexity

Perplexity ora offre la generazione di video con audio su web, iOS e Android per gli abbonati Pro (5 video al mese) e Max (15 video al mese con qualità superiore). Puoi fornire un prompt testuale o un'immagine e Perplexity creerà un video. La funzione include un "ottimizzatore di prompt" che riscrive il testo per una migliore generazione. La velocità di generazione è di circa un minuto per un video di 8 secondi, suggerendo l'uso di un modello avanzato come V3.

Notebook LM: panoramiche video per tutti

La funzione di panoramica video di Notebook LM è ora accessibile a tutti. Questo strumento consente di caricare diverse fonti (articoli, siti web, video di YouTube) e generare video esplicativi basati sul contenuto. È in grado di creare podcast audio e presentazioni video dall'aspetto professionale. Sebbene non utilizzi il modello V3 di Google, si basa su Google Vids per creare presentazioni in stile slideshow, rendendo la creazione di contenuti per piattaforme come YouTube incredibilmente efficiente.

Google Finance e Google Flights (prossimamente con AI)

Google sta implementando aggiornamenti AI su Google Finance e Google Flights. La nuova Google Finance, in fase di rollout nelle prossime settimane negli Stati Uniti, permetterà di fare ricerche finanziarie con risposte AI complete e strumenti di grafici avanzati. Allo stesso modo, Google Flights, in rollout in beta negli Stati Uniti, Canada e India, utilizzerà l'AI per suggerire opzioni di volo convenienti in base a descrizioni di idee di viaggio in linguaggio naturale.

Gemini e Claude: memoria delle conversazioni

Google Gemini e Anthropic Claude stanno introducendo la capacità di ricordare le conversazioni passate. Gemini avrà una nuova impostazione che gli permetterà di imparare dalle conversazioni precedenti, rendendo le interazioni più naturali e pertinenti. Claude offre una funzione simile che può essere attivata per permettergli di attingere alle chat precedenti per un contesto rilevante. Questa funzionalità, già presente in ChatGPT, migliora notevolmente l'esperienza utente.

Ma Gemini cambia le condizioni

Gemini aggiunge funzionalità, ma sta cambiando le condizioni d’uso. Gemini introduce chat temporanee che non vengono utilizzate per personalizzare le chat future e vengono salvate per 72 ore. L'impostazione "Conserva attività" consente di visualizzare e riprendere chat passate. Le registrazioni audio di Gemini e Gemini Live possono essere utilizzate per migliorare i servizi Google, ma l'impostazione è disattivata per impostazione predefinita.

Facciamo attenzione.

Le novità sui modelli LLM

In questo momento la corsa maggiore che stanno facendo un po’ tutti è aumentare il numero di token utilizzabili come contesto, il tema è che si crea di fatto un RAG senza dover necessariamente averne le competenze, in realtà c’è un tema di costi molto importante da tenere conto, oltre a una computazione più difficile da gestire.
Vedremo cosa accadrà.

Google ha rilasciato un nuovo modello chiamato Gemma 3 270M. Si tratta di un modello di piccole dimensioni (270 milioni di parametri, non miliardi) progettato per essere efficiente e veloce, in grado di funzionare anche su smartphone. Non è inteso come un concorrente diretto di modelli come GPT-5 o Claude 4.1, ma per applicazioni che richiedono velocità ed efficienza in locale. L’ho installato sul mio Pixel e devo dire che è sorprendentemente efficiente, certo non è perfetto.

I modelli Qwen di Alibaba hanno ricevuto aggiornamenti significativi, inclusi finestre di contesto ultra-lunghe fino a 1 milione di token. Questa tendenza verso finestre di contesto sempre più grandi suggerisce che presto la dimensione della finestra di contesto potrebbe diventare un fattore meno critico.

In risposta al lancio di GPT-5 e alla sua disponibilità nella versione gratuita, XAI ha reso Grok-4 disponibile gratuitamente a livello globale, precedentemente accessibile solo tramite piani a pagamento. Elon Musk ha confermato che l'integrazione degli annunci è prevista per compensare gli elevati costi delle GPU. La prossima iterazione di Grok sarà un sistema multimodale nativo, in grado di elaborare direttamente flussi audio/video per comprendere sfumature tonali e contesto in tempo reale, senza trascrizioni intermedie.

Skywork AI ha rilasciato Matrix Game 2.0, una versione open-source della tecnologia di navigazione in mondi 3D da un'immagine o video, simile a quanto mostrato da Google Genie la scorsa settimana. Questo richiede una notevole potenza di calcolo (GPU Nvidia con almeno 24 GB di memoria), rendendolo difficile da eseguire localmente per la maggior parte degli utenti.

MidJourney ha esteso la generazione di video HD anche agli abbonamenti standard, rendendo questa funzionalità più accessibile. Sono stati apportati anche miglioramenti alla moderazione video e alla gestione dei lavori in batch più piccoli.

Pika Labs ha anticipato un nuovo modello di performance audio-driven che promette un lip-syncing molto accurato in video HD di 6 secondi o meno. La funzione sarà presto disponibile nell'app Pika Social.

Hugsfield AI ha implementato una funzione "Draw to Video", simile a quella vista in V3, che permette agli utenti di disegnare su un'immagine e guidare la generazione video in base a quei disegni e prompt.

Il Robot che Piega il Bucato

Figure Robotics ha presentato un robot in grado di piegare il bucato, un progresso significativo nelle applicazioni domestiche della robotica. Questo stesso robot è anche in grado di caricare e scaricare lavatrici.

Samsung Bespoke (Frigorifero AI)

Un frigorifero alimentato dall'AI che tiene traccia degli alimenti, gestisce l'energia e si connette a dispositivi intelligenti. Impara la tua routine e mostra cosa c'è all'interno senza aprire la porta.

E il robot che sistema tutto

La molecola misteriosa che potrebbe accendere la vita nello spazio

I ricercatori hanno creato con successo un composto altamente instabile chiamato metanetetrolo, soprannominato "bomba prebiotica". Questo composto si scompone creando diversi elementi essenziali per la vita, suggerendo un potenziale meccanismo per la formazione della chimica complessa nello spazio e aiutandoci a identificare luoghi nell'universo che potrebbero supportare la vita.

Gocce oculari VIZZ per la presbiopia

La FDA americana ha approvato VIZZ, le prime gocce oculari a base di aceclidina in grado di correggere la visione da vicino sfocata fino a 10 ore senza occhiali. Queste gocce agiscono creando un "effetto stenopeico" che acuisce la visione ravvicinata senza compromettere la vista a distanza. Saranno disponibili entro la fine del 2025 per i 128 milioni di americani affetti da presbiopia.

Voci perfette

Boson AI ha rilasciato Higgs Audio V2, un modello text-to-speech sorprendentemente potente, capace di clonare voci e generare conversazioni multi-speaker con una precisione quasi umana. Questo apre scenari pazzeschi per la comunicazione, soprattutto perché è Open-Source e gira tranquillamente su una macchina con una RTX 4090.

L’ambulanza intelligente (forse ci siamo)

Da quanti anni sentite l’argomento “ambulanza intelligente”?
Chiaramente è un’esigenza, laddove molte di quelle in circolazione sono affidate al volontariato e non hanno a bordo un medico e la “telemedicina”, come si diceva una volta, non è mai decollata del tutto.
Il progetto TrialsNet di Ericsson Italia ha testato la "Smart Ambulance" con una rete 5G Standalone al campus del CNR di Pisa. La rete ha garantito copertura indoor e outdoor, supportando servizi mission-critical e adattandosi a scenari complessi, come il movimento di un veicolo ad alta velocità. I test hanno evidenziato l'importanza delle reti di trasporto e dell'orchestrazione avanzata per mantenere la qualità del servizio e la bassa latenza, oltre all'integrazione di soluzioni basate su intelligenza artificiale per ottimizzare l'uso delle risorse di rete.

Un farmaco contro le apnee notturne

Un nuovo farmaco contro l'apnea notturne potrebbe aiutare centinaia di milioni di persone a dormire meglio. Circa un miliardo di persone soffre di questa condizione in tutto il mondo, che aumenta il rischio di incidenti e rende le prestazioni lavorative più basse. L'apnea ostruttiva causa la contrazione dei muscoli della gola durante il sonno, portando a russare o a pause temporanee nella respirazione che fanno svegliare le persone. Il trattamento efficace attuale è una maschera facciale che pompa aria nei polmoni, rumorosa e scomoda. Tuttavia, un'azienda farmaceutica ha rilasciato i risultati preliminari di un trial clinico su un pillola che riduce significativamente le interruzioni della respirazione, potenziale alternativa alle maschere.

Come catturare l’attenzione su Instagram

OK, siamo arrivati in fondo, se ti è piaciuta questa newsletter invita qualche amico a leggerla.

Per il resto ti lascio il link a tutte le puntate del mio podcast, che è in pausa, e ai miei libri.

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.

fammi sapere cosa ne pensi

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro.

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine LinkedInInstagram FacebookYoutube

https://gigibeltrame.substack.com/p/non-solo-gpt5-ma-la-corsa-per-lai

giovedì 7 agosto 2025

Procurement, evoluzione cyber, SaaS per comunicazione, operation e lean thinking - S06e44

L'ultima puntata della sesta stagione del "Late Tech Show" ha esplorato le nuove esigenze aziendali, evidenziando il ruolo cruciale della tecnologia e dell'IA.
🔹Michele Bonfiglioli (Bonfiglioli Consulting) ha discusso come le "operations" stiano cambiando grazie alla digitalizzazione e all'IA, sottolineando la necessità di resilienza e adattamento in un mercato volatile. La sua azienda promuove il "lean thinking" a livello internazionale, con l'obiettivo di migliorare i processi e supportare i manager con l'IA per decisioni più informate.
🔹Marco Rottigni (SentinelOne) ha affrontato il tema della cybersecurity nel cloud, evidenziando che i problemi principali derivano da errori umani (misconfiguration) e sono difficili da risolvere. SentinelOne si concentra sulla "prioritizzazione" dei rischi, fornendo evidenze concrete delle vulnerabilità e contesti per un rimedio efficace, posizionandosi come partner che integra le proprie soluzioni con le piattaforme esistenti dei clienti.
🔹Diana Capitta (Nexoya) ha presentato la soluzione AI-driven della sua azienda per l'ottimizzazione delle campagne di marketing digitale. La piattaforma SAS di Nexoya analizza dati storici e utilizza modelli proprietari per allocare i budget pubblicitari, riducendo l'operatività e migliorando le performance. Nexoya, nata in Svizzera, si sta espandendo in Europa, con un focus sull'Italia.
🔹Germano Colombo (DiPriMa) ha parlato dell'applicazione dell'intelligenza artificiale al "procurement", settore che necessita di maggiore efficienza. Prima ha sviluppato "agenti" AI autonomi che supportano i buyer nella gestione dei prezzi, analizzando dati e anticipando le tendenze di mercato. Questi agenti permettono di automatizzare compiti complessi, liberando tempo per attività strategiche.

Con:
2:40 Michele Bonfiglioli di Bonfiglioli Consulting,
20:50 Marco Rottigni di SentinelOne,
38.10 Diana Capitta Nexoya,
51:32 Germano Colombo DiPriMa

Contattami per moderazioni, speech e consulenze: https://forms.gle/jtcv577NAd6gLWbi8

💻sito della trasmissione - http://lts.businesscommunity.it
💁‍♂️ La Bio - http://businesscommunity.it/gigi
📚 Scopri i miei libri: https://bit.ly/libridiGigi
📨 newsletter #Techy - https://gigibeltrame.substack.com/
👍 Seguimi su:
• Magazine - http://businesscommunity.it
• LinkedIn - https://it.linkedin.com/in/gigibeltrame
• Instagram - https://www.instagram.com/gigibeltrame
• Facebook - https://www.facebook.com/gigibeltrame
• Youtube - http://bit.ly/lts_ut
🎙️ Spotify - http://bit.ly/ltechshow
🎙️ iTunes - http://bit.ly/gigitechshow
🎙️ Google Podcast - http://bit.ly/lts_gp
🎙️ Amazon Music - http://bit.ly/ltsgigi

Procurement, evoluzione cyber, SaaS per comunicazione, operation e lean thinking - S06e44 https://www.youtube.com/watch?v=Zr6Y5YAbzJ0

mercoledì 6 agosto 2025

#Cybersecurity: i rischi sono reali

Cristina Mariano di Advens ci ha messo in guardia sull'escalation degli attacchi hashtag#cyber in Italia (phishing, ransomware), sempre più sofisticati grazie all'AI. La risposta per molte imprese, soprattutto PMI, può arrivare da modelli innovativi come il CISO as a Service e il SOC as a Service.
@advens9744 #advens

Contattami per moderazioni, speech e consulenze: https://forms.gle/jtcv577NAd6gLWbi8

💻sito della trasmissione - http://lts.businesscommunity.it
💁‍♂️ La Bio - http://businesscommunity.it/gigi
📚 Scopri i miei libri: https://bit.ly/libridiGigi
📨 newsletter #Techy - https://gigibeltrame.substack.com/
👍 Seguimi su:
• Magazine - http://businesscommunity.it
• LinkedIn - https://it.linkedin.com/in/gigibeltrame
• Instagram - https://www.instagram.com/gigibeltrame
• Facebook - https://www.facebook.com/gigibeltrame
• Youtube - http://bit.ly/lts_ut
🎙️ Spotify - http://bit.ly/ltechshow
🎙️ iTunes - http://bit.ly/gigitechshow
🎙️ Google Podcast - http://bit.ly/lts_gp
🎙️ Amazon Music - http://bit.ly/ltsgigi https://www.youtube.com/shorts/W50Y3WbGk-g

martedì 5 agosto 2025

lunedì 4 agosto 2025

I passi da gigante dell'AI, della robotica e per la salute

Come ogni settimana, il ritmo delle novità sembra inarrestabile e provo sempre a darvi una rapida, si fa per dire, carrellata di quelle che ritengo personalmente più interessanti.

Vi lascio questi pensieri sui profitti delle aziende Big Tech e il rapporto dell’AI con i lavoratori (che lasciano a casa).

Da questa settimana inizio il reward della newsletter, se vi va, qui ci sono i “premi” che ho messo in palio.

Se volete, c’è una versione podcast automatica di questa newsletter.

Grok 4: bene ma non benissimo

La notizia della settimana arriva da xAI di Elon Musk, che ha svelato Grok 4, e le chiacchiere da fare sarebbero tante. Loro lo definiscono "il modello più intelligente al mondo", con un ampio margine.

È un gigante, sì, ma con qualche tallone d'Achille che vale la pena conoscere. Iniziamo subito con le buone notizie: la sua potenza è indiscutibile. Test indipendenti lo collocano tra i modelli più performanti sul mercato, affiancandolo a colossi come Claude 4 Opus e GPT-3 Pro. E non solo, potrebbe rivelarsi anche più conveniente in termini di costo per singolo token, un dettaglio non da poco per chi lo userà intensivamente. Un aspetto che ci ha colpito è la sua capacità di affrontare compiti complessi attraverso la modalità "Grok 4 Heavy". Immaginate quattro agenti AI che lavorano contemporaneamente su una vostra richiesta, confrontando i risultati per fornirvi la risposta più accurata e completa possibile. È un approccio davvero interessante per migliorare l'affidabilità delle risposte. Tuttavia, non è tutto oro quel che luccica, e ci sono delle aree in cui Grok 4 mostra ancora i suoi limiti. Per esempio, la sua connettività con strumenti esterni è al momento piuttosto ristretta: a differenza di altri modelli che si interfacciano con un'ampia gamma di servizi, Grok 4 si collega solo a Google Drive e Microsoft OneDrive. C'è spazio per espandere questa funzionalità, sicuramente. Un'altra nota dolente riguarda la gestione delle informazioni in tempo reale. Nelle mie prove, Grok 4 ha avuto qualche difficoltà a fornire dati precisi e aggiornati, come le previsioni meteo attuali o i risultati sportivi in diretta, un campo in cui modelli come ChatGPT-3 si dimostrano decisamente più agili. Infine, un dettaglio curioso che ci porta a riflettere sulla "creatività" dell'IA: nonostante la sua impressionante potenza, Grok 4 non è riuscito a generare barzellette originali. Spesso, le sue risposte in questo campo si sono limitate al recupero di contenuti già esistenti online. Forse l'umorismo è ancora un'arte prettamente umana! Insomma, Grok 4 si presenta come un modello di linguaggio estremamente promettente e potente, capace di sfidare i giganti del settore. Ma, come ogni tecnologia agli inizi, ha ancora dei margini di miglioramento, specialmente nell'integrazione con il mondo esterno e nella gestione dei dati dinamici. Sarà interessante vedere come xAI lo farà evolvere nei prossimi mesi. Per ora, è una macchina impressionante con qualche ... tic!

Non sono mancate le polemiche, con la versione precedente di Grok che ha "sbroccato" su X, ma la potenza è innegabile. Un abbonamento SuperGrok Heavy da $300 al mese dà accesso a tutto questo.

Perplexity pensa in grande

Perplexity ha appena lanciato il suo browser web innovativo, si chiama Comet, e la sua missione è chiarissima: ridurre drasticamente la navigazione manuale, affidandosi a un assistente AI integrato. Un vero e proprio copilota digitale per le vostre esplorazioni in rete. Per ora, l'accesso è un po' esclusivo: Comet è disponibile unicamente per gli abbonati a Perplexity Max (che, diciamocelo, ha un costo non indifferente di 200 dollari al mese), mentre gli altri interessati dovranno pazientare in lista d'attesa. Ma veniamo al sodo: cosa rende Comet così speciale? Tecnicamente, si basa su Chrome, ma al suo interno troverete una barra di ricerca potenziata direttamente da Perplexity e, soprattutto, un assistente laterale super intelligente, capace di interagire con qualsiasi cosa vediate sullo schermo. Pensate a quanto tempo potrete risparmiare! Questo assistente può descrivervi l'estetica di una miniatura di YouTube, confrontare i prezzi di un prodotto su più siti contemporaneamente, aiutarvi a scrivere e persino pubblicare tweet, o leggervi e riassumervi al volo quelle email urgenti che proprio non potete ignorare. La filosofia dietro Comet è chiara: lasciare che sia l'intelligenza artificiale a fare il "lavoro sporco" della navigazione. Niente più decine di schede aperte, niente più ricerche estenuanti per riassumere informazioni. L'AI fa tutto per voi, presentandovi i dati di cui avete bisogno in modo rapido e ordinato. Un bel passo avanti, non trovate?

Perplexity ha anche stretto una partnership con Coinbase per integrare dati crypto in tempo reale direttamente nella sua sezione "Finance".

Nvidia sfonda ogni record: la prima azienda da 4 Trilioni di dollari!

Jensen Huang e Nvidia hanno fatto la storia questa settimana, diventando la prima azienda al mondo a raggiungere una capitalizzazione di mercato di 4 trilioni di dollari. È una cifra pazzesca, quasi pari all'intero PIL di nazioni come India e Giappone! Questo è un segnale forte per l'industria tech: gli investitori credono ancora nel valore dei chip all'avanguardia.

Il progetto dell’AI europea

Il progetto europeo DVPS, guidato dall'azienda italiana Translated, punta a creare un'AI capace di interagire con il mondo reale in tempo reale, superando i limiti dei modelli linguistici attuali. Con un finanziamento di 29 milioni di euro, il progetto riunisce venti aziende da nove Paesi europei e mira a sviluppare una nuova generazione di sistemi di AI, modelli multimodali che apprendono dall'interazione diretta con il mondo reale. L'obiettivo è raggiungere la consapevolezza contestuale e ampliare le capacità umane in domini come la traduzione simultanea, la medicina e l'ambiente.

I soldi parlano: più della metà dei finanziamenti Venture Capital va all'AI

PitchBook ha scoperto che più della metà di tutti i dollari di capitale di rischio a livello globale, incluso il 64% negli Stati Uniti, è andata a startup AI nella prima metà del 2025. Nello stesso periodo, l'AI ha aiutato 36 aziende tecnologiche a raggiungere lo status di "unicorno" (valutazione di 1 miliardo di dollari o più). Questo non solo conferma l'enorme interesse e l'hype intorno all'AI, ma indica anche un cambiamento fondamentale nella distribuzione del capitale. L'AI è il nuovo oro, direi.

La scoperta per la computazione che fa la differenza

Il sistema di ordinamento in memoria con memristori può superare le limitazioni delle architetture tradizionali. Un nuovo approccio consente di eseguire operazioni di ordinamento senza confronti, migliorando la velocità, l'efficienza energetica e lo spazio. Le sperimentazioni mostrano miglioramenti del throughput di 7,70 volte, dell'efficienza energetica di 160,4 volte e dell'area di 32,46 volte rispetto ai sistemi di ordinamento tradizionali.

Il “rubarsi” talenti AI si intensifica

Se c'è un campo in cui la competizione è più accesa che mai, è sicuramente quello dell'intelligenza artificiale. Stiamo assistendo a una vera e propria corsa ai talenti di alto profilo, con Meta e OpenAI in prima linea a contendersi ingegneri e dirigenti chiave. Un esempio lampante di questa "guerra dei cervelli" è la mossa di Meta, che ha recentemente acquisito Ruming Pang, una figura di spicco e responsabile del team di modelli fondamentali di Apple. L'offerta per Pang è stata un pacchetto plurimilionario, dimostrando quanto queste aziende siano disposte a investire per assicurarsi le menti più brillanti.

I giganti della tecnologia Google e Meta sono intervenuti lo stesso giorno per rafforzare il loro layout AI: Meta ha completato l'acquisizione della startup di intelligenza artificiale vocale PlayAI e il suo team sarà integrato nella linea di business Meta AI; Google ha puntato sul team principale della società di programmazione AI Windsurf per 2,4 miliardi di dollari, sconfiggendo OpenAI e la sua offerta. Le due transazioni evidenziano che le aziende tecnologiche stanno evitando la revisione antitrust e accelerando la competizione per le risorse strategiche in campo AI attraverso un modello di “quasi acquisizione” che non va ad infrangere la concorrenza.

OpenAI, dal canto suo, non è rimasta a guardare e ha risposto con una serie di assunzioni strategiche. Ha portato a bordo David Lauo, ex vicepresidente dell'ingegneria software di Tesla, Uday, che guidava l'ingegneria infrastrutturale di xAI, e Angela Fan, una ricercatrice AI proveniente proprio da Meta.

Ma cosa significa tutto questo incessante ricambio di esperti? Questo continuo valzer di talenti ci porta a riflettere sul reale stato di avanzamento verso l'Intelligenza Generale Artificiale (AGI). Potrebbe suggerire che il percorso verso l'AGI sia ancora molto più lungo e complesso di quanto si possa pensare, e che la necessità di accaparrarsi ogni singola risorsa di valore sia un sintomo della sua intrinseca difficoltà.

OpenAI si prepara a un'estate calda (e a un suo Browser?)

OpenAI non sta certo a guardare. Si vocifera che stiano preparando il loro browser AI-powered per sfidare sia Chrome che il nuovo Comet di Perplexity, con un lancio previsto tra poche settimane. Inoltre, la loro prima release open-source dal 2022 potrebbe arrivare la prossima settimana e promette di essere performante come o3-mini. Hanno anche un nuovo strumento "study together" su ChatGPT che promette di rivoluzionare il modo in cui impariamo. Che dire, saranno mesi intensi!

I nostri prodotti nelle ricerche di ChatGPT

ChatGPT include adesso raccomandazioni di prodotti nella sua esperienza di ricerca. Quando una query di un utente implica un'intenzione di acquisto, come "regali per chi ama cucinare" o "le migliori cuffie con cancellazione del rumore sotto i 200 euro", ChatGPT può mostrare prodotti rilevanti. I risultati dei prodotti sono scelti indipendentemente e non sono pubblicità. Come afferma il sito, ogni sito web o negozio può apparire nella ricerca di ChatGPT. Per poter inserire i propri, usate questo LINK.

Google "Deep Think" e i suoi nuovi modelli

Anche Google non scherza. Sta per lanciare Gemini 2.5 Pro Deep Think, un modello che pare superi i precedenti in qualità. Parallelamente, c'è una "Agent Mode" che promette "esplorazione, pianificazione ed esecuzione autonome". Tradotto: capacità multi-step e non supervisionate. Stanno anche aggiungendo nuove funzionalità creative, come un generatore image-to-video per Veo 3 in Gemini, per trasformare foto singole in brevi clip con testo e audio. La cosa interessante è che internamente, Google afferma che l'AI scrive ormai circa il 50% del loro codice. Questo mi fa riflettere su quanto l'AI stia diventando parte integrante dello sviluppo.

Meta pensa ai più giovani con molto impegno

Meta dà priorità alla sicurezza dei giovani, sostiene la creazione di un'età digitale di maggioranza nell'UE, con approvazione genitoriale per l'accesso ai servizi digitali, per garantire esperienze online sicure e adeguate all'età. I genitori dovrebbero avere l'ultima parola sull'uso dei servizi online da parte dei loro figli, con meccanismi di verifica dell'età robusti e facili da usare.
Una convinzione davvero forte, un impegno verso la società che non si vede spesso nelle aziende tech.

X è senza CEO

La CEO di X, Linda Yaccarino, ha rassegnato le dimissioni poco dopo che Grok ha avuto un "deragliamento" diventando antisemita e chiamandosi "Hitler", sebbene le sue dimissioni fossero pianificate da settimane.

I video di Moon Valley sono etici

Moon Valley ha lanciato un modello video AI addestrato esclusivamente su dati con licenza aperta, ideale per i filmmaker che desiderano evitare problemi di copyright. Offre controlli avanzati come il trasferimento di movimento e posa.

Come hackerare le camere di sicurezza per fini criminali

Un cartello messicano ha assunto un hacker per spiare un funzionario dell'FBI a Città del Messico, raccogliendo informazioni dalle telecamere di sorveglianza della città per uccidere potenziali informatori. L’hacker ha anche avuto accesso alle chiamate e ai dati di geolocalizzazione dell'ufficiale, come riportato dal Dipartimento di Giustizia. "Secondo l'agente del caso, il cartello ha utilizzato (le informazioni fornite dal hacker) per intimidire e, in alcuni casi, uccidere potenziali fonti o testimoni che collaboravano", si legge nel rapporto dell'ispettore generale.

Avere camere sicure e aggiornate, criptazione delle immagini è diventato fondamentale.

YouTube e la monetizzazione AI

Sembra che YouTube stia chiarendo le sue politiche sulla monetizzazione, puntando a demonetizzare contenuti generati ripetutamente e in automatico o semplicemente ripetitivi (spesso associati a "AI slop" o contenuti rubati), piuttosto che bloccare specificamente i contenuti generati dall'AI in generale.

Open Source per far cooperare i modelli AI

Sakana AI ha presentato "TreeQuest", una tecnica open-source che permette a più modelli di linguaggio di cooperare per risolvere un singolo compito, un potenziale futuro della navigazione AI per evitare la scelta manuale del modello migliore.

Amazon e l'esercito di robot

Amazon ha raggiunto un traguardo impressionante: ha dispiegato il suo milionesimo robot, quasi eguagliando il numero di dipendenti umani nelle sue strutture! Il gigante dell'e-commerce ha pure annunciato un nuovo modello di base che aumenterà l'efficienza della sua flotta del 10%. Per quanto mi riguarda, il fatto che circa il 75% delle consegne globali di Amazon si affidi già ai robot mi fa riflettere su come stia cambiando il mondo del lavoro. Ne vedremo delle “non” belle. Ci scommetto.

Genesis AI: un modello universale per la robotica

Mentre il lavoro fisico rappresenta una cifra impressionante del PIL globale (30-40 trilioni di dollari), i robot automatizzano solo circa il 5% di questo sistema. Una nuova startup, Genesis AI, ha raccolto 105 milioni di dollari e vuole colmare questo divario, portando "l'intelligenza a livello umano nel mondo fisico". Con il supporto di Eric Schmidt e Khosla Ventures, Genesis punta a creare un modello universale, open-source, compatibile con quasi ogni robot. Una mossa strategica che potrebbe davvero sbloccare il potenziale della robotica.

Cucinare a distanza? Il Robot Chef senza latenza

Pensate a questo: un braccio robotico DOBOT, operato a distanza da Shenzhen, ha cucinato bistecche perfettamente a 1.800 km di distanza, nello Shandong. Nessun ritardo, nessun errore, solo controllo in tempo reale e ad alta fedeltà. Questo dimostra quanto sia matura la tecnologia di presenza remota, dove latenza, precisione e stabilità si allineano. Le implicazioni vanno oltre la cucina: assistenza a distanza, risposta alle catastrofi, operazioni industriali ad alto rischio. I telerobot stanno davvero facendo un passo avanti e sono pronti per il campo. Qui un'idea di come funziona.

E nascono anche i robot tuttofare

Vi lascio direttamente il video di Robotera.

E invece gli assistenti simili a “The Sphere”?

Altra idea sorprendente, ma molto fine a se stessa anche se ovviamente molti architetti la useranno come complemento d’arredo.

DeepMind e il "dialogo interiore" dei Robot

Una notizia che mi ha lasciato a bocca aperta: DeepMind ha depositato un brevetto per un sistema che permette agli agenti AI e ai robot di generare un "dialogo interiore" per capire e imparare meglio i compiti. In pratica, il robot "parla" a se stesso per ragionare! Questa tecnologia, che abbina input visivi a descrizioni in linguaggio naturale, potrebbe consentire l'apprendimento "zero-shot", permettendo ai robot di gestire oggetti sconosciuti senza addestramento preliminare. È un passo enorme verso robot più autonomi e meno imprevedibili.

Farmaci con l’AI

Isomorphic Labs (Google) e Farmaci AI: Isomorphic Labs, la società di Google che sviluppa farmaci tramite AI, ha farmaci pronti per le sperimentazioni umane, un passo significativo che dimostra il potenziale dell'AI nel cambiare vite. Alphabet's Isomorphic Labs ha un obiettivo ambizioso: "risolvere tutte le malattie". Partendo dal successo di AlphaFold (che ha meritato un Nobel), ora i loro modelli possono prevedere quali farmaci funzionano meglio per malattie specifiche. Con 600 milioni di dollari di nuovi finanziamenti, stanno per lanciare i primi test sull'uomo, puntando a rivoluzionare lo sviluppo dei farmaci e a collaborare con l'AI per creare cure per il cancro e le malattie immunitarie. Se funziona, è una svolta che potrebbe liberarci da un sacco di sofferenze.

Polmoni cresciuti in laboratorio: tempi record

Ricercatori giapponesi hanno sviluppato una tecnica rivoluzionaria per trasformare il tessuto connettivo ordinario in cellule polmonari specializzate in soli 7-10 giorni, invece dei mesi che ci vogliono di solito. Se questa tecnica potesse essere applicata agli esseri umani, potrebbe offrire speranza a milioni di persone che soffrono di gravi malattie respiratorie. Un passo gigante per la medicina rigenerativa.

Mini cuori cresciuti in laboratorio

In una prima mondiale, scienziati australiani hanno creato minuscoli cuori cresciuti in laboratorio, delle dimensioni di un seme di chia! Stanno usando questi modelli per studiare a fondo le malattie cardiache infantili, prima impossibili da analizzare in laboratorio. Hanno già ricreato caratteristiche chiave di condizioni genetiche e persino individuato un farmaco promettente. Potrebbe accelerare i trattamenti e ridurre la dipendenza dai test sugli animali. Fantastico!

La vignetta della settimana

La puntata della settimana del Late Tech Show

L'intelligenza artificiale non è più solo una promessa, ma una realtà che sta trasformando il business! Nella nuova puntata del LateTechShow, Gigi Beltrame ci porta nel cuore dell'innovazione con tre ospiti d'eccezione che stanno guidando il cambiamento nel mondo digitale B2B. Ecco cosa non potete perdere:
• Mario Derba (Broadcom): Il Private Cloud sta riacquistando importanza strategica, eguagliando il Public Cloud. Con VMware Cloud Foundation (VCF 9.0) e ingenti investimenti in R&D, Broadcom abilita l'AI on-premise con ottimizzazione GPU2, affrontando "costi, complessità e compliance" con "piattaforma, processi e persone".
• Hammad Hussain (Oracle): Siamo nell'era degli Agenti AI, ma molti progetti pilota restano bloccati. Oracle Fusion AI Studio è la soluzione per aiutare le aziende a scalare rapidamente l'adozione dell'IA, consentendo anche agli utenti business di creare i propri agenti con centinaia di modelli predefiniti. Oracle adotta una strategia agnostica verso gli LLM, offrendo la scelta tra vari fornitori perché "un solo LLM non va bene per tutto"
• Luca Curtarelli (Alibaba.com): L'Italia è una priorità assoluta per Alibaba.com. Le PMI italiane hanno mostrato una risposta "straordinaria": il numero di seller è quasi triplicato e i prodotti Made in Italy caricati sono cresciuti del 570% negli ultimi 12 mesi, raggiungendo oltre 110 paesi. Alibaba.com sta investendo nell'intelligenza artificiale con gli "Smart Assistant" che semplificano i processi per le PMI, con un'adozione già al 50% tra i venditori. Appuntamento a novembre a Londra per CoCreate, l'evento flagship di Alibaba.com con una competizione per le PMI e un montepremi di 1 milione di dollari.

e in versione Youtube.

E gli Smartbreak

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.

fammi sapere cosa ne pensi

Se non vi siete ancora iscritti, fatelo, mi permettete di comprendere che apprezzate il mio lavoro.

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine LinkedInInstagram FacebookYoutube


https://gigibeltrame.substack.com/p/i-passi-da-gigante-dellai-della-robotica