martedì 11 marzo 2025

La terza ondata di AI generativa

Gli sviluppi dell’intelligenza artificiale di questa settimana evidenziano una crescente competizione nel settore AI, con un focus su funzionalità avanzate, personalizzazione e integrazione in strumenti quotidiani. Nel frattempo emergono con maggior vigore gli interrogativi su costi, privacy e implicazioni etiche, come il bilanciamento tra l'uso di AI e risorse umane, e l'uso del sistema legale per scopi competitivi. Le innovazioni presentate da OpenAI, Google, Microsoft e DuckDuckGo mostrano come l'AI stia diventando sempre più centrale in ambiti che vanno dalla ricerca alla creatività, dallo sviluppo software alla sicurezza personale.

Cosa aspetti a iscriverti?

Partiamo con un effetto WOW

Una nuova IA parlante sta lasciando gli utenti senza parole (in inglese, non chiedete di parlare in italiano!), con una donna e un uomo che conversano con noi con un modello che è estremamente realistico e gratuito. Sesame ha creato questo modello, che risponde con emozioni sincere e linguaggio naturale a un livello mai visto prima. Si è autodescritto come "impercettibilmente umano". Provalo qui.

Grazie per aver letto Techy di Gigi Beltrame! Iscriviti gratuitamente per ricevere nuovi post e supportare il mio lavoro.

AI in ogni dispositivo

Dal Mobile World Congress quello che sembra essere emerso è che ogni dispositivo avrà un’intelligenza artificiale integrata. Ma a quel punto, quale sarà la discriminante? Google si è presa un vantaggio enorme, non è un caso per cui l’azienda ha vinto per due anni consecutivi il premio di prodotto dell’anno, quest’anno con il Pixel 9 Pro.

La diversificazione sarà sempre l’anima del progresso? Domanda difficile, già da tempo abbiamo computer che sono praticamente standard… vedremo.

I modelli che ragionano e la terza onda

L’intervista a Nicola Grandis che ho fatto qualche settimana fa anticipando molti (che ancora non se ne sono accorti) non mostrava solo il senso di italianità nell’intelligenza artificiale, perché questo è qualcosa di evidente, ma ha mostrato che l’intelligenza artificiale generativa è entrata in una nuova fase, in cui il “ragionamento” e la specializzazione fanno la differenza.

Vitruvian-1, sviluppato con “solo” 14 miliardi di parametri, affronta complessi problemi in matematica, fisica e medicina, non è semplicemente un chatbot che risponde a domande, a prompt, e poi risponde. È un motore di ragionamento. Ovviamente non è l’unico modello che ha fatto questo passo, ma è evidente che la strada intrapresa dall’AI generativa è questa.

Bisogna considerare che i passi in avanti che possiamo pretendere dai modelli “generalisti” sono sempre meno significativi, OpenAI con il 4.5 ha ricevuto molte critiche.

Questi modelli vanno verso un “risparmio” di infrastrutture e costi accessibili per gli utenti, mentre altri modelli, più complessi, si stanno affacciando, con costi di utilizzo esorbitanti.

Stiamo entrando in una nuova fase, la terza.

Prima i modelli GPT (Generative Pre-trained Transformer), poi gli agenti, ora i modelli che ragionano.

OpenAI e i modelli avanzati

OpenAI sta pianificando il rilascio di modelli AI più avanzati, definiti "agenti" (che nome innovativo), con prezzi che variano in base alle funzionalità. Secondo indiscrezioni, i costi mensili potrebbero essere:

  • 2.000 dollari per agenti di ricerca di base, utili per attività come la raccolta di informazioni per video o articoli.

  • 10.000 dollari per agenti di sviluppo software, capaci di scrivere codice in modo più autonomo.

  • 20.000 dollari per agenti di livello "PhD", in grado di svolgere ricerche accademiche avanzate.

Questi prezzi non sono ancora confermati ufficialmente, ma OpenAI starebbe testando il mercato per capire la risposta degli utenti. Si è anche discusso del fatto che tali costi potrebbero essere paragonabili all'assunzione di personale umano altamente qualificato, sollevando interrogativi sull'effettiva convenienza di questi strumenti.

Gli utenti del piano "Plus" di ChatGPT hanno ora accesso al modello GPT-4.5, inizialmente riservato agli abbonati "Pro" (200 dollari al mese). Sebbene inizialmente il nuovo modello non abbia impressionato, con problemi come errori di ortografia, si è rivelato particolarmente utile per compiti creativi come la scrittura, la creazione di riassunti e la stesura di script per video, distinguendosi come uno dei migliori modelli per queste attività.

Gli utenti di ChatGPT su Mac (piani Plus, Pro o Team) possono ora utilizzare una funzione che permette di modificare direttamente il codice all'interno di ambienti di sviluppo integrati (IDE), come Visual Studio Code.

Ottimizzare la produzione di prodotti fisici

Larry Page, co-fondatore di Google, sta lanciando una start-up chiamata Dynatomics, che utilizza l'intelligenza artificiale per ottimizzare la produzione dei prodotti, ridurre i costi e gli sprechi. L'obiettivo è simulare la produzione di un oggetto, identificare i punti deboli e i colli di bottiglia, anticipare le difficoltà e aumentare l'efficienza.

"Stiamo cercando di utilizzare l'AI per creare un'immagine precisa della fabbrica di un cliente e aiutarlo a identificare le aree dove si possono ottenere migliori risultati".

Alibaba punta sul modello generale e per tutti (ma con problemi seri)

L'algoritmo di generazione video AI "Wan 2.1" di Alibaba, rilasciato gratuitamente su Github, è stato rapidamente adottato dalla comunità di fan del contenuto pornografico, che ne ha già creato decine di video rielaborati. L'accessibilità di tecnologia di AI su fonti pubbliche presenta pericoli non solo legati a libertà ma anche rischi di appropriazione indebita.

Il porno è stato una killer application per la diffusione di internet, non ci si può dimenticare della storia.

Potete provare, mi raccomando legalmente(!), il modello qui (ve lo dico, a a scanso di equivoci, per altri fini dovrete scaricarvi il modello, qui non funziona).

Microsoft punta su Think Deeper

Microsoft ha aggiornato la funzionalità "Think Deeper" di Copilot con il modello di intelligenza artificiale "o3-mini-high" di OpenAI, consentendo a tutti gli utenti di accedere gratuitamente a un modello di ragionamento avanzato paragonabile a quello degli abbonati premium di ChatGPT. Questa innovazione deriva dai modelli "o1" di OpenAI, progettati per dedicare più tempo al ragionamento prima di rispondere, consentendo di affrontare problemi complessi in ambiti come scienza, programmazione e matematica.

Il futuro della creatività è nelle conversazioni e i brand agent

Microsoft Advertising Accelerate ha annunciato rilasci di prodotti innovativi che aiuteranno a trasformare l'esperienza dei clienti attraverso esperienze conversazionali. In pratica, un sistema che unisce attività diverse come la ricerca, lo shopping e l'intrattenimento. La generazione di AI, come chatbot e agenti, potenzia l'esperienza di scoperta e produttività, consentendo di effettuare anche rapidissimi passaggi tra ricerca, acquisto e intrattenimento. L'utilizzo della lingua naturale può liberare scambi più facili tra consumatori, marche, editori e piattaforme pubblicitarie, garantendo metodi sicuri e rispettosi della privacy. Sono in arrivo anche i brand agent, che sono essenzialmente software programmi che possono velocemente svolgere compiti e prendere decisioni.

L’agente per le vendite di Microsoft

Microsoft sta creando un nuovo agente AI per i venditori per aiutarli a ridurre i compiti monotoni e dedicare più tempo a concludere affari importanti. . L'obiettivo è dare ai venditori più tempo da destinare a contratti più importanti, che richiedono un tocco umano.

Google: Nuove modalità AI e funzionalità

Google ha sviluppato una nuova modalità AI, simile a quella di Perplexity e OpenAI, che consente di effettuare ricerche sul web, raccogliere fonti e generare risposte basate su queste informazioni. Questa funzione, non ancora disponibile al pubblico ma accessibile a un numero limitato di utenti tramite Google Labs, ha un'interfaccia che mostra le fonti utilizzate in una barra laterale, simile a Perplexity.

Ma ha anche introdotto alcune funzionalità AI in Google Shopping, come la possibilità di generare immagini di oggetti (ad esempio, un vestito colorato con margherite) e trovare prodotti reali simili. Inoltre, sono disponibili strumenti di prova virtuale per trucco e abbigliamento, utilizzando modelli di diverse forme e dimensioni per aiutare gli utenti a visualizzare i prodotti.

E poi gli utenti business di Google Workspace hanno ora accesso a nuove funzionalità AI in Google Sheets, ovviamente basate sul modello Gemini. Queste permettono di analizzare dati, individuare correlazioni e anomalie, e generare insight. Un esempio pratico è l'analisi di un diario alimentare per trovare correlazioni tra cibi consumati e problemi di salute, come mal di stomaco o mal di testa.

E per gli Android, arriva la possibilità di condividere con Gemini lo schermo dello smartphone o la camera per richiedere informazioni. Sempre sugli smartphone, Google ha implementato una funzione per rilevare messaggi di testo sospetti e potenziali truffe, avvisando gli utenti e offrendo opzioni per bloccare e segnalare i numeri.

Duck.AI e l’intelligenza artificiale anonima

DuckDuckGo, noto per la sua attenzione alla privacy, ha introdotto nuove funzionalità AI.

Tramite il sito duck.ai, gli utenti possono accedere gratuitamente a chatbot AI popolari (come GPT-4, Llama 3.3, Claude Haiku e altri) in modo completamente anonimo, senza che le conversazioni vengano utilizzate per addestrare i modelli. Durante le ricerche sul motore di ricerca DuckDuckGo, gli utenti possono visualizzare risposte generate dall'AI che integrano informazioni da fonti web, come guide su come cambiare una gomma, citando le fonti utilizzate.

Il telefono senza interfaccia (solo AI)

Deutsche Telekom (la società madre di T-Mobile) sta lavorando a qualcosa di audace: un telefono senza app ,che funziona esclusivamente con assistenti AI.

Invece di aprire un'app per prenotare un taxi, inviare un'e-mail o riprodurre musica, parlerai semplicemente con Magenta AI, l'assistente integrato. L'AI gestirà tutto, quindi niente swipe e niente infiniti aggiornamenti delle app.

Il telefono utilizzerà Perplexity AI come motore principale, con il supporto di Google Cloud AI, ElevenLabs e Picsart. Ma ecco una buona notizia.

E se la moda con l’AI si rifacesse al passato?

Norma Kamali avvia una collaborazione con Maison Meta, uno studio creativo di New York, per sperimentare l'uso dell'Intelligenza Artificiale nella moda. La 70enni designer sottolinea voler continuare il proprio "vocabolario creativo" e l'eredità della casa di moda diretta per cinquant'anni, anziché rimpiazzare il talento umano con la tecnologia. Maison Meta sta addestrando l'Intelligenza Artificiale mediante l'etichettatura di immagini d'archivio con parole chiave. Il fondatore, Cyril Foiret, ha spiegato che il processo è "piuttosto pesante" e richiede sette ore di formazione per 1.500-2.000 immagini, prima di procedere al passaggio successivo. Le prime immagini, con costumi da bagno, le trovate qui.

Manus promette miracoli (e li fa anche)

Sorge l'era degli agenti AI, con l'avvento di Manus, fa un passo in avanti significativo. Nuovo sistema cinese che può eseguire fino a 50 attività contemporaneamente come l'analisi dei social media, la creazione e pubblicazione di contenuti, le transazioni finanziarie e la ricerca online. Per ora bisogna essere invitati all’utilizzo, ma è evidente che questa strada ha interessanti sbocchi di business, ma anche di preoccupazione.

Proviamo a riflettere

La puntata del Late Tech Show

In questa puntata parliamo di: • Sicurezza informatica: scopri le ultime tendenze e come proteggere le aziende • Donne e STEM: focus sulla formazione e sulle opportunità per le donne nel mondo della tecnologia, con un'App adeguata • Subscription economy: cos'è e come sta cambiando il mercato del tech, ma anche dei piccoli elettrodomestici Con: Ilaria Cecchini di Women at Business, Luca Nilo Livrieri di CrowdStrike, Vincenzo Granato di Commvault, Filippo Rocca di Subbyx-

Qui la versione su Youtube, con i capitoli delle interviste.

Gli SmartBreak

Gli appuntamenti live alle 11:00 sui miei profili social e quelli di alcune associazioni sono ripresi, ma vanno un po’ a rilento. Qui il podcast che parte spunto proprio dalle dirette.

I miei libri

LASCIAMI UN MESSAGGIO

Fammi sapere cosa ti ha colpito delle cose che faccio o racconto nei vari eventi, o di quello che ascolti al Late Tech Show, piuttosto che negli SmartBreak (e dal podcast "Vita da ufficio") o che leggi nella newsletter Techy.
Ti prego di farmi conoscere cosa pensi possa essere migliorato, aiutami con le critiche, e soprattutto quali temi vorresti che venissero approfonditi o trattati.
GRAZIE

fammi sapere cosa ne pensi

Se non sei ancora iscritto, fallo, mi permetti di comprendere che apprezzi il mio lavoro.

Iscritto

Più persone la leggono, meglio è, quindi, per favore, condividilo con la tua famiglia, amici e colleghi per far sì che gli effetti di rete si diffondano.

Assicurati di aggiungere gigibeltrame@substack.com ai tuoi contatti. In Gmail, trascina questa newsletter nella tua scheda principale.

Grazie per aver letto questa newsletter, le trovi tutte a questo link.

💻sito del Late Tech Show

💁‍♂️ La Bio

📚 Scopri i miei libri

Newsletter #Techy

👍 Seguimi su:
Magazine LinkedInInstagram FacebookYoutube

Grazie per aver letto Techy di Gigi Beltrame!

Cosa aspetti a iscriverti?

Share:

Related Posts: