Il prodotto di casa OpenAI sembra voler portare una nuova rivoluzione. Ecco cosa ne pensano gli esperti
ZURIGO - La nuova intelligenza artificiale di Open AI, GPT-4o, sta facendo scalpore. È in grado di cantare, essere creativa e leggere le tue emozioni. Ecco quali sono le funzioni più importanti introdotte dal nuovo software, valutate da due professionisti: Karin Frick, ricercatrice presso l'Istituto Gottlieb Duttweiler, e Mark Cieliebak del “Centro per l'intelligenza artificiale” dell'Università di Scienze applicate di Zurigo (ZHAW).
1. GPT-4o legge le tue emozioni
GPT-4o può rilevare le emozioni attraverso la tua voce, tramite la fotocamera o dal modo in cui respiri. L'intelligenza artificiale è in grado pure di simulare emozioni umane e può cambiare tono spontaneamente.
«L'AI trae vantaggio dal fatto che le persone sono facili da leggere», spiega Karin Frick. Per riconoscere le emozioni, può prendere informazioni dalle espressioni facciali, dalla voce, dal ritmo e dalla velocità con cui si parla, così come dalle parole che vengono usate. GPT-4o sta portando alle masse questa conoscenza, già da tempo a disposizione nel campo della ricerca e già usata dalle aziende.
2. GPT-4o può comunicare con te in tempo reale
Con GPT-4o puoi conversare. L'intelligenza artificiale risponde alle domande in tempo reale e reagisce a ciò che il tuo telefono sta riprendendo con la fotocamera.
«Se ne parla da molto tempo, ora sta diventando realtà anche per chi non lavora nel campo della ricerca», prosegue Frick. Il requisito fondamentale per un buon chatbot è che tu possa interagire con un’intelligenza artificiale in modo naturale. La vera domanda, però, è se le persone vogliano parlare con un’AI.
3. GPT-4o può essere creativo e cantare
GPT-4o ha una vena creativa: l'AI non solo può tenere conversazioni e fare scherzi, ma anche creare musica e cantare.
«Questo è il passo successivo ed è paragonabile alle AI in grado di generare nuove immagini», spiega Frick. GPT-4o non è l'unica intelligenza artificiale che canta, ma ora la funzione è fruibile dal grande pubblico.
4. GPT-4o combina voce, video, immagini e testo
Molte AI sono mono settoriali. Con GPT-4o le cose sono diverse: l'intelligenza artificiale combina voce, video, immagini e testo in un unico modello.
«Si tratta sicuramente di un grande passo avanti ed è stato davvero impressionante nella demo dimostrativa», commenta Mark Cieliebak. «Sono rimasto particolarmente colpito dalla comunicazione vocale: sembrava una conversazione naturale», ha ammesso.
5. GPT-4o è veloce
Secondo il produttore, GPT-4o ha un tempo medio di risposta all'input vocale di 320 millisecondi. L’intelligenza artificiale reagisce al linguaggio con la stessa rapidità delle persone che conversano tra loro.
«La velocità nella demo era sorprendentemente elevata e si avvicinava alle risposte in tempo reale», conferma Cieliebak. Tuttavia, resta da vedere come si comporterà nella pratica.
Cosa significa GPT-4o per la nostra società? - 20 Minutes ha chiesto lumi a Elisabeth Maier, comprovata esperta nel campo dell'intelligenza artificiale e CEO della società di software Karakun, specializzata in apprendimento automatico, assistenti intelligenti, traduzione automatica e chatbot.
GPT-4o sarà fautrice della prossima rivoluzione nel campo dell'intelligenza artificiale?
«Non la definirei una rivoluzione, ma piuttosto una rapida evoluzione. Le innovazioni avvengono a intervalli sempre più brevi. Ciò che è particolarmente interessante di GPT-4o è il fatto che gli utenti possano interagire con l'intelligenza artificiale utilizzando il linguaggio naturale e combinando video, immagini e testi in tempo reale».
Che impatto avrà GPT-4o sul mondo professionale e sulla società?
Le soluzioni AI come GPT-4o consentono l'interazione indipendentemente dal luogo, dall'ora e dalla lingua. Ciò porta a una democratizzazione della società, poiché tutti hanno accesso alle informazioni che stanno cercando, indipendentemente dalla lingua. E i dipendenti possono essere impiegati sul posto di lavoro indipendentemente dalla loro lingua. L’intelligenza artificiale genera molte nuove aree e opportunità di business.
Ci sono persone che si oppongono all’intelligenza artificiale, altri ne sono sostenitori. GPT-4o rafforza questa divisione?
«Il divario aumenterà sicuramente. Allo stesso tempo, il numero di fan dell’AI aumenterà perché sarà più facile l’interazione con questi sistemi, ad esempio tramite il controllo vocale. Penso, tra le altre cose, alle persone con difficoltà di lettura o agli anziani con minori affinità con il mondo digitale che non hanno utilizzato le precedenti versioni dell'AI. In breve: l'intelligenza artificiale come GPT-4o offre molte nuove opportunità, applicazioni in ambiti ancora più creativo e un accesso senza barriere per tutti».