Google sta trasformando il suo modello di intelligenza artificiale più avanzato, Gemini 2.5 Pro, in quello che definisce un 'modello del mondo' – un sistema in grado di comprendere e simulare aspetti della realtà in modi che rispecchiano il funzionamento del cervello umano.
Secondo gli annunci recenti di Google DeepMind durante il Google I/O 2025, questa capacità di modello del mondo permetterà a Gemini di pianificare e immaginare nuove esperienze comprendendo e simulando aspetti del mondo. Si tratta di una grande evoluzione nella capacità dell’IA di ragionare e interagire con ambienti complessi.
"Per questo stiamo lavorando per estendere il nostro miglior modello multimodale di base, Gemini 2.5 Pro, affinché diventi un 'modello del mondo' capace di pianificare e immaginare nuove esperienze comprendendo e simulando aspetti del mondo, proprio come fa il cervello", ha dichiarato Google nel suo blog ufficiale.
L’approccio del modello del mondo si basa sull’ampia ricerca di Google nell’addestramento di agenti IA a padroneggiare giochi complessi e creare simulazioni interattive. Le prove di queste capacità stanno già emergendo nella capacità di Gemini di utilizzare conoscenze sul mondo e ragionamento per rappresentare ambienti naturali, comprendere la fisica intuitiva e insegnare ai robot a seguire istruzioni e adattarsi in tempo reale.
Al centro di questa evoluzione c’è la nuova funzione Deep Think, una modalità sperimentale di ragionamento avanzato per Gemini 2.5 Pro. Deep Think consente al modello di valutare più ipotesi prima di rispondere, migliorando significativamente le prestazioni in compiti complessi di matematica e programmazione. La funzione ha già ottenuto risultati notevoli in benchmark impegnativi come la competizione matematica USAMO 2025 e LiveCodeBench per il coding.
Gemini 2.5 Pro con Deep Think è attualmente disponibile per tester selezionati tramite l’API Gemini, mentre Google sta conducendo ulteriori valutazioni di sicurezza prima di un rilascio più ampio. Nel frattempo, il modello standard Gemini 2.5 Pro dovrebbe essere generalmente disponibile entro la fine di giugno 2025, dopo il rilascio anticipato di Gemini 2.5 Flash.
Questo progresso verso la modellazione del mondo fa parte della visione più ampia di Google di creare un assistente IA universale, capace di comprendere il contesto, pianificare efficacemente e agire su diversi dispositivi – trasformando in definitiva il modo in cui gli esseri umani interagiscono con i sistemi di intelligenza artificiale.