Google ha annunciato un importante passo avanti per il suo modello di intelligenza artificiale di punta con l’introduzione della modalità Deep Think per Gemini 2.5 Pro, rappresentando un salto di qualità nelle capacità di ragionamento dell’IA.
Deep Think sfrutta le più recenti ricerche sulle tecniche di pensiero parallelo, permettendo al modello di esplorare e valutare simultaneamente molteplici soluzioni potenziali prima di fornire una risposta. Questo approccio rispecchia il modo in cui gli esperti umani affrontano problemi complessi, considerando diverse prospettive e ipotesi.
"Utilizza le nostre ricerche più avanzate nel campo del ragionamento – incluse le tecniche di pensiero parallelo – ottenendo prestazioni incredibili", ha spiegato Demis Hassabis, CEO di Google DeepMind, durante l’annuncio al Google I/O 2025.
La nuova modalità ha dimostrato risultati eccezionali su benchmark particolarmente impegnativi. Ha raggiunto un punteggio impressionante all’Olimpiade Matematica degli Stati Uniti d’America 2025 (USAMO), considerata uno dei test matematici più difficili al mondo. Deep Think è inoltre in testa su LiveCodeBench, un benchmark complesso per la programmazione a livello competitivo, e ha ottenuto l’84% su MMMU, che valuta il ragionamento multimodale su compiti diversificati.
Oltre a Deep Think, Google ha notevolmente rafforzato la sicurezza dell’intera famiglia Gemini 2.5. L’azienda ha implementato avanzate misure di protezione contro gli attacchi di prompt injection indiretti, in cui istruzioni malevole vengono inserite nei dati recuperati dal modello IA. Secondo Google, il nuovo approccio di sicurezza ha incrementato in modo sostanziale il tasso di protezione di Gemini contro questi attacchi durante l’uso degli strumenti, rendendo la serie 2.5 la famiglia di modelli più sicura mai realizzata da Google.
Google sta adottando un approccio prudente per il lancio di Deep Think. "Poiché stiamo definendo il confine con 2.5 Pro DeepThink, ci prendiamo più tempo per condurre ulteriori valutazioni di sicurezza di frontiera e raccogliere altri pareri da esperti di sicurezza", ha dichiarato l’azienda. Inizialmente, Deep Think sarà disponibile solo per tester fidati tramite la Gemini API, al fine di raccogliere feedback prima di una distribuzione più ampia.
L’azienda ha inoltre annunciato miglioramenti per Gemini 2.5 Flash, il modello più efficiente progettato per velocità e basso costo. La versione aggiornata utilizza il 20-30% di token in meno, offrendo al contempo prestazioni migliorate nei benchmark di ragionamento, multimodalità, codice e contesti estesi.