Google je najavio značajan napredak za svoj vodeći AI model uvođenjem načina Deep Think za Gemini 2.5 Pro, što predstavlja veliki iskorak u sposobnostima zaključivanja umjetne inteligencije.
Deep Think koristi najnovija istraživanja u tehnikama paralelnog razmišljanja, omogućujući modelu da istovremeno istražuje i procjenjuje više mogućih rješenja prije nego što ponudi odgovor. Ovakav pristup oponaša način na koji stručnjaci rješavaju složene probleme, razmatrajući različite kutove i hipoteze.
"Koristi naša najnovija istraživanja u zaključivanju – uključujući tehnike paralelnog razmišljanja – što rezultira nevjerojatnim performansama," objasnio je Demis Hassabis, izvršni direktor Google DeepMinda, tijekom predstavljanja na Google I/O 2025.
Novi način rada pokazao je iznimne rezultate na zahtjevnim testovima. Ostvario je impresivan rezultat na USAMO 2025 (United States of America Mathematical Olympiad), jednom od najtežih matematičkih testova na svijetu. Deep Think također prednjači na LiveCodeBench-u, zahtjevnom testu za natjecateljsko programiranje, te je postigao 84% na MMMU testu, koji provjerava multimodalno zaključivanje kroz razne zadatke.
Osim Deep Thinka, Google je značajno unaprijedio sigurnost cijele Gemini 2.5 serije. Tvrtka je implementirala napredne zaštite protiv neizravnih napada putem promptova – kada se zlonamjerne upute ubacuju u podatke koje AI model preuzima. Prema Googleu, njihov novi sigurnosni pristup znatno je povećao stopu zaštite Geminija od takvih napada tijekom korištenja alata, čime je serija 2.5 postala najsigurnija obitelj modela do sada.
Google pristupa oprezno uvođenju Deep Thinka. "Budući da s 2.5 Pro DeepThinkom definiramo granice mogućeg, uzimamo dodatno vrijeme za dodatne sigurnosne evaluacije i konzultacije sa stručnjacima za sigurnost," naveli su iz tvrtke. U početku će Deep Think biti dostupan samo pouzdanim testerima putem Gemini API-ja, kako bi se prikupile povratne informacije prije šireg lansiranja.
Tvrtka je također najavila poboljšanja za Gemini 2.5 Flash, svoj učinkovitiji model dizajniran za brzinu i niske troškove. Ažurirana verzija koristi 20-30% manje tokena, a pritom pruža poboljšane rezultate na testovima zaključivanja, multimodalnosti, programiranja i dugih konteksta.