Google on julkistanut merkittävän edistysaskeleen lippulaiva-AI-mallilleen tuomalla Deep Think -tilan Gemini 2.5 Prohon, mikä edustaa suurta harppausta tekoälyn päättelykyvyissä.
Deep Think hyödyntää uusinta tutkimusta rinnakkaisen ajattelun tekniikoista, mahdollistaen mallin useiden potentiaalisten ratkaisujen samanaikaisen tutkimisen ja arvioinnin ennen vastauksen antamista. Tämä lähestymistapa muistuttaa ihmisasiantuntijoiden tapaa ratkaista monimutkaisia ongelmia tarkastelemalla useita näkökulmia ja hypoteeseja.
"Se hyödyntää uusinta huippututkimustamme päättelyssä – mukaan lukien rinnakkaisen ajattelun tekniikat – ja tuloksena on uskomaton suorituskyky", kertoi Google DeepMindin toimitusjohtaja Demis Hassabis Google I/O 2025 -tapahtumassa.
Uusi tila on osoittanut poikkeuksellisia tuloksia haastavissa testeissä. Se saavutti vaikuttavan pistemäärän vuoden 2025 Yhdysvaltain matematiikkaolympialaisissa (USAMO), jota pidetään yhtenä vaikeimmista matemaattisista testeistä. Deep Think johtaa myös LiveCodeBenchissä, joka on kilpailutason ohjelmoinnin vaikea testi, ja saavutti 84 % tuloksen MMMU:ssa, joka mittaa monimuotoista päättelyä erilaisissa tehtävissä.
Deep Thinkin lisäksi Google on merkittävästi parantanut Gemini 2.5 -sarjan tietoturvaa. Yhtiö on ottanut käyttöön edistyneitä suojauksia epäsuoria kehotepistohyökkäyksiä vastaan, joissa haitallisia ohjeita upotetaan dataan, jota AI-malli hakee. Googlen mukaan uusi suojausmenetelmä on huomattavasti lisännyt Geminin torjuntakykyä näitä hyökkäyksiä vastaan työkalujen käytön aikana, tehden 2.5-sarjasta yhtiön tähän asti turvallisimman malliperheen.
Google etenee Deep Thinkin käyttöönotossa varovaisesti. "Koska määrittelemme rajoja 2.5 Pro DeepThinkin kanssa, käytämme enemmän aikaa laajennettuihin turvallisuusarviointeihin ja haemme lisäpalautetta turvallisuusasiantuntijoilta", yhtiö kertoi. Aluksi Deep Think on saatavilla vain luotetuille testaajille Gemini API:n kautta palautteen keräämiseksi ennen laajempaa julkaisua.
Yhtiö ilmoitti myös parannuksista Gemini 2.5 Flashiin, tehokkaampaan ja nopeampaan malliin. Päivitetty versio käyttää 20–30 % vähemmän tokeneita ja tarjoaa samalla parannettua suorituskykyä päättely-, monimuotoisuus-, koodi- ja pitkän kontekstin testeissä.