Google har annonceret et markant fremskridt for sin flagskibs-AI-model med introduktionen af Deep Think-tilstand til Gemini 2.5 Pro, hvilket markerer et stort spring inden for AI’s ræsonnementsevner.
Deep Think udnytter banebrydende forskning i parallelle tænketeknikker, så modellen kan undersøge og vurdere flere potentielle løsninger samtidigt, før den giver et svar. Denne tilgang spejler, hvordan menneskelige eksperter tackler komplekse problemer ved at overveje forskellige vinkler og hypoteser.
"Den bruger vores nyeste banebrydende forskning inden for ræsonnement – herunder parallelle tænketeknikker – hvilket resulterer i enestående præstationer," forklarede Demis Hassabis, CEO for Google DeepMind, under annonceringen på Google I/O 2025.
Den nye tilstand har vist exceptionelle resultater på krævende benchmarks. Den opnåede en imponerende score ved 2025 United States of America Mathematical Olympiad (USAMO), der betragtes som en af de sværeste matematik-benchmarks. Deep Think fører også på LiveCodeBench, en udfordrende benchmark for konkurrencekodning, og scorede 84% på MMMU, som tester multimodal ræsonnement på tværs af forskellige opgaver.
Ud over Deep Think har Google markant forbedret sikkerheden i hele Gemini 2.5-familien. Virksomheden har implementeret avancerede sikkerhedsforanstaltninger mod indirekte prompt-injektionsangreb – hvor ondsindede instruktioner indlejres i data, som en AI-model henter. Ifølge Google har deres nye sikkerhedstilgang væsentligt øget Geminis beskyttelsesrate mod disse angreb under værktøjsbrug, hvilket gør 2.5-serien til Googles mest sikre modelfamilie til dato.
Google tager en forsigtig tilgang til udrulningen af Deep Think. "Fordi vi definerer frontlinjen med 2.5 Pro DeepThink, tager vi os ekstra tid til at gennemføre flere avancerede sikkerhedsevalueringer og indhente yderligere input fra sikkerhedseksperter," udtaler virksomheden. Indledningsvist vil Deep Think kun være tilgængelig for betroede testere via Gemini API for at indsamle feedback før bredere lancering.
Virksomheden annoncerede også forbedringer af Gemini 2.5 Flash, dens mere effektive model designet til hastighed og lave omkostninger. Den opdaterede version bruger 20-30% færre tokens, samtidig med at den leverer forbedret præstation inden for ræsonnement, multimodalitet, kode og benchmarks med lange kontekster.