Google har presenterat ett betydande framsteg för sin flaggskeppsmodell inom AI genom introduktionen av Deep Think-läget för Gemini 2.5 Pro, vilket markerar ett stort steg framåt inom AI-resonemang.
Deep Think bygger på banbrytande forskning inom parallella tänkandetekniker och gör det möjligt för modellen att utforska och utvärdera flera potentiella lösningar samtidigt innan den ger ett svar. Detta tillvägagångssätt speglar hur mänskliga experter angriper komplexa problem genom att överväga olika perspektiv och hypoteser.
"Det använder vår senaste banbrytande forskning inom resonemang – inklusive parallella tänkandetekniker – vilket resulterar i otrolig prestanda," förklarade Demis Hassabis, VD för Google DeepMind, under tillkännagivandet på Google I/O 2025.
Det nya läget har visat exceptionella resultat på utmanande benchmarktester. Det uppnådde en imponerande poäng på 2025 års United States of America Mathematical Olympiad (USAMO), som anses vara en av de svåraste matematikbenchmarkerna som finns. Deep Think leder även på LiveCodeBench, ett svårt benchmarktest för tävlingskodning, och nådde 84 % på MMMU, som testar multimodalt resonemang över olika uppgifter.
Utöver Deep Think har Google avsevärt förbättrat säkerheten i hela Gemini 2.5-familjen. Företaget har infört avancerade skydd mot indirekta prompt injection-attacker – där skadliga instruktioner bäddas in i data som en AI-modell hämtar. Enligt Google har deras nya säkerhetsstrategi avsevärt ökat Geminis skydd mot dessa attacker vid verktygsanvändning, vilket gör 2.5-serien till Googles säkraste modellfamilj hittills.
Google tar en försiktig strategi vid lanseringen av Deep Think. "Eftersom vi definierar gränsen med 2.5 Pro DeepThink tar vi extra tid för att genomföra fler säkerhetsutvärderingar och inhämta ytterligare synpunkter från säkerhetsexperter," uppgav företaget. Inledningsvis kommer Deep Think endast att vara tillgängligt för betrodda testare via Gemini API för att samla in feedback innan en bredare lansering.
Företaget meddelade också förbättringar av Gemini 2.5 Flash, dess mer effektiva modell som är utformad för hastighet och låg kostnad. Den uppdaterade versionen använder 20–30 % färre tokens samtidigt som den levererar förbättrad prestanda inom resonemang, multimodalitet, kod och långkontext-benchmarktester.