Google ogłosiło znaczący postęp w rozwoju swojego flagowego modelu AI, wprowadzając tryb Deep Think dla Gemini 2.5 Pro, co stanowi duży krok naprzód w zakresie możliwości rozumowania sztucznej inteligencji.
Deep Think wykorzystuje najnowsze osiągnięcia w dziedzinie równoległego myślenia, umożliwiając modelowi jednoczesne analizowanie i ocenianie wielu potencjalnych rozwiązań przed udzieleniem odpowiedzi. Takie podejście odzwierciedla sposób, w jaki eksperci ludzcy podchodzą do skomplikowanych problemów, rozważając różne perspektywy i hipotezy.
"Wykorzystuje nasze najnowsze przełomowe badania w zakresie rozumowania – w tym techniki równoległego myślenia – co przekłada się na niesamowite wyniki," wyjaśnił Demis Hassabis, CEO Google DeepMind, podczas prezentacji na Google I/O 2025.
Nowy tryb wykazał wyjątkowe rezultaty w wymagających testach. Uzyskał imponujący wynik w 2025 United States of America Mathematical Olympiad (USAMO), uznawanym za jeden z najtrudniejszych testów matematycznych na świecie. Deep Think prowadzi także w rankingu LiveCodeBench – trudnym benchmarku dla programowania na poziomie konkursowym – oraz osiągnął 84% w MMMU, który sprawdza rozumowanie multimodalne w różnorodnych zadaniach.
Oprócz Deep Think, Google znacząco wzmocniło zabezpieczenia w całej rodzinie Gemini 2.5. Firma wdrożyła zaawansowane mechanizmy ochrony przed pośrednimi atakami typu prompt injection, polegającymi na ukrywaniu złośliwych instrukcji w danych pobieranych przez model AI. Według Google, nowe podejście do bezpieczeństwa znacząco zwiększyło skuteczność ochrony Gemini przed tego typu atakami podczas korzystania z narzędzi, czyniąc serię 2.5 najbezpieczniejszą rodziną modeli w historii firmy.
Google podchodzi ostrożnie do wdrażania trybu Deep Think. "Ponieważ wyznaczamy nowe granice z 2.5 Pro DeepThink, poświęcamy dodatkowy czas na przeprowadzenie kolejnych zaawansowanych ewaluacji bezpieczeństwa i konsultacje z ekspertami," poinformowała firma. Na początku Deep Think będzie dostępny wyłącznie dla zaufanych testerów poprzez API Gemini, aby zebrać opinie przed szerszym udostępnieniem.
Firma ogłosiła także usprawnienia w Gemini 2.5 Flash – bardziej wydajnym modelu zaprojektowanym z myślą o szybkości i niskich kosztach. Zaktualizowana wersja zużywa o 20-30% mniej tokenów, jednocześnie oferując lepsze wyniki w testach rozumowania, multimodalności, kodowania oraz przetwarzania długich kontekstów.