Google oficjalnie udostępniło Gemini 2.5 Pro deweloperom i przedsiębiorstwom, po wcześniejszej premierze Gemini 2.5 Flash. Wersja Pro wprowadza istotny postęp w zakresie możliwości rozumowania sztucznej inteligencji.
Najważniejszą cechą Gemini 2.5 Pro jest Deep Think — eksperymentalny, ulepszony tryb rozumowania, który pozwala modelowi rozważać wiele hipotez przed udzieleniem odpowiedzi na zapytania. Jak podkreśla Demis Hassabis, CEO Google DeepMind, Deep Think wykorzystuje „najnowocześniejsze badania z zakresu myślenia i rozumowania, w tym techniki myślenia równoległego”. Ta funkcja osiągnęła imponujące wyniki w wymagających testach, takich jak Olimpiada Matematyczna USA 2025 oraz LiveCodeBench — trudny benchmark dla kodowania na poziomie konkursowym.
Bezpieczeństwo było kluczowym aspektem tej aktualizacji. Google znacząco zwiększyło poziom ochrony Gemini przed pośrednimi atakami typu prompt injection podczas korzystania z narzędzi, wdrażając nowatorskie podejście do zabezpieczeń. Obejmuje ono automatyczne testowanie podatności (ART) oraz wzmacnianie modelu, polegające na dostrajaniu modelu na zbiorach danych realistycznych scenariuszy w celu identyfikowania i ignorowania złośliwych, ukrytych instrukcji. Te usprawnienia sprawiają, że Gemini 2.5 to najbezpieczniejsza rodzina modeli Google do tej pory.
Kolejną ważną nowością jest integracja możliwości korzystania z komputera w ramach Project Mariner z Gemini API i Vertex AI. Project Mariner pozwala agentom AI opartym na Gemini nawigować po przeglądarkach internetowych i wykonywać zadania dla użytkowników. Firmy takie jak Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company oraz Cartwheel już testują te możliwości, a Google planuje szersze udostępnienie funkcji deweloperom latem tego roku.
W ramach aktualizacji wprowadzono także podsumowania toku rozumowania w Gemini API i Vertex AI, które zwiększają przejrzystość działania modelu poprzez organizowanie surowych „myśli” modelu w czytelny format z nagłówkami, kluczowymi informacjami i opisem podejmowanych działań.
Gemini 2.5 Flash jest obecnie dostępny w wersji podglądowej w Google AI Studio dla deweloperów, w Vertex AI dla firm oraz w aplikacji Gemini dla użytkowników indywidualnych, a ogólna dostępność spodziewana jest na początku czerwca. Gemini 2.5 Pro pojawi się wkrótce potem, przy czym Deep Think będzie początkowo dostępny wyłącznie dla zaufanych testerów, podczas gdy Google przeprowadzi dodatkowe oceny bezpieczeństwa.