Google przygotowuje się do znaczącego rozszerzenia swoich możliwości AI wraz z nadchodzącą ogólnodostępną premierą Gemini 2.5 Pro w czerwcu 2025 roku.
Zgodnie z najnowszymi zapowiedziami Google DeepMind, Gemini 2.5 Flash jest już dostępny dla wszystkich w aplikacji Gemini, a wczesnym latem trafi do Google AI Studio dla deweloperów oraz Vertex AI dla przedsiębiorstw. Potężniejsza wersja Gemini 2.5 Pro pojawi się niedługo później.
Najważniejszą cechą modelu 2.5 Pro jest Deep Think — eksperymentalny tryb rozszerzonego rozumowania, który pozwala modelowi rozważać wiele hipotez przed udzieleniem odpowiedzi. Funkcja ta została zaprojektowana z myślą o wyjątkowo złożonych zadaniach matematycznych i programistycznych. Google chwali się imponującymi wynikami na wymagających benchmarkach, takich jak Olimpiada Matematyczna USA 2025 oraz LiveCodeBench — konkursowy benchmark kodowania.
„Testując granice możliwości rozumowania Gemini, zaczynamy eksperymentować z trybem Deep Think, który wykorzystuje nowe techniki badawcze umożliwiające modelowi rozważanie wielu hipotez przed odpowiedzią” — poinformowało Google w najnowszym wpisie na blogu.
Bezpieczeństwo to jeden z głównych priorytetów rodziny Gemini 2.5. Google wdrożyło zaawansowane zabezpieczenia, które znacząco zwiększyły odporność Gemini na pośrednie ataki typu prompt injection podczas korzystania z narzędzi. Ataki te polegają na umieszczaniu złośliwych instrukcji w danych pobieranych przez model AI. Dzięki automatycznym testom odporności (red teaming) i wzmocnieniu modelu, Google znacząco obniżyło skuteczność takich ataków, czyniąc rodzinę 2.5 najbezpieczniejszym modelem w historii firmy.
Oprócz usprawnień w zakresie bezpieczeństwa, Google wprowadza do Gemini API i Vertex AI możliwości komputerowego wykorzystania Project Mariner. Firmy takie jak Automation Anywhere, UiPath, Browserbase i inne już badają potencjał tych rozwiązań w automatyzacji i usprawnianiu procesów biznesowych.
Dodatkowe funkcje, które pojawią się zarówno w 2.5 Pro, jak i 2.5 Flash, to podsumowania toku rozumowania (thought summaries), które organizują proces myślowy modelu w przejrzystą formę, oraz natywna obsługa dźwięku z wieloma mówcami w ponad 24 językach.
W miarę jak Google rywalizuje na coraz bardziej konkurencyjnym rynku AI, te ulepszenia Gemini 2.5 Pro stanowią istotny postęp w zakresie rozumowania, bezpieczeństwa i funkcjonalności multimodalnej.