Google znacząco rozbudował swój ekosystem AI, wprowadzając szereg nowych rozwiązań i umacniając pozycję lidera w dziedzinie generatywnej sztucznej inteligencji.
Rodzina Gemini 2.5 powiększyła się – modele Flash i Pro są już dostępne do zastosowań produkcyjnych. Gemini 2.5 Flash i Pro są już stabilne i ogólnie dostępne, co pozwala deweloperom budować aplikacje produkcyjne z pełnym zaufaniem. Firmy takie jak Spline, Rooms, Snap i SmartBear korzystają z tych wersji produkcyjnie już od kilku tygodni. Wzrost popularności i zapotrzebowania na Gemini 2.5 Pro jest najszybszy spośród wszystkich modeli Google do tej pory, co skłoniło firmę do ustabilizowania wersji 06-05 przy zachowaniu dotychczasowej ceny. Google przewiduje, że Pro sprawdzi się najlepiej w zadaniach wymagających najwyższej inteligencji i możliwości, takich jak programowanie czy zadania agentowe.
Dodatkowo Google zaprezentował Gemini 2.5 Flash-Lite w wersji preview – to najtańszy i najszybszy model 2.5 w ofercie. Nowość została zaprojektowana jako ekonomiczne rozwiązanie do zadań wymagających dużej przepustowości, takich jak klasyfikacja czy masowe podsumowania, oferując lepszą wydajność w większości testów, krótszy czas do pierwszego tokena i wyższą liczbę tokenów na sekundę. Flash-Lite to model rozumowania, który pozwala dynamicznie kontrolować budżet „myślenia” poprzez parametr API. W przeciwieństwie do innych modeli z rodziny, domyślnie „myślenie” jest wyłączone, ponieważ Flash-Lite zoptymalizowano pod kątem kosztów i szybkości. Mimo tej optymalizacji obsługuje wszystkie natywne narzędzia, w tym Grounding z Google Search, wykonywanie kodu, kontekst URL oraz wywołania funkcji.
W obszarze generowania obrazów Google wprowadził Imagen 4, zapowiedziany po raz pierwszy podczas I/O 2025 w zeszłym miesiącu. Google określa go jako „najlepszy dotychczasowy model tekst-na-obraz”, oferujący „znacznie lepsze odwzorowanie tekstu” niż wcześniejsze wersje. Nowy model zapewnia wyjątkową klarowność detali, takich jak skomplikowane tkaniny, krople wody czy sierść zwierząt, a także doskonale radzi sobie zarówno ze stylami fotorealistycznymi, jak i abstrakcyjnymi. Inne ulepszenia to obsługa rozdzielczości 2K oraz poprawiona ortografia i typografia. Imagen 4 oraz premium Imagen 4 Ultra są już dostępne dla płatnych użytkowników preview w Gemini API, z ograniczoną możliwością darmowych testów w Google AI Studio. Cena Imagen 4 to 0,04 USD za wygenerowany obraz, natomiast wersja Ultra kosztuje 0,06 USD za obraz.
Nowości uzupełnia Gemini CLI – otwartoźródłowy agent AI, który wprowadza możliwości Gemini bezpośrednio do terminala dewelopera, wspierając programowanie, rozwiązywanie problemów i zarządzanie zadaniami. Użytkownicy mogą korzystać z Gemini 2.5 Pro bezpłatnie, używając osobistego konta Google, lub uzyskać rozszerzony dostęp przez Google AI Studio lub klucze Vertex AI. Gemini CLI oferuje największy na rynku bezpłatny limit wykorzystania: 60 żądań modelu na minutę i 1000 żądań dziennie. Narzędzie zapewnia zaawansowane możliwości AI – od rozumienia kodu i manipulacji plikami, przez wykonywanie poleceń, po dynamiczne rozwiązywanie problemów – stanowiąc fundamentalne usprawnienie pracy z terminalem. Umożliwia pisanie kodu, debugowanie błędów i automatyzację zadań w języku naturalnym.
Te premiery wzmacniają pozycję Google na konkurencyjnym rynku AI, oferując deweloperom i użytkownikom jeszcze potężniejsze, wydajniejsze i bardziej dostępne narzędzia do szerokiego zakresu zastosowań.