Google wykonuje duży krok w stronę agentów AI, wprowadzając tryb Agent dla swojej platformy Gemini, ogłoszony podczas konferencji deweloperskiej Google I/O 2025 w dniu 20 maja.
Tryb Agent, napędzany technologią Project Mariner, przekształca Gemini w autonomicznego asystenta zdolnego do realizowania złożonych, wieloetapowych zadań przy minimalnym nadzorze użytkownika. Funkcja ta umożliwia Gemini przeglądanie stron internetowych, interpretowanie elementów wizualnych i tekstowych oraz wykonywanie działań w imieniu użytkownika.
„Wyobraź sobie, że wystarczy określić swój cel, a Gemini inteligentnie zaplanuje i zrealizuje wszystkie kroki, by go osiągnąć” – wyjaśniło Google w swoim ogłoszeniu. „Tryb Agent płynnie łączy zaawansowane funkcje, takie jak przeglądanie internetu na żywo, dogłębne badania i inteligentne integracje z Twoimi aplikacjami Google.”
Podczas prezentacji CEO Google, Sundar Pichai, pokazał, jak tryb Agent może usprawnić poszukiwanie mieszkania. Sztuczna inteligencja potrafi przeszukiwać oferty na Zillow według kryteriów użytkownika, dostosowywać filtry, a nawet umawiać wizyty w nieruchomościach – wszystko bez konieczności odwiedzania wielu stron czy ręcznego zarządzania szczegółami.
Technologia działa na wirtualnych maszynach w chmurze i może zarządzać nawet dziesięcioma zadaniami jednocześnie, pozwalając użytkownikom skupić się na innych czynnościach, podczas gdy Gemini zajmuje się czasochłonnymi procesami w tle. Ta funkcjonalność stanowi istotny krok naprzód w sposobie, w jaki użytkownicy mogą w przyszłości korzystać z internetu.
W ramach dążenia do standaryzacji branżowej Google ogłosiło również kompatybilność API/SDK Gemini z protokołem Model Context Protocol (MCP) firmy Anthropic. MCP to otwarty standard umożliwiający asystentom AI łączenie się z zewnętrznymi narzędziami, źródłami danych i systemami za pośrednictwem jednolitego protokołu.
„MCP to dobry protokół i szybko staje się otwartym standardem ery agentów AI” – powiedział Demis Hassabis, CEO Google DeepMind, podkreślając zaangażowanie firmy w dalszy rozwój tego rozwiązania wraz z Anthropic i innymi partnerami branżowymi.
Tryb Agent będzie początkowo dostępny dla subskrybentów Google AI Ultra w Stanach Zjednoczonych, a wkrótce planowane jest rozszerzenie na kolejne kraje. Firma udostępni także możliwości Project Mariner deweloperom poprzez API Gemini już tego lata, a zaufani testerzy, tacy jak Automation Anywhere i UiPath, już pracują z tą technologią.