menu
close

Google prezentuje Agentic Gemini – rewolucję w realizacji złożonych zadań

Podczas Google I/O 2025 firma ogłosiła tryb Agent dla swojej sztucznej inteligencji Gemini, umożliwiający autonomiczne wykonywanie zadań dzięki funkcjom przeglądania internetu opartym na technologii Project Mariner. Nowość pozwoli Gemini realizować złożone zadania, takie jak poszukiwanie mieszkania na stronach typu Zillow – od wyszukiwania ofert po umawianie wizyt. Google zapowiedziało również kompatybilność API/SDK Gemini z protokołem Model Context Protocol firmy Anthropic, co sygnalizuje rosnącą współpracę branżową nad standardami dla agentów AI.
Google prezentuje Agentic Gemini – rewolucję w realizacji złożonych zadań

Google wykonuje duży krok w stronę agentów AI, wprowadzając tryb Agent dla swojej platformy Gemini, ogłoszony podczas konferencji deweloperskiej Google I/O 2025 w dniu 20 maja.

Tryb Agent, napędzany technologią Project Mariner, przekształca Gemini w autonomicznego asystenta zdolnego do realizowania złożonych, wieloetapowych zadań przy minimalnym nadzorze użytkownika. Funkcja ta umożliwia Gemini przeglądanie stron internetowych, interpretowanie elementów wizualnych i tekstowych oraz wykonywanie działań w imieniu użytkownika.

„Wyobraź sobie, że wystarczy określić swój cel, a Gemini inteligentnie zaplanuje i zrealizuje wszystkie kroki, by go osiągnąć” – wyjaśniło Google w swoim ogłoszeniu. „Tryb Agent płynnie łączy zaawansowane funkcje, takie jak przeglądanie internetu na żywo, dogłębne badania i inteligentne integracje z Twoimi aplikacjami Google.”

Podczas prezentacji CEO Google, Sundar Pichai, pokazał, jak tryb Agent może usprawnić poszukiwanie mieszkania. Sztuczna inteligencja potrafi przeszukiwać oferty na Zillow według kryteriów użytkownika, dostosowywać filtry, a nawet umawiać wizyty w nieruchomościach – wszystko bez konieczności odwiedzania wielu stron czy ręcznego zarządzania szczegółami.

Technologia działa na wirtualnych maszynach w chmurze i może zarządzać nawet dziesięcioma zadaniami jednocześnie, pozwalając użytkownikom skupić się na innych czynnościach, podczas gdy Gemini zajmuje się czasochłonnymi procesami w tle. Ta funkcjonalność stanowi istotny krok naprzód w sposobie, w jaki użytkownicy mogą w przyszłości korzystać z internetu.

W ramach dążenia do standaryzacji branżowej Google ogłosiło również kompatybilność API/SDK Gemini z protokołem Model Context Protocol (MCP) firmy Anthropic. MCP to otwarty standard umożliwiający asystentom AI łączenie się z zewnętrznymi narzędziami, źródłami danych i systemami za pośrednictwem jednolitego protokołu.

„MCP to dobry protokół i szybko staje się otwartym standardem ery agentów AI” – powiedział Demis Hassabis, CEO Google DeepMind, podkreślając zaangażowanie firmy w dalszy rozwój tego rozwiązania wraz z Anthropic i innymi partnerami branżowymi.

Tryb Agent będzie początkowo dostępny dla subskrybentów Google AI Ultra w Stanach Zjednoczonych, a wkrótce planowane jest rozszerzenie na kolejne kraje. Firma udostępni także możliwości Project Mariner deweloperom poprzez API Gemini już tego lata, a zaufani testerzy, tacy jak Automation Anywhere i UiPath, już pracują z tą technologią.

Source:

Latest News