Google przesuwa granice asystentów AI, wprowadzając Tryb Agenta dla Gemini – to fundamentalna zmiana z reaktywnych systemów zapytanie-odpowiedź na proaktywne agenty zdolne do autonomicznego realizowania zadań.
Tryb Agenta, ogłoszony podczas Google I/O 2025, pozwala użytkownikom po prostu określić swoje cele, a Gemini inteligentnie koordynuje niezbędne kroki, by je osiągnąć. Funkcja łączy zaawansowane możliwości, takie jak przeglądanie internetu na żywo, dogłębne badania oraz inteligentne integracje z aplikacjami Google, by zarządzać złożonymi, wieloetapowymi zadaniami przy minimalnym nadzorze użytkownika.
„Wyobraź sobie, że po prostu określasz swój cel, a Gemini inteligentnie organizuje kroki, by go zrealizować” – wyjaśniło Google podczas prezentacji. Technologia bazuje na Project Mariner, eksperymentalnym agencie AI Google, który potrafi rozumieć i analizować informacje na ekranach przeglądarki, w tym teksty, obrazy, formularze i inne elementy stron internetowych.
Google udostępnia także możliwości komputerowego użycia z Project Mariner w Gemini API oraz Vertex AI, umożliwiając deweloperom tworzenie aplikacji opartych na tych agentowych funkcjach. Firmy takie jak Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company oraz Cartwheel już badają jej potencjał, a szerszy dostęp dla deweloperów planowany jest na lato.
Technologia prezentuje imponujące możliwości, w tym funkcję „naucz i powtórz”, gdzie użytkownicy mogą pokazać zadanie tylko raz, a AI nauczy się je wykonywać i powielać podobne czynności w przyszłości. W praktyce Tryb Agenta może pomóc np. w poszukiwaniu mieszkania, przeszukując ogłoszenia na stronach takich jak Zillow, dostosowując filtry i nawet umawiając wizyty według kryteriów użytkownika.
To osiągnięcie oznacza znaczącą ewolucję w sposobie interakcji użytkowników z asystentami AI. Zamiast wydawać konkretne polecenia dla każdego kroku, użytkownicy mogą teraz delegować całe cele Gemini, który samodzielnie określi i wykona niezbędne działania. Eksperymentalna wersja Trybu Agenta wkrótce będzie dostępna dla subskrybentów Google AI Ultra, a firma podkreśla nacisk na kontrolę użytkownika, przejrzystość i zabezpieczenia na każdym etapie korzystania z funkcji.