Google posouvá hranice AI asistence představením Agent Mode pro Gemini, což představuje zásadní posun od reaktivních systémů typu dotaz-odpověď k proaktivním agentům schopným samostatného plnění úkolů.
Agent Mode, oznámený na Google I/O 2025, umožňuje uživatelům jednoduše sdělit své cíle a Gemini inteligentně naplánuje potřebné kroky k jejich dosažení. Funkce kombinuje pokročilé schopnosti včetně živého prohlížení webu, hloubkového výzkumu a chytrých integrací s aplikacemi Google, aby zvládla složité, vícekrokové úkoly s minimálním dohledem uživatele.
„Představte si, že pouze sdělíte svůj cíl a Gemini inteligentně naplánuje kroky k jeho dosažení,“ vysvětlil Google během oznámení. Technologie staví na Project Mariner, experimentálním AI agentovi Googlu, který dokáže chápat a vyhodnocovat informace na obrazovkách prohlížeče, včetně textu, obrázků, formulářů a dalších webových prvků.
Google také přináší schopnosti Project Mariner pro práci s počítačem do Gemini API a Vertex AI, což vývojářům umožní vytvářet aplikace využívající tyto agentní funkce. Společnosti jako Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company a Cartwheel již zkoumají její potenciál, přičemž širší přístup pro vývojáře je plánován na toto léto.
Technologie předvádí působivé možnosti, včetně funkce „nauč a opakuj“, kdy uživatel předvede úkol jednou a AI se jej naučí a dokáže podobné úkoly opakovat v budoucnu. V praxi může Agent Mode například pomoci s hledáním bytu – vyhledává nabídky na stránkách jako Zillow, upravuje filtry a dokonce plánuje prohlídky podle kritérií uživatele.
Tento pokrok představuje významnou evoluci v tom, jak uživatelé interagují s AI asistenty. Místo zadávání konkrétních příkazů pro každý krok mohou nyní uživatelé svěřit celý cíl Geminimu, který samostatně určí a provede potřebné akce. Experimentální verze Agent Mode bude brzy dostupná předplatitelům Google AI Ultra, přičemž společnost zdůrazňuje kontrolu uživatele, transparentnost a bezpečnostní opatření po celou dobu používání.