Google posúva hranice AI asistencie zavedením režimu Agent Mode pre Gemini, ktorý predstavuje zásadný posun od reaktívnych systémov typu otázka-odpoveď k proaktívnym agentom schopným autonómne dokončovať úlohy.
Režim Agent Mode, oznámený na Google I/O 2025, umožňuje používateľom jednoducho zadať svoje ciele a nechať Gemini inteligentne naplánovať potrebné kroky na ich dosiahnutie. Funkcia kombinuje pokročilé možnosti vrátane živého prehliadania webu, hĺbkového výskumu a inteligentných integrácií s aplikáciami Google na zvládanie komplexných, viacstupňových úloh s minimálnym dohľadom používateľa.
„Predstavte si, že jednoducho poviete svoj cieľ a Gemini inteligentne zorganizuje kroky na jeho dosiahnutie,“ vysvetlil Google počas oznámenia. Technológia stavia na projekte Mariner, experimentálnom AI agentovi od Googlu, ktorý dokáže chápať a analyzovať informácie na obrazovke prehliadača, vrátane textu, obrázkov, formulárov a ďalších webových prvkov.
Google zároveň prináša možnosti ovládania počítača z projektu Mariner aj do Gemini API a Vertex AI, čím umožňuje vývojárom vytvárať aplikácie poháňané týmito agentovými funkciami. Spoločnosti ako Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company a Cartwheel už skúmajú jej potenciál, pričom širší prístup pre vývojárov je plánovaný na toto leto.
Technológia demonštruje pôsobivé schopnosti, vrátane funkcie „nauč a opakuj“, kde používateľ predvedie úlohu raz a AI sa ju naučí a dokáže v budúcnosti vykonávať podobné úlohy samostatne. V praxi môže Agent Mode pomôcť napríklad pri hľadaní bytu – vyhľadá inzeráty na stránkach ako Zillow, upraví filtre a dokonca naplánuje obhliadky podľa kritérií používateľa.
Tento pokrok predstavuje významnú evolúciu v spôsobe, akým ľudia interagujú s AI asistentmi. Namiesto zadávania konkrétnych príkazov pre každý krok môžu používatelia teraz delegovať celé ciele na Gemini, ktorý autonómne určí a vykoná potrebné akcie. Experimentálna verzia režimu Agent Mode bude čoskoro dostupná pre predplatiteľov Google AI Ultra, pričom spoločnosť zdôrazňuje kontrolu používateľa, transparentnosť a bezpečnostné opatrenia počas celého procesu.