Google rozširuje svoje AI schopnosti integráciou funkcií Project Mariner na ovládanie počítača do platforiem Gemini API a Vertex AI, čo predstavuje významný krok vpred vo vývoji agentických AI systémov.
Project Mariner, prvýkrát predstavený koncom roka 2024, je výskumný prototyp Google DeepMind, ktorý skúma interakciu medzi človekom a agentom prostredníctvom webových prehliadačov. Systém dokáže pozorovať, čo sa zobrazuje v prehliadači, interpretovať zložité ciele, plánovať konkrétne kroky a autonómne sa pohybovať po webových stránkach s cieľom splniť zadané úlohy. Zvládne pritom viacero operácií súčasne – najnovšia verzia dokáže dokončiť až desať rôznych úloh naraz.
Viaceré technologické spoločnosti už skúmajú potenciál Project Mariner. Medzi prvými používateľmi sú Automation Anywhere, líder v oblasti agentickej procesnej automatizácie, a UiPath, známy svojou automatizačnou platformou. Ďalšími partnermi sú Browserbase, ktorý vyvíja AI frameworky na automatizáciu prehliadača, Autotab, The Interaction Company a Cartwheel, platforma na prevod textu na animáciu založená v roku 2023.
Integrácia s Gemini API a Vertex AI umožní vývojárom vytvárať aplikácie poháňané týmito agentickými schopnosťami. Google zároveň výrazne posilnil bezpečnostné opatrenia proti hrozbám, ako sú nepriame prompt injection útoky, vďaka čomu je rodina modelov Gemini 2.5 doposiaľ najbezpečnejšia.
Predplatitelia Google AI Ultra v USA už majú k Project Mariner prístup, pričom širší prístup pre vývojárov je plánovaný na leto. Spoločnosť tiež prináša niektoré funkcie Mariner do ďalších produktov Google, vrátane AI režimu v Search Labs, kde umožní napríklad nákup vstupeniek na podujatia či rezerváciu reštaurácií.
Tento vývoj predstavuje zásadnú zmenu v spôsobe, akým používatelia interagujú s internetom – od priamej práce s webom k delegovaniu úloh AI agentom. Ako tieto schopnosti dozrievajú, môžu zásadne zmeniť automatizáciu v rôznych odvetviach a umožniť vznik úplne nových aplikácií pre AI asistentov.