menu
close

Google rozširuje ovládanie počítača pomocou AI pre vývojárov cez Gemini

Google integruje schopnosti ovládania počítača z projektu Mariner do Gemini API a Vertex AI, čím umožňuje vývojárom vytvárať aplikácie, ktoré dokážu autonómne navigovať a interagovať s webovými rozhraniami. Spoločnosti ako Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company a Cartwheel už tieto možnosti skúmajú, pričom širší prístup pre vývojárov je naplánovaný na leto. Toto rozšírenie predstavuje významný pokrok v technológii AI agentov od Googlu.
Google rozširuje ovládanie počítača pomocou AI pre vývojárov cez Gemini

Google oznámil významné rozšírenie svojho AI systému Project Mariner, keď jeho schopnosti ovládania počítača sprístupňuje vývojárom prostredníctvom platforiem Gemini API a Vertex AI.

Project Mariner, ktorý bol prvýkrát predstavený koncom roka 2024, predstavuje ambicióznu snahu Googlu transformovať spôsob, akým používatelia interagujú s digitálnymi rozhraniami prostredníctvom AI agentov. Systém dokáže porozumieť a vyhodnocovať informácie zobrazované na obrazovke počítača – vrátane textu, obrázkov, kódu a webových formulárov – a následne autonómne navigovať po webových stránkach a plniť zložité úlohy.

Najnovšia verzia Project Mariner bola výrazne vylepšená, aby mohla bežať na virtuálnych strojoch v cloude, podobne ako agenti od OpenAI či Amazonu. Tento cloudový prístup umožňuje používateľom venovať sa iným projektom, zatiaľ čo Project Mariner dokončuje úlohy na pozadí a zvládne naraz až desať rôznych operácií – čo je výrazné zlepšenie oproti predchádzajúcej verzii, ktorá fungovala v prehliadači.

Viaceré spoločnosti už skúmajú potenciál Project Mariner, vrátane špecialistov na automatizáciu Automation Anywhere a UiPath, ako aj Browserbase, Autotab, The Interaction Company a Cartwheel. Títo prví používatelia využívajú technológiu na automatizáciu komplexných webových pracovných postupov, ktoré predtým vyžadovali rozsiahly ľudský zásah.

Google zároveň implementoval pokročilé bezpečnostné opatrenia na ochranu pred hrozbami, ako sú nepriame prompt injekcie, pri ktorých môžu byť škodlivé inštrukcie vložené do dát získaných AI modelmi. Podľa Googlu tieto bezpečnostné vylepšenia výrazne zvýšili mieru ochrany Gemini pri používaní nástrojov, vďaka čomu je Gemini 2.5 najbezpečnejšou modelovou rodinou spoločnosti doteraz.

Širší prístup k schopnostiam Project Mariner pre vývojárov je naplánovaný na leto, čo môže zásadne zmeniť spôsob, akým vývojári budujú AI aplikácie schopné ovládať a interagovať s počítačovými rozhraniami. Technológia sa zároveň integruje aj do AI režimu Google Search, kde bude spočiatku zvládať úlohy ako nákup vstupeniek na podujatia, rezervácie v reštauráciách či plánovanie miestnych stretnutí.

Source:

Latest News