menu
close

Google rozšiřuje ovládání počítače pomocí AI pro vývojáře skrze Gemini

Google integruje schopnosti ovládání počítače z projektu Mariner do Gemini API a Vertex AI, což vývojářům umožní vytvářet aplikace, které mohou autonomně procházet a ovládat webová rozhraní. Firmy jako Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company a Cartwheel již tyto možnosti zkoumají, přičemž širší přístup pro vývojáře je plánován na letošní léto. Toto rozšíření představuje významný pokrok v technologii AI agentů od Googlu.
Google rozšiřuje ovládání počítače pomocí AI pro vývojáře skrze Gemini

Google oznámil zásadní rozšíření svého AI systému Project Mariner, který nyní přináší schopnosti ovládání počítače vývojářům prostřednictvím platforem Gemini API a Vertex AI.

Projekt Mariner, poprvé představený na konci roku 2024, představuje ambiciózní snahu Googlu změnit způsob, jakým uživatelé interagují s digitálními rozhraními pomocí AI agentů. Systém dokáže rozumět a uvažovat nad informacemi zobrazenými na obrazovce počítače, včetně textu, obrázků, kódu a webových formulářů, a poté autonomně procházet webové stránky a plnit složité úkoly.

Nejnovější verze projektu Mariner byla výrazně vylepšena a nyní běží na virtuálních strojích v cloudu, podobně jako agenti od OpenAI a Amazonu. Tento cloudový přístup umožňuje uživatelům pracovat na jiných projektech, zatímco Project Mariner dokončuje úkoly na pozadí a zvládá až deset různých operací současně – což je výrazné zlepšení oproti předchozí verzi, která běžela pouze v prohlížeči.

Několik firem již zkoumá potenciál projektu Mariner, včetně specialistů na automatizaci Automation Anywhere a UiPath, dále Browserbase, Autotab, The Interaction Company a Cartwheel. Tito první uživatelé využívají schopnost technologie automatizovat složité webové pracovní postupy, které dříve vyžadovaly rozsáhlý lidský zásah.

Google také implementoval pokročilá bezpečnostní opatření na ochranu před hrozbami, jako jsou nepřímé prompt injection útoky, kdy mohou být škodlivé instrukce vloženy do dat získaných AI modely. Podle Googlu tato bezpečnostní vylepšení výrazně zvýšila míru ochrany Gemini při používání nástrojů, díky čemuž je Gemini 2.5 dosud nejbezpečnější modelovou rodinou společnosti.

Širší přístup k možnostem projektu Mariner pro vývojáře je plánován na toto léto a může zásadně změnit způsob, jakým vývojáři vytvářejí AI aplikace schopné ovládat a interagovat s počítačovými rozhraními. Technologie je také integrována do AI režimu Vyhledávání Google, kde bude zpočátku zajišťovat úkoly jako nákup vstupenek na akce, rezervace v restauracích a plánování místních schůzek.

Source:

Latest News