Google обяви мащабно разширяване на своята AI система Project Mariner, като предоставя възможностите ѝ за контрол на компютъра на разработчиците чрез платформите Gemini API и Vertex AI.
Project Mariner, представен за първи път в края на 2024 г., е амбициозният опит на Google да трансформира начина, по който потребителите взаимодействат с дигитални интерфейси чрез AI агенти. Системата може да разбира и анализира информация, показвана на компютърен екран – включително текст, изображения, код и уеб форми – и след това автономно да навигира уебсайтове и да изпълнява сложни задачи.
Последната версия на Project Mariner е значително подобрена и вече работи във виртуални машини в облака, подобно на агентите на OpenAI и Amazon. Този облачен подход позволява на потребителите да работят по други проекти, докато Project Mariner изпълнява задачи във фонов режим, като обработва до десет различни операции едновременно – съществено подобрение спрямо предишната версия, която работеше в браузъра.
Няколко компании вече проучват потенциала на Project Mariner, сред които са специалистите по автоматизация Automation Anywhere и UiPath, както и Browserbase, Autotab, The Interaction Company и Cartwheel. Тези ранни потребители използват технологията за автоматизация на сложни уеб-базирани работни процеси, които преди това са изисквали значителна човешка намеса.
Google е внедрила и усъвършенствани мерки за сигурност с цел защита от заплахи като индиректни prompt injection атаки, при които злонамерени инструкции могат да бъдат вградени в данни, извличани от AI моделите. Според Google тези подобрения значително са увеличили нивото на защита при използване на инструментите Gemini, като Gemini 2.5 е най-сигурното семейство модели на компанията до момента.
По-широк достъп за разработчици до възможностите на Project Mariner се очаква това лято, което потенциално може да революционизира начина, по който се създават AI приложения, способни да контролират и взаимодействат с компютърни интерфейси. Технологията ще бъде интегрирана и в AI Mode на Google Search, където първоначално ще изпълнява задачи като закупуване на билети за събития, резервации в ресторанти и записване на часове за местни услуги.