Google разширява възможностите си в областта на изкуствения интелект чрез интеграция на функциите за използване на компютър от Project Mariner в платформите Gemini API и Vertex AI, което представлява значителна стъпка напред в развитието на агентните AI системи.
Project Mariner, представен за първи път в края на 2024 г., е изследователски прототип на Google DeepMind, който изследва взаимодействието между човек и агент чрез уеб браузъри. Системата може да наблюдава какво се показва в браузърите, да интерпретира сложни цели, да планира изпълними стъпки и да навигира в уебсайтове, за да изпълнява задачи автономно. Тя може да обработва множество операции едновременно, като последната версия е способна да изпълнява до десет различни задачи наведнъж.
Няколко технологични компании вече проучват потенциала на Project Mariner. Automation Anywhere, лидер в агентната автоматизация на процеси, и UiPath, известна със своята платформа за автоматизация, са сред първите, които я внедряват. Други партньори включват Browserbase, която разработва AI рамки за автоматизация на браузъри, Autotab, The Interaction Company и Cartwheel – платформа за текст към анимация, основана през 2023 г.
Интеграцията с Gemini API и Vertex AI ще позволи на разработчиците да създават приложения, задвижвани от тези агентни възможности. Google също така значително е подобрила защитите срещу заплахи като индиректни prompt injection атаки, превръщайки Gemini 2.5 в най-сигурното си моделно семейство досега.
Абонатите на Google AI Ultra в САЩ вече имат достъп до Project Mariner, като по-широк достъп за разработчици се планира за това лято. Компанията също така въвежда част от възможностите на Mariner и в други продукти на Google, включително AI Mode в Search Labs, където ще може да се извършват задачи като закупуване на билети за събития и резервиране на маси в ресторанти.
Това развитие представлява фундаментална промяна в начина, по който потребителите взаимодействат с интернет, като потенциално се преминава от директно взаимодействие със сайтове към възлагане на задачи на AI агенти. С развитието на тези възможности те могат да революционизират автоматизацията в различни индустрии и да позволят напълно нови приложения за AI асистенти.