Google расширяет возможности своего искусственного интеллекта, интегрируя функции Project Mariner по использованию компьютера в платформы Gemini API и Vertex AI, что знаменует собой важный шаг вперёд в развитии агентных ИИ-систем.
Project Mariner, впервые представленный в конце 2024 года, является исследовательским прототипом Google DeepMind, который изучает взаимодействие человека и агента через веб-браузеры. Система способна наблюдать за тем, что отображается в браузере, интерпретировать сложные цели, планировать последовательность действий и самостоятельно перемещаться по сайтам для выполнения задач. Она может выполнять несколько операций одновременно, а последняя версия справляется с десятью различными задачами одновременно.
Ряд технологических компаний уже исследуют потенциал Project Mariner. Среди первых пользователей — Automation Anywhere, лидер в области агентной автоматизации процессов, и UiPath, известная своей платформой автоматизации. К другим партнёрам относятся Browserbase, разрабатывающая фреймворки для автоматизации браузеров с помощью ИИ, Autotab, The Interaction Company и Cartwheel — платформа для преобразования текста в анимацию, основанная в 2023 году.
Интеграция с Gemini API и Vertex AI позволит разработчикам создавать приложения на базе этих агентных возможностей. Google также значительно усилила защиту от угроз, таких как косвенные инъекции подсказок, сделав семейство моделей Gemini 2.5 самым безопасным на сегодняшний день.
Подписчики Google AI Ultra в США уже имеют доступ к Project Mariner, а более широкий доступ для разработчиков запланирован на лето. Компания также внедряет некоторые возможности Mariner в другие продукты Google, включая AI Mode в Search Labs, где ИИ сможет, например, покупать билеты на мероприятия и бронировать столики в ресторанах.
Это развитие знаменует собой фундаментальный сдвиг в том, как пользователи взаимодействуют с интернетом: от прямого взаимодействия с сайтами к делегированию задач ИИ-агентам. По мере совершенствования этих возможностей они могут революционизировать автоматизацию в различных отраслях и открыть совершенно новые сценарии использования для ИИ-ассистентов.