Google делает крупный шаг в развитии ИИ-агентов, представляя агентный режим для своей платформы Gemini, о чём было объявлено на конференции разработчиков Google I/O 2025 20 мая.
Агентный режим, основанный на технологии Project Mariner от Google, превращает Gemini в автономного помощника, способного выполнять сложные многошаговые задачи с минимальным участием пользователя. Эта функция позволяет Gemini просматривать веб-сайты, интерпретировать визуальные и текстовые элементы, а также совершать действия от имени пользователя.
«Представьте, что вы просто формулируете свою цель, а Gemini интеллектуально организует все шаги для её достижения», — говорится в заявлении Google. — «Агентный режим объединяет передовые возможности, такие как просмотр веб-страниц в реальном времени, глубокий поиск и умные интеграции с вашими приложениями Google».
Во время основной презентации генеральный директор Google Сундар Пичаи продемонстрировал, как агентный режим может упростить поиск квартиры. ИИ способен искать объявления на Zillow по заданным критериям, настраивать фильтры и даже записываться на просмотры недвижимости — всё это без необходимости вручную посещать разные сайты или заниматься организационными деталями.
Технология работает на облачных виртуальных машинах и может одновременно обрабатывать до десяти задач, позволяя пользователям сосредоточиться на других делах, пока Gemini выполняет рутинные процессы в фоновом режиме. Эта возможность знаменует собой значительный шаг вперёд в том, как пользователи будут взаимодействовать с интернетом в будущем.
В рамках движения к стандартизации в отрасли Google также объявила о совместимости Gemini API/SDK с протоколом Model Context Protocol (MCP), представленным компанией Anthropic. MCP — это открытый стандарт, позволяющий ИИ-ассистентам подключаться к внешним инструментам, источникам данных и системам через единый протокол.
«MCP — хороший протокол, и он быстро становится открытым стандартом для эпохи агентных ИИ», — отметил глава Google DeepMind Демис Хассабис, подчеркнув стремление компании развивать этот стандарт совместно с Anthropic и другими партнёрами отрасли.
Агентный режим сначала будет доступен подписчикам Google AI Ultra в США, а вскоре появится и в других странах. Кроме того, возможности Project Mariner этим летом станут доступны разработчикам через Gemini API — уже сейчас доверенные тестировщики, такие как Automation Anywhere и UiPath, создают решения на базе этой технологии.