Google расширяет границы возможностей ИИ-ассистентов с запуском режима агента для Gemini, который знаменует собой фундаментальный переход от реактивных систем «вопрос-ответ» к проактивным агентам, способным автономно выполнять задачи.
Режим агента, анонсированный на Google I/O 2025, позволяет пользователям просто формулировать свои цели, после чего Gemini интеллектуально организует необходимые шаги для их достижения. Функция сочетает в себе передовые возможности, включая просмотр веб-страниц в реальном времени, глубокий анализ информации и умные интеграции с приложениями Google для управления сложными многошаговыми задачами с минимальным участием пользователя.
«Представьте, что вы просто озвучиваете свою цель, а Gemini самостоятельно организует шаги для её достижения», — пояснили в Google во время презентации. Технология основана на Project Mariner — экспериментальном ИИ-агенте Google, который способен понимать и анализировать информацию на экране браузера, включая текст, изображения, формы и другие веб-элементы.
Google также внедряет возможности Project Mariner по работе с компьютером в Gemini API и Vertex AI, что позволит разработчикам создавать приложения с использованием этих агентных функций. Компании, такие как Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel, уже исследуют потенциал технологии, а более широкий доступ для разработчиков запланирован на это лето.
Технология демонстрирует впечатляющие возможности, включая функцию «обучения и повторения», когда пользователь показывает выполнение задачи один раз, и ИИ затем может воспроизводить аналогичные действия в будущем. В практических сценариях режим агента может, например, помочь с поиском квартиры: он самостоятельно ищет объявления на сайтах вроде Zillow, настраивает фильтры и даже записывает на просмотры в соответствии с критериями пользователя.
Этот прорыв знаменует значительную эволюцию во взаимодействии пользователей с ИИ-ассистентами. Теперь вместо необходимости давать отдельные команды для каждого шага, пользователи могут поручать Gemini достижение целых целей, а ИИ самостоятельно определяет и выполняет необходимые действия. Экспериментальная версия режима агента вскоре станет доступна подписчикам Google AI Ultra, при этом компания подчёркивает важность контроля пользователя, прозрачности и мер безопасности на всех этапах использования.