menu
close

Режим агента Gemini от Google: эволюция ИИ-ассистентов от реактивности к проактивности

Google представила режим агента — революционную функцию для Gemini, которая позволяет пользователям просто описывать свои конечные цели, а ИИ самостоятельно выполняет сложные задачи от их имени. Эта экспериментальная возможность использует технологии Project Mariner для работы с компьютером, которые также интегрируются в Gemini API и Vertex AI для разработчиков. Ряд компаний, включая Automation Anywhere, UiPath и Browserbase, уже исследуют потенциал этой технологии для трансформации автоматизации рабочих процессов.
Режим агента Gemini от Google: эволюция ИИ-ассистентов от реактивности к проактивности

Google расширяет границы возможностей ИИ-ассистентов с запуском режима агента для Gemini, который знаменует собой фундаментальный переход от реактивных систем «вопрос-ответ» к проактивным агентам, способным автономно выполнять задачи.

Режим агента, анонсированный на Google I/O 2025, позволяет пользователям просто формулировать свои цели, после чего Gemini интеллектуально организует необходимые шаги для их достижения. Функция сочетает в себе передовые возможности, включая просмотр веб-страниц в реальном времени, глубокий анализ информации и умные интеграции с приложениями Google для управления сложными многошаговыми задачами с минимальным участием пользователя.

«Представьте, что вы просто озвучиваете свою цель, а Gemini самостоятельно организует шаги для её достижения», — пояснили в Google во время презентации. Технология основана на Project Mariner — экспериментальном ИИ-агенте Google, который способен понимать и анализировать информацию на экране браузера, включая текст, изображения, формы и другие веб-элементы.

Google также внедряет возможности Project Mariner по работе с компьютером в Gemini API и Vertex AI, что позволит разработчикам создавать приложения с использованием этих агентных функций. Компании, такие как Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel, уже исследуют потенциал технологии, а более широкий доступ для разработчиков запланирован на это лето.

Технология демонстрирует впечатляющие возможности, включая функцию «обучения и повторения», когда пользователь показывает выполнение задачи один раз, и ИИ затем может воспроизводить аналогичные действия в будущем. В практических сценариях режим агента может, например, помочь с поиском квартиры: он самостоятельно ищет объявления на сайтах вроде Zillow, настраивает фильтры и даже записывает на просмотры в соответствии с критериями пользователя.

Этот прорыв знаменует значительную эволюцию во взаимодействии пользователей с ИИ-ассистентами. Теперь вместо необходимости давать отдельные команды для каждого шага, пользователи могут поручать Gemini достижение целых целей, а ИИ самостоятельно определяет и выполняет необходимые действия. Экспериментальная версия режима агента вскоре станет доступна подписчикам Google AI Ultra, при этом компания подчёркивает важность контроля пользователя, прозрачности и мер безопасности на всех этапах использования.

Source:

Latest News