Режим агента Gemini от Google: эволюция ИИ-ассистентов от реактивности к проактивности

Google представила режим агента — революционную функцию для Gemini, которая позволяет пользователям просто описывать свои конечные цели, а ИИ самостоятельно выполняет сложные задачи от их имени. Эта экспериментальная возможность использует технологии Project Mariner для работы с компьютером, которые также интегрируются в Gemini API и Vertex AI для разработчиков. Ряд компаний, включая Automation Anywhere, UiPath и Browserbase, уже исследуют потенциал этой технологии для трансформации автоматизации рабочих процессов.

Google расширяет границы возможностей ИИ-ассистентов с запуском режима агента для Gemini, который знаменует собой фундаментальный переход от реактивных систем «вопрос-ответ» к проактивным агентам, способным автономно выполнять задачи.

Режим агента, анонсированный на Google I/O 2025, позволяет пользователям просто формулировать свои цели, после чего Gemini интеллектуально организует необходимые шаги для их достижения. Функция сочетает в себе передовые возможности, включая просмотр веб-страниц в реальном времени, глубокий анализ информации и умные интеграции с приложениями Google для управления сложными многошаговыми задачами с минимальным участием пользователя.

«Представьте, что вы просто озвучиваете свою цель, а Gemini самостоятельно организует шаги для её достижения», — пояснили в Google во время презентации. Технология основана на Project Mariner — экспериментальном ИИ-агенте Google, который способен понимать и анализировать информацию на экране браузера, включая текст, изображения, формы и другие веб-элементы.

Google также внедряет возможности Project Mariner по работе с компьютером в Gemini API и Vertex AI, что позволит разработчикам создавать приложения с использованием этих агентных функций. Компании, такие как Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel, уже исследуют потенциал технологии, а более широкий доступ для разработчиков запланирован на это лето.

Технология демонстрирует впечатляющие возможности, включая функцию «обучения и повторения», когда пользователь показывает выполнение задачи один раз, и ИИ затем может воспроизводить аналогичные действия в будущем. В практических сценариях режим агента может, например, помочь с поиском квартиры: он самостоятельно ищет объявления на сайтах вроде Zillow, настраивает фильтры и даже записывает на просмотры в соответствии с критериями пользователя.

Этот прорыв знаменует значительную эволюцию во взаимодействии пользователей с ИИ-ассистентами. Теперь вместо необходимости давать отдельные команды для каждого шага, пользователи могут поручать Gemini достижение целых целей, а ИИ самостоятельно определяет и выполняет необходимые действия. Экспериментальная версия режима агента вскоре станет доступна подписчикам Google AI Ultra, при этом компания подчёркивает важность контроля пользователя, прозрачности и мер безопасности на всех этапах использования.

Source:

Режим агента Gemini от Google: эволюция ИИ-ассистентов от реактивности к проактивности

Latest News

OpenTools.AI представляет ежедневный новостной центр об ИИ для технических энтузиастов

Google Gemini 2.5 Pro эволюционирует в мировую модель, подобную мозгу

Робот ATMO от Caltech трансформируется в воздухе для бесшовной работы на земле

Пионер ИИ Бенжио запускает некоммерческую организацию для борьбы с обманчивым поведением ИИ

Глобальная этическая структура для ИИ в здравоохранении представлена

Медицинские роботы на базе ИИ готовы преобразить уход за пациентами

Глобальная коалиция представила историческую этическую структуру для ИИ общего назначения

OpenTools запускает ежедневный центр аналитики по искусственному интеллекту для руководителей

Великобритания представила ИИ-инструмент для трансформации градостроительства и ускорения строительства жилья

Ставка Tesla на роботакси: запуск 22 июня на фоне скептицизма отрасли

Режим агента Gemini от Google: эволюция ИИ-ассистентов от реактивности к проактивности

Related Articles

OpenTools.AI представляет ежедневный новостной центр об ИИ для технических энтузиастов

Google Gemini 2.5 Pro эволюционирует в мировую модель, подобную мозгу

Великобритания представила ИИ-инструмент для трансформации градостроительства и ускорения строительства жилья

Google превращает Gemini 2.5 Pro в продвинутую модель симуляции мира

Google Beam: 3D-видеозвонки меняют дистанционное общение

Latest News

OpenTools.AI представляет ежедневный новостной центр об ИИ для технических энтузиастов

Google Gemini 2.5 Pro эволюционирует в мировую модель, подобную мозгу

Робот ATMO от Caltech трансформируется в воздухе для бесшовной работы на земле

Пионер ИИ Бенжио запускает некоммерческую организацию для борьбы с обманчивым поведением ИИ

Глобальная этическая структура для ИИ в здравоохранении представлена

Медицинские роботы на базе ИИ готовы преобразить уход за пациентами

Глобальная коалиция представила историческую этическую структуру для ИИ общего назначения

OpenTools запускает ежедневный центр аналитики по искусственному интеллекту для руководителей

Великобритания представила ИИ-инструмент для трансформации градостроительства и ускорения строительства жилья

Ставка Tesla на роботакси: запуск 22 июня на фоне скептицизма отрасли