Google розширює межі можливостей AI-асистентів, презентуючи режим агента для Gemini — це фундаментальний перехід від реактивних систем запит-відповідь до проактивних агентів, здатних автономно виконувати завдання.
Режим агента, анонсований на Google I/O 2025, дозволяє користувачам просто сформулювати свої цілі, а Gemini інтелектуально організує всі необхідні кроки для їх досягнення. Функція поєднує передові можливості, зокрема живий веб-перегляд, глибокий пошук та розумну інтеграцію з додатками Google для управління складними багатокроковими завданнями з мінімальним втручанням користувача.
«Уявіть, що ви просто формулюєте свою мету, а Gemini інтелектуально організовує кроки для її досягнення», — пояснили в Google під час презентації. Технологія базується на Project Mariner — експериментальному AI-агенті Google, який може розуміти й аналізувати інформацію на екранах браузера, включаючи текст, зображення, форми та інші веб-елементи.
Google також впроваджує можливості Project Mariner для роботи з комп’ютером у Gemini API та Vertex AI, що дозволить розробникам створювати застосунки з агентськими функціями. Компанії Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company та Cartwheel вже досліджують цей потенціал, а ширший доступ для розробників заплановано на це літо.
Технологія демонструє вражаючі можливості, зокрема функцію «навчи й повтори», коли користувач може показати виконання завдання один раз, а AI навчиться й зможе повторювати подібні дії в майбутньому. На практиці режим агента може допомогти, наприклад, у пошуку квартири: шукати оголошення на сайтах на кшталт Zillow, налаштовувати фільтри та навіть планувати перегляди відповідно до критеріїв користувача.
Цей прорив означає суттєву еволюцію у взаємодії користувачів із AI-асистентами. Замість необхідності давати окремі команди для кожного кроку, тепер можна делегувати цілі завдання Gemini, який самостійно визначить і виконає потрібні дії. Експериментальна версія режиму агента незабаром стане доступною для підписників Google AI Ultra, а компанія підкреслює важливість контролю користувача, прозорості та безпеки протягом усього процесу.