menu
close

Google презентує агентний Gemini для революції у виконанні складних завдань

На конференції Google I/O 2025 компанія Google анонсувала режим Agent для свого ШІ Gemini, який дозволяє автономно виконувати завдання завдяки можливостям веб-перегляду на базі Project Mariner. Нова функція дає змогу Gemini виконувати складні завдання, наприклад, пошук квартир на сайтах на кшталт Zillow — від знаходження оголошень до планування переглядів. Google також оголосила про сумісність свого API/SDK Gemini із Model Context Protocol від Anthropic, що свідчить про зростаючу співпрацю у сфері стандартів агентів.
Google презентує агентний Gemini для революції у виконанні складних завдань

Google робить значний крок у світі агентних ШІ, представивши режим Agent для своєї платформи Gemini, про що було оголошено на конференції для розробників Google I/O 2025, яка відбулася 20 травня.

Режим Agent, що працює на базі технології Project Mariner від Google, перетворює Gemini на автономного помічника, здатного виконувати складні багатокрокові завдання з мінімальним втручанням користувача. Ця функція дозволяє Gemini переглядати вебсайти, інтерпретувати візуальні та текстові елементи й виконувати дії від імені користувача.

«Уявіть, що ви просто формулюєте свою мету, а Gemini розумно організовує кроки для її досягнення», — пояснили в Google під час анонсу. «Режим Agent безшовно поєднує сучасні можливості, такі як перегляд вебу в реальному часі, глибокі дослідження та розумні інтеграції з вашими додатками Google».

Під час демонстрації на головній сцені генеральний директор Google Сундар Пічаї показав, як режим Agent може спростити пошук квартири. ШІ може знаходити оголошення на Zillow відповідно до критеріїв користувача, налаштовувати фільтри та навіть планувати перегляди нерухомості — і все це без необхідності відвідувати різні сайти або самостійно керувати деталями.

Технологія працює на хмарних віртуальних машинах і може одночасно виконувати до десяти завдань, дозволяючи користувачам зосередитися на інших справах, поки Gemini обробляє рутинні процеси у фоновому режимі. Ця можливість є значним проривом у тому, як користувачі взаємодіятимуть з інтернетом у майбутньому.

У напрямку стандартизації галузі Google також оголосила про сумісність свого API/SDK Gemini із Model Context Protocol (MCP), представленим компанією Anthropic. MCP — це відкритий стандарт, який дозволяє ШІ-помічникам підключатися до зовнішніх інструментів, джерел даних і систем через уніфікований протокол.

«MCP — це хороший протокол, і він швидко стає відкритим стандартом для епохи агентних ШІ», — зазначив генеральний директор Google DeepMind Деміс Хассабіс, підкресливши прагнення компанії розвивати його разом з Anthropic та іншими партнерами галузі.

Режим Agent спочатку буде доступний для підписників Google AI Ultra у США, з подальшими планами розширення на інші країни. Також цього літа компанія відкриє можливості Project Mariner для розробників через Gemini API — вже зараз такі компанії, як Automation Anywhere та UiPath, тестують цю технологію.

Source:

Latest News