menu
close

Google представи агентния Gemini, който ще революционизира сложните задачи

На Google I/O 2025 компанията обяви Agent Mode за своя изкуствен интелект Gemini, който позволява автономно изпълнение на задачи чрез уеб браузинг, задвижван от Project Mariner. Новата функция ще даде възможност на Gemini да извършва сложни дейности като търсене на апартамент в сайтове като Zillow – от намиране на обяви до насрочване на огледи. Google също така разкри съвместимост между Gemini API/SDK и Model Context Protocol на Anthropic, което е знак за нарастващо сътрудничество в индустрията по отношение на стандартите за AI агенти.
Google представи агентния Gemini, който ще революционизира сложните задачи

Google прави голяма крачка в света на AI агентите с въвеждането на Agent Mode за своята платформа Gemini, обявено по време на конференцията за разработчици Google I/O 2025 на 20 май.

Agent Mode, задвижван от технологията Project Mariner на Google, превръща Gemini в автономен асистент, способен да изпълнява сложни многoетапни задачи с минимален надзор от страна на потребителя. Функцията позволява на Gemini да разглежда уебсайтове, да интерпретира визуални и текстови елементи и да извършва действия от името на потребителите.

"Представете си, че просто заявявате целта си, а Gemini интелигентно организира стъпките за постигането ѝ", обясниха от Google в съобщението си. "Agent Mode безпроблемно комбинира напреднали функции като уеб браузинг в реално време, задълбочени проучвания и интелигентни интеграции с вашите Google приложения."

В демонстрация по време на основната презентация изпълнителният директор на Google Сундар Пичай показа как Agent Mode може да улесни търсенето на апартамент. Изкуственият интелект може да търси обяви в Zillow според зададени от потребителя критерии, да настройва филтри и дори да насрочва огледи на имоти – всичко това без потребителят да посещава множество сайтове или да управлява детайлите ръчно.

Технологията работи върху облачни виртуални машини и може да управлява до десет задачи едновременно, позволявайки на потребителите да се съсредоточат върху други дейности, докато Gemini обработва времеемките процеси във фонов режим. Тази възможност представлява значителен напредък в начина, по който потребителите ще взаимодействат с интернет в бъдеще.

В стремеж към стандартизация в индустрията Google обяви и съвместимост между Gemini API/SDK и Model Context Protocol (MCP), въведен от Anthropic. MCP е отворен стандарт, който позволява на AI асистентите да се свързват с външни инструменти, източници на данни и системи чрез унифициран протокол.

"MCP е добър протокол и бързо се превръща в отворен стандарт за ерата на AI агентите", заяви изпълнителният директор на Google DeepMind Демис Хасабис, подчертавайки ангажимента на компанията да го развива съвместно с Anthropic и други партньори в индустрията.

Agent Mode първоначално ще бъде достъпен за абонатите на Google AI Ultra в Съединените щати, като скоро се планира разширяване и в други държави. Компанията ще предостави възможностите на Project Mariner и на разработчиците чрез Gemini API това лято, като доверени тестери като Automation Anywhere и UiPath вече работят с технологията.

Source:

Latest News