Google da un gran salto en el mundo de los agentes de IA con la introducción del Modo Agente para su plataforma Gemini, anunciado durante la conferencia para desarrolladores Google I/O 2025 el 20 de mayo.
El Modo Agente, impulsado por la tecnología Project Mariner de Google, transforma a Gemini en un asistente autónomo capaz de realizar tareas complejas de varios pasos con una supervisión mínima por parte del usuario. Esta función permite a Gemini navegar por sitios web, interpretar elementos visuales y textuales, y ejecutar acciones en nombre de los usuarios.
"Imagina simplemente indicar tu objetivo y Gemini orquesta inteligentemente los pasos para lograrlo", explicó Google en su anuncio. "El Modo Agente combina de forma fluida funciones avanzadas como la navegación web en tiempo real, investigación en profundidad e integraciones inteligentes con tus aplicaciones de Google".
En una demostración durante la presentación principal, el CEO de Google, Sundar Pichai, mostró cómo el Modo Agente puede simplificar la búsqueda de piso. La IA puede buscar anuncios en Zillow según los criterios del usuario, ajustar los filtros e incluso programar visitas a propiedades, todo ello sin que el usuario tenga que visitar varios sitios web o gestionar los detalles manualmente.
La tecnología funciona sobre máquinas virtuales en la nube y puede gestionar hasta diez tareas simultáneamente, permitiendo a los usuarios centrarse en otras actividades mientras Gemini se encarga de los procesos que consumen tiempo en segundo plano. Esta capacidad representa un avance significativo en la forma en que los usuarios podrían interactuar con Internet en el futuro.
En un movimiento hacia la estandarización en la industria, Google también anunció la compatibilidad entre su API/SDK de Gemini y el Model Context Protocol (MCP) presentado por Anthropic. MCP es un estándar abierto que permite a los asistentes de IA conectarse con herramientas externas, fuentes de datos y sistemas a través de un protocolo unificado.
"MCP es un buen protocolo y está convirtiéndose rápidamente en un estándar abierto para la era agentica de la IA", afirmó Demis Hassabis, CEO de Google DeepMind, destacando el compromiso de la compañía para seguir desarrollándolo junto a Anthropic y otros socios del sector.
El Modo Agente estará disponible inicialmente para los suscriptores de Google AI Ultra en Estados Unidos, con planes de expandirse a más países próximamente. La compañía también llevará las capacidades de Project Mariner a los desarrolladores a través de la API de Gemini este verano, con testers de confianza como Automation Anywhere y UiPath que ya están trabajando con la tecnología.