Google está dando un gran salto en el mundo de los agentes de IA con la introducción del Modo Agente para su plataforma Gemini, anunciado durante la conferencia para desarrolladores Google I/O 2025 el 20 de mayo.
El Modo Agente, impulsado por la tecnología Project Mariner de Google, transforma a Gemini en un asistente autónomo capaz de realizar tareas complejas de varios pasos con mínima supervisión del usuario. Esta función permite que Gemini navegue por sitios web, interprete elementos visuales y textuales, y ejecute acciones en nombre de los usuarios.
"Imagina simplemente indicar tu objetivo, y Gemini organiza inteligentemente los pasos para lograrlo", explicó Google en su anuncio. "El Modo Agente combina de manera fluida funciones avanzadas como navegación web en tiempo real, investigación profunda e integraciones inteligentes con tus aplicaciones de Google".
En una demostración durante la presentación principal, el CEO de Google, Sundar Pichai, mostró cómo el Modo Agente puede simplificar la búsqueda de departamentos. La IA puede buscar anuncios en Zillow según los criterios del usuario, ajustar filtros e incluso agendar visitas a propiedades, todo sin que el usuario tenga que visitar varios sitios web o gestionar los detalles manualmente.
La tecnología opera en máquinas virtuales basadas en la nube y puede gestionar hasta diez tareas simultáneamente, permitiendo que los usuarios se concentren en otras actividades mientras Gemini se encarga de procesos que consumen tiempo en segundo plano. Esta capacidad representa un avance significativo en la forma en que los usuarios podrían interactuar con internet en el futuro.
En un paso hacia la estandarización en la industria, Google también anunció la compatibilidad entre su API/SDK de Gemini y el Model Context Protocol (MCP) presentado por Anthropic. MCP es un estándar abierto que permite a los asistentes de IA conectarse con herramientas externas, fuentes de datos y sistemas mediante un protocolo unificado.
"MCP es un buen protocolo y rápidamente se está convirtiendo en un estándar abierto para la era de los agentes de IA", dijo Demis Hassabis, CEO de Google DeepMind, destacando el compromiso de la empresa para desarrollarlo junto con Anthropic y otros socios de la industria.
El Modo Agente estará disponible inicialmente para suscriptores de Google AI Ultra en Estados Unidos, con planes de expandirse a más países próximamente. La empresa también llevará las capacidades de Project Mariner a los desarrolladores a través de la API de Gemini este verano, con testers de confianza como Automation Anywhere y UiPath que ya están construyendo con la tecnología.