Google está llevando la asistencia de IA a un nuevo nivel con la introducción del Modo Agente para Gemini, lo que representa un cambio fundamental de los sistemas reactivos de pregunta-respuesta hacia agentes proactivos capaces de completar tareas de manera autónoma.
El Modo Agente, anunciado en Google I/O 2025, permite a los usuarios simplemente expresar sus objetivos y que Gemini orqueste de manera inteligente los pasos necesarios para alcanzarlos. La función combina capacidades avanzadas como navegación web en tiempo real, investigación profunda e integraciones inteligentes con aplicaciones de Google para gestionar tareas complejas y de múltiples pasos con mínima supervisión del usuario.
"Imagina simplemente decir tu objetivo y que Gemini orqueste inteligentemente los pasos para lograrlo", explicó Google durante el anuncio. La tecnología se basa en Project Mariner, el agente experimental de IA de Google que puede comprender y razonar sobre la información en las pantallas del navegador, incluyendo texto, imágenes, formularios y otros elementos web.
Google también está llevando las capacidades de uso de computadora de Project Mariner a la API de Gemini y Vertex AI, permitiendo a los desarrolladores crear aplicaciones impulsadas por estas funciones de agentes. Empresas como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel ya están explorando su potencial, y se planea un acceso más amplio para desarrolladores este verano.
La tecnología demuestra capacidades impresionantes, incluyendo una función de "enseñar y repetir" donde los usuarios pueden mostrar una tarea una vez, permitiendo que la IA aprenda y replique tareas similares en el futuro. En aplicaciones prácticas, el Modo Agente puede ayudar a buscar departamentos revisando listados en sitios como Zillow, ajustando filtros e incluso programando visitas según los criterios del usuario.
Este avance representa una evolución significativa en la forma en que los usuarios interactúan con los asistentes de IA. En lugar de requerir comandos específicos para cada paso, ahora los usuarios pueden delegar objetivos completos a Gemini, que determina y ejecuta de manera autónoma las acciones necesarias. Una versión experimental del Modo Agente estará disponible pronto para suscriptores de Google AI Ultra, y la empresa enfatiza el control del usuario, la transparencia y las medidas de seguridad a lo largo de toda la experiencia.