menu
close

Modo Agente de Gemini de Google: Los Asistentes de IA Evolucionan de Reactivos a Proactivos

Google ha presentado el Modo Agente, una innovadora función para Gemini que permite a los usuarios describir sus objetivos finales y dejar que la IA complete tareas complejas de manera autónoma. Esta capacidad experimental aprovecha la tecnología de uso de computadora de Project Mariner, que también se está integrando en la API de Gemini y Vertex AI para desarrolladores. Varias empresas, incluyendo Automation Anywhere, UiPath y Browserbase, ya están explorando su potencial para transformar los flujos de trabajo de automatización.
Modo Agente de Gemini de Google: Los Asistentes de IA Evolucionan de Reactivos a Proactivos

Google está llevando la asistencia de IA a un nuevo nivel con la introducción del Modo Agente para Gemini, lo que representa un cambio fundamental de los sistemas reactivos de pregunta-respuesta hacia agentes proactivos capaces de completar tareas de manera autónoma.

El Modo Agente, anunciado en Google I/O 2025, permite a los usuarios simplemente expresar sus objetivos y que Gemini orqueste de manera inteligente los pasos necesarios para alcanzarlos. La función combina capacidades avanzadas como navegación web en tiempo real, investigación profunda e integraciones inteligentes con aplicaciones de Google para gestionar tareas complejas y de múltiples pasos con mínima supervisión del usuario.

"Imagina simplemente decir tu objetivo y que Gemini orqueste inteligentemente los pasos para lograrlo", explicó Google durante el anuncio. La tecnología se basa en Project Mariner, el agente experimental de IA de Google que puede comprender y razonar sobre la información en las pantallas del navegador, incluyendo texto, imágenes, formularios y otros elementos web.

Google también está llevando las capacidades de uso de computadora de Project Mariner a la API de Gemini y Vertex AI, permitiendo a los desarrolladores crear aplicaciones impulsadas por estas funciones de agentes. Empresas como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel ya están explorando su potencial, y se planea un acceso más amplio para desarrolladores este verano.

La tecnología demuestra capacidades impresionantes, incluyendo una función de "enseñar y repetir" donde los usuarios pueden mostrar una tarea una vez, permitiendo que la IA aprenda y replique tareas similares en el futuro. En aplicaciones prácticas, el Modo Agente puede ayudar a buscar departamentos revisando listados en sitios como Zillow, ajustando filtros e incluso programando visitas según los criterios del usuario.

Este avance representa una evolución significativa en la forma en que los usuarios interactúan con los asistentes de IA. En lugar de requerir comandos específicos para cada paso, ahora los usuarios pueden delegar objetivos completos a Gemini, que determina y ejecuta de manera autónoma las acciones necesarias. Una versión experimental del Modo Agente estará disponible pronto para suscriptores de Google AI Ultra, y la empresa enfatiza el control del usuario, la transparencia y las medidas de seguridad a lo largo de toda la experiencia.

Source:

Latest News