menu
close

Modo Agente de Gemini de Google: Los Asistentes de IA Evolucionan de Reactivos a Proactivos

Google ha presentado el Modo Agente, una innovadora función para Gemini que permite a los usuarios describir sus objetivos finales y dejar que la IA complete tareas complejas de forma autónoma. Esta capacidad experimental aprovecha la tecnología de uso de ordenador de Project Mariner, que también se está integrando en la API de Gemini y Vertex AI para desarrolladores. Varias empresas, como Automation Anywhere, UiPath y Browserbase, ya están explorando su potencial para transformar los flujos de trabajo de automatización.
Modo Agente de Gemini de Google: Los Asistentes de IA Evolucionan de Reactivos a Proactivos

Google está llevando la asistencia de IA a un nuevo nivel con la introducción del Modo Agente para Gemini, lo que supone un cambio fundamental respecto a los sistemas reactivos de pregunta-respuesta hacia agentes proactivos capaces de completar tareas de forma autónoma.

El Modo Agente, anunciado en el Google I/O 2025, permite a los usuarios simplemente indicar sus objetivos y que Gemini orqueste de manera inteligente los pasos necesarios para alcanzarlos. La función combina capacidades avanzadas como navegación web en tiempo real, investigación en profundidad e integraciones inteligentes con las aplicaciones de Google para gestionar tareas complejas y de varios pasos con una supervisión mínima por parte del usuario.

"Imagina simplemente indicar tu objetivo y que Gemini orqueste de forma inteligente los pasos para lograrlo", explicó Google durante el anuncio. La tecnología se basa en Project Mariner, el agente experimental de IA de Google capaz de comprender y razonar sobre la información presente en las pantallas del navegador, incluyendo texto, imágenes, formularios y otros elementos web.

Google también está incorporando las capacidades de uso de ordenador de Project Mariner en la API de Gemini y Vertex AI, permitiendo a los desarrolladores crear aplicaciones impulsadas por estas funciones de agente. Empresas como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel ya están explorando su potencial, y se prevé un acceso más amplio para desarrolladores este verano.

La tecnología demuestra capacidades impresionantes, como la función de "enseñar y repetir", donde los usuarios pueden mostrar una tarea una vez para que la IA la aprenda y pueda replicar tareas similares en el futuro. En aplicaciones prácticas, el Modo Agente puede ayudar a buscar piso, explorando anuncios en sitios como Zillow, ajustando filtros e incluso programando visitas según los criterios del usuario.

Este avance supone una evolución significativa en la forma en que los usuarios interactúan con los asistentes de IA. En lugar de requerir comandos específicos para cada paso, ahora los usuarios pueden delegar objetivos completos a Gemini, que determina y ejecuta de manera autónoma las acciones necesarias. Una versión experimental del Modo Agente estará disponible próximamente para los suscriptores de Google AI Ultra, y la compañía destaca que la experiencia estará marcada por el control del usuario, la transparencia y las garantías de seguridad.

Source:

Latest News