Google ha anunciado una importante expansión de su sistema de IA Project Mariner, llevando sus capacidades de control de computadoras a los desarrolladores a través de las plataformas Gemini API y Vertex AI.
Presentado por primera vez a finales de 2024, Project Mariner representa el ambicioso esfuerzo de Google por transformar la forma en que los usuarios interactúan con interfaces digitales mediante agentes de IA. El sistema puede comprender y razonar sobre la información mostrada en la pantalla de una computadora, incluyendo texto, imágenes, código y formularios web, para luego navegar de manera autónoma por sitios web y completar tareas complejas.
La versión más reciente de Project Mariner ha sido significativamente mejorada para ejecutarse en máquinas virtuales en la nube, de manera similar a los agentes de OpenAI y Amazon. Este enfoque basado en la nube permite a los usuarios trabajar en otros proyectos mientras Project Mariner realiza tareas en segundo plano, gestionando hasta diez operaciones diferentes de manera simultánea, lo que representa una mejora sustancial respecto a su predecesor que funcionaba en el navegador.
Varias empresas ya están explorando el potencial de Project Mariner, incluyendo a los especialistas en automatización Automation Anywhere y UiPath, junto con Browserbase, Autotab, The Interaction Company y Cartwheel. Estos primeros adoptantes están aprovechando la capacidad de la tecnología para automatizar flujos de trabajo web complejos que antes requerían una amplia intervención humana.
Google también ha implementado medidas de seguridad avanzadas para proteger contra amenazas como las inyecciones indirectas de instrucciones, donde podrían incrustarse instrucciones maliciosas en los datos recuperados por los modelos de IA. Según Google, estas mejoras de seguridad han incrementado significativamente la tasa de protección de Gemini durante el uso de herramientas, haciendo de Gemini 2.5 la familia de modelos más segura de la compañía hasta la fecha.
El acceso más amplio para desarrolladores a las capacidades de Project Mariner está programado para este verano, lo que podría revolucionar la manera en que los desarrolladores crean aplicaciones de IA capaces de controlar e interactuar con interfaces de computadora. La tecnología también se está integrando en el Modo IA de Google Search, donde inicialmente se encargará de tareas como la compra de boletos para eventos, la realización de reservaciones en restaurantes y la programación de citas locales.