menu
close

Google amplía el control de computadoras con IA para desarrolladores a través de Gemini

Google está integrando las capacidades de control de computadoras de Project Mariner en la API de Gemini y Vertex AI, permitiendo a los desarrolladores crear aplicaciones que naveguen e interactúen de manera autónoma con interfaces web. Empresas como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel ya están explorando estas capacidades, y se espera un acceso más amplio para desarrolladores este verano. Esta expansión representa un avance significativo en la tecnología de agentes de IA de Google.
Google amplía el control de computadoras con IA para desarrolladores a través de Gemini

Google ha anunciado una importante expansión de su sistema de IA Project Mariner, llevando sus capacidades de control de computadoras a los desarrolladores a través de las plataformas Gemini API y Vertex AI.

Presentado por primera vez a finales de 2024, Project Mariner representa el ambicioso esfuerzo de Google por transformar la forma en que los usuarios interactúan con interfaces digitales mediante agentes de IA. El sistema puede comprender y razonar sobre la información mostrada en la pantalla de una computadora, incluyendo texto, imágenes, código y formularios web, para luego navegar de manera autónoma por sitios web y completar tareas complejas.

La versión más reciente de Project Mariner ha sido significativamente mejorada para ejecutarse en máquinas virtuales en la nube, de manera similar a los agentes de OpenAI y Amazon. Este enfoque basado en la nube permite a los usuarios trabajar en otros proyectos mientras Project Mariner realiza tareas en segundo plano, gestionando hasta diez operaciones diferentes de manera simultánea, lo que representa una mejora sustancial respecto a su predecesor que funcionaba en el navegador.

Varias empresas ya están explorando el potencial de Project Mariner, incluyendo a los especialistas en automatización Automation Anywhere y UiPath, junto con Browserbase, Autotab, The Interaction Company y Cartwheel. Estos primeros adoptantes están aprovechando la capacidad de la tecnología para automatizar flujos de trabajo web complejos que antes requerían una amplia intervención humana.

Google también ha implementado medidas de seguridad avanzadas para proteger contra amenazas como las inyecciones indirectas de instrucciones, donde podrían incrustarse instrucciones maliciosas en los datos recuperados por los modelos de IA. Según Google, estas mejoras de seguridad han incrementado significativamente la tasa de protección de Gemini durante el uso de herramientas, haciendo de Gemini 2.5 la familia de modelos más segura de la compañía hasta la fecha.

El acceso más amplio para desarrolladores a las capacidades de Project Mariner está programado para este verano, lo que podría revolucionar la manera en que los desarrolladores crean aplicaciones de IA capaces de controlar e interactuar con interfaces de computadora. La tecnología también se está integrando en el Modo IA de Google Search, donde inicialmente se encargará de tareas como la compra de boletos para eventos, la realización de reservaciones en restaurantes y la programación de citas locales.

Source:

Latest News