A Google está a expandir as suas capacidades de IA ao integrar as funcionalidades de utilização de computador do Project Mariner nas plataformas Gemini API e Vertex AI, representando um passo importante no desenvolvimento de sistemas de IA agente.
O Project Mariner, apresentado pela primeira vez no final de 2024, é um protótipo de investigação da Google DeepMind que explora a interação entre humanos e agentes através de navegadores web. O sistema consegue observar o que é apresentado nos navegadores, interpretar objetivos complexos, planear passos acionáveis e navegar autonomamente em websites para concluir tarefas. É capaz de gerir múltiplas operações em simultâneo, sendo que a versão mais recente consegue realizar até dez tarefas diferentes ao mesmo tempo.
Diversas empresas tecnológicas já estão a explorar o potencial do Project Mariner. A Automation Anywhere, líder em automação de processos com agentes, e a UiPath, conhecida pela sua plataforma de automação, estão entre os primeiros a adotar a tecnologia. Outros parceiros incluem a Browserbase, que desenvolve frameworks de automação de navegadores com IA, a Autotab, a The Interaction Company e a Cartwheel, uma plataforma de texto para animação fundada em 2023.
A integração com a Gemini API e o Vertex AI permitirá aos programadores criar aplicações potenciadas por estas capacidades de agentes. A Google reforçou também significativamente as proteções de segurança contra ameaças como injeções indiretas de prompts, tornando a família de modelos Gemini 2.5 a mais segura até à data.
Os subscritores do Google AI Ultra nos EUA já têm acesso ao Project Mariner, estando previsto um acesso mais alargado para programadores durante este verão. A empresa está igualmente a trazer algumas das capacidades do Mariner para outros produtos Google, incluindo o Modo IA no Search Labs, onde permitirá tarefas como a compra de bilhetes para eventos e reservas em restaurantes.
Este desenvolvimento representa uma mudança fundamental na forma como os utilizadores interagem com a internet, podendo passar da interação direta com websites para a delegação de tarefas a agentes de IA. À medida que estas capacidades amadurecem, poderão revolucionar a automação em vários setores e permitir o surgimento de novas aplicações para assistentes de IA.