A Google está a ultrapassar os limites da assistência por IA com a introdução do Modo Agente para o Gemini, representando uma mudança fundamental dos sistemas reativos de consulta-resposta para agentes proativos, capazes de concluir tarefas de forma autónoma.
O Modo Agente, anunciado na Google I/O 2025, permite aos utilizadores indicar simplesmente os seus objetivos e ter o Gemini a orquestrar inteligentemente os passos necessários para os alcançar. A funcionalidade combina capacidades avançadas, incluindo navegação web em tempo real, pesquisa aprofundada e integrações inteligentes com aplicações Google, para gerir tarefas complexas e multi-etapas com mínima supervisão do utilizador.
"Imagine simplesmente indicar o seu objetivo e o Gemini orquestrar inteligentemente os passos para o concretizar", explicou a Google durante o anúncio. A tecnologia baseia-se no Project Mariner, o agente experimental de IA da Google que consegue compreender e raciocinar sobre informação apresentada em ecrãs de navegador, incluindo texto, imagens, formulários e outros elementos web.
A Google está também a levar as capacidades de utilização de computador do Project Mariner à API Gemini e ao Vertex AI, permitindo aos programadores criar aplicações potenciadas por estas funcionalidades agenticas. Empresas como a Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company e Cartwheel já estão a explorar o seu potencial, estando previsto um acesso mais alargado para programadores ainda este verão.
A tecnologia demonstra capacidades impressionantes, incluindo uma função de "ensinar e repetir", onde os utilizadores podem demonstrar uma tarefa uma vez, permitindo à IA aprender e replicar tarefas semelhantes no futuro. Em aplicações práticas, o Modo Agente pode ajudar na procura de apartamentos, pesquisando anúncios em sites como o Zillow, ajustando filtros e até agendando visitas com base nos critérios do utilizador.
Este avanço representa uma evolução significativa na forma como os utilizadores interagem com assistentes de IA. Em vez de comandos específicos para cada passo, os utilizadores podem agora delegar objetivos inteiros ao Gemini, que determina e executa autonomamente as ações necessárias. Uma versão experimental do Modo Agente estará brevemente disponível para subscritores do Google AI Ultra, com a empresa a enfatizar o controlo do utilizador, a transparência e as salvaguardas de segurança ao longo de toda a experiência.