O Google está ampliando os limites da assistência por IA com a introdução do Modo Agente para o Gemini, representando uma mudança fundamental dos sistemas reativos de pergunta e resposta para agentes proativos capazes de concluir tarefas de forma autônoma.
Anunciado no Google I/O 2025, o Modo Agente permite que os usuários simplesmente declarem seus objetivos e deixem o Gemini orquestrar de forma inteligente os passos necessários para alcançá-los. O recurso combina capacidades avançadas, incluindo navegação web em tempo real, pesquisas aprofundadas e integrações inteligentes com aplicativos do Google para gerenciar tarefas complexas e de múltiplas etapas com mínima supervisão do usuário.
"Imagine simplesmente declarar seu objetivo, e o Gemini orquestra de forma inteligente os passos para alcançá-lo", explicou o Google durante o anúncio. A tecnologia se baseia no Project Mariner, o agente experimental de IA do Google que pode compreender e raciocinar sobre informações exibidas em telas de navegador, incluindo textos, imagens, formulários e outros elementos da web.
O Google também está levando as capacidades de uso de computador do Project Mariner para a API do Gemini e para o Vertex AI, permitindo que desenvolvedores criem aplicações impulsionadas por esses recursos agentivos. Empresas como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company e Cartwheel já estão explorando seu potencial, com um acesso mais amplo para desenvolvedores previsto para este verão.
A tecnologia demonstra capacidades impressionantes, incluindo uma função de "ensinar e repetir", na qual os usuários podem demonstrar uma tarefa uma vez, permitindo que a IA aprenda e replique tarefas semelhantes no futuro. Em aplicações práticas, o Modo Agente pode ajudar na busca por apartamentos, pesquisando anúncios em sites como o Zillow, ajustando filtros e até mesmo agendando visitas de acordo com os critérios do usuário.
Esse avanço representa uma evolução significativa na forma como os usuários interagem com assistentes de IA. Em vez de comandos específicos para cada etapa, agora é possível delegar objetivos inteiros ao Gemini, que determina e executa autonomamente as ações necessárias. Uma versão experimental do Modo Agente estará disponível em breve para assinantes do Google AI Ultra, com a empresa enfatizando o controle do usuário, a transparência e salvaguardas de segurança em toda a experiência.