menu
close

Modo Agente do Gemini da Google: Assistentes de IA Evoluem de Reativos para Proativos

A Google revelou o Modo Agente, uma funcionalidade inovadora do Gemini que permite aos utilizadores descreverem simplesmente os seus objetivos finais e deixar que a IA conclua autonomamente tarefas complexas em seu nome. Esta capacidade experimental utiliza a tecnologia de utilização de computador do Project Mariner, que também está a ser integrada na API Gemini e no Vertex AI para programadores. Várias empresas, incluindo a Automation Anywhere, UiPath e Browserbase, já estão a explorar o seu potencial para transformar fluxos de trabalho de automação.
Modo Agente do Gemini da Google: Assistentes de IA Evoluem de Reativos para Proativos

A Google está a ultrapassar os limites da assistência por IA com a introdução do Modo Agente para o Gemini, representando uma mudança fundamental dos sistemas reativos de consulta-resposta para agentes proativos, capazes de concluir tarefas de forma autónoma.

O Modo Agente, anunciado na Google I/O 2025, permite aos utilizadores indicar simplesmente os seus objetivos e ter o Gemini a orquestrar inteligentemente os passos necessários para os alcançar. A funcionalidade combina capacidades avançadas, incluindo navegação web em tempo real, pesquisa aprofundada e integrações inteligentes com aplicações Google, para gerir tarefas complexas e multi-etapas com mínima supervisão do utilizador.

"Imagine simplesmente indicar o seu objetivo e o Gemini orquestrar inteligentemente os passos para o concretizar", explicou a Google durante o anúncio. A tecnologia baseia-se no Project Mariner, o agente experimental de IA da Google que consegue compreender e raciocinar sobre informação apresentada em ecrãs de navegador, incluindo texto, imagens, formulários e outros elementos web.

A Google está também a levar as capacidades de utilização de computador do Project Mariner à API Gemini e ao Vertex AI, permitindo aos programadores criar aplicações potenciadas por estas funcionalidades agenticas. Empresas como a Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company e Cartwheel já estão a explorar o seu potencial, estando previsto um acesso mais alargado para programadores ainda este verão.

A tecnologia demonstra capacidades impressionantes, incluindo uma função de "ensinar e repetir", onde os utilizadores podem demonstrar uma tarefa uma vez, permitindo à IA aprender e replicar tarefas semelhantes no futuro. Em aplicações práticas, o Modo Agente pode ajudar na procura de apartamentos, pesquisando anúncios em sites como o Zillow, ajustando filtros e até agendando visitas com base nos critérios do utilizador.

Este avanço representa uma evolução significativa na forma como os utilizadores interagem com assistentes de IA. Em vez de comandos específicos para cada passo, os utilizadores podem agora delegar objetivos inteiros ao Gemini, que determina e executa autonomamente as ações necessárias. Uma versão experimental do Modo Agente estará brevemente disponível para subscritores do Google AI Ultra, com a empresa a enfatizar o controlo do utilizador, a transparência e as salvaguardas de segurança ao longo de toda a experiência.

Source:

Latest News