A Google está a transformar o seu modelo de IA mais avançado, o Gemini 2.5 Pro, naquilo a que chama um 'modelo do mundo' – um sistema capaz de compreender e simular aspetos da realidade de forma semelhante ao funcionamento do cérebro humano.
De acordo com os anúncios recentes da Google DeepMind na Google I/O 2025, esta capacidade de modelo do mundo permitirá ao Gemini fazer planos e imaginar novas experiências, compreendendo e simulando aspetos do mundo. Isto representa uma evolução significativa na capacidade da IA para raciocinar sobre ambientes complexos e interagir com eles.
"É por isso que estamos a trabalhar para expandir o nosso melhor modelo fundacional multimodal, o Gemini 2.5 Pro, para se tornar um 'modelo do mundo' capaz de fazer planos e imaginar novas experiências, compreendendo e simulando aspetos do mundo, tal como o cérebro faz", afirmou a Google no seu blogue oficial.
A abordagem de modelo do mundo baseia-se na vasta investigação da Google no treino de agentes de IA para dominar jogos complexos e criar simulações interativas. Já são visíveis provas destas capacidades na aptidão do Gemini para utilizar conhecimento do mundo e raciocínio para representar ambientes naturais, compreender física intuitiva e ensinar robôs a seguir instruções e adaptar-se em tempo real.
No centro desta evolução está a nova funcionalidade Deep Think, um modo experimental de raciocínio avançado para o Gemini 2.5 Pro. O Deep Think permite ao modelo considerar múltiplas hipóteses antes de responder, melhorando significativamente o desempenho em tarefas complexas de matemática e programação. Esta funcionalidade já alcançou resultados impressionantes em benchmarks exigentes, como a competição de matemática USAMO 2025 e o LiveCodeBench para programação.
O Gemini 2.5 Pro com Deep Think está atualmente disponível para testadores de confiança através da API Gemini, estando a Google a realizar avaliações adicionais de segurança antes de um lançamento mais alargado. Entretanto, espera-se que o modelo padrão Gemini 2.5 Pro esteja geralmente disponível até ao final de junho de 2025, após o lançamento anterior do Gemini 2.5 Flash.
Este avanço rumo à modelação do mundo faz parte da visão mais ampla da Google de criar um assistente universal de IA capaz de compreender o contexto, planear eficazmente e agir em vários dispositivos – transformando, em última análise, a forma como os humanos interagem com sistemas de IA.