A Google está transformando seu modelo de IA mais avançado, o Gemini 2.5 Pro, no que chama de 'modelo de mundo' — um sistema capaz de compreender e simular aspectos da realidade de maneiras que espelham o funcionamento do cérebro humano.
Segundo anúncios recentes do Google DeepMind durante o Google I/O 2025, essa capacidade de modelo de mundo permitirá ao Gemini fazer planos e imaginar novas experiências ao entender e simular aspectos do mundo. Isso representa uma grande evolução na capacidade da IA de raciocinar sobre e interagir com ambientes complexos.
"É por isso que estamos trabalhando para expandir nosso melhor modelo fundacional multimodal, o Gemini 2.5 Pro, para se tornar um 'modelo de mundo' que pode fazer planos e imaginar novas experiências ao compreender e simular aspectos do mundo, assim como o cérebro faz", afirmou a Google em seu blog oficial.
A abordagem de modelo de mundo se baseia nas extensas pesquisas da Google no treinamento de agentes de IA para dominar jogos complexos e criar simulações interativas. Evidências dessas capacidades já estão surgindo na habilidade do Gemini de usar conhecimento de mundo e raciocínio para representar ambientes naturais, compreender física intuitiva e ensinar robôs a seguir instruções e se adaptar em tempo real.
No centro dessa evolução está o novo recurso Deep Think, um modo experimental de raciocínio aprimorado para o Gemini 2.5 Pro. O Deep Think permite ao modelo considerar múltiplas hipóteses antes de responder, melhorando significativamente o desempenho em tarefas complexas de matemática e programação. O recurso já alcançou pontuações impressionantes em benchmarks desafiadores, como a competição de matemática USAMO 2025 e o LiveCodeBench para programação.
O Gemini 2.5 Pro com Deep Think está atualmente disponível para testadores de confiança via API do Gemini, enquanto a Google realiza avaliações adicionais de segurança antes de um lançamento mais amplo. Enquanto isso, espera-se que o modelo padrão Gemini 2.5 Pro esteja disponível de forma geral até o final de junho de 2025, após o lançamento anterior do Gemini 2.5 Flash.
Esse avanço rumo à modelagem de mundo faz parte da visão mais ampla da Google de criar um assistente universal de IA capaz de entender contexto, planejar de forma eficaz e agir em diferentes dispositivos — transformando, em última análise, a forma como os humanos interagem com sistemas de IA.