Google transforme son modèle d’IA le plus avancé, Gemini 2.5 Pro, en ce qu’il appelle un « modèle du monde » — un système capable de comprendre et de simuler des aspects de la réalité d’une manière qui reflète le fonctionnement du cerveau humain.
Selon les récentes annonces de Google DeepMind lors de Google I/O 2025, cette capacité de modèle du monde permettra à Gemini d’élaborer des plans et d’imaginer de nouvelles expériences en comprenant et en simulant des aspects du monde. Il s’agit d’une évolution majeure de la capacité de l’IA à raisonner sur des environnements complexes et à interagir avec eux.
« C’est pourquoi nous travaillons à étendre notre meilleur modèle fondamental multimodal, Gemini 2.5 Pro, pour qu’il devienne un “modèle du monde” capable de planifier et d’imaginer de nouvelles expériences en comprenant et en simulant des aspects du monde, tout comme le fait le cerveau », a déclaré Google dans son blogue officiel.
L’approche du modèle du monde s’appuie sur les vastes recherches de Google visant à entraîner des agents d’IA à maîtriser des jeux complexes et à créer des simulations interactives. Ces capacités se manifestent déjà dans la façon dont Gemini utilise ses connaissances du monde et son raisonnement pour représenter des environnements naturels, comprendre la physique intuitive, enseigner à des robots à suivre des instructions et s’adapter en temps réel.
Au cœur de cette évolution se trouve la nouvelle fonction Deep Think, un mode expérimental de raisonnement amélioré pour Gemini 2.5 Pro. Deep Think permet au modèle d’envisager plusieurs hypothèses avant de répondre, ce qui améliore considérablement ses performances dans des tâches complexes de mathématiques et de programmation. Cette fonction a déjà obtenu des résultats impressionnants sur des bancs d’essai exigeants comme le concours mathématique USAMO 2025 et LiveCodeBench pour la programmation.
Gemini 2.5 Pro avec Deep Think est actuellement offert à des testeurs de confiance via l’API Gemini, Google procédant à des évaluations de sécurité supplémentaires avant un déploiement plus large. Par ailleurs, la version standard de Gemini 2.5 Pro devrait être disponible pour tous d’ici la fin juin 2025, après la sortie antérieure de Gemini 2.5 Flash.
Cette avancée vers la modélisation du monde s’inscrit dans la vision plus large de Google de créer un assistant IA universel capable de comprendre le contexte, de planifier efficacement et d’agir sur différents appareils — transformant ultimement la façon dont les humains interagissent avec les systèmes d’IA.