menu
close

Google transforme Gemini 2.5 Pro en un modèle avancé de simulation du monde

Google étend les capacités de son IA phare, Gemini 2.5 Pro, pour en faire un « modèle du monde » sophistiqué, capable de planifier et de simuler de nouvelles expériences. Cette évolution permettra à l’IA de comprendre et de modéliser des aspects du monde de manière similaire à la cognition humaine, représentant ainsi une avancée majeure dans le domaine de l’intelligence artificielle. Ce développement constitue une étape clé vers la vision de Google de créer un assistant universel capable d’opérer sur tous les appareils.
Google transforme Gemini 2.5 Pro en un modèle avancé de simulation du monde

Google DeepMind s’attèle à transformer son modèle fondamental multimodal le plus avancé, Gemini 2.5 Pro, en ce qu’il qualifie de « modèle du monde » – un système d’IA capable de comprendre et de simuler des aspects du monde réel en imitant les processus cognitifs humains.

Annoncé lors de la conférence Google I/O 2025, ce projet ambitieux vise à créer une IA capable d’établir des plans et d’imaginer de nouvelles expériences en modélisant le fonctionnement du monde. Selon Demis Hassabis, PDG de DeepMind, cette capacité représente une avancée fondamentale de l’intelligence artificielle, dépassant la simple classification et prédiction.

« C’est pourquoi nous travaillons à étendre notre meilleur modèle fondamental multimodal, Gemini 2.5 Pro, pour qu’il devienne un ‘modèle du monde’ capable d’élaborer des plans et d’imaginer de nouvelles expériences en comprenant et en simulant des aspects du monde, tout comme le fait le cerveau », a expliqué Hassabis dans un récent billet de blog.

Google observe déjà les premiers signes de ces capacités de modélisation du monde dans la faculté de Gemini à représenter et simuler des environnements naturels, à comprendre la physique intuitive via son modèle Veo, et à apprendre à des robots à saisir des objets et à suivre des instructions grâce à Gemini Robotics.

L’entreprise qualifie ce développement d’étape cruciale vers la création d’un « assistant IA universel » – un système intelligent capable de comprendre le contexte, de planifier et d’agir sur n’importe quel appareil. La vision ultime de Google est de transformer l’application Gemini en un assistant capable d’effectuer des tâches quotidiennes, de gérer des tâches administratives et de fournir des recommandations personnalisées.

Cette capacité de modélisation du monde s’appuie sur les remarquables aptitudes de raisonnement déjà démontrées par Gemini 2.5 Pro. Le modèle se classe actuellement en tête des benchmarks pour les tâches complexes de mathématiques, de sciences et de programmation, et occupe la première place sur les classements LMArena et WebDev Arena, qui mesurent les préférences humaines pour les interactions avec l’IA.

Google prévoit d’intégrer ces capacités de modélisation du monde avec les technologies des projets Mariner et Astra, axés respectivement sur le multitâche et la compréhension visuelle. La version améliorée de Gemini 2.5 Pro devrait être disponible de manière générale en juin 2025, à l’issue de sa phase de prévisualisation actuelle.

Source:

Latest News