Dans une étape importante pour l’intelligence artificielle, OpenAI a annoncé que son plus récent modèle expérimental de raisonnement a atteint une performance de niveau médaille d’or à l’Olympiade internationale de mathématiques (OIM) 2025, considérée comme la compétition de mathématiques la plus prestigieuse au monde.
Le modèle a réussi à résoudre cinq des six problèmes de l’OIM 2025, obtenant 35 points sur un maximum de 42 — soit une performance équivalente à une médaille d’or. Ce qui rend cette réussite particulièrement remarquable, c’est que l’IA a opéré dans les mêmes conditions strictes que les concurrents humains : deux séances d’examen de 4,5 heures, sans accès à des outils, à Internet ou à une aide externe.
« Cela représente un nouveau niveau de créativité soutenue par rapport aux références précédentes », a déclaré Alexander Wei, chercheur chez OpenAI qui a annoncé la percée. Wei a souligné que l’horizon temporel du raisonnement est passé de problèmes mathématiques simples, que les meilleurs humains résolvent en environ 0,1 minute, à des problèmes de l’OIM qui exigent environ 100 minutes d’effort concentré.
Contrairement aux systèmes d’IA précédents conçus spécifiquement pour les compétitions mathématiques, le modèle d’OpenAI est un modèle de langage généraliste axé sur le raisonnement, qui intègre de nouvelles techniques expérimentales d’apprentissage par renforcement et d’ajustement de la puissance de calcul lors de l’exécution. Trois anciens médaillés de l’OIM ont corrigé de façon indépendante les preuves soumises par le modèle, et les notes ont été finalisées après un consensus unanime.
Cette réalisation est d’autant plus notable lorsqu’on la compare à d’autres modèles d’IA de pointe. Lors d’une évaluation récente menée par MathArena.ai, des concurrents comme Gemini 2.5 Pro, Grok-4 et l’ancien modèle o3 d’OpenAI n’ont même pas atteint le seuil de la médaille de bronze sur les mêmes problèmes.
Le moment de cette percée coïncide avec la sortie prochaine de GPT-5 par OpenAI, attendue dans les prochains mois. Selon plusieurs sources, GPT-5 unifiera les divers modèles spécialisés d’OpenAI — y compris les capacités de raisonnement démontrées lors de cette OIM — en un seul système doté d’un routeur intelligent qui sélectionnera automatiquement l’approche la plus appropriée pour chaque tâche.
« Le modèle LLM médaillé d’or à l’OIM est un modèle de recherche expérimental. Nous ne prévoyons pas de publier quoi que ce soit avec ce niveau de capacité mathématique avant plusieurs mois », a précisé Wei, laissant entendre que ces capacités avancées de raisonnement pourraient être intégrées dans de futures versions publiques.