Dans une étape majeure pour l’intelligence artificielle, OpenAI a annoncé que son dernier modèle expérimental de raisonnement a atteint un niveau de performance équivalent à la médaille d’or lors de l’Olympiade Internationale de Mathématiques (IMO) 2025, considérée comme la compétition de mathématiques la plus prestigieuse au monde.
Le modèle a réussi à résoudre cinq des six problèmes de l’IMO 2025, obtenant 35 points sur 42 possibles — soit une performance digne d’une médaille d’or. Ce qui rend cette réussite particulièrement remarquable, c’est que l’IA a travaillé dans les mêmes conditions strictes que les candidats humains : deux sessions d’examen de 4,5 heures, sans accès à des outils, à Internet ou à une aide extérieure.
« Cela représente un nouveau palier de créativité soutenue par rapport aux précédents jalons », a déclaré Alexander Wei, chercheur chez OpenAI qui a annoncé cette percée. Wei a souligné que l’horizon temporel du raisonnement est passé de problèmes mathématiques simples, que les meilleurs humains résolvent en environ 0,1 minute, à des problèmes de l’IMO nécessitant environ 100 minutes de concentration intense.
Contrairement aux précédents systèmes d’IA conçus spécifiquement pour les compétitions mathématiques, le modèle d’OpenAI est un modèle de langage généraliste doté de capacités de raisonnement, intégrant de nouvelles techniques expérimentales d’apprentissage par renforcement et d’ajustement de la puissance de calcul lors des tests. Trois anciens médaillés de l’IMO ont corrigé de manière indépendante les preuves soumises par le modèle, les notes étant finalisées après consensus unanime.
Cette réussite est d’autant plus notable lorsqu’on la compare à d’autres modèles d’IA de pointe. Lors d’une récente évaluation menée par MathArena.ai, des concurrents tels que Gemini 2.5 Pro, Grok-4 et l’ancien modèle o3 d’OpenAI n’ont même pas atteint le seuil de la médaille de bronze sur les mêmes problèmes.
Le calendrier de cette percée coïncide avec la sortie prochaine de GPT-5 par OpenAI, attendue dans les mois à venir. Selon plusieurs sources, GPT-5 unifiera les différents modèles spécialisés d’OpenAI — y compris les capacités de raisonnement démontrées lors de cette réussite à l’IMO — en un seul système doté d’un routeur intelligent qui sélectionnera automatiquement l’approche la plus adaptée à chaque tâche.
« Le LLM médaillé d’or à l’IMO est un modèle de recherche expérimental. Nous ne prévoyons pas de publier quoi que ce soit avec ce niveau de capacité mathématique avant plusieurs mois », a précisé Wei, suggérant que ces capacités avancées de raisonnement pourraient être intégrées dans de futures versions publiques.