In una tappa fondamentale per l’intelligenza artificiale, OpenAI ha annunciato che il suo più recente modello sperimentale di ragionamento ha raggiunto prestazioni da medaglia d’oro alla Olimpiade Internazionale di Matematica (IMO) 2025, considerata la competizione matematica più prestigiosa al mondo.
Il modello ha risolto con successo cinque dei sei problemi proposti all’IMO 2025, ottenendo 35 punti su 42 possibili—equivalenti a una prestazione da medaglia d’oro. Ciò che rende questo risultato particolarmente straordinario è che l’IA ha operato nelle stesse condizioni rigorose dei concorrenti umani: due sessioni d’esame da 4,5 ore ciascuna, senza accesso a strumenti, internet o assistenza esterna.
“Questo rappresenta un nuovo livello di pensiero creativo sostenuto rispetto ai precedenti benchmark,” ha dichiarato Alexander Wei, ricercatore di OpenAI che ha annunciato la svolta. Wei ha sottolineato che l’orizzonte temporale del ragionamento è passato da semplici problemi matematici che i migliori umani risolvono in circa 0,1 minuti, a problemi dell’IMO che richiedono circa 100 minuti di impegno concentrato.
A differenza dei precedenti sistemi di IA progettati specificamente per le competizioni matematiche, il modello di OpenAI è un modello linguistico di ragionamento generale che integra nuove tecniche sperimentali di reinforcement learning e scaling computazionale in fase di test. Tre ex medagliati IMO hanno valutato in modo indipendente le dimostrazioni presentate dal modello, con i punteggi finalizzati solo dopo consenso unanime.
Questo risultato è particolarmente rilevante se confrontato con altri modelli IA di punta. In una recente valutazione di MathArena.ai, concorrenti come Gemini 2.5 Pro, Grok-4 e il precedente modello o3 di OpenAI non sono riusciti a raggiungere nemmeno la soglia della medaglia di bronzo sugli stessi problemi.
Il tempismo di questa svolta coincide con l’imminente rilascio di GPT-5 da parte di OpenAI, previsto nei prossimi mesi. Secondo diverse fonti, GPT-5 unificherà i vari modelli specializzati di OpenAI—including le capacità di ragionamento dimostrate in questa impresa all’IMO—in un unico sistema dotato di un router intelligente che selezionerà automaticamente l’approccio più adatto per ciascun compito.
“Il modello linguistico IMO gold è un modello di ricerca sperimentale. Non prevediamo di rilasciare nulla con questo livello di capacità matematica per diversi mesi,” ha precisato Wei, suggerendo che queste avanzate capacità di ragionamento potrebbero essere integrate nei futuri rilasci pubblici.