menu
close

L’IA di OpenAI conquista la medaglia d’oro alla Olimpiade Internazionale di Matematica

OpenAI ha annunciato che il suo modello sperimentale di linguaggio per il ragionamento ha raggiunto prestazioni da medaglia d’oro alla Olimpiade Internazionale di Matematica (IMO) 2025, risolvendo 5 problemi su 6 nelle stesse condizioni dei concorrenti umani. Questa svolta rappresenta un notevole avanzamento nelle capacità di ragionamento dell’IA, dimostrando un pensiero creativo sostenuto che finora si riteneva esclusivamente umano. Il risultato arriva mentre OpenAI si prepara a lanciare GPT-5, che unificherà modelli specializzati, inclusi quelli con avanzate capacità di ragionamento.
L’IA di OpenAI conquista la medaglia d’oro alla Olimpiade Internazionale di Matematica

In una tappa fondamentale per l’intelligenza artificiale, OpenAI ha annunciato che il suo più recente modello sperimentale di ragionamento ha raggiunto prestazioni da medaglia d’oro alla Olimpiade Internazionale di Matematica (IMO) 2025, considerata la competizione matematica più prestigiosa al mondo.

Il modello ha risolto con successo cinque dei sei problemi proposti all’IMO 2025, ottenendo 35 punti su 42 possibili—equivalenti a una prestazione da medaglia d’oro. Ciò che rende questo risultato particolarmente straordinario è che l’IA ha operato nelle stesse condizioni rigorose dei concorrenti umani: due sessioni d’esame da 4,5 ore ciascuna, senza accesso a strumenti, internet o assistenza esterna.

“Questo rappresenta un nuovo livello di pensiero creativo sostenuto rispetto ai precedenti benchmark,” ha dichiarato Alexander Wei, ricercatore di OpenAI che ha annunciato la svolta. Wei ha sottolineato che l’orizzonte temporale del ragionamento è passato da semplici problemi matematici che i migliori umani risolvono in circa 0,1 minuti, a problemi dell’IMO che richiedono circa 100 minuti di impegno concentrato.

A differenza dei precedenti sistemi di IA progettati specificamente per le competizioni matematiche, il modello di OpenAI è un modello linguistico di ragionamento generale che integra nuove tecniche sperimentali di reinforcement learning e scaling computazionale in fase di test. Tre ex medagliati IMO hanno valutato in modo indipendente le dimostrazioni presentate dal modello, con i punteggi finalizzati solo dopo consenso unanime.

Questo risultato è particolarmente rilevante se confrontato con altri modelli IA di punta. In una recente valutazione di MathArena.ai, concorrenti come Gemini 2.5 Pro, Grok-4 e il precedente modello o3 di OpenAI non sono riusciti a raggiungere nemmeno la soglia della medaglia di bronzo sugli stessi problemi.

Il tempismo di questa svolta coincide con l’imminente rilascio di GPT-5 da parte di OpenAI, previsto nei prossimi mesi. Secondo diverse fonti, GPT-5 unificherà i vari modelli specializzati di OpenAI—including le capacità di ragionamento dimostrate in questa impresa all’IMO—in un unico sistema dotato di un router intelligente che selezionerà automaticamente l’approccio più adatto per ciascun compito.

“Il modello linguistico IMO gold è un modello di ricerca sperimentale. Non prevediamo di rilasciare nulla con questo livello di capacità matematica per diversi mesi,” ha precisato Wei, suggerendo che queste avanzate capacità di ragionamento potrebbero essere integrate nei futuri rilasci pubblici.

Source: Analyticsindiamag

Latest News