menu
close

I modelli AI di OpenAI e DeepMind conquistano l’oro alle Olimpiadi Internazionali di Matematica

I modelli di intelligenza artificiale di OpenAI e Google DeepMind hanno entrambi ottenuto la medaglia d’oro alle Olimpiadi Internazionali di Matematica (IMO) 2025, totalizzando 35 punti su 42 grazie alla risoluzione perfetta di cinque problemi su sei. Questo risultato, ufficialmente certificato dai giudici dell’IMO, colloca i sistemi AI tra l’11% dei migliori concorrenti nella più prestigiosa competizione matematica mondiale. Gli esperti suggeriscono che questa svolta potrebbe portare l’AI ad assistere i matematici nella ricerca di frontiera già entro un anno.
I modelli AI di OpenAI e DeepMind conquistano l’oro alle Olimpiadi Internazionali di Matematica

In un traguardo significativo per l’intelligenza artificiale, sia OpenAI che Google DeepMind hanno dimostrato capacità di ragionamento matematico da medaglia d’oro alle Olimpiadi Internazionali di Matematica (IMO) 2025, la competizione più prestigiosa al mondo per giovani matematici.

I modelli AI di entrambe le aziende hanno raggiunto punteggi identici di 35 su un massimo di 42 punti, risolvendo perfettamente cinque dei sei problemi proposti. Questa prestazione ha eguagliato la soglia per la medaglia d’oro di quest’anno, in cui solo circa l’11% dei 630 concorrenti umani (circa 67 studenti) ha ricevuto la medaglia d’oro.

La versione avanzata di Gemini con Deep Think di Google DeepMind è stata ufficialmente valutata e certificata dai coordinatori dell’IMO, con il presidente Gregor Dolinar che ha sottolineato come le soluzioni fossero "sorprendenti sotto molti aspetti" e "chiare, precise e per la maggior parte facili da seguire". Si tratta di un notevole progresso rispetto all’anno scorso, quando DeepMind aveva ottenuto la medaglia d’argento utilizzando sistemi specializzati.

OpenAI ha valutato il proprio modello sperimentale di ragionamento sugli stessi problemi, nelle stesse condizioni di gara: due sessioni d’esame da 4,5 ore senza accesso a internet o strumenti esterni. Sebbene OpenAI non abbia partecipato al processo di valutazione ufficiale dell’IMO, le sue soluzioni sono state valutate in modo indipendente da tre ex medagliati IMO.

La tempistica degli annunci ha generato una certa tensione tra le aziende. OpenAI ha pubblicato i propri risultati il 19 luglio, mentre Google DeepMind ha atteso fino al 21 luglio, rispettando la richiesta del Consiglio IMO di condividere i risultati solo dopo la verifica ufficiale e il riconoscimento degli studenti.

Junehyuk Jung, professore di matematica alla Brown University e visiting researcher presso Google DeepMind, ritiene che questo risultato suggerisca che l’AI sia a meno di un anno dal poter aiutare i matematici ad affrontare problemi di ricerca irrisolti ai confini della matematica. "Credo che il momento in cui riusciremo a risolvere problemi di ragionamento complessi in linguaggio naturale aprirà la strada a una collaborazione tra AI e matematici", ha dichiarato Jung a Reuters.

Nonostante l’impressionante risultato, alcuni esperti mettono in guardia: i problemi dell’IMO, seppur difficili, sono concettualmente più semplici rispetto alla matematica di ricerca di frontiera. L’impresa dimostra le crescenti capacità di ragionamento dell’AI, ma non implica necessariamente che sia pronta per affrontare tutti gli aspetti della ricerca matematica.

Source: Co

Latest News