Tekoälyn kehityksessä saavutettiin merkittävä virstanpylväs, kun sekä OpenAI että Google DeepMind osoittivat kultamitalitasoista matemaattista päättelykykyä vuoden 2025 kansainvälisissä matematiikkaolympialaisissa (IMO), joka on maailman arvostetuin nuorten matemaatikkojen kilpailu.
Molempien yhtiöiden tekoälymallit saavuttivat identtiset 35 pistettä mahdollisesta 42:sta, ratkaisten viisi kuudesta tehtävästä täydellisesti. Suoritus vastasi tämän vuoden kilpailun kultamitalirajaa, jossa vain noin 11 % 630:stä ihmiskilpailijasta (arviolta 67 opiskelijaa) sai kultamitalin.
Google DeepMindin kehittynyt Gemini with Deep Think -malli arvioitiin ja vahvistettiin virallisesti IMO:n koordinaattoreiden toimesta. IMO:n puheenjohtaja Gregor Dolinar totesi ratkaisujen olleen "monin tavoin hämmästyttäviä" sekä "selkeitä, täsmällisiä ja useimmiten helppoja seurata". Tämä on huomattava edistysaskel viime vuodesta, jolloin DeepMind saavutti hopeamitalitason erikoistuneilla järjestelmillä.
OpenAI puolestaan testasi kokeellista päättelymalliaan samoilla tehtävillä identtisissä kilpailuolosuhteissa – kahdessa 4,5 tunnin koetilaisuudessa ilman internetiä tai apuvälineitä. Vaikka OpenAI ei osallistunut IMO:n viralliseen arviointiprosessiin, yhtiö teetti ratkaisujensa arvioinnin itsenäisesti kolmella entisellä IMO-mitalistilla.
Tulosten julkistuksen ajoitus aiheutti pientä jännitystä yhtiöiden välillä. OpenAI julkaisi tuloksensa 19. heinäkuuta, kun taas Google DeepMind odotti 21. heinäkuuta IMO:n hallituksen pyynnöstä, jotta tulokset jaettaisiin vasta virallisen vahvistuksen ja opiskelijoiden palkitsemisen jälkeen.
Brownin yliopiston matematiikan professori ja Google DeepMindin vieraileva tutkija Junehyuk Jung uskoo, että saavutuksen perusteella tekoäly on alle vuoden päässä siitä, että se voi auttaa matemaatikkoja ratkaisemaan ratkaisemattomia tutkimusongelmia matematiikan eturintamalla. "Uskon, että hetki, jolloin pystymme ratkaisemaan vaikeita päättelytehtäviä luonnollisella kielellä, mahdollistaa yhteistyön tekoälyn ja matemaatikkojen välillä", Jung kertoi Reutersille.
Vaikka tulos on vaikuttava, osa asiantuntijoista muistuttaa, että IMO-tehtävät ovat vaikeudestaan huolimatta käsitteellisesti yksinkertaisempia kuin matematiikan huippututkimuksen ongelmat. Saavutus osoittaa tekoälyn kasvavaa päättelykykyä, mutta ei välttämättä vielä valmiutta kaikkiin matemaattisen tutkimuksen osa-alueisiin.