Важен етап за изкуствения интелект беше постигнат, след като както OpenAI, така и Google DeepMind демонстрираха математически умения на ниво златен медал на Международната математическа олимпиада (IMO) 2025 – най-престижното състезание за млади математици в света.
AI моделите и на двете компании постигнаха еднакви резултати – 35 от възможни 42 точки, като решиха перфектно пет от шестте задачи. Това съответства на прага за златен медал на тазгодишното състезание, където само около 11% от 630-те човешки участници (приблизително 67 ученици) получиха златни медали.
Разширената версия на Gemini с Deep Think на Google DeepMind беше официално оценена и сертифицирана от координаторите на IMO, като президентът на IMO Грегор Долинар отбеляза, че решенията им са „впечатляващи в много отношения“ и „ясни, прецизни и повечето лесни за проследяване“. Това е значителен напредък спрямо миналата година, когато DeepMind спечели сребърен медал със специализирани системи.
OpenAI оцени своя експериментален модел за разсъждение върху същите задачи при идентични условия на състезанието – два изпита по 4,5 часа без достъп до интернет или помощни инструменти. Макар OpenAI да не участваше в официалния процес на оценяване на IMO, компанията възложи независима проверка на решенията си от трима бивши медалисти от олимпиадата.
Времето на обявяването на резултатите доведе до известно напрежение между компаниите. OpenAI публикува своите резултати на 19 юли, докато Google DeepMind изчака до 21 юли, спазвайки искането на Борда на IMO да се обявят резултатите след официалната верификация и признаване на постиженията на учениците.
Джунхьок Джунг, професор по математика в Университета Браун и гост-изследовател в Google DeepMind, смята, че това постижение показва, че AI е на по-малко от година разстояние от това да помага на математиците да решават неразрешени изследователски проблеми на границата на математиката. „Мисля, че моментът, в който можем да решаваме трудни задачи за разсъждение на естествен език, ще отключи потенциала за сътрудничество между AI и математиците“, казва Джунг пред Reuters.
Въпреки впечатляващия успех, някои експерти предупреждават, че задачите от IMO, макар и трудни, са концептуално по-прости от изследователската математика на границата на науката. Постижението демонстрира нарастващите способности на AI за разсъждение, но не означава непременно готовност за всички аспекти на математическите изследвания.