В значим етап за изкуствения интелект OpenAI обяви, че последният ѝ експериментален модел за разсъждение е постигнал резултат, равняващ се на златен медал на Международната математическа олимпиада (IMO) 2025 — най-престижното математическо състезание в света.
Моделът успешно е решил пет от шестте задачи от IMO 2025, като е събрал 35 от възможни 42 точки — резултат, еквивалентен на златен медал. Особено впечатляващо е, че ИИ е работил при същите строги условия като човешките участници: два изпитни модула по 4,5 часа, без достъп до инструменти, интернет или външна помощ.
"Това представлява ново ниво на устойчиво творческо мислене спрямо досегашните стандарти," коментира Александър Уей, изследовател в OpenAI, който обяви пробива. Уей отбелязва, че хоризонтът на разсъждение е напреднал от прости математически задачи, които най-добрите хора решават за около 0,1 минути, до задачи от IMO, изискващи приблизително 100 минути концентрирани усилия.
За разлика от предишни ИИ системи, създадени специално за математически състезания, моделът на OpenAI е универсален езиков модел за разсъждение, който включва нови експериментални техники в подсилващото обучение и мащабиране на изчисленията по време на тестове. Трима бивши медалисти от IMO независимо са оценили подадените от модела решения, като крайните оценки са определени след единодушно съгласие.
Това постижение е особено забележително в сравнение с други водещи ИИ модели. В скорошна оценка на MathArena.ai конкуренти като Gemini 2.5 Pro, Grok-4 и по-старият модел o3 на OpenAI не успяват да достигнат дори прага за бронзов медал на същите задачи.
Пробивът съвпада с предстоящото пускане на GPT-5 от OpenAI, очаквано през следващите месеци. Според множество източници GPT-5 ще обедини различните специализирани модели на OpenAI — включително възможностите за разсъждение, демонстрирани в този IMO успех — в една система с интелигентен маршрутизатор, който автоматично избира най-подходящия подход за всяка задача.
"LLM моделът със златен медал от IMO е експериментален изследователски модел. Не планираме да пускаме нищо с това ниво на математически възможности през следващите няколко месеца," уточнява Уей, намеквайки, че тези напреднали възможности за разсъждение може да бъдат включени в бъдещи публични версии.