У значний момент для розвитку штучного інтелекту компанія OpenAI оголосила, що її новітня експериментальна модель розумування досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO) 2025 року — найпрестижнішому математичному конкурсі у світі.
Модель успішно розв'язала п’ять із шести завдань IMO-2025, набравши 35 із 42 можливих балів, що відповідає рівню золотої медалі. Особливо вражає те, що ШІ працювала в умовах, ідентичних до людських учасників: дві сесії по 4,5 години без доступу до інструментів, інтернету чи зовнішньої допомоги.
"Це новий рівень стійкого творчого мислення порівняно з попередніми досягненнями," — зазначив Олександр Вей, дослідник OpenAI, який оголосив про прорив. Вей підкреслив, що горизонт розумових задач просунувся від простих математичних прикладів, які найкращі люди вирішують за 0,1 хвилини, до завдань IMO, що потребують близько 100 хвилин зосередженої роботи.
На відміну від попередніх систем ШІ, спеціально розроблених для математичних змагань, модель OpenAI є універсальною мовною моделлю розумування, яка використовує нові експериментальні методики підкріпленого навчання та масштабування обчислень під час тестування. Троє колишніх призерів IMO незалежно перевірили подані моделю розв'язки, а остаточні оцінки були затверджені після одностайної згоди.
Це досягнення особливо помітне на тлі інших провідних моделей ШІ. У нещодавньому тестуванні MathArena.ai конкуренти, зокрема Gemini 2.5 Pro, Grok-4 та попередня модель OpenAI o3, не змогли навіть досягти порогу бронзової медалі на тих самих завданнях.
Час цього прориву збігається з майбутнім релізом GPT-5, який очікується в найближчі місяці. За даними кількох джерел, GPT-5 об'єднає різні спеціалізовані моделі OpenAI — включаючи розумові можливості, продемонстровані на IMO — в єдину систему з "розумним маршрутизатором", що автоматично обиратиме найкращий підхід для кожного завдання.
"Модель LLM, що здобула золото на IMO, є експериментальною дослідницькою розробкою. Ми не плануємо випускати щось із такими математичними можливостями ще кілька місяців," — уточнив Вей, натякаючи, що ці розширені можливості розумування можуть з'явитися у майбутніх публічних релізах.