Важное достижение в области искусственного интеллекта: компания OpenAI объявила, что её новейшая экспериментальная модель для рассуждений достигла уровня золотой медали на Международной математической олимпиаде (IMO) 2025 года — самом престижном математическом соревновании в мире.
Модель успешно решила пять из шести задач IMO-2025, набрав 35 из 42 возможных баллов, что соответствует результату золотой медали. Особенно примечательно, что ИИ работал в условиях, идентичных тем, что были у человеческих участников: два экзамена по 4,5 часа без доступа к инструментам, интернету или внешней помощи.
«Это новый уровень устойчивого творческого мышления по сравнению с предыдущими рубежами», — отметил Александр Вэй, исследователь OpenAI, объявивший о прорыве. По его словам, горизонт рассуждений ИИ вырос: от простых задач, которые лучшие люди решают за 0,1 минуты, до олимпиадных задач IMO, требующих около 100 минут сосредоточенной работы.
В отличие от предыдущих ИИ-систем, специально созданных для математических соревнований, модель OpenAI — это универсальная языковая модель для рассуждений, в которую внедрены новые экспериментальные методы обучения с подкреплением и масштабирования вычислений во время тестирования. Представленные моделью доказательства оценивали три бывших призёра IMO, а итоговые баллы были утверждены после единогласного согласия.
Это достижение особенно выделяется на фоне других ведущих ИИ-моделей. В недавнем тестировании MathArena.ai конкуренты, включая Gemini 2.5 Pro, Grok-4 и предыдущую модель OpenAI o3, не смогли набрать даже минимальный балл, необходимый для бронзовой медали на тех же задачах.
Время этого прорыва совпадает с предстоящим запуском GPT-5, который ожидается в ближайшие месяцы. По данным нескольких источников, GPT-5 объединит различные специализированные модели OpenAI — включая продвинутые возможности рассуждения, продемонстрированные на IMO — в единую систему с интеллектуальным маршрутизатором, автоматически выбирающим наилучший подход для каждой задачи.
«Модель LLM, получившая золотую медаль IMO, — это экспериментальная исследовательская разработка. Мы не планируем выпускать решения с таким уровнем математических возможностей в течение нескольких месяцев», — уточнил Вэй, намекнув, что эти продвинутые возможности рассуждения могут появиться в будущих публичных релизах.