Важное достижение в области искусственного интеллекта: как OpenAI, так и Google DeepMind продемонстрировали математические способности на уровне золотых медалей на Международной математической олимпиаде (IMO) 2025 года — самом престижном соревновании для молодых математиков в мире.
ИИ-модели обеих компаний набрали одинаковое количество баллов — 35 из 42 возможных, идеально решив пять из шести задач. Этот результат соответствует порогу для получения золотой медали на олимпиаде этого года, где только около 11% из 630 участников (примерно 67 студентов) получили золото.
Продвинутая версия Gemini с модулем Deep Think от Google DeepMind была официально оценена и подтверждена координаторами IMO. Президент IMO Грегор Долинар отметил, что их решения были «поразительными во многих отношениях» и «ясными, точными, большинство из них легко понять». Это значительный прогресс по сравнению с прошлым годом, когда DeepMind получила серебро, используя специализированные системы.
OpenAI протестировала свою экспериментальную модель рассуждений на тех же задачах в идентичных условиях соревнования — две сессии по 4,5 часа без доступа к интернету и вспомогательным инструментам. Хотя OpenAI не участвовала в официальной оценке IMO, компания поручила независимую проверку своих решений трём бывшим медалистам IMO.
Время публикации результатов вызвало некоторое напряжение между компаниями. OpenAI объявила о своих успехах 19 июля, а Google DeepMind подождала до 21 июля, выполнив просьбу Совета IMO обнародовать результаты только после официальной проверки и признания достижений студентов.
Профессор математики Брауновского университета и приглашённый исследователь Google DeepMind Джунхёк Чжон считает, что это достижение говорит о том, что ИИ менее чем через год сможет помогать математикам в решении нерешённых исследовательских задач на переднем крае математики. «Я думаю, что момент, когда мы сможем решать сложные задачи рассуждения на естественном языке, откроет потенциал для сотрудничества между ИИ и математиками», — сказал Чжон агентству Reuters.
Несмотря на впечатляющий результат, некоторые эксперты предупреждают, что задачи IMO, хотя и сложны, концептуально проще, чем задачи современной исследовательской математики. Это достижение демонстрирует растущие способности ИИ к рассуждению, но не обязательно говорит о готовности решать все аспекты математических исследований.