인공지능 분야에서 중요한 이정표가 세워졌다. OpenAI와 Google DeepMind가 2025년 국제 수학 올림피아드(IMO)에서 금메달 수준의 수학적 추론 능력을 입증한 것이다. IMO는 전 세계 젊은 수학자들이 겨루는 가장 권위 있는 대회다.
양사의 AI 모델은 각각 42점 만점에 35점을 받아 6문제 중 5문제를 완벽하게 풀어냈다. 이는 올해 대회 금메달 기준과 동일한 성적으로, 630명의 인간 참가자 중 약 11%(67명 정도)만이 금메달을 받은 것과 맞먹는 성과다.
Google DeepMind의 최신 Gemini with Deep Think 모델은 IMO 코디네이터들의 공식 채점 및 인증을 받았다. IMO 위원장 그레고르 돌리나르는 DeepMind의 해법에 대해 "여러 면에서 놀라웠으며, 명확하고 정밀하며 대부분 따라가기 쉬웠다"고 평가했다. 이는 지난해 DeepMind가 특화 시스템으로 은메달을 획득했던 것에서 한 단계 도약한 결과다.
OpenAI는 실험적 추론 모델을 동일한 문제에 대해 동일한 대회 조건(인터넷이나 도구 없이 4.5시간씩 두 번의 시험 세션)에서 평가했다. OpenAI는 공식 IMO 평가 과정에는 참여하지 않았지만, 세 명의 전직 IMO 메달리스트에게 독립적으로 해답을 채점받았다.
양사 발표 시점에는 다소 긴장감이 감돌았다. OpenAI는 7월 19일 결과를 공개한 반면, Google DeepMind는 IMO 위원회의 공식 검증 및 학생 시상 이후 결과를 발표해 달라는 요청을 존중해 7월 21일에 발표했다.
브라운대학교 수학 교수이자 Google DeepMind 방문 연구원인 정준혁 교수는 이번 성과가 AI가 1년 이내에 수학자들이 미해결 연구 문제를 푸는 데 실질적으로 도움을 줄 수 있음을 시사한다고 밝혔다. 정 교수는 로이터 통신과의 인터뷰에서 "자연어로 어려운 추론 문제를 풀 수 있는 순간, AI와 수학자 간의 협업 가능성이 열릴 것"이라고 말했다.
전문가들은 이번 성과가 인상적이지만, IMO 문제는 난이도가 높음에도 불구하고 첨단 연구 수학에 비해 개념적으로 단순하다는 점을 지적한다. 이번 성과는 AI의 추론 능력이 빠르게 발전하고 있음을 보여주지만, 모든 수학 연구 분야에 즉시 적용될 수 있음을 의미하지는 않는다.