人工知能分野における重要なマイルストーンとして、OpenAIは最新の実験的推論モデルが2025年国際数学オリンピック(IMO)で金メダル級の成績を達成したと発表した。IMOは世界で最も権威ある数学競技会として知られている。
このモデルは、2025年IMOの6問中5問を解答し、42点満点中35点を獲得。これは金メダルに相当する成績である。特筆すべきは、このAIが人間の参加者と同じ厳格な条件下――2回の4.5時間試験、ツールやインターネット、外部支援なし――で挑戦した点だ。
「これは過去のベンチマークと比べて、持続的な創造的思考の新たなレベルを示しています」と、この成果を発表したOpenAI研究者のアレクサンダー・ウェイ氏は述べている。ウェイ氏によれば、AIの推論時間のスケールは、トップレベルの人間が約0.1分で解く単純な数学問題から、約100分の集中力を要するIMOレベルの問題へと大きく進化した。
従来の数学競技向けAIとは異なり、OpenAIのモデルは強化学習やテスト時の計算拡張といった新たな実験的手法を取り入れた汎用推論型言語モデルである。モデルが提出した証明は、元IMOメダリスト3名が独立して採点し、全員一致で最終スコアが確定した。
この成果は、他の先端AIモデルと比較しても際立っている。MathArena.aiによる最近の評価では、Gemini 2.5 Pro、Grok-4、OpenAIの旧o3モデルなどの競合モデルはいずれも同じ問題で銅メダルの基準すら達成できなかった。
このブレークスルーは、OpenAIが数カ月以内に予定しているGPT-5のリリースと時期を同じくしている。複数の情報筋によれば、GPT-5は今回のIMO成果で示された推論能力を含む各種専門モデルを統合し、タスクごとに最適なアプローチを自動選択するスマートルーターを備えた単一システムとなる見込みだ。
「IMO金メダル級LLMは実験的な研究モデルです。このレベルの数学能力を持つものを一般公開する予定は、数カ月先になります」とウェイ氏は明言しており、これらの高度な推論能力が今後の一般向けリリースに組み込まれる可能性を示唆している。