menu
close

OpenAI 人工智能在数学奥林匹克挑战赛中斩获金牌

OpenAI 宣布,其实验性推理语言模型在 2025 年国际数学奥林匹克(IMO)中取得了金牌级别的表现,在与人类选手相同的条件下成功解答了 6 道题中的 5 道。这一突破标志着人工智能推理能力的重大进步,展现了此前被认为是人类独有的持续创造性思维。此成就正值 OpenAI 准备推出 GPT-5,该模型将整合包括高级推理在内的多项专用模型。
OpenAI 人工智能在数学奥林匹克挑战赛中斩获金牌

人工智能领域迎来重要里程碑,OpenAI 宣布其最新实验性推理模型在 2025 年国际数学奥林匹克(IMO)中取得了金牌级别的成绩。IMO 被公认为全球最具声望的数学竞赛。

该模型成功解答了 2025 年 IMO 的 6 道题中的 5 道,总分为 35 分(满分 42 分),相当于金牌水平。更为引人注目的是,这一 AI 在与人类选手完全相同的严格条件下参赛:两场各 4.5 小时的考试,无任何工具、互联网或外部协助。

“这代表了与以往基准相比,人工智能持续创造性思维能力的新高度。”OpenAI 研究员 Alexander Wei 在宣布这一突破时表示。他指出,AI 推理的时间跨度已经从顶尖人类只需 0.1 分钟解决的简单数学题,提升到了需要约 100 分钟集中思考的 IMO 级别难题。

与以往专为数学竞赛设计的 AI 系统不同,OpenAI 此次的模型是一款通用推理语言模型,融合了强化学习和推理时算力扩展等多项实验性新技术。三位前 IMO 金牌得主独立评分了该模型提交的证明,最终分数在一致同意后确定。

这一成就与其他领先 AI 模型形成鲜明对比。根据 MathArena.ai 的最新评测,Gemini 2.5 Pro、Grok-4 以及 OpenAI 早期的 o3 模型在同样的题目上均未达到铜牌线。

此次突破正值 OpenAI 即将发布 GPT-5 之际。据多方消息,GPT-5 将整合 OpenAI 旗下各类专用模型——包括本次 IMO 推理能力——为统一系统,并配备智能路由器,自动为每项任务选择最合适的解决方案。

“IMO 金牌大模型目前仍为实验性研究模型,短期内我们不会发布具备如此数学能力的产品。”Wei 补充道,暗示这些高级推理能力有望在未来的公开版本中逐步落地。

Source: Analyticsindiamag

Latest News