menu
close

OpenAI与DeepMind的AI模型在国际数学奥林匹克竞赛中斩获金牌

OpenAI和Google DeepMind的AI模型在2025年国际数学奥林匹克竞赛(IMO)中均获得金牌成绩,各自以42分满分中的35分完美解决了六道题中的五道。该成绩已由IMO评委官方认证,使这两套AI系统跻身全球最负盛名数学竞赛前11%的选手行列。专家认为,这一突破有望在一年内推动AI协助数学家攻克前沿研究难题。
OpenAI与DeepMind的AI模型在国际数学奥林匹克竞赛中斩获金牌

在人工智能领域迎来重要里程碑之际,OpenAI与Google DeepMind均在2025年国际数学奥林匹克竞赛(IMO)中展现出金牌级的数学推理能力。IMO是全球最具声望的青年数学竞赛。

两家公司AI模型的得分均为42分中的35分,完美解答了六道题中的五道。这一表现与本届竞赛的金牌线持平,而在630名人类参赛者中,只有约11%(约67名学生)获得金牌。

Google DeepMind的Gemini高级版结合Deep Think系统,经过IMO官方评审组正式评分与认证。IMO主席Gregor Dolinar表示,他们的解答“在许多方面令人惊叹”,“清晰、精确,大多数解题过程易于理解”。这标志着较去年DeepMind凭借专用系统获得银牌后的重大进步。

OpenAI则在相同的竞赛条件下,对其实验性推理模型进行了测试——两场各4.5小时的考试,无网络和工具辅助。虽然OpenAI未参与官方IMO评审流程,但公司邀请了三位前IMO金牌得主独立评分。

两家公司公布成绩的时间也引发了一些紧张。OpenAI于7月19日发布结果,而Google DeepMind则遵循IMO理事会的要求,在官方认证和学生表彰后,于7月21日才公布。

布朗大学数学教授、Google DeepMind访问研究员Junehyuk Jung认为,这一成就表明AI距离协助数学家攻克未解前沿难题已不足一年。“我认为,一旦我们能用自然语言解决复杂推理问题,AI与数学家的协作潜力就会被释放。”Jung在接受路透社采访时表示。

尽管令人瞩目,但部分专家提醒,IMO题目虽难,但在概念上仍较前沿数学研究问题简单。此次成就展示了AI推理能力的提升,但并不意味着AI已准备好应对所有数学研究领域的挑战。

Source: Co

Latest News