在人工智能领域迎来重要里程碑之际,OpenAI与Google DeepMind均在2025年国际数学奥林匹克竞赛(IMO)中展现出金牌级的数学推理能力。IMO是全球最具声望的青年数学竞赛。
两家公司AI模型的得分均为42分中的35分,完美解答了六道题中的五道。这一表现与本届竞赛的金牌线持平,而在630名人类参赛者中,只有约11%(约67名学生)获得金牌。
Google DeepMind的Gemini高级版结合Deep Think系统,经过IMO官方评审组正式评分与认证。IMO主席Gregor Dolinar表示,他们的解答“在许多方面令人惊叹”,“清晰、精确,大多数解题过程易于理解”。这标志着较去年DeepMind凭借专用系统获得银牌后的重大进步。
OpenAI则在相同的竞赛条件下,对其实验性推理模型进行了测试——两场各4.5小时的考试,无网络和工具辅助。虽然OpenAI未参与官方IMO评审流程,但公司邀请了三位前IMO金牌得主独立评分。
两家公司公布成绩的时间也引发了一些紧张。OpenAI于7月19日发布结果,而Google DeepMind则遵循IMO理事会的要求,在官方认证和学生表彰后,于7月21日才公布。
布朗大学数学教授、Google DeepMind访问研究员Junehyuk Jung认为,这一成就表明AI距离协助数学家攻克未解前沿难题已不足一年。“我认为,一旦我们能用自然语言解决复杂推理问题,AI与数学家的协作潜力就会被释放。”Jung在接受路透社采访时表示。
尽管令人瞩目,但部分专家提醒,IMO题目虽难,但在概念上仍较前沿数学研究问题简单。此次成就展示了AI推理能力的提升,但并不意味着AI已准备好应对所有数学研究领域的挑战。