中国AI初创公司DeepSeek凭借最新的R1-0528模型更新,已成为挑战西方AI主导地位的重要力量,其性能已接近行业领军者OpenAI和Google。
虽然DeepSeek将此次升级称为“小版本升级”,但该模型在多项关键能力上实现了重大突破。在数学推理方面,该模型在高难度AIME 2025测试中的准确率从70%跃升至87.5%,展现出更强的问题解决能力。这一进步得益于模型推理深度的提升,每次查询可处理的Token数量由上一版本的12,000提升至约23,000。
除数学外,R1-0528在编程能力上也有显著提升。在Codeforces编程挑战中,模型评分由此前的1530提升至约1930,增加了400分,反映出其代码生成和问题解决能力的增强。在综合编程测试中的表现同样大幅提升。
该模型的进步与斯坦福大学2025年AI指数报告的结论相呼应。报告显示,中美顶尖AI模型在主要基准测试上的差距已从2023年的两位数缩小至2025年初的几乎持平。在Chatbot Arena排行榜上,中美顶尖模型的差距从2024年1月的9.26%降至2025年2月的1.70%。
业界领袖也注意到了这一变化。英伟达CEO黄仁勋在5月表示:“DeepSeek和中国阿里巴巴的Qwen是目前最优秀的开源AI模型之一,已在美国、欧洲等地获得广泛关注。”
值得一提的是,DeepSeek作为一家起步不久的初创公司,能取得如此成就尤为引人注目。该模型采用宽松的开源许可协议,既有完整版,也有适用于低算力设备的精简版(distilled variant),让全球开发者都能更便捷地获取先进AI能力。