menu
close

DeepSeek R1 升级以增强推理能力,向 AI 巨头发起挑战

中国 AI 初创公司 DeepSeek 发布了 R1-0528,这是其开源推理模型的一次重大升级,如今已可与 OpenAI 和 Google 的专有产品媲美。升级后的模型在数学准确率上有了显著提升,在 AIME 2025 测试中的准确率从 70% 跃升至 87.5%,推理能力实现翻倍。DeepSeek 还发布了一款更小型的 8B 参数蒸馏版,可在单张 GPU 上运行,同时保持出色性能。
DeepSeek R1 升级以增强推理能力,向 AI 巨头发起挑战

中国人工智能初创公司 DeepSeek 近日推出了其开源推理模型 R1-0528 的重大升级,使其性能几乎与行业领军者 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro 持平。

此次升级通过增加计算资源和优化算法,极大提升了 DeepSeek 的推理能力。在基准测试中,该模型在数学推理方面表现出显著进步,AIME 2025 数学测试的准确率从 70% 提升至 87.5%。这一提升得益于推理深度的增强,模型每道题平均使用 23,000 个 token,相比此前的 12,000 大幅增加。

除了数学能力的提升,R1-0528 还带来了多项增强功能,更加便于开发者使用。新模型现已支持系统提示、函数调用和 JSON 输出,便于集成至各类应用。同时,模型的幻觉率(hallucination rate)在重写和摘要任务中据称降低了 45-50%,并对“vibe coding”有更好支持,开发者可用自然语言生成代码。

值得一提的是,针对资源有限的用户,DeepSeek 还发布了名为 DeepSeek-R1-0528-Qwen3-8B 的蒸馏版。该版本通过在阿里巴巴 Qwen3 8B 模型基础上,微调融入 R1-0528 的推理模式,能够在单张消费级 GPU 上运行,在部分数学基准测试中超越了 Google 的 Gemini 2.5 Flash,并几乎追平微软的 Phi 4 reasoning plus 模型。

与前代产品一样,R1-0528 继续采用宽松的 MIT 许可证发布,允许商业化使用与定制。包括亚马逊云服务(AWS)和微软 Azure 在内的主流云服务商已向客户提供 DeepSeek 的模型,但为确保数据隐私,这些模型与中国服务器隔离部署。

此次发布进一步巩固了 DeepSeek 与 Meta 在开源 AI 领域的领先地位,为 OpenAI、Google、微软和 Anthropic 等专有模型提供了强有力且成本更低的替代方案。

Source:

Latest News