DeepSeek R1 升级以增强推理能力，向 AI 巨头发起挑战

中国 AI 初创公司 DeepSeek 发布了 R1-0528，这是其开源推理模型的一次重大升级，如今已可与 OpenAI 和 Google 的专有产品媲美。升级后的模型在数学准确率上有了显著提升，在 AIME 2025 测试中的准确率从 70% 跃升至 87.5%，推理能力实现翻倍。DeepSeek 还发布了一款更小型的 8B 参数蒸馏版，可在单张 GPU 上运行，同时保持出色性能。

中国人工智能初创公司 DeepSeek 近日推出了其开源推理模型 R1-0528 的重大升级，使其性能几乎与行业领军者 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro 持平。

此次升级通过增加计算资源和优化算法，极大提升了 DeepSeek 的推理能力。在基准测试中，该模型在数学推理方面表现出显著进步，AIME 2025 数学测试的准确率从 70% 提升至 87.5%。这一提升得益于推理深度的增强，模型每道题平均使用 23,000 个 token，相比此前的 12,000 大幅增加。

除了数学能力的提升，R1-0528 还带来了多项增强功能，更加便于开发者使用。新模型现已支持系统提示、函数调用和 JSON 输出，便于集成至各类应用。同时，模型的幻觉率（hallucination rate）在重写和摘要任务中据称降低了 45-50%，并对“vibe coding”有更好支持，开发者可用自然语言生成代码。

值得一提的是，针对资源有限的用户，DeepSeek 还发布了名为 DeepSeek-R1-0528-Qwen3-8B 的蒸馏版。该版本通过在阿里巴巴 Qwen3 8B 模型基础上，微调融入 R1-0528 的推理模式，能够在单张消费级 GPU 上运行，在部分数学基准测试中超越了 Google 的 Gemini 2.5 Flash，并几乎追平微软的 Phi 4 reasoning plus 模型。

与前代产品一样，R1-0528 继续采用宽松的 MIT 许可证发布，允许商业化使用与定制。包括亚马逊云服务（AWS）和微软 Azure 在内的主流云服务商已向客户提供 DeepSeek 的模型，但为确保数据隐私，这些模型与中国服务器隔离部署。

此次发布进一步巩固了 DeepSeek 与 Meta 在开源 AI 领域的领先地位，为 OpenAI、Google、微软和 Anthropic 等专有模型提供了强有力且成本更低的替代方案。

Source:

DeepSeek R1 升级以增强推理能力，向 AI 巨头发起挑战

Latest News

英伟达CEO盛赞中国AI模型全球影响力

Google Flow：AI工具借助Veo 3技术革新电影制作

特朗普在预算危机与AI战略担忧下撤回NASA提名人选

Anthropic年化营收突破30亿美元，企业级AI应用激增

斯坦福2025年指数显示中美AI差距大幅缩小

Google在I/O 2025发布Gemini 2.5，强化AI安全防护

百度调整战略，开源文心大模型以应对新兴竞争对手

YouTube 携手 DeepMind Veo 2 AI 视频生成技术革新 Shorts 平台

马斯克推出Grok 3.5，承诺实现革命性AI推理能力

谷歌推出 Gemini 2.5，强化安全性与 AI 能力

DeepSeek R1 升级以增强推理能力，向 AI 巨头发起挑战

Related Articles

斯坦福2025年指数显示中美AI差距大幅缩小

Google在I/O 2025发布Gemini 2.5，强化AI安全防护

马斯克推出Grok 3.5，承诺实现革命性AI推理能力

YouTube 携手 DeepMind Veo 2 AI 视频生成技术革新 Shorts 平台

百度调整战略，开源文心大模型以应对新兴竞争对手

Latest News

英伟达CEO盛赞中国AI模型全球影响力

Google Flow：AI工具借助Veo 3技术革新电影制作

特朗普在预算危机与AI战略担忧下撤回NASA提名人选

Anthropic年化营收突破30亿美元，企业级AI应用激增

斯坦福2025年指数显示中美AI差距大幅缩小

Google在I/O 2025发布Gemini 2.5，强化AI安全防护

百度调整战略，开源文心大模型以应对新兴竞争对手

YouTube 携手 DeepMind Veo 2 AI 视频生成技术革新 Shorts 平台

马斯克推出Grok 3.5，承诺实现革命性AI推理能力

谷歌推出 Gemini 2.5，强化安全性与 AI 能力