月之暗面的万亿参数Kimi K2挑战AI巨头

中国初创公司月之暗面（Moonshot AI）发布了Kimi K2，这是一款拥有1万亿参数的开源大语言模型，在关键基准测试中超越了GPT-4和Claude。该模型在编程、数学推理和自主智能等方面表现出色，代表着推动先进AI技术普及的战略举措。凭借创新的MoE架构和MuonClip优化器，Kimi K2以远低于竞争对手的成本实现了卓越性能。

由清华大学毕业生杨植麟于2023年创立、阿里巴巴支持的中国初创公司月之暗面（Moonshot AI），近日发布了Kimi K2——一款具有突破性的开源大语言模型，直接挑战OpenAI和Anthropic等行业领军者。

Kimi K2采用先进的专家混合（Mixture-of-Experts, MoE）架构，总参数量高达1万亿，但推理时仅激活320亿参数。这一设计在保证卓越性能的同时，大幅提升了计算效率。该模型基于15.5万亿tokens进行预训练，采用了月之暗面自研的MuonClip优化器。官方称，该优化器在大规模训练中实现了“零训练不稳定性”，这是工程上的重大突破。

在基准测试中，Kimi K2展现了卓越能力，尤其在编程和数学推理方面表现突出。在LiveCodeBench测试中，Kimi K2准确率达到53.7%，超越了DeepSeek-V3（46.9%）和GPT-4.1（44.7%）。在MATH-500测试中，其得分高达97.4%，而GPT-4.1仅为92.4%。在极具挑战的软件工程基准SWE-bench Verified中，Kimi K2准确率达到65.8%，领先于大多数开源同类模型。

与传统聊天机器人不同，Kimi K2专为“自主智能”设计，即具备自主调用工具、编写并执行代码、以极少人工干预完成复杂多步骤任务的能力。这种强调执行力而非单纯推理的设计，使其成为企业流程和自动化的实用解决方案。

月之暗面提供了两个版本：Kimi-K2-Base面向需要完全控制和微调的研究者与开发者，Kimi-K2-Instruct则适用于通用对话和自主智能场景。该模型已通过月之暗面平台开放，价格远低于竞争对手——输入tokens每百万仅需0.15美元，输出tokens每百万为2.50美元，而OpenAI和Anthropic的价格则高出许多。

Kimi K2的发布，是月之暗面在面对DeepSeek等竞争对手加剧压力后，重夺市场地位的战略举措。通过开源这一强大模型，公司希望扩大开发者社区和全球影响力，同时挑战AI巨头的商业模式。这一策略也契合了中国AI企业拥抱开源、与美国科技巨头封闭专有模式形成对比的行业趋势。

Source:

月之暗面的万亿参数Kimi K2挑战AI巨头

Latest News

OpenAI发布GPT-5：多项AI能力将统一于单一强大模型

Meta的148亿美元AI豪赌：绝望之举还是战略天才？

科技巨头拥抱核能以满足AI的能源需求

Dailymotion发布AI驱动视频平台，开启行业变革

科技巨头拥抱核能，应对AI巨大的能源需求

Google 扩展 Gemini Live，深化应用集成

微软与埃森哲启动AI驱动的网络防御联盟

AI模型现已学会在复杂问题上投入更多时间

谷歌24亿美元战略交易揽获Windsurf AI核心人才

月之暗面的万亿参数Kimi K2挑战AI巨头

Related Articles

OpenAI发布GPT-5：多项AI能力将统一于单一强大模型

Meta的148亿美元AI豪赌：绝望之举还是战略天才？

科技巨头拥抱核能以满足AI的能源需求

Dailymotion发布AI驱动视频平台，开启行业变革

科技巨头拥抱核能，应对AI巨大的能源需求

Latest News

OpenAI发布GPT-5：多项AI能力将统一于单一强大模型

Meta的148亿美元AI豪赌：绝望之举还是战略天才？

科技巨头拥抱核能以满足AI的能源需求

Dailymotion发布AI驱动视频平台，开启行业变革

科技巨头拥抱核能，应对AI巨大的能源需求

Google 扩展 Gemini Live，深化应用集成

微软与埃森哲启动AI驱动的网络防御联盟

AI模型现已学会在复杂问题上投入更多时间

谷歌24亿美元战略交易揽获Windsurf AI核心人才