由清华大学毕业生杨植麟于2023年创立、阿里巴巴支持的中国初创公司月之暗面(Moonshot AI),近日发布了Kimi K2——一款具有突破性的开源大语言模型,直接挑战OpenAI和Anthropic等行业领军者。
Kimi K2采用先进的专家混合(Mixture-of-Experts, MoE)架构,总参数量高达1万亿,但推理时仅激活320亿参数。这一设计在保证卓越性能的同时,大幅提升了计算效率。该模型基于15.5万亿tokens进行预训练,采用了月之暗面自研的MuonClip优化器。官方称,该优化器在大规模训练中实现了“零训练不稳定性”,这是工程上的重大突破。
在基准测试中,Kimi K2展现了卓越能力,尤其在编程和数学推理方面表现突出。在LiveCodeBench测试中,Kimi K2准确率达到53.7%,超越了DeepSeek-V3(46.9%)和GPT-4.1(44.7%)。在MATH-500测试中,其得分高达97.4%,而GPT-4.1仅为92.4%。在极具挑战的软件工程基准SWE-bench Verified中,Kimi K2准确率达到65.8%,领先于大多数开源同类模型。
与传统聊天机器人不同,Kimi K2专为“自主智能”设计,即具备自主调用工具、编写并执行代码、以极少人工干预完成复杂多步骤任务的能力。这种强调执行力而非单纯推理的设计,使其成为企业流程和自动化的实用解决方案。
月之暗面提供了两个版本:Kimi-K2-Base面向需要完全控制和微调的研究者与开发者,Kimi-K2-Instruct则适用于通用对话和自主智能场景。该模型已通过月之暗面平台开放,价格远低于竞争对手——输入tokens每百万仅需0.15美元,输出tokens每百万为2.50美元,而OpenAI和Anthropic的价格则高出许多。
Kimi K2的发布,是月之暗面在面对DeepSeek等竞争对手加剧压力后,重夺市场地位的战略举措。通过开源这一强大模型,公司希望扩大开发者社区和全球影响力,同时挑战AI巨头的商业模式。这一策略也契合了中国AI企业拥抱开源、与美国科技巨头封闭专有模式形成对比的行业趋势。