アリババが支援し、清華大学出身の楊志霖氏が2023年に設立した中国のスタートアップMoonshot AIは、業界リーダーであるOpenAIやAnthropicに真っ向から挑む画期的なオープンソース大規模言語モデル「Kimi K2」を発表した。
Kimi K2は、推論時に320億パラメータのみを活性化する1兆パラメータの高度なMixture-of-Experts(MoE)アーキテクチャを採用。これにより、計算効率を維持しつつ卓越した性能を実現している。モデルは、Moonshot独自のMuonClipオプティマイザーを用いて15.5兆トークンで事前学習され、大規模学習における「ゼロトレーニング不安定性」を達成したと同社は主張しており、これは大きな技術的ブレークスルーとなっている。
ベンチマーク評価では、Kimi K2は特にコーディングや数学的推論で際立った能力を示した。LiveCodeBenchでは53.7%の正答率を記録し、DeepSeek-V3(46.9%)やGPT-4.1(44.7%)を上回った。さらに、MATH-500ではGPT-4.1の92.4%に対し97.4%という高スコアを達成。難易度の高いソフトウェア工学ベンチマークSWE-bench Verifiedでも65.8%の正答率を記録し、多くのオープンソース代替モデルを凌駕している。
従来のチャットボットとは異なり、Kimi K2は「エージェント的知能」——ツールの自律的な活用、コードの生成・実行、複雑なマルチステップタスクの最小限の人間監督下での完遂——に特化して設計されている。推論だけでなく実行に重点を置くことで、企業のワークフローや自動化における実践的なソリューションとなる。
Moonshot AIは、研究者や開発者向けにファインチューニングが可能な「Kimi-K2-Base」と、一般的なチャットやエージェントAI用途向けの「Kimi-K2-Instruct」の2バージョンを提供。モデルはMoonshotのプラットフォームを通じて、競合他社より大幅に低価格——入力100万トークンあたり0.15ドル、出力100万トークンあたり2.50ドル——で利用でき、OpenAIやAnthropicの価格を大きく下回る。
Kimi K2のリリースは、DeepSeekなどの競合の台頭による市場シェア低下を受けたMoonshotの戦略的な巻き返しと位置付けられる。強力なモデルをオープンソース化することで、開発者コミュニティとグローバルな影響力の拡大を図り、既存AI大手のビジネスモデルに挑戦する狙いだ。この方針は、最先端モデルを独占的に管理する米国大手とは対照的に、オープンソース開発を積極的に推進する中国AI企業の潮流とも一致している。