menu
close

Moonshot AIの1兆パラメータLLM「Kimi K2」、AI大手に挑戦

中国のスタートアップMoonshot AIは、1兆パラメータを持つオープンソース大規模言語モデル「Kimi K2」を発表した。Kimi K2は、コーディング、数学的推論、エージェント的能力に優れ、主要なベンチマークでGPT-4やClaudeを上回る性能を示している。革新的なMoEアーキテクチャとMuonClipオプティマイザーにより、競合他社のコストの一部で高いパフォーマンスを実現している。
Moonshot AIの1兆パラメータLLM「Kimi K2」、AI大手に挑戦

アリババが支援し、清華大学出身の楊志霖氏が2023年に設立した中国のスタートアップMoonshot AIは、業界リーダーであるOpenAIやAnthropicに真っ向から挑む画期的なオープンソース大規模言語モデル「Kimi K2」を発表した。

Kimi K2は、推論時に320億パラメータのみを活性化する1兆パラメータの高度なMixture-of-Experts(MoE)アーキテクチャを採用。これにより、計算効率を維持しつつ卓越した性能を実現している。モデルは、Moonshot独自のMuonClipオプティマイザーを用いて15.5兆トークンで事前学習され、大規模学習における「ゼロトレーニング不安定性」を達成したと同社は主張しており、これは大きな技術的ブレークスルーとなっている。

ベンチマーク評価では、Kimi K2は特にコーディングや数学的推論で際立った能力を示した。LiveCodeBenchでは53.7%の正答率を記録し、DeepSeek-V3(46.9%)やGPT-4.1(44.7%)を上回った。さらに、MATH-500ではGPT-4.1の92.4%に対し97.4%という高スコアを達成。難易度の高いソフトウェア工学ベンチマークSWE-bench Verifiedでも65.8%の正答率を記録し、多くのオープンソース代替モデルを凌駕している。

従来のチャットボットとは異なり、Kimi K2は「エージェント的知能」——ツールの自律的な活用、コードの生成・実行、複雑なマルチステップタスクの最小限の人間監督下での完遂——に特化して設計されている。推論だけでなく実行に重点を置くことで、企業のワークフローや自動化における実践的なソリューションとなる。

Moonshot AIは、研究者や開発者向けにファインチューニングが可能な「Kimi-K2-Base」と、一般的なチャットやエージェントAI用途向けの「Kimi-K2-Instruct」の2バージョンを提供。モデルはMoonshotのプラットフォームを通じて、競合他社より大幅に低価格——入力100万トークンあたり0.15ドル、出力100万トークンあたり2.50ドル——で利用でき、OpenAIやAnthropicの価格を大きく下回る。

Kimi K2のリリースは、DeepSeekなどの競合の台頭による市場シェア低下を受けたMoonshotの戦略的な巻き返しと位置付けられる。強力なモデルをオープンソース化することで、開発者コミュニティとグローバルな影響力の拡大を図り、既存AI大手のビジネスモデルに挑戦する狙いだ。この方針は、最先端モデルを独占的に管理する米国大手とは対照的に、オープンソース開発を積極的に推進する中国AI企業の潮流とも一致している。

Source:

Latest News