中国の人工知能スタートアップであるDeepSeekは、今年1月に画期的なR1モデルを発表しテック株に衝撃を与えたが、その主力AIシステムの大幅なアップデートを静かに展開した。
新バージョン「DeepSeek-R1-0528」は5月28日、同社のWeChatグループで簡単な告知とともにリリースされた。DeepSeekはこれを「小規模な試験的アップグレード」と位置付けているが、初期のテストでは複数分野で顕著な進化が確認されている。
LiveCodeBenchのリーダーボードによると、アップデート後のモデルはコーディング能力でPass@1スコア73.1を記録し、OpenAIのO3およびO4-Miniモデルに次ぐ4位にランクインした。これは、オープンソースモデルとしては画期的な進歩であり、西側の競合モデルよりもはるかに少ないリソースで開発された点が注目される。
技術仕様としては、R1-0528は前バージョンと同じMixture-of-Experts(MoE)アーキテクチャを採用し、総パラメータ数は約6850億だが、推論時に実際に使われるのは約370億パラメータにとどまる。コンテキストウィンドウも拡張され、最大128Kトークンまで対応し、より大規模な文書やコードベースの処理が可能となった。
ユーザーからは推論の深さ、文章品質、問題解決能力の向上が報告されている。開発者によれば、複雑なタスクに対して30~60分に及ぶ長時間の推論セッションにも対応できるようになり、Googleのモデルに匹敵する性能を示しているという。また、従来のテキスト生成における癖も改善され、より自然で整った出力が得られるようになった。
DeepSeekの継続的なイノベーションは、「AIのスケーリングには膨大な計算資源と投資が不可欠」という従来の常識に挑戦している。同社のコスト効率に優れたオープンソースモデルの成功は、OpenAIの価格引き下げやGoogleの割引プラン導入など、テック大手の対応を促している。一方、中国国内でもアリババやテンセントなどがDeepSeekを凌駕すると主張する独自モデルを発表している。
R1-0528アップデートはMITライセンスのもとHugging Faceで公開されており、商用利用や改変も可能だ。業界関係者の間では、今後数カ月以内により包括的なR2モデルがリリースされ、AI業界にさらなる変革をもたらすのではないかと期待が高まっている。