Anthropicは2025年5月22日、次世代AIモデルであるClaude Opus 4およびClaude Sonnet 4を発表し、人間の介入なしにAIシステムが達成できることの限界を押し広げました。
Anthropicが「世界最高のコーディングモデル」と称するClaude Opus 4は、実際のコーディングタスクで性能を測定する厳格なソフトウェアエンジニアリングベンチマーク「SWE-bench」で画期的な72.5%のスコアを達成しました。楽天でのテストでは、複雑なオープンソースプロジェクトにおいて約7時間にわたり自律的に作業を続け、従来のAIモデルの数分間という集中力を大きく上回る持続力を示しました。
Opus 4のより効率的な代替として設計されたClaude Sonnet 4は、前モデルのClaude Sonnet 3.7と比較して優れたコーディングおよび推論能力を発揮します。驚くべきことに、SWE-benchで72.7%というさらに高いスコアを記録し、OpenAIのCodex-1(72.1%)やGoogleのGemini 2.5 Pro(63.2%)といった競合モデルを上回りました。
両モデルはハイブリッド推論機能を備え、瞬時の応答と深い推論のための長時間思考を切り替えることが可能です。思考プロセスの中でウェブ検索などのツールを利用でき、ローカルファイルへのアクセスが許可された場合は、重要な情報を抽出・保存して継続性を維持し、知識を蓄積していくことができます。
これらの新モデルは、AIの機能性におけるパラダイムシフトを象徴しており、単なるチャットボットから、数千ステップに及ぶ複雑なマルチステップワークフローを自律的に処理できる作業エージェントへと進化しています。この進化により、AIはプロジェクトの立案から完了まで一日がかりの作業を文脈を維持しながら遂行できるようになりました。
Claude Sonnet 4はすべてのClaudeユーザー(無料プランを含む)が利用可能で、Claude Opus 4はPro、Max、Team、Enterpriseプランの加入者のみが利用できます。両モデルはAnthropic API、Amazon Bedrock、Google CloudのVertex AIでも利用可能で、価格は従来モデルと同様です(Opus 4:入力100万トークンあたり15ドル/出力100万トークンあたり75ドル、Sonnet 4:入力100万トークンあたり3ドル/出力100万トークンあたり15ドル)。