menu
close

Anthropic、Claude 4を発表:AIコーディングの新たなベンチマークを樹立

Anthropicは、Claude Opus 4およびClaude Sonnet 4を新たに発表し、AIによるコーディングと推論能力の新基準を打ち立てました。Claude Opus 4はSWE-benchで72.5%という業界最高水準を記録し、Sonnet 4はより手頃な価格で高いパフォーマンスを実現しています。両モデルはハイブリッド推論機能を備え、即時応答と拡張的な思考をツール連携で切り替えられるため、複雑な多段階タスクへの対応力が大幅に向上しました。
Anthropic、Claude 4を発表:AIコーディングの新たなベンチマークを樹立

Anthropicは2025年5月22日、次世代AIモデルであるClaude Opus 4およびClaude Sonnet 4を正式にリリースし、人工知能の能力において大きな進歩を遂げました。

Claude Opus 4はAnthropicのフラッグシップモデルとして位置付けられ、同社は「世界最高のコーディングモデル」と称しています。SWE-benchで72.5%、Terminal-benchで43.2%というスコアを記録し、数千ステップに及ぶ長時間タスクでも持続的なパフォーマンスを発揮します。このモデルは数時間にわたり連続稼働でき、従来のSonnetモデルを大きく上回る成果を実現。AIエージェントの可能性を大きく広げています。

Claude Sonnet 4は、Claude Sonnet 3.7から大幅なアップグレードとなり、より優れたコーディングと推論能力、そして指示への高精度な応答を実現しています。SWE-benchでは72.7%を達成し、並列テスト時の計算を活用することで80.2%の正確性に到達。これはより大型のOpus 4モデルを上回るコーディング性能です。Anthropicは「パフォーマンスと効率性を両立し、内外のユースケースに最適化。実装制御性も強化」と説明しています。

両モデルはツール活用による拡張的な思考など、強力な新機能を搭載。Claudeは推論とツール利用を切り替えながら応答を最適化でき、ツールの並列利用や指示の厳密な遵守が可能です。開発者がローカルファイルへのアクセスを許可した場合、記憶能力も大幅に向上し、重要な事実を抽出・保存して継続性を保ち、暗黙知を蓄積できます。

モデルは「メモリ」に事実を保存・抽出し、タスクの信頼性を高めつつ、Anthropicが「暗黙知」と呼ぶ知識を時間とともに構築します。Opus 4とSonnet 4はいずれも「ハイブリッド」モデルで、即時応答と拡張的な思考による深い推論の両方に対応。推論モードを有効にすると、回答前に複数の解決策をじっくり検討し、その思考過程をユーザーに分かりやすく要約して提示します。

両モデルはAnthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能。価格は従来のOpusおよびSonnetモデルと同様で、Opus 4は100万トークンあたり入力$15/出力$75、Sonnet 4は入力$3/出力$15です。個人ユーザー向けには段階的なサブスクリプションプランが用意されており、無料プランではClaude Sonnet 4へのアクセス(1日あたりの利用制限あり)、Proプラン($20/月または$200/年)では無料プランの約5倍の利用量、モデルセレクターによるClaude 4 SonnetおよびClaude 4 Opusの両方へのアクセス、高負荷時の優先利用権が付与されます。

Claude 4の登場は、大規模言語モデルの新時代の幕開けを告げるものです。20万トークンのコンテキストウィンドウ、業界最高水準のコーディング・推論ベンチマーク、複雑かつ高リスクで変化の激しい現実世界のシナリオに対応する堅牢な安全性フレームワークにより、企業・研究・クリエイティブ分野での活用可能性が飛躍的に拡大しています。

Source:

Latest News