menu
close

Anthropic、Claude 4を発表:AI推論の新たなベンチマーク

2025年5月22日、AnthropicはClaude 4をリリースし、かつてない推論能力とマルチモーダル処理を備えた2つの強力なモデル—Opus 4とSonnet 4—を導入した。新モデルは複雑なタスク、特にコーディング分野で卓越した性能を発揮し、Opus 4はSWE-benchで業界最高の72.5%を達成、最大7時間にわたり高いパフォーマンスを維持できる。Claude 4は、即時応答と段階的な思考を両立するハイブリッド推論を導入し、ツール連携も強化されている。
Anthropic、Claude 4を発表:AI推論の新たなベンチマーク

Anthropicは、これまでで最も高度なAIシステム「Claude 4」ファミリーを正式に発表し、人工知能の能力における大きな進化を示した。2025年5月22日にリリースされたClaude 4ファミリーは、Claude Opus 4とClaude Sonnet 4の2モデルで構成され、AIの可能性をさらに拡張することを目指している。

AnthropicのフラッグシップモデルであるClaude Opus 4は、SWE-bench Verifiedベンチマークで過去最高の72.5%というスコアを記録し、OpenAIやGoogleのGemini 2.5 Proなどの競合モデルを上回る「世界最高のコーディングAI」と位置付けられている。楽天でのテストでは、Opus 4が複雑なソフトウェアエンジニアリングタスクをほぼ7時間にわたり自律的にこなす能力を示し、AIが単なる即時応答ツールから本格的な協働者へと進化したことを証明した。

コストパフォーマンスを重視したSonnet 4も、SWE-benchで72.7%という優れたスコアを達成している。無料ユーザーと有料ユーザーの両方が利用可能で、Claude 3.7 Sonnetの直接的なアップグレードとなり、価格体系も据え置かれている。

Claude 4の最大の特徴は、ハイブリッド推論アプローチにある。従来モデルが即時応答のみを生成していたのに対し、Claude 4は瞬時の回答と、段階的に問題を解決する「拡張思考モード」を切り替えることができる。この手法により、より繊細な文脈処理や曖昧な指示への対応力が向上した。さらに、ウェブ検索を含む複数のツールを並行して活用し、推論とツール利用を交互に行うことで、応答の質を高めている。

両モデルとも20万トークンのコンテキストウィンドウと大幅に強化されたメモリ機能を備える。ローカルファイルへのアクセス時には、重要情報を抽出・保存し、複雑なタスクを通じて一貫性を維持できる。この進化により、従来は人間の介入が必要だった高度なワークフローもAIが担えるようになった。

Anthropicは、特に高度な能力を持つOpus 4をASL-3安全基準に分類し、Claude 4の安全対策も強化した。これには有害コンテンツ検出やサイバーセキュリティ防御の強化が含まれる。

このリリースはAI業界の激しい競争の中で行われ、Anthropicは今年の売上予測22億ドルから2027年には120億ドルへの成長を目指している。Claude 4はAnthropicのウェブインターフェース、API、Amazon Bedrock、Google CloudのVertex AIで利用可能となっており、Opus 4は100万トークンあたり入力15ドル/出力75ドル、Sonnet 4は入力3ドル/出力15ドルで提供される。

Source:

Latest News