AnthropicのClaude 4モデルがAIコーディングの新たなベンチマークを樹立

Anthropicは、これまでで最も高度なAIモデルであるClaude Opus 4およびClaude Sonnet 4を発表し、コーディング、推論、自律作業の新たな基準を打ち立てました。Claude Opus 4は、複雑なタスクにおいてほぼ7時間にわたり自律的に作業できる前例のない持続力を示し、ほぼ一日の労働時間に迫ります。両モデルはハイブリッド推論機能、ウェブ検索統合、記憶保持能力の向上を備え、チャットボットから自律型AIエージェントへの大きな進化を示しています。

Anthropicは2025年5月22日、次世代AIモデルであるClaude Opus 4およびClaude Sonnet 4を発表し、人間の介入なしにAIシステムが達成できることの限界を押し広げました。

Anthropicが「世界最高のコーディングモデル」と称するClaude Opus 4は、実際のコーディングタスクで性能を測定する厳格なソフトウェアエンジニアリングベンチマーク「SWE-bench」で画期的な72.5%のスコアを達成しました。楽天でのテストでは、複雑なオープンソースプロジェクトにおいて約7時間にわたり自律的に作業を続け、従来のAIモデルの数分間という集中力を大きく上回る持続力を示しました。

Opus 4のより効率的な代替として設計されたClaude Sonnet 4は、前モデルのClaude Sonnet 3.7と比較して優れたコーディングおよび推論能力を発揮します。驚くべきことに、SWE-benchで72.7%というさらに高いスコアを記録し、OpenAIのCodex-1（72.1%）やGoogleのGemini 2.5 Pro（63.2%）といった競合モデルを上回りました。

両モデルはハイブリッド推論機能を備え、瞬時の応答と深い推論のための長時間思考を切り替えることが可能です。思考プロセスの中でウェブ検索などのツールを利用でき、ローカルファイルへのアクセスが許可された場合は、重要な情報を抽出・保存して継続性を維持し、知識を蓄積していくことができます。

これらの新モデルは、AIの機能性におけるパラダイムシフトを象徴しており、単なるチャットボットから、数千ステップに及ぶ複雑なマルチステップワークフローを自律的に処理できる作業エージェントへと進化しています。この進化により、AIはプロジェクトの立案から完了まで一日がかりの作業を文脈を維持しながら遂行できるようになりました。

Claude Sonnet 4はすべてのClaudeユーザー（無料プランを含む）が利用可能で、Claude Opus 4はPro、Max、Team、Enterpriseプランの加入者のみが利用できます。両モデルはAnthropic API、Amazon Bedrock、Google CloudのVertex AIでも利用可能で、価格は従来モデルと同様です（Opus 4：入力100万トークンあたり15ドル／出力100万トークンあたり75ドル、Sonnet 4：入力100万トークンあたり3ドル／出力100万トークンあたり15ドル）。

Source:

AnthropicのClaude 4モデルがAIコーディングの新たなベンチマークを樹立

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

AnthropicのClaude 4モデルがAIコーディングの新たなベンチマークを樹立

Related Articles

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

Latest News

バイトダンスの「豆包AI」、リアルタイム動画アシスタンス機能を提供開始

OnePlus、アラートスライダーを廃止しAI搭載「プラスキー」を導入

ドイツのテック大手がEU支援のAIギガファクトリー建設で結集

米検察、Builder.aiを調査 15億ドルAIスタートアップ破綻の舞台裏

ノルウェーの1.8兆ドル政府系ファンド、AI活用を全社員に義務化

OpenTools.ai、テクノロジー専門家向けAIニュースハブを発表

Google、Geminiを通じてAIによるコンピューター操作機能を開発者向けに拡大

Google、Geminiモデルに「思考サマリー」機能を追加し透明性を強化

米検察、Builder.aiを調査　15億ドルAIスタートアップ破綻の舞台裏