Anthropicは、Claude 4 Opusモデルによって人工知能開発の大きなマイルストーンを達成しました。このモデルは、経験豊富な人間のプログラマーに匹敵するコーディング能力を示しています。
2025年5月にリリースされたClaude 4 Opusは、SWE-benchという実際のGitHub課題を用いた厳格なソフトウェアエンジニアリングベンチマークで72.5%という過去最高スコアを達成し、AIコーディングモデルのトップに君臨しています。このスコアは、同じテストで54.6%を記録したOpenAIのGPT-4.1を大きく上回っています。
Claude 4 Opusの最大の特徴は、これまでにない長時間にわたる集中力と文脈保持能力です。楽天でのテストでは、同モデルが複雑なオープンソースのリファクタリングプロジェクトにおいて、約7時間にわたり自律的に作業を続け、集中力や一貫性を失うことがありませんでした。これにより、AIは短時間の応答ツールから、1日がかりのプロジェクトでも本格的な協働者へと進化しています。
20万トークンのコンテキストウィンドウを持つClaude 4 Opusは、エンタープライズ規模のコードベース全体を処理し、複雑なマルチファイルの変更にも対応。特定のコーディングスタイルにも適応し、大規模な生成やリファクタリングプロジェクトにおいても卓越した品質を発揮します。開発者からのフィードバックによれば、そのスキルはミッドキャリアのPhDレベルのコンピュータープログラマーに相当します。
この進化は単なる技術的進歩にとどまらず、組織が知識労働に取り組む方法そのものに根本的な変化をもたらします。これまで人間の継続的な注意力が必要だった業務も、AIシステムに委ねることが可能となり、数時間から数日にわたって集中力と文脈を維持できます。経済的な影響も大きく、業界アナリストは2025年にヘルスケア、金融、法務分野のエントリーレベルのオペレーション職で大規模な雇用の置き換えが始まると予測しています。
Claude 4 Opusはコーディングだけでなく、リサーチ、ライティング、科学的発見にも高い能力を発揮します。AnthropicのAPI、Amazon Bedrock、Google CloudのVertex AIなど複数のチャネルで利用可能で、価格は入力トークン100万あたり15ドル、出力トークン100万あたり75ドルからとなっています。
Claude 4 OpusのようなAIシステムが進化を続ける中、組織にとっての課題は「AIが人間のスキルに追いつけるか」ではなく、「最も生産的な協働者が人間からデジタルへと移行する未来にどう適応するか」へと変わりつつあります。