Anthropic 的 Claude 4 模型树立全新 AI 编程标杆

Anthropic 于 2025 年 5 月 22 日发布了迄今为止最强大的 AI 模型 Claude Opus 4 和 Claude Sonnet 4。这两款混合推理模型在编程、任务执行和高级记忆功能方面实现了突破性进展。此次发布进一步巩固了 Anthropic 在与 OpenAI 和 Google 的竞争地位，其中 Claude Opus 4 在关键软件工程基准测试中取得了业界领先的成绩。

Anthropic 在 5 月 22 日举办的“Code with Claude 2025”开发者大会上，正式发布了新一代 AI 模型 Claude Opus 4 和 Claude Sonnet 4。这两款模型代表了公司迄今为止最重大的技术飞跃，尤其在软件工程和自主智能体能力方面表现突出。

Claude Opus 4 被定位为“全球最佳编程模型”，在 SWE-bench 编程基准测试中取得了 72.5% 的高分，超越了 OpenAI 的 GPT-4.1（54.6%）和 Google 的 Gemini 2.5 Pro。在乐天（Rakuten）的测试中，Opus 4 展现出近 7 小时的自主编程能力，远超以往 AI 模型仅能维持数分钟注意力的表现。

两款模型均采用混合推理系统，既可实现近乎即时的响应，也支持逐步深入的长时推理。它们能够并行调用多种工具，包括网页搜索，并在获得本地文件访问权限时，能够提取和存储关键信息，逐步构建 Anthropic 所称的“隐性知识”。

Claude Sonnet 4 在今年 2 月发布的 Sonnet 3.7 基础上进一步提升，具备更强的问题解决能力和更优的指令遵循性。该模型面向所有 Claude 用户开放，包括免费用户；而 Opus 4 仅限 Pro、Max、Team 和 Enterprise 计划用户使用。

此次发布正值 Anthropic 快速增长之际，2025 年第一季度年化收入翻倍至 20 亿美元，年消费超过 10 万美元的客户数量增长了八倍。公司近期还获得了 25 亿美元的信用额度，用于加速 AI 研发。

尽管取得了技术突破，Anthropic 仍为 Claude Opus 4 实施了严格的安全措施，在内部测试发现潜在风险后，将其归类为 AI 安全等级 3（ASL-3）。两款模型均可通过 Anthropic API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 获取，Opus 4 定价为每百万 tokens 15/75 美元，Sonnet 4 为 3/15 美元。

Source:

Anthropic 的 Claude 4 模型树立全新 AI 编程标杆

Latest News

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键

德国科技巨头联合竞逐欧盟支持的AI超级工厂

美国检方调查Builder.ai，微软支持的15亿美元AI初创公司破产前夕风暴再起

挪威1.8万亿美元主权基金：AI应用成为员工“硬性要求”

OpenTools.ai 推出面向科技专业人士的 AI 新闻聚合平台

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能

Anthropic 的 Claude 4 模型树立全新 AI 编程标杆

Related Articles

字节跳动豆包AI现已支持实时视频辅助功能

OpenTools.ai 推出面向科技专业人士的 AI 新闻聚合平台

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能

WordPress组建AI团队，统一开发者生态

Latest News

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键

德国科技巨头联合竞逐欧盟支持的AI超级工厂

美国检方调查Builder.ai，微软支持的15亿美元AI初创公司破产前夕风暴再起

挪威1.8万亿美元主权基金：AI应用成为员工“硬性要求”

OpenTools.ai 推出面向科技专业人士的 AI 新闻聚合平台

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能