Anthropic 正式发布了新一代 AI 模型——Claude Opus 4 和 Claude Sonnet 4,这标志着人工智能领域在前沿能力与负责任部署之间取得了重大进展。
Claude 4 系列于 2025 年 5 月 22 日发布,首次引入了混合推理系统,让用户可在极速响应与深度思考之间灵活切换,以实现更深入的推理。两款模型均为“混合型”,既能实现近乎即时的响应,也能通过开启推理模式,花费更多时间权衡各种解决方案。在推理过程中,模型会以“用户友好”的方式展示其思考路径。
Anthropic 在与 Google、OpenAI 等巨头的“前沿模型之争”中发布了这两款新作。Claude Opus 4 被誉为“应对复杂挑战的强大大型模型”,可在数小时内持续执行数千步任务而不失焦点。Anthropic 称,Claude Opus 4 是“全球最强的编程模型”,在复杂、长周期任务及智能体工作流中表现出色。
值得注意的是,Anthropic 首次为 Claude Opus 4 启动了 AI 安全等级 3(ASL-3),以“限制 Claude 被滥用于开发或获取化学、生物、放射性及核(CBRN)武器的风险”。这家亚马逊支持的公司表示,目前尚未确定 Opus 4 是否已达到需更严控的门槛,但已提前采取预防措施。此前内部评估发现,Opus 4 可能帮助非专业用户制造危险物质。对此,Anthropic 已实施 100 多项安全控制措施,包括实时监控、数据输出限制及漏洞奖励计划。
公司表示,Claude Opus 4 和 Sonnet 4 正在定义 AI 智能体的“新标准”——能够分析数千个数据源、执行长时间任务、撰写媲美人类的内容并完成复杂操作。Anthropic 由前 OpenAI 研究高管创立,自 2023 年 3 月推出 Claude 聊天机器人以来,已成为 AI 军备竞赛的重要参与者。自去年底起,Anthropic 停止对聊天机器人的投入,转而专注于提升 Claude 在科研、编程等复杂任务上的能力。
两款模型均支持“扩展思考”,可在深度推理与行动执行两种模式间切换。Claude 能按需进行数据分析,边工作边提升准确性,从而更好地预判并执行后续步骤。Claude 现在还能在深度推理时调用如网页搜索等工具,实现思考与工具使用的无缝切换,以产出更优结果。模型可同时运行多种工具,指令执行更精准,记忆力增强,能提取并存储关键信息,确保上下文理解更完整。
Anthropic 2025 年第一季度年化营收达到 20 亿美元,较上一周期的 10 亿美元翻倍。Opus 4 的定价为每百万输入 tokens 15 美元、输出 75 美元;Sonnet 4 则为输入 3 美元、输出 15 美元。
随着 AI 能力持续提升,Anthropic 的做法表明,强大模型也可在安全措施同步升级的前提下负责任地开发与部署。