menu
close

OpenAI Operator 升级至 o3 模型,推动 AI 自动化进步

OpenAI 近日为其半自主 AI 助手 Operator 引入了强大的 o3 推理模型,大幅提升了其在线任务执行能力。Operator 最初于 2025 年 1 月面向 ChatGPT Pro 订阅用户推出,如今能够以更高的准确性和持续性处理复杂的网页活动。此次升级在保持多层安全防护的同时,进一步拓展了助手在购物、旅行预订及日常在线事务等领域的应用能力。
OpenAI Operator 升级至 o3 模型,推动 AI 自动化进步

OpenAI 的 Operator 是公司首个能够独立执行网页任务的真正 AI 智能体。2025 年 5 月,OpenAI 将其基础模型从 GPT-4o 升级为更先进的 o3 推理模型,为 Operator 带来了重大提升。

Operator 于 2025 年 1 月作为研究预览版首次发布,代表了智能体型 AI 技术的重要进展。该助手配备专属浏览器,能够通过点击、输入和导航等操作与网站交互,方式与人类类似。这使用户可以将诸如预订旅行住宿、餐厅订位、网购杂货、填写表单等重复性在线任务交由 AI 处理。

5 月份升级至 o3 模型后,Operator 的能力显著增强。根据 OpenAI 的基准测试,搭载 o3 的版本在浏览器交互中的持续性和准确性均有大幅提升,多项评测指标表现优异。在 OSWorld 基准测试中,o3 版本的网页任务完成得分为 42.9,较上一版本的 38.1 有明显提升;在 WebArena 测试中,得分从 48.1 提升至 62.9。

安全性依然是 OpenAI 推出强大智能体时的核心关注点。Operator 采用三层安全防护体系,包括模型层级的安全措施、实时监控以及用户控制机制。系统在涉及输入登录凭证或支付信息等敏感操作时,会主动请求用户接管。同时,Operator 也对与邮箱、金融服务等高风险平台的交互进行了严格限制。

目前,Operator 向美国地区的 ChatGPT Pro 订阅用户开放,月费为 200 美元,并计划逐步扩展至 Plus、Team 和 Enterprise 等更多订阅层级。由于监管因素,欧洲地区的上线时间有所推迟,但 OpenAI 已表示未来将推进国际扩展。

6 月最新发布的 o3-pro 版本,是 OpenAI 迄今为止最强大的模型,预示着 Operator 未来还将迎来更多增强功能。随着 Google、Anthropic 等厂商纷纷布局 AI 智能体赛道,OpenAI 继续将 Operator 定位为自动化日常数字任务的领先解决方案,同时坚守重要的安全底线。

Source:

Latest News