OpenAI Operator 升级至 o3 模型，推动 AI 自动化进步

OpenAI 近日为其半自主 AI 助手 Operator 引入了强大的 o3 推理模型，大幅提升了其在线任务执行能力。Operator 最初于 2025 年 1 月面向 ChatGPT Pro 订阅用户推出，如今能够以更高的准确性和持续性处理复杂的网页活动。此次升级在保持多层安全防护的同时，进一步拓展了助手在购物、旅行预订及日常在线事务等领域的应用能力。

OpenAI 的 Operator 是公司首个能够独立执行网页任务的真正 AI 智能体。2025 年 5 月，OpenAI 将其基础模型从 GPT-4o 升级为更先进的 o3 推理模型，为 Operator 带来了重大提升。

Operator 于 2025 年 1 月作为研究预览版首次发布，代表了智能体型 AI 技术的重要进展。该助手配备专属浏览器，能够通过点击、输入和导航等操作与网站交互，方式与人类类似。这使用户可以将诸如预订旅行住宿、餐厅订位、网购杂货、填写表单等重复性在线任务交由 AI 处理。

5 月份升级至 o3 模型后，Operator 的能力显著增强。根据 OpenAI 的基准测试，搭载 o3 的版本在浏览器交互中的持续性和准确性均有大幅提升，多项评测指标表现优异。在 OSWorld 基准测试中，o3 版本的网页任务完成得分为 42.9，较上一版本的 38.1 有明显提升；在 WebArena 测试中，得分从 48.1 提升至 62.9。

安全性依然是 OpenAI 推出强大智能体时的核心关注点。Operator 采用三层安全防护体系，包括模型层级的安全措施、实时监控以及用户控制机制。系统在涉及输入登录凭证或支付信息等敏感操作时，会主动请求用户接管。同时，Operator 也对与邮箱、金融服务等高风险平台的交互进行了严格限制。

目前，Operator 向美国地区的 ChatGPT Pro 订阅用户开放，月费为 200 美元，并计划逐步扩展至 Plus、Team 和 Enterprise 等更多订阅层级。由于监管因素，欧洲地区的上线时间有所推迟，但 OpenAI 已表示未来将推进国际扩展。

6 月最新发布的 o3-pro 版本，是 OpenAI 迄今为止最强大的模型，预示着 Operator 未来还将迎来更多增强功能。随着 Google、Anthropic 等厂商纷纷布局 AI 智能体赛道，OpenAI 继续将 Operator 定位为自动化日常数字任务的领先解决方案，同时坚守重要的安全底线。

Source:

OpenAI Operator 升级至 o3 模型，推动 AI 自动化进步

Latest News

OpenAI 推出 o3-mini：为小型模型带来先进推理能力

Google DeepMind 推出 Veo3，为 AI 视频创作带来声音革新

软银加码AI领域，拟5亿美元投资Skild AI

微软裁员9000人，同时加码AI投资

世卫组织峰会将展示应对全球挑战的AI医疗创新

AI支出激增，数字支付迈向代理型商业新时代

OpenTools.ai 推出面向行业专业人士的 AI 新闻聚合平台

量子计算实现历史性指数级加速突破

谷歌扩展Gemini 2.5产品线，推出高性价比Flash-Lite模型

AI机器人在突破性演示中掌握类人敏捷性

OpenAI Operator 升级至 o3 模型，推动 AI 自动化进步

Related Articles

软银加码AI领域，拟5亿美元投资Skild AI

Google DeepMind 推出 Veo3，为 AI 视频创作带来声音革新

OpenAI 推出 o3-mini：为小型模型带来先进推理能力

世卫组织峰会将展示应对全球挑战的AI医疗创新

微软裁员9000人，同时加码AI投资

Latest News

OpenAI 推出 o3-mini：为小型模型带来先进推理能力

Google DeepMind 推出 Veo3，为 AI 视频创作带来声音革新

软银加码AI领域，拟5亿美元投资Skild AI

微软裁员9000人，同时加码AI投资

世卫组织峰会将展示应对全球挑战的AI医疗创新

AI支出激增，数字支付迈向代理型商业新时代

OpenTools.ai 推出面向行业专业人士的 AI 新闻聚合平台

量子计算实现历史性指数级加速突破

谷歌扩展Gemini 2.5产品线，推出高性价比Flash-Lite模型

AI机器人在突破性演示中掌握类人敏捷性