OpenAI 的 Operator 是公司首个能够独立执行网页任务的真正 AI 智能体。2025 年 5 月,OpenAI 将其基础模型从 GPT-4o 升级为更先进的 o3 推理模型,为 Operator 带来了重大提升。
Operator 于 2025 年 1 月作为研究预览版首次发布,代表了智能体型 AI 技术的重要进展。该助手配备专属浏览器,能够通过点击、输入和导航等操作与网站交互,方式与人类类似。这使用户可以将诸如预订旅行住宿、餐厅订位、网购杂货、填写表单等重复性在线任务交由 AI 处理。
5 月份升级至 o3 模型后,Operator 的能力显著增强。根据 OpenAI 的基准测试,搭载 o3 的版本在浏览器交互中的持续性和准确性均有大幅提升,多项评测指标表现优异。在 OSWorld 基准测试中,o3 版本的网页任务完成得分为 42.9,较上一版本的 38.1 有明显提升;在 WebArena 测试中,得分从 48.1 提升至 62.9。
安全性依然是 OpenAI 推出强大智能体时的核心关注点。Operator 采用三层安全防护体系,包括模型层级的安全措施、实时监控以及用户控制机制。系统在涉及输入登录凭证或支付信息等敏感操作时,会主动请求用户接管。同时,Operator 也对与邮箱、金融服务等高风险平台的交互进行了严格限制。
目前,Operator 向美国地区的 ChatGPT Pro 订阅用户开放,月费为 200 美元,并计划逐步扩展至 Plus、Team 和 Enterprise 等更多订阅层级。由于监管因素,欧洲地区的上线时间有所推迟,但 OpenAI 已表示未来将推进国际扩展。
6 月最新发布的 o3-pro 版本,是 OpenAI 迄今为止最强大的模型,预示着 Operator 未来还将迎来更多增强功能。随着 Google、Anthropic 等厂商纷纷布局 AI 智能体赛道,OpenAI 继续将 Operator 定位为自动化日常数字任务的领先解决方案,同时坚守重要的安全底线。