OpenAI 正式发布了 ChatGPT Agent,这一突破性进展将广受欢迎的 AI 从对话助手转变为能够独立完成复杂任务的数字同事。
新系统让 ChatGPT 能够主动思考与行动,借助自身的虚拟计算机,从头到尾处理复杂任务。用户现在可以让 ChatGPT 执行各种基于计算机的任务,从管理日历、生成可编辑演示文稿到运行代码。
ChatGPT Agent 的独特之处在于其统一的 AI 能力整合。此前,OpenAI 分别提供了各具优势的工具:Operator 能够滚动、点击并在网站上输入,但无法进行深度分析;Deep Research 擅长分析和总结信息,但无法与需要身份验证的网站交互。通过整合这些互补优势并引入更多工具,OpenAI 在单一模型中解锁了全新能力。
安全性是新系统的核心关注点。OpenAI 特别重视防范通过提示注入进行的对抗性操控,这在第三方可能通过网络上的恶意指令试图影响 Agent 行为的系统中是一项风险。公司已对 Agent 进行了专门训练和测试,以识别并抵御提示注入,并实施了监控机制以快速检测和响应攻击,同时在执行重要操作前要求用户明确确认。输出内容会清晰标注来源链接或截图引用,便于用户核实信息。额外的隐私控制允许用户一键删除所有浏览数据,并立即注销所有活跃网站会话。当用户在“接管模式”下通过 ChatGPT 浏览网页时,输入内容保持私密,ChatGPT 不会收集或存储诸如密码等敏感数据。
尽管取得了这些进展,ChatGPT Agent 仍处于早期阶段。虽然已能处理多种复杂任务,但仍可能出现错误。目前,这一新 Agent 功能已面向 ChatGPT Plus、Pro 和 Team 用户开放,允许 AI 在浏览器内通过虚拟计算机执行真实任务。
此次发布标志着 AI 融入专业工作流程的关键时刻。人工智能的最新进化已超越简单对话,开启了数字助手能主动在数字领域执行任务的新时代。这一发展意味着重大转变,推动 AI 从理解人类意图走向直接、可操作地与人类日常使用的工具和界面互动。此次发布也预示着用户与 AI 的互动方式正发生转变——从提问到直接分配完整任务。凭借推理、行动和交付成果的能力,OpenAI 认为用户对 AI 的需求正从“协助”转向“为我工作”。