OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

2025 年 7 月 17 日，OpenAI 正式发布 ChatGPT Agent，这是一套统一的智能代理系统，融合了 Operator 的网页导航能力、deep research 的深度分析优势以及 ChatGPT 的对话智能。该强大工具让用户能够将竞品分析、会议准备、旅行规划等复杂任务交由 ChatGPT 处理，系统可通过虚拟计算机自主浏览网站、分析信息并生成可编辑文档。虽然仍处于早期阶段，但此次发布标志着 OpenAI 迄今为止最具雄心的努力，旨在将 ChatGPT 从问答工具转型为自主数字助手。

OpenAI 在人工智能领域迈出了重要一步，推出了 ChatGPT Agent，这是一套能够利用自身虚拟计算机独立完成复杂任务的系统。

新代理于 2025 年 7 月 17 日发布，代表了一种统一的方法，将原本分离的三项能力整合在一起：Operator 的网页点击、滚动和输入交互能力；deep research 跨网页信息整合与分析能力；以及 ChatGPT 的对话智能。这一整合解决了早期工具各自为战、难以完成端到端工作流的局限。

ChatGPT Agent 由 OpenAI 旗舰多模态模型 GPT-4o 驱动，能够处理诸如“分析三家竞争对手并制作演示文稿”或“查看我的日历，并根据最新新闻简要汇报即将到来的客户会议”等复杂请求。系统可通过视觉和文本方式导航网页，填写表单，在用户授权下访问账户，执行代码，并生成包括电子表格和演示文稿在内的可编辑文档。

在基准测试中，ChatGPT Agent 的表现远超以往 OpenAI 工具。在投行分析师建模任务中，其成绩优于 deep research 和 o3 模型；在难以查找信息的 BrowseComp 基准测试中，取得了 68.9% 的新纪录，比 deep research 高出 17.4 个百分点。

尽管功能强大，OpenAI 强调用户始终掌控全局。代理在执行关键操作前会请求用户许可，用户可随时中断、接管浏览器或终止任务。从即日起，Pro、Plus 和 Team 用户可通过工具下拉菜单，在任意对话中选择“代理模式”以启用相关功能。

此次发布标志着 OpenAI 迄今为止最大胆的尝试，将 ChatGPT 从问答工具转型为可执行操作、分担复杂任务的智能代理产品。尽管早期 AI 代理在复杂任务上表现有限，OpenAI 表示 ChatGPT Agent 的能力已远超以往，并计划持续改进，让其变得越来越实用。

Source:

OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

Latest News

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

穆拉蒂的Thinking Machines Lab获20亿美元融资，推动AI革命

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

Google发布Imagen 4，革新文本渲染能力

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

Related Articles

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

穆拉蒂的Thinking Machines Lab获20亿美元融资，推动AI革命

Latest News

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

穆拉蒂的Thinking Machines Lab获20亿美元融资，推动AI革命

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

Google发布Imagen 4，革新文本渲染能力

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能