查日历、调研新闻、再做一份简报文档——这三件事现在用一个提示词就能搞定了。OpenAI 在 2025 年 7 月首次推出的 ChatGPT Agent,到 2026 年 3 月搭载 GPT-5.4 后,已经脱胎换骨。 曾经独立的 Operator 即将停运,Deep Research 的分析能力也融入了 Agent 内部。现在它真的成了那种“一站式搞定所有事”的 AI。
这是什么?
先把时间线捋一下。2025 年 1 月,OpenAI 发布了 Operator——一款让 AI 直接操作浏览器的服务。同一时期还有 Deep Research,这是一个专注调研的功能,能读几十个信息源并生成综合报告。 问题是——这两者各玩各的。
Operator 擅长点击、滚动网页,但读长文档、做分析就力不从心。Deep Research 是分析高手,但遇到需要登录的站点就完全进不去。 2025 年 7 月,OpenAI 把这两个团队合并,做出了 ChatGPT Agent。
然后在 2026 年 3 月 5 日,GPT-5.4 发布,ChatGPT Agent 进入了一个全新阶段。 GPT-5.4 是 OpenAI 最强的前沿模型(frontier model),首次将推理、编程、Agent 工作流整合在单一模型中,也是首次同时登陆 ChatGPT、API 和 Codex。
关键变化是原生电脑使用(Computer Use)。GPT-5.4 能直接解读屏幕,控制鼠标和键盘,自动化复杂的工作流。 文本浏览器、可视化浏览器、终端、API 调用——所有工具共享同一份状态,并能无缝切换。
Sequoia Capital 播客里,OpenAI 研究员透露的内部故事挺耐人寻味。 打造 Agent 的团队其实非常小——Deep Research 的 3~4 位研究员、Operator 的 6~8 位研究员,再加上一个应用工程团队。这个小团队用强化学习(RL)在数千台虚拟机上训练模型完成各种任务,关键在于“没有预设工具使用方式,而是让模型自己摸索最优策略”。
Operator 即将停运
ChatGPT Agent 内置虚拟浏览器后,单独运营的 operator.chatgpt.com 将在数周内下线。 原 Operator 用户无需任何操作,直接切到 ChatGPT 的 Agent 模式即可。
有什么不同?
之前的 ChatGPT Agent(2025 年 7 月版)也能操作浏览器,但搭载 GPT-5.4 后的变化在于——从“能做”升级到了“做得好”。
| 此前(基于 GPT-5.2) | 现在(基于 GPT-5.4) | |
|---|---|---|
| 推理模型 | GPT-5.2 Thinking + o3 | GPT-5.4 Thinking 单一模型 |
| 桌面操作 | 以网页浏览器为主 | 原生电脑使用(鼠标+键盘) |
| 专家级任务 | 44 个职业一致率 70.9% | 44 个职业一致率 83.0%(GDPval) |
| 编程 | 基础代码生成 | GPT-5.3-Codex 级编程 + 前端精修 |
| 上下文 | 较受限 | 默认 272K,最高 1M token |
| 表格·PPT | 基础生成 | 直接生成·编辑可修改的文件 |
| 思考过程 | 黑盒 | 提前展示思考计划,用户可调整 |
OSWorld-Verified 基准很有象征意义。 这是衡量 AI 在真实桌面环境中完成任务能力的测试,GPT-5.4 拿下了 75%,超过了人类平均水平(72.4%)。“AI 操作电脑比人还强”这件事,第一次在基准测试上被证实了。
Sequoia Capital 的分析一针见血——“1+1=3”。 Operator 的可视化网页操作能力和 Deep Research 的文本分析·综合能力合起来,就能做成各自原本都做不到的事。比如说一句“分析三个竞争对手,做成演示文稿”——它会直接浏览网站搜集数据(Operator 能力)、综合分析信息(Deep Research 能力)、生成可编辑的演示文件(GPT-5.4 新能力),整个流程一气呵成。
注意
虽然 GPT-5.4 带来了很大提升,但 Agent 任务仍需要 5~30 分钟。 有时候在日期选择器(datepicker)这种简单 UI 上会卡住,适配不同网站布局也仍是一大难题。 支付、发送邮件这类高风险操作,请务必亲自确认。
上手指南
- 确认订阅方案
GPT-5.4 Thinking 面向 ChatGPT Plus($20/月)、Team、Pro($200/月)用户开放。Plus 每月可用 40 次 Agent,Pro 每月 400 次。 GPT-5.4 Pro(最高性能)仅限 Pro·Enterprise 使用。 - 进入 Agent 模式
在 ChatGPT 对话框底部的工具下拉菜单里选择“agent mode”,或直接输入/agent即可。任何对话中途都能切换。 - 连接应用 Connector
接入 Google Calendar、Gmail、Google Drive、GitHub 后,就能执行“看我的日历,为下周的会议做一份简报”这种个性化任务。 - 把第一个任务交给它
“调研+整理”组合的成功率最高。试试“找本周 5 条 AI 新闻并做成摘要表”、“对比竞品 A/B/C 的价格并整理成表格”这类指令。 - 把重复任务自动化
在已完成任务里点击时钟图标,就能设置每日/每周/每月的重复计划。试着把“每周一早上发一份竞品新闻简报”自动化吧。




