查日历、调研新闻、再做一份简报文档——这三件事现在用一个提示词就能搞定了。OpenAI 在 2025 年 7 月首次推出的 ChatGPT Agent,到 2026 年 3 月搭载 GPT-5.4 后,已经脱胎换骨。 曾经独立的 Operator 即将停运,Deep Research 的分析能力也融入了 Agent 内部。现在它真的成了那种“一站式搞定所有事”的 AI。

3秒速览
搭载 GPT-5.4 Operator+Deep Research 整合 虚拟电脑内自由切换浏览器·终端·API 一个提示词完成多步骤任务

这是什么?

先把时间线捋一下。2025 年 1 月,OpenAI 发布了 Operator——一款让 AI 直接操作浏览器的服务。同一时期还有 Deep Research,这是一个专注调研的功能,能读几十个信息源并生成综合报告。 问题是——这两者各玩各的。

Operator 擅长点击、滚动网页,但读长文档、做分析就力不从心。Deep Research 是分析高手,但遇到需要登录的站点就完全进不去。 2025 年 7 月,OpenAI 把这两个团队合并,做出了 ChatGPT Agent。

然后在 2026 年 3 月 5 日,GPT-5.4 发布,ChatGPT Agent 进入了一个全新阶段。 GPT-5.4 是 OpenAI 最强的前沿模型(frontier model),首次将推理、编程、Agent 工作流整合在单一模型中,也是首次同时登陆 ChatGPT、API 和 Codex。

关键变化是原生电脑使用(Computer Use)。GPT-5.4 能直接解读屏幕,控制鼠标和键盘,自动化复杂的工作流。 文本浏览器、可视化浏览器、终端、API 调用——所有工具共享同一份状态,并能无缝切换。

75%
OSWorld 基准(人类 72.4%)
83%
GDPval 专家对比一致率
272K
默认上下文窗口(最高 1M)

Sequoia Capital 播客里,OpenAI 研究员透露的内部故事挺耐人寻味。 打造 Agent 的团队其实非常小——Deep Research 的 3~4 位研究员、Operator 的 6~8 位研究员,再加上一个应用工程团队。这个小团队用强化学习(RL)在数千台虚拟机上训练模型完成各种任务,关键在于“没有预设工具使用方式,而是让模型自己摸索最优策略”。

Operator 即将停运

ChatGPT Agent 内置虚拟浏览器后,单独运营的 operator.chatgpt.com 将在数周内下线。 原 Operator 用户无需任何操作,直接切到 ChatGPT 的 Agent 模式即可。

有什么不同?

之前的 ChatGPT Agent(2025 年 7 月版)也能操作浏览器,但搭载 GPT-5.4 后的变化在于——从“能做”升级到了“做得好”

此前(基于 GPT-5.2) 现在(基于 GPT-5.4)
推理模型 GPT-5.2 Thinking + o3 GPT-5.4 Thinking 单一模型
桌面操作 以网页浏览器为主 原生电脑使用(鼠标+键盘)
专家级任务 44 个职业一致率 70.9% 44 个职业一致率 83.0%(GDPval)
编程 基础代码生成 GPT-5.3-Codex 级编程 + 前端精修
上下文 较受限 默认 272K,最高 1M token
表格·PPT 基础生成 直接生成·编辑可修改的文件
思考过程 黑盒 提前展示思考计划,用户可调整

OSWorld-Verified 基准很有象征意义。 这是衡量 AI 在真实桌面环境中完成任务能力的测试,GPT-5.4 拿下了 75%,超过了人类平均水平(72.4%)。“AI 操作电脑比人还强”这件事,第一次在基准测试上被证实了。

Sequoia Capital 的分析一针见血——“1+1=3”。 Operator 的可视化网页操作能力和 Deep Research 的文本分析·综合能力合起来,就能做成各自原本都做不到的事。比如说一句“分析三个竞争对手,做成演示文稿”——它会直接浏览网站搜集数据(Operator 能力)、综合分析信息(Deep Research 能力)、生成可编辑的演示文件(GPT-5.4 新能力),整个流程一气呵成。

注意

虽然 GPT-5.4 带来了很大提升,但 Agent 任务仍需要 5~30 分钟。 有时候在日期选择器(datepicker)这种简单 UI 上会卡住,适配不同网站布局也仍是一大难题。 支付、发送邮件这类高风险操作,请务必亲自确认。

上手指南

  1. 确认订阅方案
    GPT-5.4 Thinking 面向 ChatGPT Plus($20/月)、Team、Pro($200/月)用户开放。Plus 每月可用 40 次 Agent,Pro 每月 400 次。 GPT-5.4 Pro(最高性能)仅限 Pro·Enterprise 使用。
  2. 进入 Agent 模式
    在 ChatGPT 对话框底部的工具下拉菜单里选择“agent mode”,或直接输入 /agent 即可。任何对话中途都能切换。
  3. 连接应用 Connector
    接入 Google Calendar、Gmail、Google Drive、GitHub 后,就能执行“看我的日历,为下周的会议做一份简报”这种个性化任务。
  4. 把第一个任务交给它
    “调研+整理”组合的成功率最高。试试“找本周 5 条 AI 新闻并做成摘要表”、“对比竞品 A/B/C 的价格并整理成表格”这类指令。
  5. 把重复任务自动化
    在已完成任务里点击时钟图标,就能设置每日/每周/每月的重复计划。试着把“每周一早上发一份竞品新闻简报”自动化吧。