去年,如果你问AI"怎样更好地获得税款退还",它会给你一个指南。一步一步地,这样做、那样做。但在2026年3月,Anthropic发布Claude Cowork + Dispatch后,局面改变了。现在Claude会直接在你的电脑上打开应用、找到文件、制作成果并返回给你。
这是什么?
「向导AI」和「助手AI」的区别很简单。向导告诉你方法,助手直接帮你做。
2025年之前的AI被困在对话框里。无论多聪明,说"帮我修改这个文件"也只是扔给你一段代码,无法直接打开文件进行修改。2026年的代理不同。它会制定计划、使用工具、编辑文件、执行命令。
不只是回答问题,而是能自主完成计划 → 使用工具 → 执行 → 验证全过程的AI系统。这是2026年关键词之一"代理式(Agentic)AI"的核心概念。
Anthropic今年3月发布的Claude Cowork是这一概念的代表案例。Claude在桌面上读取本地文件,操控浏览器,在应用间穿梭处理任务。加入Dispatch功能后,用手机下达指令,在PC上接收执行结果的架构得以完成。Forbes将其描述为"不是聊天窗口,而是运营层(operating layer)"。
有什么变化?
| 2025 向导AI | 2026 助手AI | |
|---|---|---|
| 运作方式 | 提问 → 文字回答 | 下达指令 → 直接执行并返回结果 |
| 范围 | 对话框内 | 文件系统、浏览器、整个应用 |
| 编程 | 提供代码片段 | 文件编辑 + 终端命令 + Git管理 |
| 指令方式 | 坐在PC前聊天 | 手机下达指令,PC自主执行 |
| 自主性 | 每次都需要用户介入 | 计划 → 执行 → 验证全程自主 |
看看现实中正在发生的变化就能感同身受。
编程领域:Segment联合创始人Calvin French-Owen同时使用Claude Code和Codex,他说"我的时间是最大的瓶颈"。他采用了把3~4个任务交给代理在夜间处理,早上审查的工作流程。还有数据显示,25%的YC初创公司的代码中95%由AI编写。
科学研究:Anthropic的一名研究员将宇宙论模拟器交给Claude处理,即便这不是他自己的专业领域。通常需要研究人员数月至数年的工作,在数天内完成,并达到基准代码1%以内的误差。
日常工作:Bernard Marr在2026年AI代理八大趋势中预测"从食材订购、运动计划到家电管理,代理将渗透到日常生活中"。不只是制作待办清单,而是下单、预约、控制设备。
如何开始
- 尝试Claude Cowork
Anthropic Pro/Max订阅者可以立即使用。从简单的任务开始 — 比如"整理这个文件夹的文件"、"在浏览器上找这个数据"。关键是从"提问"切换到"下达指令"。 - 挑选适合代理的工作
并非所有工作都适合代理。成功标准明确、重复性强、不需要人一直监督的任务最为合适。例如:文件整理、数据收集、报告草稿、代码审查。 - 建立成果验证流程
不能无条件相信代理制作的结果。Anthropic研究团队也将"测试预言机(验证标准)"设为必须,编程代理专家们同时进行自动代码审查。人的角色从"下达指令的人"变成"验证结果的人"。 - 投资于上下文管理
代理性能的核心是上下文窗口。Calvin French-Owen的建议:将任务分割为适当的大小,将计划文档外部化到文件系统,并保持在上下文的"聪明的一半"中。 - 检查安全检查清单
给代理文件和浏览器访问权限很强大,但也很危险。Anthropic表示"在执行前会请求应用访问许可",但Simon Willison警告的"Lethal Trifecta"(权限 + 互联网访问 + 不可信数据)组合需要谨慎。
想深入了解
Claude Code vs Codex vs Cursor — 每天实际使用者的比较。Opus并行执行的优势、Codex代码精度的优势、工作树的使用方法,内容具体详实。
在calv.info阅读 →连续多天运行代理进行科学研究的方法论。包含测试预言机、基于CHANGELOG的长期记忆、Ralph循环模式等实战技巧。
在anthropic.com阅读 →超越编程,延伸到日常工作、医疗保健、金融、网络安全 — 可以从大局上看代理正在渗透到哪些领域。
在bernardmarr.com阅读 →



