去年,如果你问AI"怎样更好地获得税款退还",它会给你一个指南。一步一步地,这样做、那样做。但在2026年3月,Anthropic发布Claude Cowork + Dispatch后,局面改变了。现在Claude会直接在你的电脑上打开应用、找到文件、制作成果并返回给你。

3秒摘要
2025: AI = 向导 2026: AI = 助手(直接执行) Claude Cowork + Dispatch 手机下达指令,PC执行 编程/科学/金融全面渗透

这是什么?

「向导AI」和「助手AI」的区别很简单。向导告诉你方法,助手直接帮你做。

2025年之前的AI被困在对话框里。无论多聪明,说"帮我修改这个文件"也只是扔给你一段代码,无法直接打开文件进行修改。2026年的代理不同。它会制定计划、使用工具、编辑文件、执行命令。

代理(Agent)是什么?
不只是回答问题,而是能自主完成计划 → 使用工具 → 执行 → 验证全过程的AI系统。这是2026年关键词之一"代理式(Agentic)AI"的核心概念。

Anthropic今年3月发布的Claude Cowork是这一概念的代表案例。Claude在桌面上读取本地文件,操控浏览器,在应用间穿梭处理任务。加入Dispatch功能后,用手机下达指令,在PC上接收执行结果的架构得以完成。Forbes将其描述为"不是聊天窗口,而是运营层(operating layer)"。

有什么变化?

2025 向导AI2026 助手AI
运作方式提问 → 文字回答下达指令 → 直接执行并返回结果
范围对话框内文件系统、浏览器、整个应用
编程提供代码片段文件编辑 + 终端命令 + Git管理
指令方式坐在PC前聊天手机下达指令,PC自主执行
自主性每次都需要用户介入计划 → 执行 → 验证全程自主

看看现实中正在发生的变化就能感同身受。

编程领域:Segment联合创始人Calvin French-Owen同时使用Claude Code和Codex,他说"我的时间是最大的瓶颈"。他采用了把3~4个任务交给代理在夜间处理,早上审查的工作流程。还有数据显示,25%的YC初创公司的代码中95%由AI编写。

科学研究:Anthropic的一名研究员将宇宙论模拟器交给Claude处理,即便这不是他自己的专业领域。通常需要研究人员数月至数年的工作,在数天内完成,并达到基准代码1%以内的误差。

日常工作:Bernard Marr在2026年AI代理八大趋势中预测"从食材订购、运动计划到家电管理,代理将渗透到日常生活中"。不只是制作待办清单,而是下单、预约、控制设备。

核心转变:AI的价值正在从"提供信息"转向"完成任务"。知道和做到的区别,就是2025→2026的差异。

如何开始

  1. 尝试Claude Cowork
    Anthropic Pro/Max订阅者可以立即使用。从简单的任务开始 — 比如"整理这个文件夹的文件"、"在浏览器上找这个数据"。关键是从"提问"切换到"下达指令"。
  2. 挑选适合代理的工作
    并非所有工作都适合代理。成功标准明确、重复性强、不需要人一直监督的任务最为合适。例如:文件整理、数据收集、报告草稿、代码审查。
  3. 建立成果验证流程
    不能无条件相信代理制作的结果。Anthropic研究团队也将"测试预言机(验证标准)"设为必须,编程代理专家们同时进行自动代码审查。人的角色从"下达指令的人"变成"验证结果的人"。
  4. 投资于上下文管理
    代理性能的核心是上下文窗口。Calvin French-Owen的建议:将任务分割为适当的大小,将计划文档外部化到文件系统,并保持在上下文的"聪明的一半"中。
  5. 检查安全检查清单
    给代理文件和浏览器访问权限很强大,但也很危险。Anthropic表示"在执行前会请求应用访问许可",但Simon Willison警告的"Lethal Trifecta"(权限 + 互联网访问 + 不可信数据)组合需要谨慎。

想深入了解

Calvin French-Owen的编程代理比较

Claude Code vs Codex vs Cursor — 每天实际使用者的比较。Opus并行执行的优势、Codex代码精度的优势、工作树的使用方法,内容具体详实。

在calv.info阅读 →
Anthropic: Long-running Claude for Scientific Computing

连续多天运行代理进行科学研究的方法论。包含测试预言机、基于CHANGELOG的长期记忆、Ralph循环模式等实战技巧。

在anthropic.com阅读 →
Bernard Marr: 2026 AI代理八大趋势

超越编程,延伸到日常工作、医疗保健、金融、网络安全 — 可以从大局上看代理正在渗透到哪些领域。

在bernardmarr.com阅读 →