Harvey的AI法律智能体连续3周犯同样的错误。文件格式的特殊处理方式、工具调用的绕过方法——每次会话结束后全部消失。引入Dreaming后,完成率一跃提升了6倍。
为什么智能体总是忘掉昨天学会的东西?
说实话,真正部署过智能体的人都知道,这是第一个绕不开的问题。提示词写得很好,工具也接好了,一开始运行得不错——但几天后同样的错误又出现了。
原因很简单。AI智能体默认没有跨会话记忆。每次会话都从空白状态开始。Harvey的情况正是如此——智能体每次会话都重新"发现"特定文件格式的处理方式,然后失败,然后遗忘,循环往复。
以前的解决方案主要有两种:手动写记忆(提示词工程),或者对模型进行微调。前者在规模扩大后难以维护,后者成本高、周期长。Dreaming找到了中间路径:让智能体自己精炼记忆。
Dreaming和普通记忆有什么不同?
一句话:普通记忆是开发者写的,Dreaming是智能体自己改写的。
Dreaming是在智能体休息时间(会话之间)触发的后台进程。它扫描历史会话和记忆存储,寻找三类模式。
- 重复出现的错误
如果智能体持续犯同样的错,Dreaming会提取错误模式。Harvey的案例中,文件格式的特殊处理和工具调用失败就是这类模式。 - 智能体收敛的工作流
Dreaming捕捉智能体在多次会话中自然形成的工作方式,将这些"经过验证的工作流"保存为Playbook——下一个智能体可以直接从这里起步,省去试错过程。 - 团队共享的偏好
当多个智能体组成团队时,单个智能体发现的模式会传播给整个团队。这让单个智能体看不到的洞察得以涌现。
Anthropic的Alex Albert这样解释:
"Dreaming做的事情和你手动创建Skill非常类似——区别在于,以前是你从与Claude合作的经验中手动总结,现在是模型自己来做这件事。"
— Alex Albert, Anthropic Research Product
不需要写代码,也不需要改变模型权重。输出只是普通文本笔记和Playbook文件——可以随时查看、编辑或删除。开发者可以选择自动更新模式,或者设置成每次变更前需要人工审核。
| 手动记忆管理 | 微调 | Dreaming | |
|---|---|---|---|
| 运营负担 | 每次手动编写 | 数据准备+训练 | 自动(可选审核) |
| 学习范围 | 单个智能体 | 整个模型 | 团队共享 |
| 成本 | 人力成本 | 非常高 | 包含在Managed Agents中 |
| 可审计性 | 高 | 低 | 高(文本文件) |
| 生效速度 | 即时 | 数周至数月 | 会话间自动 |
5月6日Code with Claude 2026同期发布的另外两项功能也值得了解。
同期发布:Outcomes + 多智能体编排
Outcomes(公测版) — 开发者用评分标准定义成功条件,独立的评分智能体在隔离的上下文窗口中对输出进行评估。内部测试显示任务成功率最高提升+10个百分点,.docx文档+8.4%,.pptx文档+10.1%。
多智能体编排(公测版) — 主智能体将复杂任务分解后分配给专业子智能体并行处理。Netflix正在用这个功能同时分析数百个构建的日志。
快速上手指南
- 访问Claude Managed Agents平台
Managed Agents是2026年4月9日上线的Claude云托管智能体运行时。通过Claude开发者控制台用API密钥访问。目前适用于Team和Enterprise套餐。 - 先开启Memory功能
Dreaming需要与Memory功能配合使用,所以先开启Memory。Memory已是公测版,可立即使用。可以在设置中按智能体或团队配置记忆范围。 - 用Outcomes定义成功标准
Dreaming要判断"什么是错误",需要先有成功的定义。先在Outcomes中编写评分标准。"输出必须是.docx格式"、"摘要不超过500字"这类具体标准效果最好。 - 申请Dreaming访问权限
Dreaming目前是研究预览阶段,需要在Claude开发者控制台单独申请访问。获批后可选择自动更新模式或"审核后应用"模式。 - 监控记忆变化
在Claude Console中定期检查智能体编写的Playbook,确认没有学到意外的模式,可直接编辑或删除错误记忆。文本文件,修改很方便。
Dreaming仍在研究预览阶段
Outcomes、多智能体编排、Memory和Webhooks均已进入公测版可立即使用,唯独Dreaming需要单独申请。另外安全方面也需注意——持久化的结构化记忆会扩大提示注入攻击面。如果智能体需要处理不可信的外部内容,要考虑记忆污染的风险。
延伸阅读
New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Anthropic官方博客,详细介绍Dreaming、Outcomes和多智能体编排的工作原理,以及Harvey、Netflix、Wisedocs案例。 claude.com
Scaling Managed Agents: Decoupling the brain from the job Anthropic工程博客,解析Managed Agents如何像OS虚拟化硬件一样虚拟化智能体组件的设计理念。 anthropic.com
Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 详细介绍Harvey、Wisedocs、Spiral、Netflix案例和Outcomes技术指标的英文评测文章。 letsdatascience.com
Anthropic's Claude Agents Can Now "Dream" 包含技术背景和记忆污染攻击风险分析的英文深度解析。 quasa.io
Anthropic adds self-improving 'dreaming' system to Claude Managed Agents YourStory对此次发布的报道,包含竞争格局分析。 yourstory.com




