Harvey的AI法律智能体连续3周犯同样的错误。文件格式的特殊处理方式、工具调用的绕过方法——每次会话结束后全部消失。引入Dreaming后,完成率一跃提升了6倍。

3秒速览
会话结束 Dreaming启动 提取3类模式 记忆自动精炼 下次会话改进

为什么智能体总是忘掉昨天学会的东西?

说实话,真正部署过智能体的人都知道,这是第一个绕不开的问题。提示词写得很好,工具也接好了,一开始运行得不错——但几天后同样的错误又出现了。

原因很简单。AI智能体默认没有跨会话记忆。每次会话都从空白状态开始。Harvey的情况正是如此——智能体每次会话都重新"发现"特定文件格式的处理方式,然后失败,然后遗忘,循环往复。

以前的解决方案主要有两种:手动写记忆(提示词工程),或者对模型进行微调。前者在规模扩大后难以维护,后者成本高、周期长。Dreaming找到了中间路径:让智能体自己精炼记忆。

6倍
Harvey完成率提升
50%
Wisedocs文档审核速度提升
+10pt
Outcomes任务成功率

Dreaming和普通记忆有什么不同?

一句话:普通记忆是开发者写的,Dreaming是智能体自己改写的。

Dreaming是在智能体休息时间(会话之间)触发的后台进程。它扫描历史会话和记忆存储,寻找三类模式。

  1. 重复出现的错误
    如果智能体持续犯同样的错,Dreaming会提取错误模式。Harvey的案例中,文件格式的特殊处理和工具调用失败就是这类模式。
  2. 智能体收敛的工作流
    Dreaming捕捉智能体在多次会话中自然形成的工作方式,将这些"经过验证的工作流"保存为Playbook——下一个智能体可以直接从这里起步,省去试错过程。
  3. 团队共享的偏好
    当多个智能体组成团队时,单个智能体发现的模式会传播给整个团队。这让单个智能体看不到的洞察得以涌现。

Anthropic的Alex Albert这样解释:

"Dreaming做的事情和你手动创建Skill非常类似——区别在于,以前是你从与Claude合作的经验中手动总结,现在是模型自己来做这件事。"

— Alex Albert, Anthropic Research Product

不需要写代码,也不需要改变模型权重。输出只是普通文本笔记和Playbook文件——可以随时查看、编辑或删除。开发者可以选择自动更新模式,或者设置成每次变更前需要人工审核。

手动记忆管理微调Dreaming
运营负担每次手动编写数据准备+训练自动(可选审核)
学习范围单个智能体整个模型团队共享
成本人力成本非常高包含在Managed Agents中
可审计性高(文本文件)
生效速度即时数周至数月会话间自动

5月6日Code with Claude 2026同期发布的另外两项功能也值得了解。

同期发布:Outcomes + 多智能体编排

Outcomes(公测版) — 开发者用评分标准定义成功条件,独立的评分智能体在隔离的上下文窗口中对输出进行评估。内部测试显示任务成功率最高提升+10个百分点,.docx文档+8.4%,.pptx文档+10.1%。

多智能体编排(公测版) — 主智能体将复杂任务分解后分配给专业子智能体并行处理。Netflix正在用这个功能同时分析数百个构建的日志。

快速上手指南

  1. 访问Claude Managed Agents平台
    Managed Agents是2026年4月9日上线的Claude云托管智能体运行时。通过Claude开发者控制台用API密钥访问。目前适用于Team和Enterprise套餐。
  2. 先开启Memory功能
    Dreaming需要与Memory功能配合使用,所以先开启Memory。Memory已是公测版,可立即使用。可以在设置中按智能体或团队配置记忆范围。
  3. 用Outcomes定义成功标准
    Dreaming要判断"什么是错误",需要先有成功的定义。先在Outcomes中编写评分标准。"输出必须是.docx格式"、"摘要不超过500字"这类具体标准效果最好。
  4. 申请Dreaming访问权限
    Dreaming目前是研究预览阶段,需要在Claude开发者控制台单独申请访问。获批后可选择自动更新模式或"审核后应用"模式。
  5. 监控记忆变化
    在Claude Console中定期检查智能体编写的Playbook,确认没有学到意外的模式,可直接编辑或删除错误记忆。文本文件,修改很方便。

Dreaming仍在研究预览阶段

Outcomes、多智能体编排、Memory和Webhooks均已进入公测版可立即使用,唯独Dreaming需要单独申请。另外安全方面也需注意——持久化的结构化记忆会扩大提示注入攻击面。如果智能体需要处理不可信的外部内容,要考虑记忆污染的风险。

延伸阅读

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Anthropic官方博客,详细介绍Dreaming、Outcomes和多智能体编排的工作原理,以及Harvey、Netflix、Wisedocs案例。 claude.com

Scaling Managed Agents: Decoupling the brain from the job Anthropic工程博客,解析Managed Agents如何像OS虚拟化硬件一样虚拟化智能体组件的设计理念。 anthropic.com

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 详细介绍Harvey、Wisedocs、Spiral、Netflix案例和Outcomes技术指标的英文评测文章。 letsdatascience.com

Anthropic's Claude Agents Can Now "Dream" 包含技术背景和记忆污染攻击风险分析的英文深度解析。 quasa.io

Anthropic adds self-improving 'dreaming' system to Claude Managed Agents YourStory对此次发布的报道,包含竞争格局分析。 yourstory.com