Claude Managed Agents Dreaming, Outcomes, Multiagent Orchestration 업데이트 발표

cdn.prod.website-files.com

智能体在「睡眠」中学习 — Anthropic的Dreaming如何将Harvey完成率提升6倍

AI智能体自我改进, Claude Dreaming, Managed Agents, Harvey 6倍, 跨会话记忆优化开发

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration

Anthropic introduces "dreaming," a system that lets AI agents learn from their own mistakes

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026

Harvey的AI法律智能体连续3周犯同样的错误。文件格式的特殊处理方式、工具调用的绕过方法——每次会话结束后全部消失。引入Dreaming后，完成率一跃提升了6倍。

3秒速览

会话结束 → Dreaming启动 → 提取3类模式 → 记忆自动精炼 → 下次会话改进

为什么智能体总是忘掉昨天学会的东西？

说实话，真正部署过智能体的人都知道，这是第一个绕不开的问题。提示词写得很好，工具也接好了，一开始运行得不错——但几天后同样的错误又出现了。

原因很简单。AI智能体默认没有跨会话记忆。每次会话都从空白状态开始。Harvey的情况正是如此——智能体每次会话都重新"发现"特定文件格式的处理方式，然后失败，然后遗忘，循环往复。

以前的解决方案主要有两种：手动写记忆（提示词工程），或者对模型进行微调。前者在规模扩大后难以维护，后者成本高、周期长。Dreaming找到了中间路径：让智能体自己精炼记忆。

6倍

Harvey完成率提升

50%

Wisedocs文档审核速度提升

+10pt

Outcomes任务成功率

Dreaming和普通记忆有什么不同？

一句话：普通记忆是开发者写的，Dreaming是智能体自己改写的。

Dreaming是在智能体休息时间（会话之间）触发的后台进程。它扫描历史会话和记忆存储，寻找三类模式。

重复出现的错误
如果智能体持续犯同样的错，Dreaming会提取错误模式。Harvey的案例中，文件格式的特殊处理和工具调用失败就是这类模式。
智能体收敛的工作流
Dreaming捕捉智能体在多次会话中自然形成的工作方式，将这些"经过验证的工作流"保存为Playbook——下一个智能体可以直接从这里起步，省去试错过程。
团队共享的偏好
当多个智能体组成团队时，单个智能体发现的模式会传播给整个团队。这让单个智能体看不到的洞察得以涌现。

Anthropic的Alex Albert这样解释：

"Dreaming做的事情和你手动创建Skill非常类似——区别在于，以前是你从与Claude合作的经验中手动总结，现在是模型自己来做这件事。"
— Alex Albert, Anthropic Research Product

不需要写代码，也不需要改变模型权重。输出只是普通文本笔记和Playbook文件——可以随时查看、编辑或删除。开发者可以选择自动更新模式，或者设置成每次变更前需要人工审核。

	手动记忆管理	微调	Dreaming
运营负担	每次手动编写	数据准备+训练	自动（可选审核）
学习范围	单个智能体	整个模型	团队共享
成本	人力成本	非常高	包含在Managed Agents中
可审计性	高	低	高（文本文件）
生效速度	即时	数周至数月	会话间自动

5月6日Code with Claude 2026同期发布的另外两项功能也值得了解。

同期发布：Outcomes + 多智能体编排

Outcomes（公测版） — 开发者用评分标准定义成功条件，独立的评分智能体在隔离的上下文窗口中对输出进行评估。内部测试显示任务成功率最高提升+10个百分点，.docx文档+8.4%，.pptx文档+10.1%。

多智能体编排（公测版） — 主智能体将复杂任务分解后分配给专业子智能体并行处理。Netflix正在用这个功能同时分析数百个构建的日志。

快速上手指南

访问Claude Managed Agents平台
Managed Agents是2026年4月9日上线的Claude云托管智能体运行时。通过Claude开发者控制台用API密钥访问。目前适用于Team和Enterprise套餐。
先开启Memory功能
Dreaming需要与Memory功能配合使用，所以先开启Memory。Memory已是公测版，可立即使用。可以在设置中按智能体或团队配置记忆范围。
用Outcomes定义成功标准
Dreaming要判断"什么是错误"，需要先有成功的定义。先在Outcomes中编写评分标准。"输出必须是.docx格式"、"摘要不超过500字"这类具体标准效果最好。
申请Dreaming访问权限
Dreaming目前是研究预览阶段，需要在Claude开发者控制台单独申请访问。获批后可选择自动更新模式或"审核后应用"模式。
监控记忆变化
在Claude Console中定期检查智能体编写的Playbook，确认没有学到意外的模式，可直接编辑或删除错误记忆。文本文件，修改很方便。

Dreaming仍在研究预览阶段

Outcomes、多智能体编排、Memory和Webhooks均已进入公测版可立即使用，唯独Dreaming需要单独申请。另外安全方面也需注意——持久化的结构化记忆会扩大提示注入攻击面。如果智能体需要处理不可信的外部内容，要考虑记忆污染的风险。

延伸阅读

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Anthropic官方博客，详细介绍Dreaming、Outcomes和多智能体编排的工作原理，以及Harvey、Netflix、Wisedocs案例。 claude.com

Scaling Managed Agents: Decoupling the brain from the job Anthropic工程博客，解析Managed Agents如何像OS虚拟化硬件一样虚拟化智能体组件的设计理念。 anthropic.com

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 详细介绍Harvey、Wisedocs、Spiral、Netflix案例和Outcomes技术指标的英文评测文章。 letsdatascience.com

Anthropic's Claude Agents Can Now "Dream" 包含技术背景和记忆污染攻击风险分析的英文深度解析。 quasa.io

Anthropic adds self-improving 'dreaming' system to Claude Managed Agents YourStory对此次发布的报道，包含竞争格局分析。 yourstory.com

常见问题

Dreaming和Claude Code Auto Memory有什么区别？

Auto Memory是面向使用Claude Code的个人开发者的会话记忆自动记录功能；Dreaming是Claude Managed Agents平台上，对智能体团队的历史会话进行分析并精炼共享记忆的功能。前者相当于个人笔记，后者相当于团队知识管理。

Claude Pro或Max订阅用户也能用Dreaming吗？

Dreaming是Claude Managed Agents平台的专属功能，无法在claude.com的普通对话或Claude Code中使用。需要通过API配置Managed Agents平台。目前处于研究预览阶段，需要单独申请访问权限。

如果Dreaming学到了错误的模式怎么办？

Dreaming生成的记忆是纯文本文件，可以在Claude Console中直接查看、编辑或删除。也可以将自动更新模式改为「审核后应用」模式，这样每次记忆变更前都需要人工确认。

Harvey的6倍改善适用于所有类型的工作吗？

Harvey的结果来自于长篇法律文书撰写这类反复文件处理密集的任务。Anthropic官方博客目前只发布了客户案例，没有独立基准测试数据。重复性错误越多的任务改善幅度越大，简单的一次性任务效果可能有限。

作者拉什

追踪商业与AI的交汇点。

这个参考对您有帮助吗？

每周精选参考直达您的邮箱

分享此参考

8年只想不动手的产品,我用AI编程代理3个月做完了

Google资深工程师把搁置8年的开源项目,用AI编程代理3个月内做出来了。从Vibe Coding的失败、推倒重写,到AI真正擅长与不擅长的事——一份用250小时实战记录证明的复盘。

你可能还感兴趣

其他读者也在看的参考

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

pymnts.com

Cursor爆发式增长至500亿美元估值，预示AI编程工具市场大变局

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

ARR 突破 20 亿美元,3 个月营收翻倍。并行 Agent、MCP Apps、JetBrains 集成——Cursor 揭示 AI 编程市场的真实规模与未来走向。

查看详情

cdn.infograb.io

Claude Skills

只需教AI一次 — Claude Skills 33页指南完整整理

Anthropic公开的33页官方指南核心总结。用一个文件夹向Claude传授业务诀窍的Skills功能——节省50%token，消息15次→2次，还可以全团队共享。

查看详情

下一篇 →8年只想不动手的产品,我用AI编程代理3个月做完了