Claude Managed Agents Dreaming, Outcomes, Multiagent Orchestration 업데이트 발표

cdn.prod.website-files.com

エージェントは眠りながら学ぶ — AnthropicのDreamingがHarveyの完了率を6倍にした方法

AIエージェント自己改善, Claude Dreaming, Managed Agents, Harvey 6倍, セッション間メモリ最適化開発

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration

Anthropic introduces "dreaming," a system that lets AI agents learn from their own mistakes

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026

Harveyの法律AIエージェントは、3週間同じミスを繰り返し続けました。ファイル形式の特殊な挙動、ツールの回避策——セッションが終わるたびにすべて消えてしまうんです。Dreamingを導入後、完了率は6倍に跳ね上がりました。

3秒まとめ

セッション終了 → Dreaming起動 → 3種パターン抽出 → メモリ自動精製 → 次セッション改善

なぜエージェントは昨日学んだことを今日忘れるんですか？

正直、エージェントを実際に運用してみると最初にぶつかる壁がこれです。プロンプトをしっかり書いて、ツールも繋いで、最初はうまく動いていても——数日後に同じミスが繰り返される。

理由はシンプルです。AIエージェントにはデフォルトでセッション間のメモリがありません。毎セッションがゼロからのスタートなんです。Harveyのケースがまさにそれで——エージェントが特定の法務文書形式の癖、特定のツール呼び出し方法をセッションごとに「再発見」しては失敗する、そのループでした。

従来の解決策は大きく二つでした。自分でメモリを書く（プロンプトエンジニアリング）か、モデルをファインチューニングするか。前者は規模が大きくなると管理できなくなり、後者はコストと時間がかかりすぎます。Dreamingはその中間を見つけたんです。エージェント自身にメモリを精製させるという。

6倍

Harvey完了率の向上

50%

Wisedocsレビュー速度改善

+10pt

Outcomesタスク成功率

Dreamingは従来のメモリと何が違うんですか？

一言で言えば：従来のメモリは開発者が書くもの、Dreamingはエージェントが自分で書き直すもの、です。

Dreamingはエージェントが休んでいる間（セッションとセッションの間）に起動するバックグラウンドプロセスです。過去のセッションとメモリストアを精査して、ちょうど3種類のパターンを抽出します。

繰り返されるミス
エージェントが同じエラーを繰り返している場合、そのミスのパターンを抽出します。Harveyの場合はファイル形式の特殊挙動とツール呼び出し失敗パターンがこれにあたりました。
エージェントが収束するワークフロー
複数のセッションでエージェントが自然と採用するアプローチを捉えます。この「実証済みワークフロー」をプレイブックとして保存しておくと、次のエージェントは試行錯誤なしに同じ方法でスタートできます。
チーム全体で共有される傾向
複数のエージェントがチームとして動く場合、一つのエージェントが発見したパターンがチーム全体に共有されます。単独のエージェントには見えなかったインサイトがここから生まれます。

AnthropicのAlex Albertはこう説明しています。

「Dreamingで起きていることは、あなたがClaudeとの作業経験からSkillを手動で作っていたことを、モデル自身がやるようなものです。」
— Alex Albert, Anthropic Research Product

コードも不要、モデルの重みも変わりません。出力はただのプレーンテキストのノートとプレイブック——テキストファイルなのでいつでも確認・編集できます。自動更新モードと、変更前に人間がレビューするモードを選択できます。

	手動メモリ管理	ファインチューニング	Dreaming
運用負担	毎回自分で書く	データ準備+学習	自動（レビューオプション）
学習範囲	単一エージェント	モデル全体	チーム全体で共有
コスト	人件費	非常に高い	Managed Agentsに含まれる
監査可能性	高い	低い	高い（テキストファイル）
反映速度	即時	数週間〜数ヶ月	セッション間で自動

5月6日のCode with Claude 2026で同時に発表された2つの機能も合わせて押さえておきましょう。

同時発表: Outcomes + マルチエージェントオーケストレーション

Outcomes（パブリックベータ） — 開発者がルーブリックで成功基準を定義すると、独立したコンテキストウィンドウを持つ採点エージェントが結果を評価します。内部テストではタスク成功率最大+10ポイント、docxで+8.4%、pptxで+10.1%の改善が見られました。

マルチエージェントオーケストレーション（パブリックベータ） — リードエージェントが複雑なタスクを専門サブエージェントに分配して並列処理します。Netflixはこれを使って数百のビルドのログを同時に分析しています。

始め方：核心だけまとめると

Claude Managed Agentsプラットフォームにアクセス
Managed Agentsは2026年4月9日に開始したClaudeのクラウドホスティングエージェントランタイムです。Claude開発者ダッシュボードからAPIキーでアクセスできます。現在チーム・エンタープライズプラン以上で利用可能です。
まずMemoryを有効化
DreamingはMemory機能と連携して動作するため、先にMemoryを有効にする必要があります。Memoryはパブリックベータなので即時利用可能。エージェント単位・チーム単位でメモリの範囲を設定できます。
Outcomesで成功基準を定義
Dreamingが「何がミスか」を判断するには成功基準が必要です。Outcomesで先にルーブリックを作成しましょう。「法務文書は.docx形式で保存する」「要約は500語以内」といった具体的な基準が効果的です。
Dreamingのアクセスを申請
Dreamingはまだリサーチプレビュー段階です。Claude開発者ダッシュボードから別途アクセス申請が必要です。承認後、自動更新モードと「レビュー後適用」モードのどちらかを選択できます。
メモリの変化を監視
Claude Consoleでエージェントが書いたプレイブックを定期的に確認しましょう。意図しないパターンが学習されていないか検証し、誤ったメモリは直接修正できます。テキストファイルなので編集も簡単です。

Dreamingはまだリサーチプレビューです

Outcomes、マルチエージェントオーケストレーション、Memory、Webhooksはパブリックベータで今すぐ使えますが、Dreamingだけは別途アクセス申請が必要です。また、セキュリティ面でも注意が必要です——構造化された永続メモリはプロンプトインジェクション攻撃の表面を拡大します。エージェントが外部コンテンツを処理する場合は、メモリ汚染のリスクを考慮してください。

もっと深く知りたい方へ

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Dreaming、Outcomes、マルチエージェントオーケストレーションの仕組みとHarvey、Netflix、Wisedocs事例が確認できるAnthropicの公式ブログです。 claude.com

Scaling Managed Agents: Decoupling the brain from the job OSがハードウェアを仮想化するようにエージェントコンポーネントを仮想化したManaged Agentsの設計哲学を詳説するAnthropicエンジニアリングブログです。 anthropic.com

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 Harvey、Wisedocs、Spiral、Netflix事例とOutcomesの技術指標が詳しくまとめられた英語レビューです。 letsdatascience.com

Anthropic's Claude Agents Can Now "Dream" 技術的背景とメモリポイズニング攻撃リスクを含むセキュリティ分析が読める英語分析記事です。 quasa.io

앤트로픽 'Code with Claude 2026' 키노트 전체 정리 Dreaming以外の発表機能のコンテキストも合わせて把握できるAIマターズのキーノート要約です（韓国語）。 aimatters.co.kr

よくある質問

Claude Code Auto MemoryとDreamingはどう違うんですか？

Auto MemoryはClaude Codeを使う個人開発者向けのセッション記憶自動記録機能です。DreamingはClaude Managed Agentsプラットフォームで、エージェントチーム全体の過去セッションを分析してメモリを洗練させる機能です。個人のメモとチームのナレッジ管理の違いに近いですね。

Claude ProやMaxの利用者もDreamingを使えますか？

DreamingはClaude Managed Agentsプラットフォーム専用の機能です。claude.comのチャットやClaude Codeでは使用できません。APIを通じてManaged Agentsを構成する必要があります。現在はリサーチプレビュー段階で別途アクセス申請が必要です。

Dreamingが間違ったパターンを学習した場合はどうすればいいですか？

Dreamingが生成するメモリはプレーンテキストファイルです。Claude Consoleから直接確認・編集・削除できます。自動更新モードの代わりに「レビュー後適用」モードに設定すれば、メモリ変更前に必ず人間が確認できます。

Harveyの6倍改善はすべての業務に当てはまりますか？

Harveyの結果は長文法律文書作成という特定の作業で出た数値です。Anthropicの公式ブログでも独立したベンチマークなしに顧客事例のみ公開されています。繰り返しミスが多い作業ほど改善幅が大きく、単純な一回性の作業では効果が限定的な場合があります。