Harveyの法律AIエージェントは、3週間同じミスを繰り返し続けました。ファイル形式の特殊な挙動、ツールの回避策——セッションが終わるたびにすべて消えてしまうんです。Dreamingを導入後、完了率は6倍に跳ね上がりました。
なぜエージェントは昨日学んだことを今日忘れるんですか?
正直、エージェントを実際に運用してみると最初にぶつかる壁がこれです。プロンプトをしっかり書いて、ツールも繋いで、最初はうまく動いていても——数日後に同じミスが繰り返される。
理由はシンプルです。AIエージェントにはデフォルトでセッション間のメモリがありません。毎セッションがゼロからのスタートなんです。Harveyのケースがまさにそれで——エージェントが特定の法務文書形式の癖、特定のツール呼び出し方法をセッションごとに「再発見」しては失敗する、そのループでした。
従来の解決策は大きく二つでした。自分でメモリを書く(プロンプトエンジニアリング)か、モデルをファインチューニングするか。前者は規模が大きくなると管理できなくなり、後者はコストと時間がかかりすぎます。Dreamingはその中間を見つけたんです。エージェント自身にメモリを精製させるという。
Dreamingは従来のメモリと何が違うんですか?
一言で言えば:従来のメモリは開発者が書くもの、Dreamingはエージェントが自分で書き直すもの、です。
Dreamingはエージェントが休んでいる間(セッションとセッションの間)に起動するバックグラウンドプロセスです。過去のセッションとメモリストアを精査して、ちょうど3種類のパターンを抽出します。
- 繰り返されるミス
エージェントが同じエラーを繰り返している場合、そのミスのパターンを抽出します。Harveyの場合はファイル形式の特殊挙動とツール呼び出し失敗パターンがこれにあたりました。 - エージェントが収束するワークフロー
複数のセッションでエージェントが自然と採用するアプローチを捉えます。この「実証済みワークフロー」をプレイブックとして保存しておくと、次のエージェントは試行錯誤なしに同じ方法でスタートできます。 - チーム全体で共有される傾向
複数のエージェントがチームとして動く場合、一つのエージェントが発見したパターンがチーム全体に共有されます。単独のエージェントには見えなかったインサイトがここから生まれます。
AnthropicのAlex Albertはこう説明しています。
「Dreamingで起きていることは、あなたがClaudeとの作業経験からSkillを手動で作っていたことを、モデル自身がやるようなものです。」
— Alex Albert, Anthropic Research Product
コードも不要、モデルの重みも変わりません。出力はただのプレーンテキストのノートとプレイブック——テキストファイルなのでいつでも確認・編集できます。自動更新モードと、変更前に人間がレビューするモードを選択できます。
| 手動メモリ管理 | ファインチューニング | Dreaming | |
|---|---|---|---|
| 運用負担 | 毎回自分で書く | データ準備+学習 | 自動(レビューオプション) |
| 学習範囲 | 単一エージェント | モデル全体 | チーム全体で共有 |
| コスト | 人件費 | 非常に高い | Managed Agentsに含まれる |
| 監査可能性 | 高い | 低い | 高い(テキストファイル) |
| 反映速度 | 即時 | 数週間〜数ヶ月 | セッション間で自動 |
5月6日のCode with Claude 2026で同時に発表された2つの機能も合わせて押さえておきましょう。
同時発表: Outcomes + マルチエージェントオーケストレーション
Outcomes(パブリックベータ) — 開発者がルーブリックで成功基準を定義すると、独立したコンテキストウィンドウを持つ採点エージェントが結果を評価します。内部テストではタスク成功率最大+10ポイント、docxで+8.4%、pptxで+10.1%の改善が見られました。
マルチエージェントオーケストレーション(パブリックベータ) — リードエージェントが複雑なタスクを専門サブエージェントに分配して並列処理します。Netflixはこれを使って数百のビルドのログを同時に分析しています。
始め方:核心だけまとめると
- Claude Managed Agentsプラットフォームにアクセス
Managed Agentsは2026年4月9日に開始したClaudeのクラウドホスティングエージェントランタイムです。Claude開発者ダッシュボードからAPIキーでアクセスできます。現在チーム・エンタープライズプラン以上で利用可能です。 - まずMemoryを有効化
DreamingはMemory機能と連携して動作するため、先にMemoryを有効にする必要があります。Memoryはパブリックベータなので即時利用可能。エージェント単位・チーム単位でメモリの範囲を設定できます。 - Outcomesで成功基準を定義
Dreamingが「何がミスか」を判断するには成功基準が必要です。Outcomesで先にルーブリックを作成しましょう。「法務文書は.docx形式で保存する」「要約は500語以内」といった具体的な基準が効果的です。 - Dreamingのアクセスを申請
Dreamingはまだリサーチプレビュー段階です。Claude開発者ダッシュボードから別途アクセス申請が必要です。承認後、自動更新モードと「レビュー後適用」モードのどちらかを選択できます。 - メモリの変化を監視
Claude Consoleでエージェントが書いたプレイブックを定期的に確認しましょう。意図しないパターンが学習されていないか検証し、誤ったメモリは直接修正できます。テキストファイルなので編集も簡単です。
Dreamingはまだリサーチプレビューです
Outcomes、マルチエージェントオーケストレーション、Memory、Webhooksはパブリックベータで今すぐ使えますが、Dreamingだけは別途アクセス申請が必要です。また、セキュリティ面でも注意が必要です——構造化された永続メモリはプロンプトインジェクション攻撃の表面を拡大します。エージェントが外部コンテンツを処理する場合は、メモリ汚染のリスクを考慮してください。
もっと深く知りたい方へ
New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Dreaming、Outcomes、マルチエージェントオーケストレーションの仕組みとHarvey、Netflix、Wisedocs事例が確認できるAnthropicの公式ブログです。 claude.com
Scaling Managed Agents: Decoupling the brain from the job OSがハードウェアを仮想化するようにエージェントコンポーネントを仮想化したManaged Agentsの設計哲学を詳説するAnthropicエンジニアリングブログです。 anthropic.com
Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026 Harvey、Wisedocs、Spiral、Netflix事例とOutcomesの技術指標が詳しくまとめられた英語レビューです。 letsdatascience.com
Anthropic's Claude Agents Can Now "Dream" 技術的背景とメモリポイズニング攻撃リスクを含むセキュリティ分析が読める英語分析記事です。 quasa.io
앤트로픽 'Code with Claude 2026' 키노트 전체 정리 Dreaming以外の発表機能のコンテキストも合わせて把握できるAIマターズのキーノート要約です(韓国語)。 aimatters.co.kr




