Harvey의 AI 법률 에이전트는 같은 실수를 3주 동안 반복했어요. 특정 파일 형식의 quirk, 도구별 우회법 — 매 세션이 끝나면 전부 사라졌거든요. Dreaming 도입 이후 완료율이 6배 뛰었습니다.
왜 에이전트는 어제 배운 걸 오늘 모르는 건데?
솔직히 에이전트를 실제로 운영해보면 가장 먼저 부딪히는 벽이 이거예요. 프롬프트 잘 짜고, 도구도 연결하고, 처음엔 잘 돌아가는 것 같은데 — 며칠 지나면 비슷한 실수가 반복돼요.
이유는 단순해요. AI 에이전트에겐 기본적으로 세션 간 메모리가 없어요. 매 세션은 백지에서 시작하거든요. Harvey 사례가 딱 그래요 — 에이전트가 특정 법무 문서 형식에서 겪는 quirk, 특정 도구 호출 방법을 세션마다 새로 '발견'하고 또 실패하는 루프였던 거예요.
기존 해법은 크게 두 가지였어요. 직접 메모리를 써주거나(프롬프트 엔지니어링), 아니면 모델을 fine-tuning하거나. 첫 번째는 규모가 커지면 관리가 안 되고, 두 번째는 비용과 시간이 엄청났어요. Dreaming은 그 사이 어딘가를 찾은 거예요. 에이전트가 스스로 메모리를 정제하도록 한 거죠.
Dreaming이 기존 메모리랑 뭐가 다른 건데?
한 줄로 정리하면: 기존 메모리는 개발자가 쓰는 것, Dreaming은 에이전트가 알아서 고쳐쓰는 거예요.
Dreaming은 에이전트가 쉬는 시간(세션 사이)에 발동하는 백그라운드 프로세스예요. 과거 세션과 메모리 저장소를 훑으면서 딱 3종류의 패턴을 찾아요.
- 반복되는 실수
에이전트가 같은 실수를 계속 하고 있다면, 왜 그 실수가 발생하는지 패턴을 추출해요. Harvey의 경우 파일 형식 quirk와 도구 호출 실패 패턴이 여기에 해당했어요. - 에이전트가 수렴하는 워크플로우
여러 세션에서 에이전트가 자연스럽게 수렴하는 작업 방식을 포착해요. 이 '검증된 워크플로우'를 플레이북으로 저장해두면, 다음 에이전트도 시행착오 없이 같은 방식으로 시작할 수 있어요. - 팀 전체에서 공유되는 선호도
에이전트 여러 개가 팀으로 운영될 때, 개별 에이전트 하나가 발견한 패턴이 팀 전체에 공유돼요. 단일 에이전트가 볼 수 없었던 인사이트가 여기서 나와요.
Anthropic의 Alex Albert는 이걸 이렇게 설명했어요.
"Dreaming은 당신이 Claude와 일하면서 수동으로 만들던 Skill을 모델이 직접 만드는 것과 같아요."
— Alex Albert, Anthropic Research Product
코드도 없고, 모델 가중치 변경도 없어요. 결과물은 그냥 평문 노트와 플레이북 — 텍스트 파일이라 언제든 확인하고 수정할 수 있어요. 개발자가 자동 업데이트 모드로 돌릴 수도 있고, 변경 전에 검토 후 적용하는 모드를 선택할 수도 있어요.
| 직접 메모리 관리 | Fine-tuning | Dreaming | |
|---|---|---|---|
| 운영자 개입 | 매번 직접 작성 | 데이터 준비 + 학습 | 자동 (검토 옵션) |
| 학습 범위 | 단일 에이전트 | 전체 모델 개선 | 에이전트 팀 공유 |
| 비용 | 인력 비용 | 매우 높음 | Managed Agents 포함 |
| 감사 가능성 | 높음 | 낮음 | 높음 (텍스트 파일) |
| 반영 속도 | 즉시 | 수주~수개월 | 세션 간 자동 |
5월 6일 Code with Claude 2026에서 함께 공개된 두 기능도 같이 알아두면 좋아요.
함께 공개된 기능: Outcomes + 멀티에이전트 오케스트레이션
Outcomes (퍼블릭 베타) — 개발자가 성공 기준을 루브릭으로 정의하면, 독립된 채점 에이전트가 결과물을 평가해요. 내부 테스트에서 태스크 성공률 최대 +10포인트, docx +8.4%, pptx +10.1% 개선이 나왔어요.
멀티에이전트 오케스트레이션 (퍼블릭 베타) — 리드 에이전트가 복잡한 작업을 전문 서브에이전트에게 나눠서 병렬 처리해요. Netflix는 이걸로 수백 개 빌드의 로그를 동시에 분석하고 있어요.
핵심만 정리: 시작하는 법
- Claude Managed Agents 플랫폼 접근
Managed Agents는 2026년 4월 9일 런칭된 Claude의 클라우드 호스팅 에이전트 런타임이에요. claude.com 개발자 대시보드에서 API 키 기반으로 접근해요. 현재 기업/팀 플랜 이상에서 사용 가능합니다. - Memory 먼저 활성화
Dreaming은 Memory 기능과 함께 동작해요. Memory가 먼저 켜져 있어야 해요. 퍼블릭 베타이므로 즉시 사용 가능하고, 에이전트별·팀별 메모리 범위를 설정 화면에서 지정할 수 있어요. - Outcomes로 성공 기준 정의
Dreaming이 "뭐가 실수인지"를 파악하려면 성공 기준이 있어야 해요. Outcomes에서 루브릭을 먼저 작성하세요. "법무 문서는.docx로 저장한다", "요약은 500단어 이내" 같은 구체적인 기준이 효과적이에요. - Dreaming 액세스 신청
Dreaming은 아직 리서치 프리뷰 단계예요. claude.com 개발자 대시보드에서 액세스를 별도로 신청해야 해요. 승인 후 자동 업데이트 모드 또는 검토 후 적용 모드 중 선택하세요. - 메모리 변화 모니터링
Claude Console에서 에이전트가 작성한 플레이북을 정기적으로 확인하세요. 의도하지 않은 패턴이 학습됐는지 검토하고, 잘못된 메모리는 직접 수정할 수 있어요. 텍스트 파일이라 편집이 쉬워요.
Dreaming은 아직 리서치 프리뷰예요
Outcomes, 멀티에이전트 오케스트레이션, Memory, Webhooks는 퍼블릭 베타로 지금 바로 쓸 수 있지만, Dreaming만 리서치 프리뷰로 별도 액세스 신청이 필요해요. 그리고 보안 측면에서도 주의가 필요한데 — 구조적 영구 메모리는 프롬프트 인젝션 공격 표면이 될 수 있어요. 에이전트가 외부 콘텐츠를 처리하는 경우엔 메모리 오염 가능성을 고려해야 해요.





