Harvey의 AI 법률 에이전트는 같은 실수를 3주 동안 반복했어요. 특정 파일 형식의 quirk, 도구별 우회법 — 매 세션이 끝나면 전부 사라졌거든요. Dreaming 도입 이후 완료율이 6배 뛰었습니다.

3초 요약
세션 종료 Dreaming 발동 패턴 3종 추출 메모리 자동 정제 다음 세션 개선

왜 에이전트는 어제 배운 걸 오늘 모르는 건데?

솔직히 에이전트를 실제로 운영해보면 가장 먼저 부딪히는 벽이 이거예요. 프롬프트 잘 짜고, 도구도 연결하고, 처음엔 잘 돌아가는 것 같은데 — 며칠 지나면 비슷한 실수가 반복돼요.

이유는 단순해요. AI 에이전트에겐 기본적으로 세션 간 메모리가 없어요. 매 세션은 백지에서 시작하거든요. Harvey 사례가 딱 그래요 — 에이전트가 특정 법무 문서 형식에서 겪는 quirk, 특정 도구 호출 방법을 세션마다 새로 '발견'하고 또 실패하는 루프였던 거예요.

기존 해법은 크게 두 가지였어요. 직접 메모리를 써주거나(프롬프트 엔지니어링), 아니면 모델을 fine-tuning하거나. 첫 번째는 규모가 커지면 관리가 안 되고, 두 번째는 비용과 시간이 엄청났어요. Dreaming은 그 사이 어딘가를 찾은 거예요. 에이전트가 스스로 메모리를 정제하도록 한 거죠.

6x
Harvey 에이전트 완료율 증가
50%
Wisedocs 문서 리뷰 속도 향상
+10pt
Outcomes 기능 태스크 성공률

Dreaming이 기존 메모리랑 뭐가 다른 건데?

한 줄로 정리하면: 기존 메모리는 개발자가 쓰는 것, Dreaming은 에이전트가 알아서 고쳐쓰는 거예요.

Dreaming은 에이전트가 쉬는 시간(세션 사이)에 발동하는 백그라운드 프로세스예요. 과거 세션과 메모리 저장소를 훑으면서 딱 3종류의 패턴을 찾아요.

  1. 반복되는 실수
    에이전트가 같은 실수를 계속 하고 있다면, 왜 그 실수가 발생하는지 패턴을 추출해요. Harvey의 경우 파일 형식 quirk와 도구 호출 실패 패턴이 여기에 해당했어요.
  2. 에이전트가 수렴하는 워크플로우
    여러 세션에서 에이전트가 자연스럽게 수렴하는 작업 방식을 포착해요. 이 '검증된 워크플로우'를 플레이북으로 저장해두면, 다음 에이전트도 시행착오 없이 같은 방식으로 시작할 수 있어요.
  3. 팀 전체에서 공유되는 선호도
    에이전트 여러 개가 팀으로 운영될 때, 개별 에이전트 하나가 발견한 패턴이 팀 전체에 공유돼요. 단일 에이전트가 볼 수 없었던 인사이트가 여기서 나와요.

Anthropic의 Alex Albert는 이걸 이렇게 설명했어요.

"Dreaming은 당신이 Claude와 일하면서 수동으로 만들던 Skill을 모델이 직접 만드는 것과 같아요."

— Alex Albert, Anthropic Research Product

코드도 없고, 모델 가중치 변경도 없어요. 결과물은 그냥 평문 노트와 플레이북 — 텍스트 파일이라 언제든 확인하고 수정할 수 있어요. 개발자가 자동 업데이트 모드로 돌릴 수도 있고, 변경 전에 검토 후 적용하는 모드를 선택할 수도 있어요.

직접 메모리 관리Fine-tuningDreaming
운영자 개입매번 직접 작성데이터 준비 + 학습자동 (검토 옵션)
학습 범위단일 에이전트전체 모델 개선에이전트 팀 공유
비용인력 비용매우 높음Managed Agents 포함
감사 가능성높음낮음높음 (텍스트 파일)
반영 속도즉시수주~수개월세션 간 자동

5월 6일 Code with Claude 2026에서 함께 공개된 두 기능도 같이 알아두면 좋아요.

함께 공개된 기능: Outcomes + 멀티에이전트 오케스트레이션

Outcomes (퍼블릭 베타) — 개발자가 성공 기준을 루브릭으로 정의하면, 독립된 채점 에이전트가 결과물을 평가해요. 내부 테스트에서 태스크 성공률 최대 +10포인트, docx +8.4%, pptx +10.1% 개선이 나왔어요.

멀티에이전트 오케스트레이션 (퍼블릭 베타) — 리드 에이전트가 복잡한 작업을 전문 서브에이전트에게 나눠서 병렬 처리해요. Netflix는 이걸로 수백 개 빌드의 로그를 동시에 분석하고 있어요.

핵심만 정리: 시작하는 법

  1. Claude Managed Agents 플랫폼 접근
    Managed Agents는 2026년 4월 9일 런칭된 Claude의 클라우드 호스팅 에이전트 런타임이에요. claude.com 개발자 대시보드에서 API 키 기반으로 접근해요. 현재 기업/팀 플랜 이상에서 사용 가능합니다.
  2. Memory 먼저 활성화
    Dreaming은 Memory 기능과 함께 동작해요. Memory가 먼저 켜져 있어야 해요. 퍼블릭 베타이므로 즉시 사용 가능하고, 에이전트별·팀별 메모리 범위를 설정 화면에서 지정할 수 있어요.
  3. Outcomes로 성공 기준 정의
    Dreaming이 "뭐가 실수인지"를 파악하려면 성공 기준이 있어야 해요. Outcomes에서 루브릭을 먼저 작성하세요. "법무 문서는.docx로 저장한다", "요약은 500단어 이내" 같은 구체적인 기준이 효과적이에요.
  4. Dreaming 액세스 신청
    Dreaming은 아직 리서치 프리뷰 단계예요. claude.com 개발자 대시보드에서 액세스를 별도로 신청해야 해요. 승인 후 자동 업데이트 모드 또는 검토 후 적용 모드 중 선택하세요.
  5. 메모리 변화 모니터링
    Claude Console에서 에이전트가 작성한 플레이북을 정기적으로 확인하세요. 의도하지 않은 패턴이 학습됐는지 검토하고, 잘못된 메모리는 직접 수정할 수 있어요. 텍스트 파일이라 편집이 쉬워요.

Dreaming은 아직 리서치 프리뷰예요

Outcomes, 멀티에이전트 오케스트레이션, Memory, Webhooks는 퍼블릭 베타로 지금 바로 쓸 수 있지만, Dreaming만 리서치 프리뷰로 별도 액세스 신청이 필요해요. 그리고 보안 측면에서도 주의가 필요한데 — 구조적 영구 메모리는 프롬프트 인젝션 공격 표면이 될 수 있어요. 에이전트가 외부 콘텐츠를 처리하는 경우엔 메모리 오염 가능성을 고려해야 해요.