Claude Managed Agents Dreaming, Outcomes, Multiagent Orchestration 업데이트 발표

cdn.prod.website-files.com

에이전트가 자면서 배운다 — Anthropic Dreaming이 Harvey 완료율을 6배 올린 방법

AI 에이전트 자기학습, Claude Dreaming, Managed Agents, Harvey 6배, 세션 간 메모리 정제AI 워크플로우

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration

Anthropic introduces "dreaming," a system that lets AI agents learn from their own mistakes

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026

Harvey의 AI 법률 에이전트는 같은 실수를 3주 동안 반복했어요. 특정 파일 형식의 quirk, 도구별 우회법 — 매 세션이 끝나면 전부 사라졌거든요. Dreaming 도입 이후 완료율이 6배 뛰었습니다.

3초 요약

세션 종료 → Dreaming 발동 → 패턴 3종 추출 → 메모리 자동 정제 → 다음 세션 개선

왜 에이전트는 어제 배운 걸 오늘 모르는 건데?

솔직히 에이전트를 실제로 운영해보면 가장 먼저 부딪히는 벽이 이거예요. 프롬프트 잘 짜고, 도구도 연결하고, 처음엔 잘 돌아가는 것 같은데 — 며칠 지나면 비슷한 실수가 반복돼요.

이유는 단순해요. AI 에이전트에겐 기본적으로 세션 간 메모리가 없어요. 매 세션은 백지에서 시작하거든요. Harvey 사례가 딱 그래요 — 에이전트가 특정 법무 문서 형식에서 겪는 quirk, 특정 도구 호출 방법을 세션마다 새로 '발견'하고 또 실패하는 루프였던 거예요.

기존 해법은 크게 두 가지였어요. 직접 메모리를 써주거나(프롬프트 엔지니어링), 아니면 모델을 fine-tuning하거나. 첫 번째는 규모가 커지면 관리가 안 되고, 두 번째는 비용과 시간이 엄청났어요. Dreaming은 그 사이 어딘가를 찾은 거예요. 에이전트가 스스로 메모리를 정제하도록 한 거죠.

Harvey 에이전트 완료율 증가

50%

Wisedocs 문서 리뷰 속도 향상

+10pt

Outcomes 기능 태스크 성공률

Dreaming이 기존 메모리랑 뭐가 다른 건데?

한 줄로 정리하면: 기존 메모리는 개발자가 쓰는 것, Dreaming은 에이전트가 알아서 고쳐쓰는 거예요.

Dreaming은 에이전트가 쉬는 시간(세션 사이)에 발동하는 백그라운드 프로세스예요. 과거 세션과 메모리 저장소를 훑으면서 딱 3종류의 패턴을 찾아요.

반복되는 실수
에이전트가 같은 실수를 계속 하고 있다면, 왜 그 실수가 발생하는지 패턴을 추출해요. Harvey의 경우 파일 형식 quirk와 도구 호출 실패 패턴이 여기에 해당했어요.
에이전트가 수렴하는 워크플로우
여러 세션에서 에이전트가 자연스럽게 수렴하는 작업 방식을 포착해요. 이 '검증된 워크플로우'를 플레이북으로 저장해두면, 다음 에이전트도 시행착오 없이 같은 방식으로 시작할 수 있어요.
팀 전체에서 공유되는 선호도
에이전트 여러 개가 팀으로 운영될 때, 개별 에이전트 하나가 발견한 패턴이 팀 전체에 공유돼요. 단일 에이전트가 볼 수 없었던 인사이트가 여기서 나와요.

Anthropic의 Alex Albert는 이걸 이렇게 설명했어요.

"Dreaming은 당신이 Claude와 일하면서 수동으로 만들던 Skill을 모델이 직접 만드는 것과 같아요."
— Alex Albert, Anthropic Research Product

코드도 없고, 모델 가중치 변경도 없어요. 결과물은 그냥 평문 노트와 플레이북 — 텍스트 파일이라 언제든 확인하고 수정할 수 있어요. 개발자가 자동 업데이트 모드로 돌릴 수도 있고, 변경 전에 검토 후 적용하는 모드를 선택할 수도 있어요.

	직접 메모리 관리	Fine-tuning	Dreaming
운영자 개입	매번 직접 작성	데이터 준비 + 학습	자동 (검토 옵션)
학습 범위	단일 에이전트	전체 모델 개선	에이전트 팀 공유
비용	인력 비용	매우 높음	Managed Agents 포함
감사 가능성	높음	낮음	높음 (텍스트 파일)
반영 속도	즉시	수주~수개월	세션 간 자동

5월 6일 Code with Claude 2026에서 함께 공개된 두 기능도 같이 알아두면 좋아요.

함께 공개된 기능: Outcomes + 멀티에이전트 오케스트레이션

Outcomes (퍼블릭 베타) — 개발자가 성공 기준을 루브릭으로 정의하면, 독립된 채점 에이전트가 결과물을 평가해요. 내부 테스트에서 태스크 성공률 최대 +10포인트, docx +8.4%, pptx +10.1% 개선이 나왔어요.

멀티에이전트 오케스트레이션 (퍼블릭 베타) — 리드 에이전트가 복잡한 작업을 전문 서브에이전트에게 나눠서 병렬 처리해요. Netflix는 이걸로 수백 개 빌드의 로그를 동시에 분석하고 있어요.

핵심만 정리: 시작하는 법

Claude Managed Agents 플랫폼 접근
Managed Agents는 2026년 4월 9일 런칭된 Claude의 클라우드 호스팅 에이전트 런타임이에요. claude.com 개발자 대시보드에서 API 키 기반으로 접근해요. 현재 기업/팀 플랜 이상에서 사용 가능합니다.
Memory 먼저 활성화
Dreaming은 Memory 기능과 함께 동작해요. Memory가 먼저 켜져 있어야 해요. 퍼블릭 베타이므로 즉시 사용 가능하고, 에이전트별·팀별 메모리 범위를 설정 화면에서 지정할 수 있어요.
Outcomes로 성공 기준 정의
Dreaming이 "뭐가 실수인지"를 파악하려면 성공 기준이 있어야 해요. Outcomes에서 루브릭을 먼저 작성하세요. "법무 문서는.docx로 저장한다", "요약은 500단어 이내" 같은 구체적인 기준이 효과적이에요.
Dreaming 액세스 신청
Dreaming은 아직 리서치 프리뷰 단계예요. claude.com 개발자 대시보드에서 액세스를 별도로 신청해야 해요. 승인 후 자동 업데이트 모드 또는 검토 후 적용 모드 중 선택하세요.
메모리 변화 모니터링
Claude Console에서 에이전트가 작성한 플레이북을 정기적으로 확인하세요. 의도하지 않은 패턴이 학습됐는지 검토하고, 잘못된 메모리는 직접 수정할 수 있어요. 텍스트 파일이라 편집이 쉬워요.

Dreaming은 아직 리서치 프리뷰예요

Outcomes, 멀티에이전트 오케스트레이션, Memory, Webhooks는 퍼블릭 베타로 지금 바로 쓸 수 있지만, Dreaming만 리서치 프리뷰로 별도 액세스 신청이 필요해요. 그리고 보안 측면에서도 주의가 필요한데 — 구조적 영구 메모리는 프롬프트 인젝션 공격 표면이 될 수 있어요. 에이전트가 외부 콘텐츠를 처리하는 경우엔 메모리 오염 가능성을 고려해야 해요.

🔗

더 깊이 파고 싶다면

Scaling Managed Agents: Decoupling the brain from the job

OS가 하드웨어를 가상화하듯 에이전트 컴포넌트를 가상화한 Managed Agents의 설계 철학을 다루는 Anthropic 엔지니어링 블로그예요.

Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026

Harvey, Wisedocs, Spiral, Netflix 사례와 Outcomes 기술 지표가 상세히 정리된 영문 리뷰예요.

'자고 깨면 더 똑똑해져'... 앤트로픽, AI 자기 개선 기능 '드리밍' 공개

경쟁 환경(OpenAI, Google, MS)과 함께 Anthropic의 포지셔닝을 분석한 AI타임스 기사예요.

앤트로픽 'Code with Claude 2026' 키노트 전체 정리

Dreaming 외 다른 발표 기능들의 맥락을 함께 파악할 수 있는 AI매터스 키노트 요약이에요.

Anthropic's Claude Agents Can Now "Dream"

기술적 배경과 보안 우려(메모리 포이즈닝 공격 가능성)를 포함한 영문 분석 글이에요.

자주 묻는 질문

Claude Code Auto Memory와 Dreaming은 어떻게 다른가요?

Auto Memory는 Claude Code를 쓰는 개발자 개인의 세션 메모리를 자동 기록하는 기능이고, Dreaming은 Claude Managed Agents 플랫폼에서 에이전트 팀의 과거 세션을 분석해 메모리를 정제하는 기능이에요. Auto Memory는 개인 도구이고, Dreaming은 엔터프라이즈 에이전트 운영 인프라에 가깝죠.

Claude Pro나 Max 구독자도 Dreaming을 사용할 수 있나요?

Dreaming은 Claude Managed Agents 플랫폼 전용 기능이에요. Claude.com의 일반 채팅이나 Claude Code에서는 사용할 수 없고, API를 통한 Managed Agents 플랫폼을 구성해야 해요. 현재 리서치 프리뷰로 별도 액세스 신청이 필요합니다.

Dreaming이 잘못된 패턴을 학습하면 어떻게 하나요?

Dreaming이 만든 메모리는 평문 텍스트 파일이에요. Claude Console에서 직접 확인하고 수정하거나 삭제할 수 있어요. 자동 업데이트 모드 대신 '검토 후 적용' 모드로 설정하면 메모리 변경 전에 개발자가 먼저 검토할 수 있어요.

Harvey의 6배 개선이 모든 업무에 해당하나요?

Harvey의 결과는 장문의 법률 문서 작성처럼 반복적 파일 처리가 많은 작업에서 나온 수치예요. Anthropic 공식 블로그에서도 독립적인 벤치마크 없이 고객 사례만 공개된 상태라 일반화에 주의가 필요해요. 반복 실수가 많은 작업일수록 개선 폭이 크고, 단순한 일회성 작업은 효과가 제한적일 수 있어요.

Written by 러쉬

비즈니스와 AI가 만나는 접점을 추적합니다.

이 레퍼런스가 도움이 되셨나요?

매주 엄선된 레퍼런스를 메일로 받아보세요

이 레퍼런스 공유하기

다음 읽을 레퍼런스

AI가 밤새 자기 자신을 고쳤다 — $650M이 걸린 '재귀적 자기개선 루프'의 시작

AI가 스스로 연구하고, 구현하고, 검증하는 재귀적 자기개선 루프를 하나의 회사로 만든 Recursive Superintelligence가 $650M과 함께 등장했다. Richard Socher, Tim Rocktäschel 등 AI 연구 핵심 인물들이 모인 이유와 기술 접근법을 정리했다.