AI 에이전트를 만들어 본 적 있으신가요? 데모까지는 뚝딱인데, 프로덕션에 올리는 순간 지옥이 시작되죠. 컨테이너 샌드박싱, 크레덴셜 관리, 장애 복구, 상태 관리... 정작 에이전트 로직은 전체 작업의 20%밖에 안 되는데, 나머지 80%가 인프라 삽질이에요. Anthropic이 2026년 4월 8일, 이 문제를 정면으로 해결하겠다며 Claude Managed Agents를 퍼블릭 베타로 출시했어요.

3줄 요약

뭘 해결하나: AI 에이전트 프로덕션 배포에 필요한 인프라(샌드박스, 상태 관리, 장애 복구)를 Anthropic이 통째로 관리해줘요.

핵심 아키텍처: "뇌(Brain)"와 "손(Hands)"을 분리해서, 모델·하네스·컨테이너가 독립적으로 스케일링되고 장애에서 복구돼요.

비즈니스 임팩트: 에이전트 배포가 수개월에서 며칠로 단축. Notion, Sentry, Rakuten 등이 이미 도입 중이에요.

이게 뭔데?

Claude Managed Agents는 "호스티드 에이전트 런타임"이에요. 쉽게 말하면, 여러분이 에이전트의 "뭘 할지"만 정의하면 — 태스크, 도구, 가드레일, 시스템 프롬프트 — 나머지 전부를 Anthropic이 돌려준다는 뜻이에요.

기존에 프로덕션 에이전트를 배포하려면 이런 작업이 필요했어요:

  1. 격리 컨테이너 설정
    에이전트가 코드를 실행할 때 프로덕션 시스템을 건드리지 않도록 샌드박스를 구축해야 했어요.
  2. 크레덴셜 관리 + 권한 스코핑
    API 키, OAuth 토큰 등을 안전하게 주입하고 범위를 제한하는 시스템이 필요했어요.
  3. 체크포인팅 + 장애 복구
    에이전트가 중간에 죽어도 마지막 상태에서 이어서 실행할 수 있는 메커니즘을 만들어야 했어요.
  4. 에이전트 루프 + 장기 세션 관리
    컨텍스트가 모델의 윈도우를 넘어가도 일관성을 유지하는 오케스트레이션 레이어가 필요했어요.
  5. 옵저버빌리티 + 모니터링
    에이전트가 뭘 하고 있는지, 어디서 에러가 났는지 볼 수 있는 대시보드를 구축해야 했어요.

이 중 어느 것도 에이전트 "자체"가 아니에요. 전부 스캐폴딩이죠. Managed Agents는 이 스캐폴딩을 통째로 가져가요.

가격 참고: Claude 모델 사용료 + 에이전트 런타임 시간당 $0.08이 과금돼요. 기존에 인프라 엔지니어 인건비를 생각하면 상당히 공격적인 가격이에요.

뭐가 달라지는 건데?

핵심 아키텍처 혁신은 "뇌(Brain)"와 "손(Hands)"의 분리예요. 기존에는 모든 게 하나의 컨테이너 안에 살았어요 — 모델 추론, 도구 실행, 상태 관리가 다 같은 곳. 하나가 죽으면 전부 죽었죠. Managed Agents는 이걸 완전히 뜯어냈어요.

기존 DIY 에이전트Claude Managed Agents
아키텍처모놀리식 (모델+도구+상태 한 컨테이너)뇌/손 분리 (독립 스케일링)
컨테이너 장애전체 재시작 필요새 컨테이너 자동 스핀업
하네스 업데이트모델 변경 시 수동 리팩토링Anthropic이 자동 최적화
보안 모델토큰 스코핑에 의존생성 코드가 크레덴셜에 접근 불가
배포 기간수주~수개월수일
TTFT (P50)기준선~60% 감소

보안 모델이 특히 인상적이에요. 기존 방식은 "토큰의 권한을 최소한으로 줄이자"였다면, Managed Agents는 에이전트가 생성한 코드가 아예 크레덴셜에 접근할 수 없는 구조예요. Git 토큰은 컨테이너 초기화 시 로컬 리모트에 주입되고, MCP/OAuth 토큰은 별도 볼트에 살면서 프록시가 대신 호출해요. 공격 표면 자체를 제거한 거죠.

Anthropic 내부 테스트에서 TTFT(Time to First Token)가 P50 기준 약 60%, P95 기준 90% 이상 감소했다고 해요. 그리고 "아웃컴" 기능으로 성공 기준을 정의하면 표준 프롬프팅 대비 태스크 성공률이 최대 10포인트 향상됐어요.

이미 Notion은 클라이언트 온보딩 자동화에, SentryRakuten도 프로덕션에 도입했어요. Notion의 PM Eric Liu는 WIRED 데모에서 작업 목록을 Managed Agent에 넘기고, Claude Platform 대시보드에서 에이전트가 어떤 도구를 쓰고 있는지 실시간으로 모니터링하는 모습을 보여줬어요.

핵심만 정리: 시작하는 법

  1. API 키 준비
    Claude Platform API 키가 있으면 바로 시작 가능해요. 별도 신청 없이 퍼블릭 베타에 접근할 수 있어요. 요청 헤더에 anthropic-beta: managed-agents-2026-04-01만 추가하면 돼요.
  2. 에이전트 정의
    POST /v1/agents로 에이전트를 생성해요. 모델, 시스템 프롬프트, 사용할 도구(bash, file_editor, web_search 등)를 JSON으로 지정해요.
  3. 환경 설정
    에이전트가 사용할 컨테이너 환경을 정의해요. 필요한 패키지, 네트워크 접근 범위, MCP 서버 연결 등을 설정해요.
  4. 세션 시작 + 이벤트 전송
    세션을 만들고, 에이전트에 메시지를 보내면 끝이에요. 나머지는 Anthropic의 오케스트레이션 레이어가 처리해요.
  5. 모니터링
    Claude Platform 대시보드에서 에이전트의 도구 사용, 의사결정 과정, 에러 로그를 실시간으로 확인할 수 있어요.
주의할 점: 멀티 에이전트 오케스트레이션과 아웃컴(성공 기준 자동 최적화)은 아직 리서치 프리뷰 상태예요. 프로덕션 의존도를 높이기 전에 이 기능들의 GA 전환 시점을 확인하세요.

에이전트 프레임워크 비교

LangGraph, CrewAI 같은 기존 프레임워크와 Managed Agents의 차이가 궁금하다면. 핵심 질문은 "멀티모델 오케스트레이션이 필요한가"예요. Claude 전용이라면 Managed Agents가 미들웨어를 상당 부분 대체해요.

Anthropic의 플랫폼 전략

Anthropic의 ARR이 2025년 말 $9B에서 2026년 3월 $30B으로 3배 뛴 건 대부분 Claude Platform 덕이에요. Managed Agents는 "의존성 해자(dependency moat)" 전략의 다음 수순이에요.

Claude Mythos와의 시너지

출시 하루 전 공개된 Claude Mythos 모델은 사이버보안 취약점 수천 건을 자동 발견했어요. Managed Agents + Mythos 조합은 보안 감사 자동화의 새 기준이 될 수 있어요.