Anthropic의 2026년 1분기 연간환산 매출은 계획의 80배 성장했어요. SWE-bench Verified 점수는 1년 만에 62%에서 87%로 뛰었고, API 볼륨은 전년 대비 17배 늘었어요. 그리고 5월 런던 컨퍼런스 현장에서 공개된 데이터 중 가장 눈을 뜨이게 한 건 따로 있었어요 — 참석한 개발자의 절반 가까이가 Claude가 전부 작성한 PR을 코드 한 줄도 읽지 않고 그대로 올렸다고 답했어요.

Code w/ Claude 2026은 새 모델 발표 행사가 아니었어요. 이미 일어나고 있는 일의 규모와 방향을 공식화하는 자리였어요.

3초 요약
컨퍼런스 발표 Managed Agents 출시 자율 품질 관리(Outcomes) 비동기 자동화(Routines) 개발자 = 오케스트레이터

이게 무슨 행사였는데?

Code w/ Claude는 Anthropic의 연례 개발자 컨퍼런스예요. 2026년엔 처음으로 샌프란시스코(5월 6일), 런던(5월 19일), 도쿄(6월 10일) 세 도시로 확장됐어요. 새 모델 발표가 없었다는 게 오히려 눈에 띄었는데요, Anthropic이 메시지로 선택한 건 "모델은 이미 충분히 강하다 — 이제는 그걸 제대로 활용하는 구조를 만드는 게 남은 과제"였어요.

Anthropic 엔지니어 Ravi Trivedi가 컨퍼런스 현장에서 한 말이 이걸 잘 요약해요: "핵심 원칙은 Claude의 방해가 되지 않는 거예요. 우리는 '그냥 내버려 두세요'라고 말해요." 'Let it cook.' 코드 리뷰 없이 PR을 올리는 게 이미 많은 팀의 기본값이 됐다는 뜻이에요.

80×
계획 대비 Q1 매출 성장
87%
SWE-bench Verified (62%→, 1년 만)
17×
전년 대비 API 볼륨
Pro·Max 요청 한도 상향

인프라도 대폭 확충됐어요. SpaceX의 Colossus 슈퍼클러스터 전체 용량을 Claude에 할당하는 파트너십이 발표됐고, 구독 플랜 피크타임 제한이 해제됐어요. Dario Amodei CEO는 컨퍼런스에서 "2026년 안에 1인 10억 달러 회사가 나올 것"이라는 예측을 공개했어요.

그래서 실제로 뭐가 달라진 건데?

이번 컨퍼런스의 핵심은 Claude Code가 단일 AI 도우미에서 멀티에이전트 플랫폼으로 진화했다는 선언이에요. 세 가지 핵심 기능이 추가됐어요.

Outcomes — 품질을 AI가 직접 채점한다
원하는 결과를 기준(루브릭)으로 정의하면, 별도의 채점 에이전트가 작업 결과물을 평가하고 기준을 충족할 때까지 루프를 돌려요. 기존의 "출력하고 끝"이 아니라 "검증하고 재시도"로 바뀌는 거예요. Anthropic 내부 테스트에서 모델 변경 없이 Word 문서 품질이 8.4%, PowerPoint 품질이 10.1% 향상됐다고 해요.

Multi-agent Orchestration — 리드가 팀을 지휘한다
리드 에이전트가 복잡한 작업을 분해해서 전문화된 서브에이전트들에게 병렬로 위임해요. 서브에이전트들은 공유 파일 시스템에서 동시에 작업하고, 리드가 중간 진행 상황을 모니터링해요. Addy Osmani는 이 패턴을 "서브에이전트 → 에이전트 팀 → 오케스트레이션"의 3단계로 정리했어요.

Dreaming — 에이전트가 실수에서 스스로 배운다
세션과 세션 사이에 자동으로 이전 작업 로그를 검토하고, 반복된 실수나 패턴을 메모리로 정제해서 다음 세션에 미리 로드해요. Harvey 도입 사례에서 완료율을 6배 올린 기능이에요.

기존 Claude Code Claude Managed Agents
품질 검증 개발자가 직접 확인 Outcomes가 자동 채점·재시도
에이전트 수 1개 (순차 실행) 리드 + N개 전문 에이전트 (병렬)
자동화 트리거 수동 프롬프트 Routines: cron·GitHub 웹훅·API
에이전트 학습 세션마다 처음부터 Dreaming으로 세션 간 패턴 축적
서비스 형태 로컬 CLI 도구 서버 관리형 (샌드박스·체크포인트)

Claude Code 자체도 크게 확장됐어요. CLI에 더해 IDE(시각적 변경 추적), 데스크탑 앱(풀스크린 GUI·이미지 지원), 그리고 외부 개발자가 직접 빌드할 수 있는 Claude Agent SDK까지. 여기에 CI auto-fix(실패한 테스트에 자동 수정 PR 생성), Code Review, Security Review가 추가됐어요.

Routines가 핵심이에요

Routines는 Claude Code 작업을 크론 스케줄, GitHub 웹훅, API 엔드포인트로 자동 트리거하는 기능이에요. PR이 올라오면 자동으로 코드 리뷰가 돌고, 매일 새벽에 보안 스캔이 실행되고, 테스트가 실패하면 자동 수정 PR이 올라오는 워크플로가 가능해져요. 개발자가 직접 Claude를 여는 게 아니라, Claude가 알아서 일하는 구조예요.

핵심만 정리: 시작하는 법

  1. Claude Code 최신 버전 업데이트
    npm install -g @anthropic-ai/claude-code로 업데이트하세요. Managed Agents 전체 기능은 Enterprise 플랜 중심이지만, Routines와 기본 orchestration은 Pro/Max부터 일부 사용 가능해요.
  2. Outcomes 루브릭 정의하기
    반복하는 코드 리뷰나 문서 작업에 Outcomes부터 적용해보세요. "이 PR이 보안 취약점 없이, 테스트 커버리지 80% 이상이어야 합니다"처럼 구체적인 기준을 주면 Outcomes가 달성할 때까지 루프를 돌려요.
  3. AGENTS.md 파일 만들기
    에이전트가 프로젝트 컨벤션, 금지 패턴, 자주 쓰는 명령을 기억하도록 AGENTS.md를 작성해두세요. Dreaming이 이 파일을 기반으로 세션 간 학습을 축적해요.
  4. Routines로 자동화 트리거 설정
    GitHub 레포지터리에 웹훅을 연결하면 PR·커밋 이벤트에 Claude가 자동 반응하게 할 수 있어요. 처음엔 코드 리뷰나 보안 스캔 같은 읽기 중심 작업부터 시작하는 걸 추천해요.
  5. 멀티에이전트 패턴 단계별 도입
    Addy Osmani가 정리한 3단계 패턴으로 접근하세요 — 서브에이전트(기본, 바로 사용 가능), 에이전트 팀(실험적, 환경변수로 활성화), 오케스트레이션(대규모, Claude Managed Agents). 서브에이전트로 단순 작업 분리부터 시작하는 게 안전해요.