Code w/ Claude 2026 컨퍼런스 발표 현장 — Anthropic Managed Agents 공개

res.infoq.com

절반이 코드 안 읽고 PR 올렸다 — Code w/ Claude 2026 Managed Agents가 바꾼 개발 방식

Claude Code 2026, Managed Agents, Outcomes, AI 자율 코딩, 멀티에이전트 오케스트레이션AI 워크플로우

Code w/ Claude 2026 Liveblog

Anthropic's Code with Claude showed off coding's future—whether you like it or not

Inside Anthropic's 2026 Developer Conference

Anthropic의 2026년 1분기 연간환산 매출은 계획의 80배 성장했어요. SWE-bench Verified 점수는 1년 만에 62%에서 87%로 뛰었고, API 볼륨은 전년 대비 17배 늘었어요. 그리고 5월 런던 컨퍼런스 현장에서 공개된 데이터 중 가장 눈을 뜨이게 한 건 따로 있었어요 — 참석한 개발자의 절반 가까이가 Claude가 전부 작성한 PR을 코드 한 줄도 읽지 않고 그대로 올렸다고 답했어요.

Code w/ Claude 2026은 새 모델 발표 행사가 아니었어요. 이미 일어나고 있는 일의 규모와 방향을 공식화하는 자리였어요.

3초 요약

컨퍼런스 발표 → Managed Agents 출시 → 자율 품질 관리(Outcomes) → 비동기 자동화(Routines) → 개발자 = 오케스트레이터

이게 무슨 행사였는데?

Code w/ Claude는 Anthropic의 연례 개발자 컨퍼런스예요. 2026년엔 처음으로 샌프란시스코(5월 6일), 런던(5월 19일), 도쿄(6월 10일) 세 도시로 확장됐어요. 새 모델 발표가 없었다는 게 오히려 눈에 띄었는데요, Anthropic이 메시지로 선택한 건 "모델은 이미 충분히 강하다 — 이제는 그걸 제대로 활용하는 구조를 만드는 게 남은 과제"였어요.

Anthropic 엔지니어 Ravi Trivedi가 컨퍼런스 현장에서 한 말이 이걸 잘 요약해요: "핵심 원칙은 Claude의 방해가 되지 않는 거예요. 우리는 '그냥 내버려 두세요'라고 말해요." 'Let it cook.' 코드 리뷰 없이 PR을 올리는 게 이미 많은 팀의 기본값이 됐다는 뜻이에요.

80×

계획 대비 Q1 매출 성장

87%

SWE-bench Verified (62%→, 1년 만)

17×

전년 대비 API 볼륨

2×

Pro·Max 요청 한도 상향

인프라도 대폭 확충됐어요. SpaceX의 Colossus 슈퍼클러스터 전체 용량을 Claude에 할당하는 파트너십이 발표됐고, 구독 플랜 피크타임 제한이 해제됐어요. Dario Amodei CEO는 컨퍼런스에서 "2026년 안에 1인 10억 달러 회사가 나올 것"이라는 예측을 공개했어요.

그래서 실제로 뭐가 달라진 건데?

이번 컨퍼런스의 핵심은 Claude Code가 단일 AI 도우미에서 멀티에이전트 플랫폼으로 진화했다는 선언이에요. 세 가지 핵심 기능이 추가됐어요.

Outcomes — 품질을 AI가 직접 채점한다
원하는 결과를 기준(루브릭)으로 정의하면, 별도의 채점 에이전트가 작업 결과물을 평가하고 기준을 충족할 때까지 루프를 돌려요. 기존의 "출력하고 끝"이 아니라 "검증하고 재시도"로 바뀌는 거예요. Anthropic 내부 테스트에서 모델 변경 없이 Word 문서 품질이 8.4%, PowerPoint 품질이 10.1% 향상됐다고 해요.

Multi-agent Orchestration — 리드가 팀을 지휘한다
리드 에이전트가 복잡한 작업을 분해해서 전문화된 서브에이전트들에게 병렬로 위임해요. 서브에이전트들은 공유 파일 시스템에서 동시에 작업하고, 리드가 중간 진행 상황을 모니터링해요. Addy Osmani는 이 패턴을 "서브에이전트 → 에이전트 팀 → 오케스트레이션"의 3단계로 정리했어요.

Dreaming — 에이전트가 실수에서 스스로 배운다
세션과 세션 사이에 자동으로 이전 작업 로그를 검토하고, 반복된 실수나 패턴을 메모리로 정제해서 다음 세션에 미리 로드해요. Harvey 도입 사례에서 완료율을 6배 올린 기능이에요.

	기존 Claude Code	Claude Managed Agents
품질 검증	개발자가 직접 확인	Outcomes가 자동 채점·재시도
에이전트 수	1개 (순차 실행)	리드 + N개 전문 에이전트 (병렬)
자동화 트리거	수동 프롬프트	Routines: cron·GitHub 웹훅·API
에이전트 학습	세션마다 처음부터	Dreaming으로 세션 간 패턴 축적
서비스 형태	로컬 CLI 도구	서버 관리형 (샌드박스·체크포인트)

Claude Code 자체도 크게 확장됐어요. CLI에 더해 IDE(시각적 변경 추적), 데스크탑 앱(풀스크린 GUI·이미지 지원), 그리고 외부 개발자가 직접 빌드할 수 있는 Claude Agent SDK까지. 여기에 CI auto-fix(실패한 테스트에 자동 수정 PR 생성), Code Review, Security Review가 추가됐어요.

Routines가 핵심이에요

Routines는 Claude Code 작업을 크론 스케줄, GitHub 웹훅, API 엔드포인트로 자동 트리거하는 기능이에요. PR이 올라오면 자동으로 코드 리뷰가 돌고, 매일 새벽에 보안 스캔이 실행되고, 테스트가 실패하면 자동 수정 PR이 올라오는 워크플로가 가능해져요. 개발자가 직접 Claude를 여는 게 아니라, Claude가 알아서 일하는 구조예요.

핵심만 정리: 시작하는 법

Claude Code 최신 버전 업데이트
npm install -g @anthropic-ai/claude-code로 업데이트하세요. Managed Agents 전체 기능은 Enterprise 플랜 중심이지만, Routines와 기본 orchestration은 Pro/Max부터 일부 사용 가능해요.
Outcomes 루브릭 정의하기
반복하는 코드 리뷰나 문서 작업에 Outcomes부터 적용해보세요. "이 PR이 보안 취약점 없이, 테스트 커버리지 80% 이상이어야 합니다"처럼 구체적인 기준을 주면 Outcomes가 달성할 때까지 루프를 돌려요.
AGENTS.md 파일 만들기
에이전트가 프로젝트 컨벤션, 금지 패턴, 자주 쓰는 명령을 기억하도록 AGENTS.md를 작성해두세요. Dreaming이 이 파일을 기반으로 세션 간 학습을 축적해요.
Routines로 자동화 트리거 설정
GitHub 레포지터리에 웹훅을 연결하면 PR·커밋 이벤트에 Claude가 자동 반응하게 할 수 있어요. 처음엔 코드 리뷰나 보안 스캔 같은 읽기 중심 작업부터 시작하는 걸 추천해요.
멀티에이전트 패턴 단계별 도입
Addy Osmani가 정리한 3단계 패턴으로 접근하세요 — 서브에이전트(기본, 바로 사용 가능), 에이전트 팀(실험적, 환경변수로 활성화), 오케스트레이션(대규모, Claude Managed Agents). 서브에이전트로 단순 작업 분리부터 시작하는 게 안전해요.

🔗

더 깊이 파고 싶다면

Simon Willison — Code w/ Claude 2026 Liveblog

컨퍼런스 전체 발표를 실시간으로 정리한 1차 소스예요.

Every.to — Inside Anthropic's 2026 Developer Conference

Managed Agents의 등장이 AI 플랫폼의 정의를 어떻게 바꾸는지 날카롭게 분석한 글이에요. Spiral이 하루 만에 도입한 사례도 담겨 있어요.

MIT Technology Review — Anthropic's Code with Claude showed off coding's future

컨퍼런스를 비판적 시각으로 분석한 기사예요. 코드 리뷰 없이 PR을 올리는 현실의 기회와 위험을 함께 다뤘어요.

Addy Osmani — The Code Agent Orchestra

멀티에이전트 코딩의 3단계 패턴(서브에이전트 → 에이전트 팀 → 오케스트레이션)을 단계별로 정리한 실전 가이드예요.

InfoQ — Anthropic's Code with Claude Announces Managed Agents

기술적 세부사항과 비즈니스 지표를 함께 다룬 심층 분석이에요.

Claude Code Agent Teams 공식 문서

멀티에이전트 설정과 실험적 기능 활성화 가이드예요.

자주 묻는 질문

Claude Code Agent Teams랑 Managed Agents가 다른 건가요?

다른 레이어예요. Claude Code Agent Teams는 로컬에서 여러 Claude Code 세션을 실험적으로 돌리는 기능이고, Managed Agents는 Anthropic 서버에서 관리되는 에이전트 실행 환경이에요. Managed Agents는 샌드박스·체크포인트·자격증명 범위 설정 같은 프로덕션 인프라가 내장돼 있어서 팀·기업 환경에 적합해요.

Outcomes는 어떤 작업에 가장 효과적인가요?

기준을 명확하게 정의할 수 있는 작업에서 효과가 커요. 코드 리뷰(보안 취약점 없음, 테스트 커버리지 80% 이상)나 문서 작업(특정 포맷 준수, 필수 섹션 포함)처럼 합격/불합격 기준이 명확한 경우가 가장 좋아요. 반대로 창의적 작업이나 주관적 판단이 많이 필요한 작업은 루브릭 정의가 어렵기 때문에 효과가 떨어질 수 있어요.

Routines가 GitHub Actions 같은 기존 CI와 다른 점이 뭔가요?

GitHub Actions는 정해진 스크립트를 실행하지만, Routines는 Claude가 상황을 이해하고 판단하며 실행해요. PR이 올라오면 단순히 린터를 돌리는 게 아니라, 코드 변경의 맥락을 파악해서 관련 보안 취약점이 없는지, 기존 아키텍처와 충돌하지 않는지를 자연어로 분석해줘요. 기존 CI를 대체하는 게 아니라 이해하는 리뷰어를 추가하는 거예요.

소규모 팀이나 1인 개발자도 바로 쓸 수 있나요?

Routines와 기본 Outcomes는 Pro/Max 플랜부터 일부 사용 가능해요. 서버 관리형 Managed Agents 전체 기능은 Enterprise 중심으로 출시됐어요. 1인 개발자는 Claude Code의 Agent Teams(실험적, 환경변수 활성화) + AGENTS.md 조합으로 비슷한 효과를 낼 수 있어요.

코드를 안 읽고 PR을 올리는 게 지금 당장 안전한가요?

솔직히 아직은 위험해요. MIT Tech Review도 이 현상을 비판적으로 다뤘는데요, 보안 취약점이 통과되거나 비효율적인 패턴이 쌓일 수 있어요. Anthropic이 Outcomes와 Security Review를 함께 출시한 이유이기도 해요. 적어도 Outcomes 루브릭과 Security 스캔을 CI에 연결한 다음에 'Let it cook' 하는 걸 추천해요.