AI 코딩 어시스턴트 쓸 때 가장 아쉬운 순간이 있어요. 좋은 모델은 비싸고, 싼 모델은 어려운 문제에서 멈춰버리는 거예요. Anthropic이 그 딜레마를 정면으로 풀었어요.
Claude Code의 /advisor 명령어는 실행 모델(Sonnet)이 작업 중 막히면 자동으로 상위 모델(Opus)에게 조언을 구하는 기능이에요. 대부분의 토큰은 싼 모델이 처리하고, 어려운 판단만 비싼 모델이 개입해서 비용 대비 품질을 극대화하는 구조예요. SWE-bench에서 Sonnet 단독 72.1% → Sonnet+Opus Advisor 74.8%로 올라가면서, 작업당 비용은 오히려 11.9% 줄었어요.
이게 뭔데?
/advisor는 2026년 4월 9일 Anthropic이 Claude 플랫폼에 공식 출시한 모델 페어링 패턴이에요. 기존에는 비싼 모델(Opus)이 위에서 지시하고 싼 모델(Sonnet/Haiku)이 하청 받는 구조(서브에이전트 패턴)가 일반적이었는데, /advisor는 이걸 완전히 뒤집었어요.
작동 방식은 이래요. Sonnet 4.6이나 Haiku 4.5 같은 빠르고 저렴한 모델이 처음부터 끝까지 작업을 주도해요. 파일 읽기, 코드 작성, 테스트 실행 — 전부 실행 모델이 해요. 그러다 스스로 판단이 어려운 결정에 부딪히면, 자동으로 Opus 4.6에게 조언을 요청해요.
핵심 포인트: Opus는 전체 대화 맥락을 다 본 뒤 400~700 토큰 정도의 짧은 전략 조언만 돌려줘요. 코드를 직접 쓰거나 파일을 수정하거나 외부 도구를 호출하는 건 일절 못 해요. 순수하게 "생각만" 하는 역할이에요.
Claude Code에서는 /advisor를 입력하고 Opus 4.6을 선택하면 바로 활성화돼요. 별도 설정이나 파라미터 조정 없이 한 줄이면 끝이에요. API에서도 도구 배열에 advisor_20260301 타입 하나만 추가하면 되고요.
가장 인상적인 건 조언이 세션 컨텍스트에 누적된다는 점이에요. 나중에 Advisor가 다시 호출되면 이전 조언도 함께 참고해요. 실행 모델이 조언과 다른 결과를 얻으면 "Advisor가 X라고 했는데 테스트 결과는 Y입니다 — 다시 상담할까요?"라고 명시적으로 물어봐요.
뭐가 달라지는 건데?
기존 멀티모델 패턴과 /advisor가 어떻게 다른지 비교해볼게요.
| 기존 서브에이전트 패턴 | /advisor 패턴 | |
|---|---|---|
| 구조 | 비싼 모델이 위에서 지시, 싼 모델이 실행 | 싼 모델이 주도, 막힐 때만 비싼 모델 자문 |
| 비용 구조 | 오케스트레이터 모델에 대부분 비용 집중 | 실행 모델 요금 위주, Advisor는 소량 토큰만 |
| 컨텍스트 공유 | 개발자가 직접 컨텍스트 패싱 관리 | 서버 사이드에서 자동 전달 |
| 오케스트레이션 | LangGraph, AutoGen 등 프레임워크 필요 | API 설정 한 줄이면 끝 |
| Advisor 도구 접근 | Worker가 도구 사용 가능 | Advisor는 도구 접근 불가 (추론만) |
| 적합한 작업 | 모든 턴이 복잡한 경우 | 대부분 기계적이고 가끔 어려운 판단 필요한 경우 |
실제 벤치마크는 어떤데?
숫자로 확인해볼게요.
특히 Haiku의 도약이 주목할 만해요. BrowseComp에서 19.7% → 41.2%는 단순한 개선이 아니라 복잡한 웹 리서치에서의 근본적인 능력 격차를 Advisor가 메워주고 있다는 뜻이에요. 법률 문서 추출 서비스 Eve Legal은 실제로 Haiku + Opus Advisor 조합으로 프론티어 모델 수준의 품질을 달성하면서 비용은 Opus 단독 대비 5분의 1로 줄었다고 해요.
핵심만 정리: 시작하는 법
- Claude Code에서 바로 시작하기
터미널에서/advisor입력 → Opus 4.6 선택 → 끝이에요. Sonnet 4.6을 메인 모델로 쓰고 있다면 지금 바로 해보세요. - API로 연동하기
Messages API 요청에 베타 헤더anthropic-beta: advisor-tool-2026-03-01을 추가하고, tools 배열에{"type": "advisor_20260301", "name": "advisor", "model": "claude-opus-4-6"}를 넣으면 돼요. - 비용 관리 세팅
max_uses파라미터로 요청당 Advisor 호출 횟수를 제한하세요. 코딩 작업이라면 2~3회면 핵심 의사결정 포인트를 충분히 커버해요. - 추천 모델 페어링 선택
가성비 최고: Sonnet + Opus Advisor. 초절약: Haiku + Opus Advisor (대량 처리에 적합). Opus 메인이라면 서브에이전트 워크플로우와 병행하는 게 나아요. - 프롬프팅 팁 활용하기
"substantive work 전에 advisor에게 확인해"나 "완료 전에 advisor와 더블체크해" 같은 명시적 지시를 시스템 프롬프트에 넣으면 Advisor 호출 타이밍이 더 정확해져요.
실전 팁: Advisor 호출은 토큰 원장에 별도 라인으로 표시돼요. Advisor가 비용 대비 가치를 내는지 프로젝트별로 추적할 수 있어요. 또한 /compact로 대화를 압축해도 Advisor의 이전 조언은 유지되기 때문에, 긴 세션에서 누적 지식 레이어 역할을 해요.
한계도 알아두세요: Advisor 출력은 스트리밍되지 않아서, 서브 추론 중에 스트림이 잠깐 멈춰요. 또한 메인 모델이 과신하면 Advisor를 호출 안 하는 문제가 있어요 — 프롬프트로 보완하는 게 중요해요.
Advisor의 진짜 잠재력은 단독 기능이 아니라 미래 모델 전략의 인프라라는 점이에요. 만약 Opus보다 훨씬 비싼 차세대 모델(Mythos 등)이 나온다면, 그 모델을 메인으로 쓰는 건 너무 비싸겠죠. 하지만 Advisor로 설정하면 핵심 의사결정에만 차세대 모델의 지능을 활용하면서 비용은 관리 가능한 수준으로 유지할 수 있어요.
Anthropic 공식 문서에 따르면, 코딩 작업에서 Sonnet을 medium effort로 설정하고 Opus Advisor를 붙이면 default effort Sonnet 단독과 비슷한 지능을 더 낮은 비용으로 얻을 수 있어요. 최대 지능이 필요하면 default effort + Advisor 조합이 최강이고요.
서브에이전트 vs Advisor, 어떤 걸 써야 할까요? Sonnet이 메인이면 Advisor가 정답이에요. Opus가 메인이면 서브에이전트(독립 컨텍스트)가 더 나아요. 왜냐하면 Advisor는 전체 트랜스크립트를 공유하기 때문에, 메인 모델이 문제를 잘못 프레이밍하면 Advisor도 같은 함정에 빠질 수 있거든요. 반면 서브에이전트는 깨끗한 컨텍스트에서 시작하니까 신선한 시각을 줄 수 있어요.




