Claude Code /advisor 기능 개념도 — Sonnet과 Opus의 모델 페어링

mejba.me

Claude Code /advisor:便宜模型向昂贵模型临时"借脑"的新机制

Claude Code /advisor、Sonnet+Opus配对、AI编程成本优化开发

클로드 프로 플랜분들은 사용하셔야하는 기능 — AI Coffee Chat

Anthropic Advisor Strategy: Smarter AI Agents at Lower Cost (2026)

Claude's Advisor Tool: The Sub-Agent Pattern, Inverted

用 AI 编码助手时最让人纠结的一幕是什么?好模型太贵,便宜模型又会在难题面前卡住。Anthropic 这回正面解决了这个两难。

3秒速览

Claude Code 的 /advisor 命令,其实是执行模型(Sonnet)在作业途中卡住时,自动向上位模型(Opus)请教的机制。大部分 token 都交给便宜模型处理,只有难判断的环节才让贵模型介入,以此把性价比拉到极致。SWE-bench 上 Sonnet 单独跑 72.1%,加上 Opus Advisor 提升到 74.8%,而每次任务的成本反而下降了 11.9%。

这是什么?

/advisor 是 Anthropic 于 2026 年 4 月 9 日在 Claude 平台正式推出的模型配对模式(Model Pairing)。过去常见的做法是贵模型(Opus)在上面指挥,便宜模型(Sonnet/Haiku)承接下游任务(子智能体/Sub-agent 模式),而 /advisor 把这套完全反了过来。

它的工作方式是这样的:像 Sonnet 4.6 或 Haiku 4.5 这种又快又便宜的模型从头到尾主导整个任务。读文件、写代码、跑测试 —— 全部由执行模型自己完成。一旦遇到自己拿不准的决定,它就会自动向 Opus 4.6 请教。

关键在于:Opus 会先看完整段对话上下文,然后只回一段 400~700 token 左右的简短战略建议。它完全不能直接写代码、改文件或调用外部工具,纯粹扮演"思考者"的角色。

在 Claude Code 里,输入 /advisor 并选中 Opus 4.6 就能立即启用。不需要额外设置或调参,一行就搞定。通过 API 调用时,也只要在 tools 数组里加上一个 advisor_20260301 类型即可。

最亮眼的一点是,建议会累积进整个会话的上下文。之后再次触发 Advisor 时,它会连同之前的建议一起参考。如果执行模型得到的结果和建议不符,它会明确问出来:"Advisor 说是 X,但测试结果是 Y —— 要不要再咨询一次?"

有什么不同?

来对比一下传统多模型模式和 /advisor 模式的差异。

	传统子智能体模式	/advisor 模式
结构	贵模型在上面指挥,便宜模型负责执行	便宜模型主导,卡住时才向贵模型咨询
成本结构	大部分费用集中在编排模型上	以执行模型费用为主,Advisor 只消耗少量 token
上下文共享	开发者自行管理上下文传递	服务端自动传递
编排方式	需要 LangGraph、AutoGen 等框架	一行 API 配置即可
Advisor 的工具访问	Worker 可以使用工具	Advisor 无法访问工具(只做推理)
适用场景	每一步都很复杂的任务	大部分是机械性步骤,偶尔需要难判断的场景

实际的基准测试如何?

用数字来看看。

74.8%

Sonnet + Opus Advisor 的 SWE-bench 分数(Sonnet 单独 72.1%)

41.2%

Haiku + Opus Advisor 的 BrowseComp 分数(Haiku 单独 19.7% → 翻倍以上)

11.9%

使用 Sonnet + Advisor 后每次任务的成本下降幅度

其中 Haiku 的跳跃格外值得关注。BrowseComp 从 19.7% 提升到 41.2%,不只是简单的改进,而是 Advisor 把 Haiku 在复杂网页研究上本来存在的根本能力差距给补上了。法律文件抽取服务 Eve Legal 就靠 Haiku + Opus Advisor 组合,达到了前沿模型级别的质量,而成本只有 Opus 单独使用时的五分之一。

上手指南

在 Claude Code 里直接开用
在终端输入 /advisor → 选中 Opus 4.6 → 就这样。如果你现在把 Sonnet 4.6 当主模型用,现在就可以试试看。
通过 API 集成
在 Messages API 请求中加上 beta 头 anthropic-beta: advisor-tool-2026-03-01,然后在 tools 数组里放一条 {"type": "advisor_20260301", "name": "advisor", "model": "claude-opus-4-6"} 就行。
做好成本控制
用 max_uses 参数限制每次请求里 Advisor 的调用次数。编码任务通常 2~3 次就足够覆盖核心决策点。
选对模型搭配
性价比之王:Sonnet + Opus Advisor。极致省钱:Haiku + Opus Advisor(适合大批量处理)。如果你主要用 Opus,那就和子智能体流程并行使用更合适。
用好提示词技巧
在系统提示中加入"在做 substantive work 之前先向 advisor 确认"或者"完成前和 advisor 再 double check 一次"这类明确指令,可以让 Advisor 的调用时机更精准。

实战提示:Advisor 的调用会在 token 账单上以独立一行显示,你可以按项目追踪 Advisor 是否真的物有所值。而且用 /compact 压缩对话后,Advisor 之前的建议依然会被保留,在长会话里充当"知识沉淀层"。

深入了解

局限也要知道:Advisor 的输出不支持流式,所以子推理期间流会短暂中断。此外,如果主模型过于自信,它可能根本不调用 Advisor —— 这时候就得靠提示词来补。

Advisor 真正的潜力,并不在于它本身是一个功能,而在于它是未来模型策略的底层设施。如果以后出现比 Opus 贵得多的下一代模型(比如 Mythos 之类),把它当主模型用显然代价太高。但要是把它设为 Advisor,就能只在关键决策上调用下一代模型的智力,同时把成本压在可控范围内。

根据 Anthropic 的官方文档,在编码任务中把 Sonnet 设为 medium effort 再接上 Opus Advisor,可以用更低的成本拿到接近 default effort Sonnet 单独使用时的智能水平。如果你需要最强智能,default effort + Advisor 的组合就是最强档。

那么子智能体和 Advisor 到底该用哪一个?主模型是 Sonnet 的话,Advisor 就是答案。主模型是 Opus 的话,子智能体(独立上下文)更合适。因为 Advisor 共享整条对话记录,如果主模型一开始把问题 framing 错了,Advisor 也很容易掉进同一个陷阱。而子智能体是在干净的上下文里起步,反而能给出更新鲜的视角。