有没有让智能体"迁移整个代码库"的经历?大概到一半就出现上下文溢出、方向迷失、文件冲突——这是智能体编码中反复碰到的那堵墙。

Claude Opus 4.8对这堵墙同时投入了1,000个智能体。2026年5月28日发布的Dynamic Workflows让Claude自动编写JS编排脚本,运行时在后台并行启动数百个子智能体。从启动到合并,处理数十万行代码库——这现在已经是现实了。

30秒速览
单智能体瓶颈 Dynamic Workflows 1,000智能体并行 全代码库自动化 7:2领先GPT-5.5

智能体为什么总是卡住,Workflows怎么解决的

传统的Claude Code子智能体像是"主智能体派差事"的结构。主智能体掌握所有上下文,子智能体只汇报结果。遇到数十万行代码库,主智能体会先触顶。

Dynamic Workflows采用了完全不同的架构。Claude分析任务后自动编写JS编排脚本,运行时在后台执行脚本并动态生成智能体。每个智能体独立处理一个狭窄的范围,部分智能体专门负责验证(反驳)其他智能体的结果。循环持续到答案收敛为止。

传统子智能体Dynamic Workflows
上下文管理主智能体全部持有 → 容易溢出每个智能体独立处理小范围
作业规模单个文件到数千行数十万行代码库
编排方式人工指定角色Claude自动生成JS脚本
并发数量有限最多16个同时,总计1,000个
自我验证验证智能体自动反驳并收敛

Anthropic实际验证的案例是从启动到通过现有测试套件,全自动处理数十万行代码库。这正是这种架构对代码库迁移等大范围重复性工作特别强大的原因。

套餐要求

Dynamic Workflows仅支持Max、Team和Enterprise套餐。Max/Team套餐默认开启。

与GPT-5.5正面交锋——数据说明一切

Opus 4.8上线以来,与GPT-5.5的对比数据不断累积。9项主要基准测试中,Opus 4.8在7项中领先。

69.2%
SWE-bench Pro(GPT-5.5为58.6%)
1.5%
ARC-AGI-3最高分(GPT-5.5的3倍)
68.1%
GraphWalks BFS 1M(GPT-5.5为45.4%)

差距在长上下文任务中最为明显。GraphWalks BFS 1M测试(100万Token上下文推理)中,Opus 4.8得68.1%,GPT-5.5得45.4%,相差23个百分点。这正是Opus 4.8在Dynamic Workflows等大规模上下文场景中优势最突出的地方。

基准测试GPT-5.5Claude Opus 4.8
SWE-bench Pro(编码)58.6%69.2%
Humanity's Last Exam(含工具)52.2%57.9%
ARC-AGI-3(抽象推理)0.43%1.5%
OSWorld-Verified(计算机操作)78.7%83.4%
GraphWalks BFS 1M(长上下文)45.4%68.1%
Terminal-Bench 2.0(终端操作)78.2%74.6%

终端密集型Shell操作中GPT-5.5仍领先3.6个百分点。以编码、推理、计算机控制为核心选Opus 4.8,以终端自动化为主则GPT-5.5也值得考虑。

Opus 4.8在ARC-AGI-3达到1.5%不只是分数提升。ARC Prize分析指出,Opus 4.8开始将环境识别为"对象"而非像素集合——这是Opus 4.7从未迈出的一步。抽象化层次本身发生了变化。

立即开始的方法

  1. 确认套餐
    访问claude.com/pricing确认是否为Max、Team或Enterprise之一。Personal/Pro套餐不支持Dynamic Workflows。Max 5x为每月$100的起点。
  2. 将Claude Code更新到最新版
    运行npm install -g @anthropic-ai/claude-code获取最新版本。Max/Team默认启用Dynamic Workflows,无需额外设置。
  3. 直接交代代码库规模的任务
    不要在提示中拆分任务。直接输入"将整个代码库迁移到Python 3.12"等代码库规模的指令,Claude会自动生成编排脚本。
  4. 活用Effort Control
    在claude.ai中根据任务难度设置effort级别。复杂的迁移任务建议设为Extra以获得更深入的分析。
  5. 监控成本
    API按量计费:输入$5/百万Token,输出$25/百万Token。Fast Mode为$10/$50,速度快3倍,且比旧款Fast Mode便宜3倍。大规模迁移建议先在部分文件上测试。

想深入了解

Introducing Claude Opus 4.8 Dynamic Workflows、Effort Control和API变更的官方详情全在这里。 anthropic.com

What Is ARC-AGI-3? How Claude Opus 4.8 Achieved State-of-the-Art Fluid Intelligence 分析Opus 4.8创ARC-AGI-3历史最高分的原因及抽象化层次变化。 mindstudio.ai

Claude Opus 4.8 vs GPT-5.5: Benchmarks, Tests, and Which to Choose 对9项基准测试进行实测的最详细对比分析,帮助按任务类型选择合适的模型。 datacamp.com

Anthropic releases Claude Opus 4.8 with new dynamic workflow tool 发布当天的Anthropic采访和Bridgewater Associates真实使用反馈。 techcrunch.com

Claude Opus 4.8 — The New #1 AI Model Artificial Analysis Intelligence Index 61.4对GPT-5.5 60.2的综合指标排名分析。 artificialanalysis.ai

Anthropic Ships Claude Opus 4.8 Alongside Dynamic Workflows, Capped at 1,000 Subagents 技术架构、1,000个智能体上限及各套餐差异的详细分析。 marktechpost.com