engadget.com

8个智能体同时写代码 — Grok Build能抢走Claude Code的位置吗？

Grok Build、AI编程智能体对比、Claude Code替代品、并行智能体、SWE-Bench、xAI终端开发

xAI introduces its coding agent called Grok Build

Grok Build Review: xAI's Agentic Coding CLI Takes On Claude Code and Codex

xAI joins crowded coding agent race with Grok Build

编程智能体市场再次震动。2026年5月14日，xAI正式发布Grok Build测试版，成为继Claude Code和Codex CLI之后第三个入局终端编程智能体竞争的玩家。

有意思的是xAI的策略。他们没有追求基准分数，而是选择了一种全新的方式——8个智能体同时独立运行，各自在独立分支上编码来建立差异化。

30秒总结

任务输入 → 计划审核·批准 → 8个并行智能体 → 独立Git分支 → 结果合并

这是什么东西？

直到2025年中期，终端编程智能体实际上只有两强：Anthropic的Claude Code和OpenAI的Codex CLI。xAI的Grok在编程能力上落后是公开的秘密，连Elon Musk本人都承认了。

Grok Build就是xAI填补这一差距的正面出击。他们不是把通用模型调整用于编程，而是专门为智能体工作流程从头训练的grok-build-0.1模型。

5月14日以SuperGrok Heavy(月299美元)独享方式发布，5月25日起向SuperGrok(月30美元)和X Premium+用户开放。

8个

最大并行智能体数

256K

上下文Token

70.8%

SWE-Bench Verified

结构上值得关注的是本地优先(Local-first)架构。源代码不会传输到xAI服务器，甚至支持气隙(Air-gap)环境。这直接解决了金融、医疗、政府等对安全性敏感领域中Claude Code和Codex CLI难以采用的关键障碍。

同时支持MCP(模型上下文协议)。已经在Claude Code中使用GitHub、Linear、Slack MCP集成的团队，无需重新配置即可迁移到Grok Build。

和Claude Code有什么不同？

从数字看，Grok Build处于劣势。SWE-Bench Verified基准：Claude Code 87.6%，Codex CLI 88.7%，Grok Build仅70.8%，相差约17个百分点。这不是四舍五入的误差，在复杂的多文件任务中是实际可感知的差距。

但xAI瞄准的是另一场游戏。不是基准测试，而是用"怎么工作"的结构差异来决胜负。

	Claude Code	Codex CLI	Grok Build
SWE-Bench	87.6%	88.7%	70.8%
并行智能体	支持	支持	最多8个(默认)
计划预审批	可选	不支持	默认开启
本地优先	不支持	不支持	支持(气隙可用)
MCP兼容	原生	不支持	原生
入门价格	$20/月(Pro)	$20/月(ChatGPT+)	$30/月(SuperGrok)

两个核心差异点：

计划预审批(Plan Mode默认开启): Grok Build在修改任何代码前，必须先写出计划。开发者审阅批准后执行才开始。Claude Code有Plan Mode但是可选项，Codex CLI则完全没有。通过"计划→审核→执行"三步门控，从结构上防止智能体跑偏。

真正的并行执行: 8个智能体各自在独立的Git分支上同时工作。以遗留认证模块重构为例，一个智能体处理核心逻辑，另一个写测试，再一个更新文档，同时进行。有评测报告显示约15分钟内完成含认证和测试的完整CRUD API。

Grok Build真正出彩的场景

大型代码仓库重构、需要同时验证多个假设的Bug追踪、架构审查等"需要同时探索多个方向"的工作。简单功能添加或一对一调试，Claude Code和Codex CLI更稳定。

核心总结：如何开始

安装
执行官方安装脚本。支持macOS/Linux，Windows需要WSL2环境。
curl -fsSL https://x.ai/cli/install.sh | bash
登录
用SuperGrok或X Premium+账号进行认证。
grok-build login
从计划模式开始
加--plan参数运行，先显示计划草案。确认修改后批准，执行才开始。
grok-build --plan "重构认证模块"
使用并行智能体
复杂任务用--parallel指定同时运行的智能体数量。建议从2-4个开始，熟悉后再增加。
grok-build --parallel=4 "任务描述"
迁移MCP集成
现有的Claude Code MCP配置文件直接被识别，GitHub、Linear等集成无需重新配置。

注意费用结构

月30美元的SuperGrok套餐仅提供基本访问权限。完整的并行智能体和Arena Mode需要SuperGrok Heavy(前6个月优惠价$99/月，之后$299/月)。纯API使用：输入每百万Token $0.20，输出$1.50。

深入了解

ChatForest: Grok Build vs Claude Code vs Codex CLI深度评测 从SWE-Bench比较到实际PR生成测试，最全面的基准测试评测 chatforest.com

Codersera: 按使用场景的决策矩阵 不同场景下应选择哪个智能体的实战指南 codersera.com

ByteIota: Grok Build诚实评测 均衡分析优势与局限的开发者视角评测 byteiota.com

CIO Dive: xAI进军编程智能体市场分析 企业视角下的市场定位与竞争格局分析 ciodive.com

Engadget: Grok Build发布报道 xAI官方发布与市场背景 engadget.com

常见问题

月30美元的SuperGrok套餐真的能用Grok Build吗？

基本功能可以使用。但8智能体全并行和Arena Mode是Heavy套餐专属。先用$30开始，需要更多并行能力时再升级是比较现实的策略。

能把现有的Claude Code项目直接迁移到Grok Build吗？

支持AGENTS.md，也能识别现有的MCP配置文件。大多数情况下无需重新配置即可开始。但Claude Code专用的自定义命令需要按Grok Build语法重写。

SWE-Bench 70.8%的分数在实际使用中能感知到吗？

简单的功能添加或单文件修改差异不大。差距在多组件依赖关系复杂的重构中会显现——与Claude Code相比可能需要更多手动修正。

本地优先真的意味着代码不会上传到服务器吗？

xAI官方声明源代码不会传输到其服务器。气隙环境支持是核心设计目标，数据处理方式与Claude Code和Codex CLI根本不同。不过使用元数据会发送到xAI。

Grok 5发布后差距会缩小吗？

xAI路线图中已有Grok 5集成计划。发布后重新测试SWE-Bench，与Claude Code的差距很可能显著缩小。目前许多观察人士认为这是一个值得早期参与的'平台先期投资'阶段。

作者拉什

追踪商业与AI的交汇点。

这个参考对您有帮助吗？

每周精选参考直达您的邮箱

分享此参考

8年只想不动手的产品,我用AI编程代理3个月做完了

Google资深工程师把搁置8年的开源项目,用AI编程代理3个月内做出来了。从Vibe Coding的失败、推倒重写,到AI真正擅长与不擅长的事——一份用250小时实战记录证明的复盘。

你可能还感兴趣

其他读者也在看的参考

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

pymnts.com

Cursor爆发式增长至500亿美元估值，预示AI编程工具市场大变局

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

ARR 突破 20 亿美元,3 个月营收翻倍。并行 Agent、MCP Apps、JetBrains 集成——Cursor 揭示 AI 编程市场的真实规模与未来走向。

查看详情

cdn.infograb.io

Claude Skills

只需教AI一次 — Claude Skills 33页指南完整整理

Anthropic公开的33页官方指南核心总结。用一个文件夹向Claude传授业务诀窍的Skills功能——节省50%token，消息15次→2次，还可以全团队共享。

查看详情

下一篇 →8年只想不动手的产品,我用AI编程代理3个月做完了