engadget.com

8개 에이전트가 동시에 코딩한다 — Grok Build, Claude Code 자리를 뺏을 수 있나

Grok Build, AI 코딩 에이전트, Claude Code 비교, 병렬 에이전트, SWE-Bench, xAI 터미널AI 도구 실전기

xAI introduces its coding agent called Grok Build

Grok Build Review: xAI's Agentic Coding CLI Takes On Claude Code and Codex

xAI joins crowded coding agent race with Grok Build

코딩 에이전트 시장이 다시 요동치고 있어요. 2026년 5월 14일, xAI가 드디어 Grok Build를 베타로 출시했거든요. Claude Code, Codex CLI 이후 세 번째로 터미널 코딩 에이전트 경쟁에 뛰어든 거예요.

흥미로운 건 xAI의 전략이에요. 벤치마크 점수를 올리는 대신, 아무도 안 했던 방식 — 8개 에이전트가 동시에, 각자 독립적으로 코딩하는 구조로 차별화를 택했어요. 과연 이게 통할까요?

3초 요약

작업 입력 → 계획 검토·승인 → 8개 병렬 에이전트 → 독립 Git 브랜치 → 결과 통합

세 번째 선수가 등장한 건데?

2025년 중반까지만 해도 터미널 코딩 에이전트는 사실상 양강이었어요. Anthropic의 Claude Code, OpenAI의 Codex CLI. 그 사이에 xAI의 Grok은 코딩 능력에서 뒤처진다는 게 공공연한 사실이었고, Elon Musk 본인도 인정했을 정도였으니까요.

Grok Build는 그 공백을 메우기 위한 xAI의 정면 승부예요. 일반 채팅 모델을 코딩에 맞게 조정한 게 아니라, 에이전틱 워크플로우 전용으로 처음부터 새로 훈련한 grok-build-0.1 모델을 씁니다. 2026년 5월 20일에 출시된 이 모델은 범용 모델을 재목적화한 게 아니라 처음부터 에이전트 실행에 최적화돼 있어요.

2026년 5월 14일 베타 출시 당시에는 SuperGrok Heavy($299/월) 구독자 전용이었는데, 5월 25일부터 SuperGrok($30/월)과 X Premium+ 구독자에게도 열렸어요.

8개

동시 병렬 에이전트

256K

컨텍스트 토큰

70.8%

SWE-Bench Verified

구조적으로 주목할 건 로컬 우선(Local-first) 아키텍처예요. 소스 코드가 xAI 서버로 전송되지 않아요. 에어갭 환경에서도 사용할 수 있다는 얘기인데, 금융·의료·정부 같은 보안 민감한 분야에서 Claude Code나 Codex CLI가 채택하기 어려운 이유 중 하나를 바로 해결한 거예요.

MCP(Model Context Protocol) 호환성도 챙겼어요. Claude Code에서 이미 GitHub, Linear, Slack MCP 연동을 써오던 팀이라면 재설정 없이 Grok Build로 그대로 이전 가능해요.

Claude Code랑 뭐가 다른 건데?

숫자만 보면 Grok Build는 열세예요. SWE-Bench Verified 기준으로 Claude Code는 87.6%, Codex CLI는 88.7%인데 Grok Build는 70.8%로 약 17포인트 뒤처져 있어요. 이 격차는 반올림 오차 수준이 아니에요. 복잡한 멀티파일 작업에서 실질적으로 체감됩니다.

근데 xAI가 노린 건 다른 게임이에요. 벤치마크가 아니라 '어떻게 일하느냐'의 구조적 차이로 승부를 건 거거든요.

	Claude Code	Codex CLI	Grok Build
SWE-Bench	87.6%	88.7%	70.8%
병렬 에이전트	지원	지원	최대 8개 (기본값)
계획 선승인	옵션	미지원	기본 ON
로컬 우선	미지원	미지원	지원 (에어갭 가능)
MCP 호환	네이티브	미지원	네이티브
기본 가격	$20/월 (Pro)	$20/월 (ChatGPT Plus)	$30/월 (SuperGrok)

차별점 두 가지만 짚어볼게요.

계획 선승인(Plan Mode on by default): Grok Build는 코드를 건드리기 전에 무조건 계획을 먼저 써요. 개발자가 검토하고 승인해야 실행이 시작돼요. Claude Code도 Plan Mode가 있지만 옵션이고, Codex CLI는 아예 없어요. 에이전트가 엉뚱한 방향으로 달려가는 상황을 구조적으로 방지하는 거예요.

진짜 병렬 실행: 8개 에이전트가 각각 독립된 Git 브랜치에서 동시에 작업해요. 레거시 인증 모듈 리팩터링을 예로 들면, 한 에이전트는 코어 로직을, 다른 에이전트는 테스트를, 또 다른 에이전트는 문서를 동시에 작성하는 식이에요. 코더 리뷰 결과, 약 15분 만에 CRUD API 전체를 완성하는 사례도 나왔어요.

Grok Build가 빛나는 상황

대규모 모노레포 리팩터링, 여러 가설을 동시에 검증해야 하는 버그 추적, 아키텍처 분석처럼 "여러 방향을 동시에 탐색"하는 작업에서 Claude Code 대비 실질적인 시간 절감이 나와요. 반면 단순 기능 추가나 1:1 디버깅은 Claude Code나 Codex CLI가 더 안정적이에요.

핵심만 정리: 시작하는 법

설치
공식 CLI 설치 스크립트를 실행해요. macOS/Linux 지원, Windows는 WSL2 환경에서 사용 가능해요.
curl -fsSL https://x.ai/cli/install.sh | bash
로그인
SuperGrok 또는 X Premium+ 계정으로 인증해요.
grok-build login
플랜 모드로 시작
프로젝트 디렉터리에서 --plan 플래그로 실행하면 계획 초안을 먼저 보여줘요. 수정하고 승인하면 실행이 시작돼요.
grok-build --plan "인증 모듈 리팩터링"
병렬 에이전트 활용
복잡한 작업은 --parallel 옵션으로 동시 실행 에이전트 수를 지정해요. 2~4개로 시작해서 익숙해지면 늘리는 걸 추천해요.
grok-build --parallel=4 "작업 설명"
MCP 연동 확인
기존 Claude Code용 MCP 설정 파일이 있다면 그대로 인식돼요. GitHub, Linear 등 기존 연동을 별도 재설정 없이 사용 가능해요.

비용 구조 주의

$30 SuperGrok 플랜은 기본 접근 권한을 줘요. 전체 병렬 에이전트와 Arena Mode를 쓰려면 SuperGrok Heavy($99/월 프로모 → 6개월 후 $299/월)가 필요해요. API 전용 사용은 입력 $0.20/백만 토큰, 출력 $1.50/백만 토큰이에요.

🔗