opengraph.githubassets.com

Codex CLI에 /goal 명령이 박혔다 — "멍청한 Bash 한 줄"이 OpenAI의 정식 기능이 됐다

Codex CLI, /goal, Ralph loop, Geoff Huntley, OpenAI 코딩 에이전트AI 개발 도구

Simon Willison — Codex CLI 0.128.0 adds /goal

Geoff Huntley — The Ralph Loop 원조 글

OpenAI Codex CLI 0.128.0 GitHub Releases

OpenAI가 자기 코딩 에이전트에 "끝까지 알아서 해라" 모드를 박았다. Codex CLI 0.128.0의 /goal 명령이다.

이름이 낯선 게 아니다. 작년 가을 호주 개발자 Geoff Huntley가 공개한 "Ralph loop"를 OpenAI가 정식 기능으로 가져왔다. while:; do cat PROMPT.md | claude-code; done — 단 한 줄짜리 Bash 트릭이 6개월 만에 빅테크 코딩 에이전트의 메인 기능으로 승격된 흔치 않은 사례다.

이게 뭔데?

2026년 4월 30일 풀린 Codex CLI 0.128.0의 핵심 추가 기능이 persisted /goal workflows다. GitHub 릴리즈 노트의 표현 그대로 — "app-server APIs, model tools, runtime continuation, and TUI controls for create, pause, resume, and clear"가 한꺼번에 들어왔다. 그냥 새 슬래시 명령 하나가 아니라 세션이 끊겨도 살아남는 장기 목표 시스템이다.

Simon Willison은 이걸 한 줄로 요약했다. "OpenAI's Codex CLI coding agent adds their own version of the Ralph loop: you can now set a /goal and Codex will keep on looping until it evaluates that the goal has been completed... or the configured token budget runs out."

구현은 두 개의 프롬프트 파일로 굴러간다 — goals/continuation.md(매 턴이 끝날 때 "목표 달성됐나?"를 자기에게 묻는 프롬프트)와 goals/budget_limit.md(토큰 한도에 다다르면 안전하게 종료하는 프롬프트). 매 사이클이 끝날 때마다 이 두 프롬프트가 자동 주입되면서 에이전트는 인간 개입 없이 다음 행동을 결정한다.

Ralph loop이 왜 갑자기 표준이 됐는데?

Ralph는 The Simpsons의 캐릭터 Ralph Wiggum에서 따온 이름이다. "선의는 있지만 좀 멍청하다" — 이 비유 그대로다. 한 번에 한 작업, 실패하면 프롬프트에 "팻말"을 추가, 다시 루프. Geoff Huntley는 이 방식으로 $50,000짜리 외주 계약을 $297로 끝냈다고 공개했다. CURSED라는 새 프로그래밍 언어 컴파일러를 LLVM으로 자동 생성한 사례까지 나왔다.

핵심 인사이트 3개:

한 번에 한 작업
멀티 에이전트 마이크로서비스가 아니라 단일 프로세스 모놀리식. 한 사이클 = 한 기능 구현.
결정론적 컨텍스트 할당
스펙·계획을 매 턴 같은 형식으로 주입. "real context window는 147~152K"라는 Huntley의 관찰이 핵심 — 200K 광고하지만 실제 효과적인 한도는 그보다 좁다.
실패가 곧 튜닝
에이전트가 헛소리하면 시스템을 갈아엎는 게 아니라 프롬프트에 "이건 하지 마라" 줄 한 줄 추가하고 다시 루프. 인간은 운영자(operator)일 뿐 코더가 아니다.

구분	기존 Codex CLI (0.127↓)	Codex CLI 0.128 + /goal
작업 단위	개발자 한 턴 입력	목표 한 문장 → 자율 다중 턴
중단 처리	세션 끊기면 컨텍스트 소실	persisted — 재개·일시정지·정리 가능
종료 조건	개발자가 "완료" 판단	에이전트 자기 평가 OR 토큰 한도
운영 모델	코파일럿 — 사람 옆에서 거든다	오버나잇 — 자고 일어나면 돼있다
리스크	잘못된 한 줄	토큰 폭주·헛수고 누적

Anthropic은 이미 작년 가을부터 Claude Code의 SDK 레이어에서 비슷한 패턴을 굴리고 있었고, OpenAI는 정식 슬래시 명령으로 끌어올렸다. "인간 개입 없는 코딩"이 더 이상 실험이 아니라 product surface가 됐다는 게 변곡점이다.

핵심만 정리: 시작하는 법

Codex CLI 업데이트
codex update 또는 npm i -g @openai/codex@latest. 0.128.0 이상 확인.
greenfield 프로젝트로 시작
Huntley 본인이 강조 — "기존 코드베이스에 Ralph 절대 안 쓴다." 새 프로젝트의 0~90% 구간이 가장 효과적.
SPECS.md 한 장 쓰기
기능 명세 + 표준 라이브러리 + 절대 금지사항. 매 턴 자동 주입될 컨텍스트라 짧고 결정적이어야 한다.
/goal 입력
/goal "Build a todo CRUD API with SQLite + tests + README" 같은 한 문장. budget_limit.md에 토큰 상한 명시.
로그만 보기
처음 2시간은 자리 비우지 말고 모니터링. 헛수고 패턴 발견하면 SPECS.md에 한 줄 추가하고 재시작.

자주 묻는 질문

(FAQSection 자동 렌더링 — content에는 포함하지 않음)

🔗

더 깊이 파고 싶다면

Simon Willison — Codex CLI 0.128.0 adds /goal

릴리즈 분석의 1차 출처 — Eric Traut 트윗·릴리즈 노트 인용

Geoff Huntley — The Ralph Loop

원조 Ralph의 모든 것 — $50K → $297 사례 + 컨텍스트 윈도우 핵

OpenAI Codex GitHub Releases

v0.128.0 공식 릴리즈 노트 — persisted /goal 워크플로우 전체 사양

Th0rgal/open-ralph-wiggum

Codex·Cursor·Copilot CLI 모두에서 Ralph 패턴 굴리는 오픈 구현

자주 묻는 질문

Claude Code의 무한 루프 모드랑 뭐가 다른가요?

방향은 같지만 노출 방식이 달라요. Claude Code는 SDK 레이어에 비슷한 패턴을 깔아두고 사용자가 직접 스크립트로 루프를 굴려야 했어요. OpenAI는 /goal이라는 정식 슬래시 명령으로 끌어올렸고, persisted 워크플로우(세션 끊겨도 살아남음) + TUI 컨트롤(create·pause·resume·clear)을 패키지로 묶었어요. 즉 "기능이 있다"에서 "product surface가 됐다"로 단계가 다르다는 게 핵심.

기존 코드베이스에 써도 되나요?

Geoff Huntley 본인이 강하게 만류했어요 — "기존 코드베이스에 Ralph 절대 안 쓴다"가 그의 표현이에요. 효과가 좋은 구간은 새 프로젝트의 0~90% 구간이에요. 큰 모놀리스나 기존 마이크로서비스 안에서 Ralph를 굴리면 잘못된 방향으로 가는 토큰이 폭주해요. 프로토타입·MVP·새 마이크로서비스·실험 코드까지가 안전한 영역.

토큰 비용이 폭주하면 어떻게 막나요?

두 단계로 막아요. (1) goals/budget_limit.md에 토큰 상한을 명시 — 도달하면 안전하게 종료. (2) 첫 시도는 $5~$10 상한, 1시간 타임박스로 검증. 그래도 폭주하면 SPECS.md(매 턴 주입되는 컨텍스트 문서)가 모호한 거예요. "이건 하지 마라" 같은 명시적 금지를 추가해서 다시 루프. Andrey Ivanov 같은 초기 사용자들도 LinkedIn에서 같은 패턴으로 정착했어요.

Cursor·Windsurf·Copilot CLI에서도 똑같이 굴릴 수 있나요?

가능해요. Th0rgal/open-ralph-wiggum이 Codex·Cursor·Copilot CLI 모두에서 동일 패턴을 굴리는 오픈 구현을 공개했어요. 차이는 (1) /goal 같은 product 단위 명령은 OpenAI가 먼저 박았고, (2) 다른 도구들은 직접 while 루프 + 프롬프트 인젝션을 짜야 한다는 점. 도구 선택보다 SPECS.md 품질이 결과를 좌우해요.

개발자 1명짜리 팀에 의미가 있나요?

가장 큰 효과는 1인 팀에서 나와요. Huntley의 $50K → $297 사례가 정확히 "외주 비용을 자기 시간 + 토큰으로 대체"한 케이스예요. 단 조건이 있어요 — 명세를 정확히 쓸 수 있어야 해요. SPECS.md를 못 쓰면 Ralph는 헛수고만 합니다. 결국 운영자(operator) 스킬이 결과를 결정해요. "LLMs are mirrors of operator skill"이 Huntley의 원문 표현.

Written by 러쉬

비즈니스와 AI가 만나는 접점을 추적합니다.

이 레퍼런스가 도움이 되셨나요?

매주 엄선된 레퍼런스를 메일로 받아보세요

이 레퍼런스 공유하기

다음 읽을 레퍼런스

웹 스크레이프와 회사 PDF가 처음으로 같은 엔진을 쓴다 — Firecrawl /parse + Fire-PDF 정리

Firecrawl이 4월에 두 번 갈아엎었다. 14일 Fire-PDF, 28일 /parse. 웹과 로컬 파일이 처음으로 같은 RAG 파이프라인에 들어가게 만든 변화 — RAG/에이전트 운영자라면 알아둬야 할 시점.

이런 가이드도 추천해요

비슷한 주제의 AI 활용 가이드를 더 살펴보세요

1억 달러 사이닝 보너스를 거절한 사람들 — Anthropic이 인재 전쟁에서 진짜 이긴 이유

techcrunch.com

AI 조직 전환AI 인재 전쟁, Anthropic 보상 정책, Meta 슈퍼인텔리전스, 1억 달러 사이닝 보너스, 잔존율

1억 달러 사이닝 보너스를 거절한 사람들 — Anthropic이 인재 전쟁에서 진짜 이긴 이유

Meta는 24살 박사 중퇴생에게 2.5억 달러를 던졌다. Anthropic은 같은 1억 달러 제시를 받은 직원에게 매칭조차 하지 않았다. 그리고 잔존율 80% — Meta(64%)를 16%p 앞질렀다. 인재 전쟁이 보여준 진짜 메커니즘.

AI 에이전트가 웹을 긁기만 해도 인젝션이다 — Firecrawl이 깐 'Lockdown' 방어선

firecrawl.dev

AI 에이전트 보안Firecrawl Lockdown, 프롬프트 인젝션, AI 에이전트 보안, web-agent, MCP 보안

AI 에이전트가 웹을 긁기만 해도 인젝션이다 — Firecrawl이 깐 'Lockdown' 방어선

AI 에이전트의 웹 스크레이프가 새로운 데이터 유출 채널이다. Firecrawl Lockdown Mode가 cache-only로 이 채널을 닫는다 — 4월 21일 Comment and Control 공격, 9일 뒤 나온 방어선의 전말.

Claude Code Skill — markdown 파일 한 장이 매물 50개 비교 스프레드시트로 돌아온다

miro.medium.com

AI 개발 도구Claude Code Skill, SKILL.md, 웹 스크래핑, Firecrawl, Santiago Valdarrama

Claude Code Skill — markdown 파일 한 장이 매물 50개 비교 스프레드시트로 돌아온다

Santiago Valdarrama가 Claude Code Skill로 매물 50개를 5개 사이트에서 자연어 한 줄로 정리된 테이블로 받았다. SKILL.md 한 장이면 모든 프로젝트에서 같은 능력이 자동 트리거. 작성법·실전 예시·Cursor와의 차이까지 정리.

다음 →웹 스크레이프와 회사 PDF가 처음으로 같은 엔진을 쓴다 — Firecrawl /parse + Fire-PDF 정리