OpenAI가 자기 코딩 에이전트에 "끝까지 알아서 해라" 모드를 박았다. Codex CLI 0.128.0의 /goal 명령이다.

이름이 낯선 게 아니다. 작년 가을 호주 개발자 Geoff Huntley가 공개한 "Ralph loop"OpenAI가 정식 기능으로 가져왔다. while:; do cat PROMPT.md | claude-code; done — 단 한 줄짜리 Bash 트릭이 6개월 만에 빅테크 코딩 에이전트의 메인 기능으로 승격된 흔치 않은 사례다.

이게 뭔데?

2026년 4월 30일 풀린 Codex CLI 0.128.0의 핵심 추가 기능이 persisted /goal workflows다. GitHub 릴리즈 노트의 표현 그대로 — "app-server APIs, model tools, runtime continuation, and TUI controls for create, pause, resume, and clear"가 한꺼번에 들어왔다. 그냥 새 슬래시 명령 하나가 아니라 세션이 끊겨도 살아남는 장기 목표 시스템이다.

Simon Willison은 이걸 한 줄로 요약했다. "OpenAI's Codex CLI coding agent adds their own version of the Ralph loop: you can now set a /goal and Codex will keep on looping until it evaluates that the goal has been completed... or the configured token budget runs out."

구현은 두 개의 프롬프트 파일로 굴러간다 — goals/continuation.md(매 턴이 끝날 때 "목표 달성됐나?"를 자기에게 묻는 프롬프트)와 goals/budget_limit.md(토큰 한도에 다다르면 안전하게 종료하는 프롬프트). 매 사이클이 끝날 때마다 이 두 프롬프트가 자동 주입되면서 에이전트는 인간 개입 없이 다음 행동을 결정한다.

Ralph loop이 왜 갑자기 표준이 됐는데?

Ralph는 The Simpsons의 캐릭터 Ralph Wiggum에서 따온 이름이다. "선의는 있지만 좀 멍청하다" — 이 비유 그대로다. 한 번에 한 작업, 실패하면 프롬프트에 "팻말"을 추가, 다시 루프. Geoff Huntley는 이 방식으로 $50,000짜리 외주 계약을 $297로 끝냈다고 공개했다. CURSED라는 새 프로그래밍 언어 컴파일러를 LLVM으로 자동 생성한 사례까지 나왔다.

핵심 인사이트 3개:

  1. 한 번에 한 작업
    멀티 에이전트 마이크로서비스가 아니라 단일 프로세스 모놀리식. 한 사이클 = 한 기능 구현.
  2. 결정론적 컨텍스트 할당
    스펙·계획을 매 턴 같은 형식으로 주입. "real context window는 147~152K"라는 Huntley의 관찰이 핵심 — 200K 광고하지만 실제 효과적인 한도는 그보다 좁다.
  3. 실패가 곧 튜닝
    에이전트가 헛소리하면 시스템을 갈아엎는 게 아니라 프롬프트에 "이건 하지 마라" 줄 한 줄 추가하고 다시 루프. 인간은 운영자(operator)일 뿐 코더가 아니다.
구분 기존 Codex CLI (0.127↓) Codex CLI 0.128 + /goal
작업 단위 개발자 한 턴 입력 목표 한 문장 → 자율 다중 턴
중단 처리 세션 끊기면 컨텍스트 소실 persisted — 재개·일시정지·정리 가능
종료 조건 개발자가 "완료" 판단 에이전트 자기 평가 OR 토큰 한도
운영 모델 코파일럿 — 사람 옆에서 거든다 오버나잇 — 자고 일어나면 돼있다
리스크 잘못된 한 줄 토큰 폭주·헛수고 누적

Anthropic은 이미 작년 가을부터 Claude Code의 SDK 레이어에서 비슷한 패턴을 굴리고 있었고, OpenAI는 정식 슬래시 명령으로 끌어올렸다. "인간 개입 없는 코딩"이 더 이상 실험이 아니라 product surface가 됐다는 게 변곡점이다.

핵심만 정리: 시작하는 법

  1. Codex CLI 업데이트
    codex update 또는 npm i -g @openai/codex@latest. 0.128.0 이상 확인.
  2. greenfield 프로젝트로 시작
    Huntley 본인이 강조 — "기존 코드베이스에 Ralph 절대 안 쓴다." 새 프로젝트의 0~90% 구간이 가장 효과적.
  3. SPECS.md 한 장 쓰기
    기능 명세 + 표준 라이브러리 + 절대 금지사항. 매 턴 자동 주입될 컨텍스트라 짧고 결정적이어야 한다.
  4. /goal 입력
    /goal "Build a todo CRUD API with SQLite + tests + README" 같은 한 문장. budget_limit.md에 토큰 상한 명시.
  5. 로그만 보기
    처음 2시간은 자리 비우지 말고 모니터링. 헛수고 패턴 발견하면 SPECS.md에 한 줄 추가하고 재시작.

자주 묻는 질문

(FAQSection 자동 렌더링 — content에는 포함하지 않음)