Claude Code를 쓰는 개발자라면 한 번쯤 이런 생각을 해봤을 거예요. "이걸 좀 더 체계적으로 쓸 수는 없나?" Y Combinator CEO Garry Tan이 그 답을 오픈소스로 내놨어요. 이름은 gstack. GitHub에 공개된 지 2주 만에 별 4만 5천 개를 넘겼어요.

3초 요약
Claude Code 커스텀 명령어 28개 역할별 전문가 시스템 Think → Plan → Build → Review → Test → Ship → Reflect

이게 뭔데?

gstack은 Claude Code용 커스텀 슬래시 커맨드(slash command) 모음이에요. 핵심 아이디어는 단순해요. AI에게 "코드 짜줘"라고 말하는 대신, "너는 지금 QA 리드야" 혹은 "너는 시니어 디자이너야"라고 역할을 부여하는 거예요.

전체 28개 스킬이 있고, 각각이 특정 전문가 역할에 매핑돼요. CEO가 제품 방향을 검토하고, 엔지니어링 매니저가 아키텍처를 잠그고, 디자이너가 AI 슬롭(slop)을 잡아내고, QA가 실제 브라우저를 열어서 테스트하고, 릴리즈 엔지니어가 PR을 올리는 식이에요.

45.8K+
GitHub Stars
28개
커스텀 스킬
60만+ LOC
60일간 생산량 (Tan 기준)

설치도 30초면 돼요. Git clone 한 줄이면 끝이에요. 모든 스킬은 마크다운 파일이라 누구나 읽고 수정할 수 있고, SaaS 종속이나 텔레메트리 같은 건 없어요. MIT 라이선스예요.

뭐가 달라지는 건데?

보통 AI 코딩 도구를 쓰는 방식은 이래요. 프롬프트를 던지면 AI가 대답하고, 그 결과를 사람이 판단해요. 문제는 하나의 AI 세션이 자기가 쓴 코드를 스스로 리뷰하는 "자기 확인 편향(self-affirmation spiral)"이 생긴다는 거예요.

gstack은 이 구조를 깨요. 각 단계마다 다른 "전문가"가 투입되니까, 이전 단계의 결과를 다음 단계가 독립적으로 검증해요.

단계 주요 스킬 역할
기획 /office-hours, /plan-ceo-review YC 오피스아워 스타일 질문 6개로 전제를 뒤흔든다
설계 /plan-eng-review, /plan-design-review 아키텍처 잠금, 디자인 0-10점 평가
개발 /review, /investigate Staff Engineer 수준 코드 리뷰, 체계적 디버깅
테스트 /qa, /cso 실제 브라우저 QA, OWASP Top 10 + STRIDE 보안 감사
배포 /ship, /land-and-deploy PR 생성부터 프로덕션 헬스체크까지 원커맨드
회고 /retro 주간 회고, 프로젝트별 배포 추적

특히 /browse 스킬이 눈에 띄어요. Claude Code에 실제 Chromium 브라우저를 연결해서, 클릭하고 스크린샷을 찍는 브라우저 자동화를 지원해요. 콜드 스타트가 3~5초, 이후 커맨드당 100~200ms라고 해요. 쿠키와 로그인 상태가 세션 간에 유지돼서 인증이 필요한 테스트도 가능하고요.

그리고 /codex 스킬은 OpenAI Codex CLI를 불러서 "세컨드 오피니언"을 받아요. Claude가 쓴 코드를 경쟁 모델이 리뷰하는 구조예요. 크로스 모델 분석이라는 개념 자체가 흥미로워요.

This is my open source software factory. I use it every day. I'm sharing it because these tools should be available to everyone.

— Garry Tan, Y Combinator CEO

논쟁도 있다

반응이 전부 긍정적이진 않아요. TechCrunch가 "so much love, and hate"라고 표현할 정도로 갈렸어요.

비판의 핵심은 두 가지예요. 첫째, 많은 개발자들이 이미 비슷한 프롬프트 세트를 만들어 쓰고 있었다는 거예요. gstack이 특별히 기술적으로 혁신적인 건 아니고, YC CEO라는 위치 때문에 과도한 관심을 받았다는 시각이에요.

둘째, 안전성 우려예요. Hacker News에서 한 개발자가 공유한 사례가 인상적이에요. Claude Code 에이전트가 70분 동안 스테이징 URL을 프로덕션 설정에 반복 주입하면서도 exit code는 정상이었다고요. 자율 에이전트의 속도가 빠를수록, 안전장치가 더 중요하다는 교훈이에요.

주의: 자율 에이전트의 양날의 검

gstack의 /careful, /freeze, /guard 같은 안전 스킬이 있긴 하지만, 프로덕션 환경에서는 별도의 감사 레이어를 두는 게 안전해요. 속도와 통제의 균형을 항상 의식하세요.

핵심만 정리: 지금 시작하는 법

  1. Claude Code가 설치돼 있는지 확인하세요
    gstack은 Claude Code 위에서 동작해요. Anthropic 구독이 필요해요. Bun v1.0+, Git도 필요하고요.
  2. 30초 설치를 따라하세요
    git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack &&./setup — 이 한 줄이면 돼요.
  3. /office-hours부터 시작하세요
    코드를 바로 짜는 게 아니라, 6개의 강제 질문으로 "이 기능을 진짜 만들어야 하는지"부터 점검하는 게 gstack의 철학이에요.
  4. 전체를 쓸 필요는 없어요
    28개 스킬 전부를 쓸 필요 없어요. /review/qa만 써봐도 코드 품질이 달라질 거예요. 자기 워크플로우에 맞는 것만 골라 쓰세요.
  5. 커스텀하세요
    모든 스킬이 마크다운 파일이에요. 자기 팀의 컨벤션, 기술 스택, 리뷰 기준에 맞게 수정하는 게 진짜 활용법이에요. 그대로 쓰는 건 반쪽이에요.

핵심 인사이트

gstack의 진짜 가치는 28개 커맨드 자체가 아니에요. "AI를 범용 어시스턴트가 아니라 역할별 전문가로 분리하면 결과가 달라진다"는 패턴이에요. 이 패턴은 코딩뿐 아니라 콘텐츠 제작, 데이터 분석, 고객 지원 등 어디든 적용할 수 있어요.