같은 AI 모델이에요. 같은 프롬프트고요. 그런데 한쪽은 "죄송하지만 저는 파일을 직접 다룰 수 없어요"라고 답하고, 다른 한쪽은 400장 제품 사진을 SKU 포맷으로 이름 바꾸고, 1200x1200으로 리사이즈하고, 카테고리별 폴더로 분류해서 몇 초 만에 끝내요. 사람이 하면 2시간 걸릴 일을요.

차이는 모델의 똑똑함이 아니에요. 한쪽에는 손이 달려 있고, 다른 한쪽에는 없다는 거예요. 그 손이 바로 CLI(명령줄 도구)고요. 에이전트의 능력은 모델이 아니라, 쥐어준 CLI가 몇 개냐로 결정돼요.

3초 요약
에이전트 = LLM + 손(도구) 손의 정체 = CLI bash·Stripe·Playwright를 끼우면 할 수 있는 일이 폭발 그 손을 미리 장착한 CLI 에이전트 15개 중 고르기

왜 하필 CLI인가 — 텍스트가 텍스트를 부린다

Ben Tossell(Ben's Bites)이 에이전트의 정체를 한 문장으로 못 박았어요: "에이전트는 도구를 쓸 수 있는 LLM이다. 답변만 하는 게 아니라 실제로 뭔가를 할 수 있다." 여기서 핵심은 '도구'예요. 그리고 그 도구의 가장 기본 형태가 CLI고요.

CLI가 에이전트와 궁합이 완벽한 이유는 단순해요. 에이전트는 텍스트를 읽고 텍스트를 뱉는 기계인데, CLI도 텍스트로 명령하고 텍스트로 응답하거든요. 버튼도 마우스도 필요 없어요. 에이전트 입장에서 CLI는 '말이 통하는 도구'인 거예요. 사람에겐 불친절한 검은 화면이, 에이전트에겐 가장 편한 인터페이스죠.

가장 기본이 되는 손은 bash — 거의 모든 컴퓨터에 기본 탑재된 범용 명령줄이에요. 위의 사진 정리 작업도 사실 bash 명령 몇 개의 조합이에요:

ls로 파일을 훑고 → mogrify로 1200x1200 리사이즈하고 → mv로 SKU 이름으로 바꾸고 → mkdir로 카테고리 폴더를 만들어 분류. 사람은 이 명령어들을 외우고 조합해야 하지만, 에이전트는 알아서 엮어요.

하지만 bash는 시작일 뿐이에요. 진짜 마법은 목적별로 특화된 CLI를 하나씩 더 끼울 때 일어나요.

손을 하나 더 끼울 때마다 다른 직업이 된다

에이전트에게 새 CLI를 쥐어주는 건, 마치 직원에게 새 자격증을 따게 하는 것과 같아요. bash만 쥔 에이전트는 '파일 정리 알바'지만, Stripe CLI를 붙이면 '경리'가 되고, Playwright를 붙이면 'QA 테스터'가 돼요. 같은 모델이 직업을 바꿔 다는 거예요.

끼우는 CLI에이전트가 새로 얻는 직업구체적으로 할 수 있게 되는 일
bash시스템 잡역부파일 관리, 스크립트 실행, 데이터 일괄 처리
Stripe CLI경리·결제 담당매출 데이터 조회, 구독 관리, 결제 흐름 테스트
PlaywrightQA·웹 자동화웹 탐색, 클릭, 폼 입력, 스크린샷 캡처
AWS CLI인프라 엔지니어서버 생성, DB 관리, 스케일링
Vercel CLI배포 담당빌드한 사이트를 명령 한 줄로 배포

에이전트에게 더 많은 CLI를 쥐어줄수록 할 수 있는 일이 늘어나요. 그래서 진짜 중요한 역량은 '더 똑똑한 모델 찾기'가 아니라, "이 작업엔 어떤 CLI를 쥐어줘야 하지?"를 판단하는 것이에요. 매출 분석을 시키고 싶으면 Stripe CLI를, 경쟁사 가격을 긁어오고 싶으면 Playwright를, 만든 걸 띄우고 싶으면 Vercel CLI를 손에 쥐여주면 돼요. 도구함을 설계하는 사람이 곧 에이전트의 능력을 설계하는 사람이에요.

그래서 등장한 게 'CLI 에이전트'다 — 손이 미리 달려 나오는 제품

여기까지 읽으면 자연스러운 질문이 떠올라요. "그럼 CLI를 누가 다 세팅해주지?" 그 수고를 대신 해주려고 등장한 게 바로 CLI 코딩 에이전트예요. bash·git·파일 접근 같은 기본 손을 미리 장착하고 터미널에서 바로 돌아가는 완제품이죠.

1년 전만 해도 선택지는 "Copilot vs Cursor"가 전부였어요. 그런데 2026년 현재, 터미널에서 작동하는 AI 코딩 에이전트만 15개가 넘어요. 왜 다들 IDE를 버리고 터미널로 갔을까요? 작동 방식 자체가 다르거든요.

IDE 기반 도구 (Cursor 등)CLI 기반 에이전트
작업 방식코드 제안, 자동완성계획 → 실행 → 검증까지 자율
닿는 범위에디터 안 코드만파일·터미널·git·외부 API 전부
자율성한 줄씩 사람이 승인에이전트가 알아서 반복 실행
확장성플러그인 생태계 안에서어떤 CLI든 손으로 추가 가능

핵심은 마지막 줄이에요. IDE 도구는 정해진 플러그인 안에서만 놀지만, CLI 에이전트는 위에서 본 것처럼 아무 CLI나 손으로 끼워 능력을 무한히 늘릴 수 있어요. 그래서 15개나 쏟아진 거고요. Tembo의 비교 분석은 이들을 3개 그룹으로 나눠요.

1/3

빅랩 네이티브

Claude Code(Anthropic), Codex(OpenAI), Gemini CLI(Google), Copilot CLI(GitHub). 자사 모델과의 깊은 통합이 강점.

2/3

독립·스타트업

Amp(Sourcegraph), Aider, Warp, Augment, Droid(Factory). 특화된 워크플로우와 고유 기능이 무기.

3/3

오픈소스·커뮤니티

OpenCode(95K+ 스타), Goose(Block), Crush, Cline, Kilo. 모델 자유도와 확장성이 핵심.

규모로 보면 Aider가 39K+ GitHub 스타에 주당 150억 토큰 처리량으로 가장 큰 사용자 기반을 갖고 있고, OpenCode는 95K+ 스타로 급성장 중이에요. Gemini CLI는 무료 티어(분당 60건, 일 1,000건)로 진입장벽이 가장 낮고요.

그래서 나는 뭘 깔아야 하나 — 3분 결정 가이드

15개를 다 비교할 필요 없어요. 본인이 어느 쪽에 해당하는지만 보면 돼요. 아래 순서대로 자문해보세요.

  1. 이미 한 모델에 올인 중인가?
    그렇다면 네이티브 도구가 마찰이 가장 적어요. Anthropic → Claude Code, OpenAI → Codex, Google → Gemini CLI. 결제·인증이 이미 연결돼 있으니 5분이면 돌려봐요.
  2. 돈은 한 푼도 안 쓰고 시작하고 싶은가?
    Gemini CLI예요. 구글 계정 로그인만으로 하루 1,000건 무료고, 1M 토큰 컨텍스트 윈도우라 대형 코드베이스를 통째로 물려도 버텨요.
  3. 모델을 자유롭게 갈아 끼우고 싶은가?
    Aider 또는 OpenCode. 거의 모든 LLM을 지원하고 오픈소스라 프로그램 자체는 무료예요. 쓰는 모델의 API 비용만 직접 내면 돼요.
  4. 그다음, 목적별 CLI로 손을 늘려라.
    여기가 이 글의 진짜 결론이에요. 어떤 에이전트를 골랐든, 거기에 Stripe CLI·Playwright·Vercel CLI 같은 전문 도구를 추가로 끼우는 순간 할 수 있는 일이 기하급수적으로 늘어요. 도구 선택권이 곧 능력 선택권이에요.

한눈에 보는 선택 치트시트

자율성 높은 게 최우선이면 → Claude Code, Droid, Warp
한 단계씩 사람이 승인하고 싶으면 → Cline(VS Code), Kiro(스펙 기반)
예산이 0원이면 → Gemini CLI, Aider, Goose, OpenCode

정리하면 이래요. 에이전트의 능력 = 모델 × 쥐어준 손의 개수. 모델은 이미 충분히 똑똑해요. 진짜 레버는 "이 일에 어떤 CLI를 끼울까"를 고르는 당신의 판단이에요. 오늘은 위 가이드로 본인에게 맞는 CLI 에이전트 하나만 골라 깔고, bash 작업부터 시켜보세요. 다음 주엔 거기에 손을 하나 더 끼워보고요.