한 대만 개발자가 Hacker News에 올린 한 줄이 화제예요. "제 LLM 비용은 $0입니다." 농담이 아니에요. AI 에이전트 4개가 그의 1인 회사에서 콘텐츠를 쓰고, 영업 리드를 캐고, 보안 스캔을 돌리고, 운영을 관리해요. 27개 소셜 계정, 누적 330만 뷰. 그런데 LLM에 들어가는 돈은 정말로 0원이에요.

대부분의 "AI 자동화로 월 얼마 벌었다" 글은 비용 칸을 슬쩍 비워둬요. 막상 따라 해보면 OpenAI 청구서가 월 수십~수백 달러씩 나오죠. 이 사례가 다른 건, 비용이 진짜로 0에 수렴하는 설계를 공개했다는 점이에요. 그리고 그 핵심은 의외로 단순해요.

3초 요약
창작만 LLM, 수집은 전부 HTTP Gemini 무료 티어 + 1요청=1결과 일 105건으로 한도 7%만 소진 에이전트 4개로 27개 계정 운영

비밀은 "LLM을 안 쓰는 곳"에 있다

보통 우리는 AI 에이전트를 만들 때 모든 단계에 LLM을 부르고 싶은 유혹에 빠져요. RSS 읽기도 LLM, 웹페이지 파싱도 LLM, 요약도 LLM, 작성도 LLM. 그렇게 토큰이 새어 나가요.

Bo Liu의 설계 원칙은 정반대예요. "LLM은 창작에만 쓰고, 데이터 수집은 전부 HTTP로 처리한다." RSS 피드, Hacker News 크롤링, 웹 스크래핑 — 이 리서치 파이프라인은 토큰을 단 한 개도 쓰지 않아요. Jina Reader 같은 도구로 순수 HTTP 호출만 하고, 결과를 로컬 마크다운으로 차곡차곡 정리해 둬요. LLM은 그 정리된 재료를 받아 "판단"하고 "생성"하는, 사람으로 치면 가장 비싼 두뇌 노동만 담당해요.

이 구분 하나가 비용 구조를 통째로 바꿔요. 무료 티어의 빠듯한 한도 안에서도 여유가 넘치는 이유죠. Gemini 2.5 Flash의 일일 무료 한도 1,500건 중, 이 회사는 하루 105건만 써요. 한도의 93%가 매일 그대로 남아요.

$0
월 LLM 비용
27
자동 운영 소셜 계정
3.3M+
누적 조회수
~$5
월 인프라 비용

$127짜리 함정: 그도 한 번 당했다

여기서 가장 비싼 교훈을 짚고 갈게요. Bo Liu도 처음엔 청구서를 받았어요. $127. 무료 티어를 쓴다고 믿었는데, 알고 보니 GCP 빌링 계정에 연결된 API 키를 실수로 쓰고 있었던 거예요.

함정은 미묘해요. 같은 Gemini 2.5 Flash 모델이라도, 키를 어디서 만들었느냐에 따라 공짜냐 유료냐가 갈려요. Google AI Studio에서 발급한 키는 무료, GCP 콘솔에서 만든 키는 유료. 모델 이름이 똑같으니 구분이 안 가고, 그래서 한순간에 수백 달러가 빠져나갈 수 있어요.

무료 티어의 진짜 리스크

Gemini 무료 티어는 Google AI Studio에서 생성한 키만 무료예요. GCP 콘솔에서 만든 키는 동일 모델이라도 과금돼요. 시작 전에 키 출처를 반드시 확인하고, 무료 티어는 상업적 사용에 제한이 있을 수 있으니 서비스 약관도 짚어보세요.

에이전트 4개는 각각 무슨 일을 하나

"AI가 1인 회사를 운영한다"는 말은 추상적으로 들리지만, 실제로는 역할이 또렷이 쪼개진 4개의 일꾼이에요. OpenClaw(오픈소스 AI 에이전트 플랫폼)를 기반으로 WSL2 위에서 돌고, 스케줄링은 외부 크론 서비스 없이 systemd 타이머 25개로 처리해요.

에이전트 맡은 직무 실제 하는 일
콘텐츠 소셜 포스트 생성 일 8개 포스트, 셀프 리뷰로 품질 게이팅
영업 잠재 고객 발굴 보안 스캔으로 리드 생성, 고객 데이터 동기화
보안 취약점 스캐닝 잠재 고객 사이트 분석, 리포트 생성
운영 일상 관리 엔드포인트 모니터링, 데이터 싱크

영업 에이전트가 영리해요. 보안 스캔으로 "취약점이 있는 사이트"를 찾아내고, 그게 곧 잠재 고객이 돼요. 발굴과 가치 제안(보안 리포트)이 같은 파이프라인에서 나오는 구조죠. 한 명이 4개 직무를 다 굴리는 게 아니라, 4개의 좁고 깊은 일꾼이 각자 한 가지만 잘하게 설계한 거예요.

당신의 노트북에서 따라 하는 법

거창한 인프라가 필요한 일이 아니에요. 순서대로 가면 돼요.

  1. 키부터 올바르게 발급
    Google AI Studio(ai.google.dev)에서 무료 API 키를 만드세요. 반드시 AI Studio에서 — GCP 콘솔이 아니라요. ($127 함정을 다시 떠올리세요.) 일일 1,500건이 무료고 Gemini 2.5 Flash를 쓸 수 있어요.
  2. 데이터 수집을 LLM에서 떼어내기
    이게 비용을 0으로 만드는 핵심이에요. RSS 수집, 웹 스크래핑, API 호출은 LLM 없이 Python의 requests·feedparser·Jina Reader로 순수 HTTP 처리하세요. LLM 토큰은 오직 판단과 생성에만 쓰는 거예요.
  3. "1요청 = 1결과" 패턴 적용
    무료 티어의 RPM 30 제한을 이기는 방법이에요. 미리 수집한 데이터를 로컬 마크다운으로 정리해 두고, LLM 호출 때 모든 컨텍스트를 한 번에 주입해서 한 번의 응답으로 끝내세요. 멀티턴 대화는 시간과 한도를 둘 다 낭비해요.
  4. OpenClaw(또는 유사 플랫폼) 세팅
    오픈소스 AI 에이전트 플랫폼이에요. WSL2·Docker·서버 어디든 설치하고 Gemini API를 연결하면 에이전트가 돌아가요. 단, 프로덕션 수준까지 끌어올리려면 상당한 커스터마이징이 필요하다는 점은 Bo Liu도 솔직히 인정했어요.
  5. 에이전트 하나로 시작해서 늘리기
    처음부터 4개를 만들지 마세요. 콘텐츠 에이전트 하나 — "RSS에서 트렌딩 토픽 수집 → Gemini로 초안 → 셀프 리뷰 → 소셜 포스팅" — 이 파이프라인 하나가 안정되면, 그때 다음 일꾼을 붙이세요.
토큰을 아끼는 진짜 기술은 "더 싼 모델"을 찾는 게 아니라, "LLM을 부르지 않아도 되는 곳"을 찾는 거예요. 비용 0의 비결은 모델이 아니라 아키텍처에 있었어요.