AI 토큰 하나의 가격이 3년 만에 1,000분의 1이 됐어요. GPT-3 시대에 100만 토큰당 60달러 하던 게, 지금은 동급 성능 모델이 0.06달러에 불과해요.

그런데 기업들의 AI 청구서는 3배나 올랐어요. 값이 내려갔는데 지출이 늘었다 — 이 역설의 이름이 있어요. 1865년 영국 경제학자 윌리엄 스탠리 제번스가 석탄 효율이 높아지면 오히려 석탄 소비가 급증한다는 걸 발견했거든요. 그걸 지금 AI에서 우리가 보고 있는 거예요.

3초 요약
지능 비용 1,000배 붕괴 사용량 50~500배 폭증 중국이 가격 전쟁 가속 제번스 역설 작동 새 경쟁 법칙

다들 이렇게 알고 있었죠

"AI 비용이 내려가면 우리 AI 청구서도 줄겠지." 당연한 말 같잖아요. 토큰값이 절반으로 내려가면 같은 일을 절반 값에 할 수 있을 거라고.

1,000x
AI 추론 비용 하락 (2021→2024)
320%
기업 AI 지출 증가 (2024→2025)
3x
평균 기업 AI 청구서 증가

실제 데이터는 정반대예요. 기업 AI 지출은 2024년 115억 달러에서 2025년 370억 달러로 320%나 올랐어요. 토큰 단가가 1,000배 떨어지는 동안에요.

마크 안드레센은 a16z 팟캐스트에서 이렇게 말했어요: AI는 "내 평생 경험한 가장 큰 기술 혁명"이라고요. 동시에 "지능의 단위 비용이 무어의 법칙을 초과하는 속도로 붕괴하고 있다"고 진단했어요. 근데 동시에 "시장은 아직 매우 초기 단계다"라고도 했죠.

이 두 문장이 같이 읽혀야 해요. 비용이 내려가면 수요가 폭발한다는 게 제번스 역설의 핵심이니까요. 에이전트 워크플로우 하나가 단순 채팅보다 토큰을 50배에서 500배 더 써요. 저렴해진 토큰으로 더 복잡한 일을 시키게 되고, 그러면 더 많은 토큰이 필요해지는 구조예요. 실제로 AI 비용의 72%가 모델 인보이스 밖에 있는 오케스트레이션·재시도·모니터링 비용이에요.

중국이 가격 전쟁에 불을 질렀다

여기에 변수가 하나 더 있어요. 중국이에요.

안드레센은 팟캐스트에서 "DeepSeek이 실리콘밸리를 놀라게 했다"고 인정했어요. 실제로 DeepSeek, Kimi(Moonshot AI), Qwen(Alibaba), ByteDance 모델들이 Claude 3.5 Sonnet, GPT-4o와 거의 동급 벤치마크를 달성했거든요 — 출시 12개월 만에.

미국 최상위 모델 중국 최상위 모델
종합 벤치마크 Claude Opus 4.6 — 88점 DeepSeek V4 Pro — 87점
코딩 점수 Claude: 93.9% (SWE-Bench) DeepSeek: 91.2% (SWE-Bench)
API 단가 차이 기준 (100%) 약 10~13배 저렴
오픈소스 여부 폐쇄형 오픈 가중치, 자체 호스팅 가능

성능 차이는 벤치마크 기준 5~7% 수준인데, 비용 차이는 10배가 넘어요. 안드레센은 이걸 "오픈소스 전략으로 글로벌 가격 경쟁을 재편하고 있다"고 봐요.

중국 AI 개발자 연령대도 눈여겨볼 포인트예요. 안드레센이 언급한 대로, 주요 연구자들이 22~24세거든요. 경험이 없다는 게 아니라, 기존 패러다임에 대한 선입견도 없다는 말이에요. 이 팀들이 GPU 효율을 극도로 최적화해서 미국보다 저렴한 비용으로 동급 성능을 냈어요.

a16z 전망대로라면, 현재의 GPU 부족 상황은 향후 5년 안에 과잉공급으로 전환될 거예요. 빅테크들이 자체 칩을 만들고, AMD·중국 기업들이 대규모 생산에 들어가면서요. 그때 AI 단위 비용은 지금보다도 훨씬 더 내려가요.

안드레센의 핵심 주장

AI가 "내 평생 경험한 가장 큰 기술 혁명"이고, 인터넷보다 크며 전기·마이크로프로세서와 비견된다고 했어요. 근데 동시에 시장은 "아직 매우 초기"라고 했죠. 수억 명이 ChatGPT를 쓰는데도 초기라는 게 뭔 말이냐 — 지금의 제품 형태가 아직 미성숙하다는 거예요. 제번스 역설이 제대로 작동하려면 아직 훨씬 더 많은 사용 사례가 나와야 한다는 뜻이기도 해요.

지금 당장 당신 비즈니스에서 점검할 것

  1. AI 지출 구조 분리해서 보기
    모델 API 비용과 그 외 비용을 나눠서 보세요. 실제 AI 비용의 72%가 모델 인보이스 밖에 있어요 — 오케스트레이션·재시도·모니터링 비용이에요. 청구서가 이상하게 많이 나온다면 여기를 먼저 보세요.
  2. 에이전트 도입 전 토큰 소비 시뮬레이션
    에이전트 워크플로우는 단순 채팅보다 50~500배 더 토큰을 써요. 소규모 파일럿을 먼저 돌려서 태스크당 실제 토큰 소비량을 측정하고, 그걸 기준으로 예산을 잡으세요.
  3. 오픈소스·중국 모델 A/B 테스트
    DeepSeek V4 Pro는 최상위 미국 모델과 성능 차이는 5~7%인데 API 단가가 10~13배 저렴해요. 전면 교체보다 특정 워크플로우에서 A/B로 비교해보세요. 자체 호스팅도 가능해요.
  4. 월별 AI 예산 상한선 설정
    Uber가 연간 AI 예산을 4개월 만에 소진하고 직원당 월 $1,500 캡을 걸었어요. 제번스 역설을 알면서도 명시적 예산 상한이 없으면 지출은 계속 늘어요. 팀·기능 단위로 상한선을 먼저 설정하세요.
  5. 절약분을 새 자동화 투자로 전환
    토큰값 하락으로 생기는 절약분을 비용 절감으로 잡지 말고, 새로운 워크플로우 자동화에 재투자하세요. 제번스 역설을 방어가 아닌 공격에 쓰는 거예요. 지금 기획하지 않으면 경쟁사가 먼저 그 우위를 가져가요.