img.36krcdn.com

AI 값이 1,000분의 1이 됐는데 청구서는 3배 올랐다 — 제번스 역설이 바꾼 경쟁 법칙

AI 가격 붕괴, 제번스 역설, 마크 안드레센, 미중 AI 경쟁, 지능 비용 하락, DeepSeek프롬프트 & 전략

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses

AI 토큰 하나의 가격이 3년 만에 1,000분의 1이 됐어요. GPT-3 시대에 100만 토큰당 60달러 하던 게, 지금은 동급 성능 모델이 0.06달러에 불과해요.

그런데 기업들의 AI 청구서는 3배나 올랐어요. 값이 내려갔는데 지출이 늘었다 — 이 역설의 이름이 있어요. 1865년 영국 경제학자 윌리엄 스탠리 제번스가 석탄 효율이 높아지면 오히려 석탄 소비가 급증한다는 걸 발견했거든요. 그걸 지금 AI에서 우리가 보고 있는 거예요.

3초 요약

지능 비용 1,000배 붕괴 → 사용량 50~500배 폭증 → 중국이 가격 전쟁 가속 → 제번스 역설 작동 → 새 경쟁 법칙

다들 이렇게 알고 있었죠

"AI 비용이 내려가면 우리 AI 청구서도 줄겠지." 당연한 말 같잖아요. 토큰값이 절반으로 내려가면 같은 일을 절반 값에 할 수 있을 거라고.

1,000x

AI 추론 비용 하락 (2021→2024)

320%

기업 AI 지출 증가 (2024→2025)

평균 기업 AI 청구서 증가

실제 데이터는 정반대예요. 기업 AI 지출은 2024년 115억 달러에서 2025년 370억 달러로 320%나 올랐어요. 토큰 단가가 1,000배 떨어지는 동안에요.

마크 안드레센은 a16z 팟캐스트에서 이렇게 말했어요: AI는 "내 평생 경험한 가장 큰 기술 혁명"이라고요. 동시에 "지능의 단위 비용이 무어의 법칙을 초과하는 속도로 붕괴하고 있다"고 진단했어요. 근데 동시에 "시장은 아직 매우 초기 단계다"라고도 했죠.

이 두 문장이 같이 읽혀야 해요. 비용이 내려가면 수요가 폭발한다는 게 제번스 역설의 핵심이니까요. 에이전트 워크플로우 하나가 단순 채팅보다 토큰을 50배에서 500배 더 써요. 저렴해진 토큰으로 더 복잡한 일을 시키게 되고, 그러면 더 많은 토큰이 필요해지는 구조예요. 실제로 AI 비용의 72%가 모델 인보이스 밖에 있는 오케스트레이션·재시도·모니터링 비용이에요.

중국이 가격 전쟁에 불을 질렀다

여기에 변수가 하나 더 있어요. 중국이에요.

안드레센은 팟캐스트에서 "DeepSeek이 실리콘밸리를 놀라게 했다"고 인정했어요. 실제로 DeepSeek, Kimi(Moonshot AI), Qwen(Alibaba), ByteDance 모델들이 Claude 3.5 Sonnet, GPT-4o와 거의 동급 벤치마크를 달성했거든요 — 출시 12개월 만에.

	미국 최상위 모델	중국 최상위 모델
종합 벤치마크	Claude Opus 4.6 — 88점	DeepSeek V4 Pro — 87점
코딩 점수	Claude: 93.9% (SWE-Bench)	DeepSeek: 91.2% (SWE-Bench)
API 단가 차이	기준 (100%)	약 10~13배 저렴
오픈소스 여부	폐쇄형	오픈 가중치, 자체 호스팅 가능

성능 차이는 벤치마크 기준 5~7% 수준인데, 비용 차이는 10배가 넘어요. 안드레센은 이걸 "오픈소스 전략으로 글로벌 가격 경쟁을 재편하고 있다"고 봐요.

중국 AI 개발자 연령대도 눈여겨볼 포인트예요. 안드레센이 언급한 대로, 주요 연구자들이 22~24세거든요. 경험이 없다는 게 아니라, 기존 패러다임에 대한 선입견도 없다는 말이에요. 이 팀들이 GPU 효율을 극도로 최적화해서 미국보다 저렴한 비용으로 동급 성능을 냈어요.

a16z 전망대로라면, 현재의 GPU 부족 상황은 향후 5년 안에 과잉공급으로 전환될 거예요. 빅테크들이 자체 칩을 만들고, AMD·중국 기업들이 대규모 생산에 들어가면서요. 그때 AI 단위 비용은 지금보다도 훨씬 더 내려가요.

안드레센의 핵심 주장

AI가 "내 평생 경험한 가장 큰 기술 혁명"이고, 인터넷보다 크며 전기·마이크로프로세서와 비견된다고 했어요. 근데 동시에 시장은 "아직 매우 초기"라고 했죠. 수억 명이 ChatGPT를 쓰는데도 초기라는 게 뭔 말이냐 — 지금의 제품 형태가 아직 미성숙하다는 거예요. 제번스 역설이 제대로 작동하려면 아직 훨씬 더 많은 사용 사례가 나와야 한다는 뜻이기도 해요.

지금 당장 당신 비즈니스에서 점검할 것

AI 지출 구조 분리해서 보기
모델 API 비용과 그 외 비용을 나눠서 보세요. 실제 AI 비용의 72%가 모델 인보이스 밖에 있어요 — 오케스트레이션·재시도·모니터링 비용이에요. 청구서가 이상하게 많이 나온다면 여기를 먼저 보세요.
에이전트 도입 전 토큰 소비 시뮬레이션
에이전트 워크플로우는 단순 채팅보다 50~500배 더 토큰을 써요. 소규모 파일럿을 먼저 돌려서 태스크당 실제 토큰 소비량을 측정하고, 그걸 기준으로 예산을 잡으세요.
오픈소스·중국 모델 A/B 테스트
DeepSeek V4 Pro는 최상위 미국 모델과 성능 차이는 5~7%인데 API 단가가 10~13배 저렴해요. 전면 교체보다 특정 워크플로우에서 A/B로 비교해보세요. 자체 호스팅도 가능해요.
월별 AI 예산 상한선 설정
Uber가 연간 AI 예산을 4개월 만에 소진하고 직원당 월 $1,500 캡을 걸었어요. 제번스 역설을 알면서도 명시적 예산 상한이 없으면 지출은 계속 늘어요. 팀·기능 단위로 상한선을 먼저 설정하세요.
절약분을 새 자동화 투자로 전환
토큰값 하락으로 생기는 절약분을 비용 절감으로 잡지 말고, 새로운 워크플로우 자동화에 재투자하세요. 제번스 역설을 방어가 아닌 공격에 쓰는 거예요. 지금 기획하지 않으면 경쟁사가 먼저 그 우위를 가져가요.

🔗

더 깊이 파고 싶다면

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI

안드레센 본인의 전망을 1시간 21분 분량으로 직접 들을 수 있는 a16z AMA 팟캐스트

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing

36kr의 영문 인터뷰 정리 — 비용 붕괴와 중국 AI 부상에 대한 핵심 발언을 확인할 수 있어요

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses

GPU 과잉공급 전환 예측과 AI 칩 시장 구조 변화를 다룬 36kr 분석

The Inference Cost Paradox: Why Generative AI Spending Surged 320% Despite Per-Token Costs Dropping 1,000x

제번스 역설이 AI에서 어떻게 작동하는지 수치로 파고드는 데이터 분석

AI Token Cost Over Time: Down 99.7%, Bills Up 3x

토큰 단가 하락과 청구서 증가 역설을 데이터로 정리한 NavyaAI 리포트

Best Chinese LLMs in 2026: DeepSeek V4, Kimi K2.6, Qwen and Every Model Ranked

중국 AI 모델 벤치마크 비교와 미국 모델 대비 성능·비용 분석

자주 묻는 질문

제번스 역설이 정확히 뭔가요?

1865년 영국 경제학자 윌리엄 스탠리 제번스가 발견한 원리예요. 석탄 효율이 높아져서 석탄 사용이 줄 것 같지만, 오히려 석탄 수요가 폭증했거든요. 비용이 낮아질수록 더 많이 사용하게 되고 총 지출이 오히려 늘어나는 역설이에요. AI에서는 토큰값이 내려갈수록 더 많은 에이전트 워크플로우를 돌리게 돼서, 총 AI 청구서가 올라가는 패턴으로 나타나요.

중국 AI 모델을 프로덕션에 써도 안전한가요?

데이터 보안과 규정 준수 관점에서 확인이 필요해요. DeepSeek 등 중국 모델은 오픈 가중치이기 때문에 자체 서버에 호스팅하면 중국 기업과 데이터를 공유하지 않아도 돼요. 단, 의료·금융·정부 데이터가 포함된 경우라면 법무팀과 먼저 검토하세요. 민감하지 않은 워크플로우에서 A/B 테스트부터 시작하는 게 현실적이에요.

AI 예산이 계획보다 빠르게 불어날 때 가장 먼저 볼 곳은요?

모델 API 청구서가 아닌 그 외 비용을 먼저 보세요. 실제 AI 비용의 72%가 오케스트레이션·재시도·모니터링 같은 인프라 비용이에요. 에이전트 워크플로우가 있다면 태스크당 실제 토큰 소비량을 측정해보세요. 예상보다 50~500배 더 쓰고 있을 가능성이 높아요.

GPU 부족이 5년 안에 과잉공급으로 바뀐다는 게 실제로 가능한 얘기인가요?

안드레센과 a16z의 전망이에요. 논리적 근거는 있어요 — 빅테크들이 자체 AI 칩을 만들고 있고(Meta MTIA, Google TPU, Microsoft Maia 등), AMD와 중국 기업들도 GPU 대안 생산을 늘리고 있거든요. 역사적으로 기술 인프라는 초기 부족 → 대규모 투자 → 과잉공급 패턴을 반복해왔어요. 정확한 타임라인은 알 수 없지만, 방향성 자체는 업계 공감대가 있어요.