5,000명의 엔지니어에게 AI 코딩 도구를 깔아줬어요. 4개월 뒤, 연간 예산이 바닥났어요. Uber 실화입니다. 2026년 4월에 일어난 일이에요.

3초 요약
AI 코딩 도구 배포 토큰 소비 18.6배 폭증 예산 4개월 만에 소진 라이선스 강제 회수 거버넌스 없이 배포하면 생기는 일

Uber만의 문제인 줄 알았어요

아니에요. Microsoft도 같은 일을 겪었어요. 2025년 12월에 엔지니어들한테 Claude Code를 쥐어줬는데, 6개월 만에 대부분의 라이선스를 취소했어요. 이유는 하나예요. 토큰 기반 청구서가 연간 AI 예산을 예상보다 훨씬 빨리 소진했다는 거였어요.

18.6배
9개월간 개발자 1인당 토큰 소비 증가
$40,000
한 엔지니어의 월 토큰 지출 최고치
68%
개발자당 AI 비용 추적 못 하는 조직 비율

NVIDIA 부사장 Bryan Catanzaro는 이렇게 말했어요. "우리 팀에서 컴퓨팅 비용은 이미 직원 급여를 훨씬 초과했다." 벤처 투자자 Jason Calacanis는 자기 조직의 Claude API 에이전트 비용이 하루 $300, 연환산 $109,500에 달한다고 밝혔어요. 어지간한 직원 연봉 수준이에요.

Uber는 그게 어떻게 된 걸까요. 5,000명 엔지니어에게 Claude Code를 배포했고, 채택률은 2월 32%에서 3월 84%까지 치솟았어요. 코드의 70%가 AI에서 나왔고, 생산성 지표는 올라갔어요. 근데 COO Andrew Macdonald가 이렇게 말했어요. "소비자 제품에 직선으로 연결하기가 굉장히 어렵다. 그 연결이 아직은 없다."

왜 토큰은 쌀수록 더 비싸질까요?

역설처럼 들리죠. 근데 이게 실제로 일어나는 일이에요. Goldman Sachs는 2030년까지 토큰 소비가 24배 증가할 거라고 전망해요. 같은 기간 토큰 단가는 90% 떨어질 거라고 하는데요 — 그래도 전체 비용은 올라간다는 얘기예요.

이유는 두 가지예요. 첫째, 에이전틱 AI는 같은 작업에 토큰을 10배 이상 써요. 챗봇처럼 한 번 묻고 답하는 게 아니라, 계획을 세우고, 코드를 쓰고, 검증하고, 수정하고 — 이 루프를 반복하거든요. 둘째, 토큰이 싸면 더 많이 쓰게 돼요. 경제학에서 제번스 역설이라고 부르는 현상이에요. 석탄 엔진 효율이 올라가자 석탄 소비가 오히려 늘었던 것처럼요.

OpenAI가 대화 주제를 바꿨어요

OpenAI의 Alexander Embiricos가 이렇게 말했어요. "기업 고객과의 대화가 이제 역량 얘기가 전혀 아니에요. 지출 가시성, 감사 추적, 토큰 통제, 모델 효율 — 이게 전부예요."

Faros AI 연구에서 흥미로운 사실이 나왔어요. 토큰을 가장 많이 쓰는 엔지니어들이 생산성은 약 2배 높았어요. 근데 소비한 토큰은 10배였어요. 생산성이 오른 건 맞는데, 비용은 훨씬 더 올랐다는 거예요. 게다가 버그 발생률과 리라이트 빈도도 같이 올랐어요. ROI 계산이 복잡해지는 이유예요.

거버넌스 없는 배포 거버넌스 있는 배포
비용 예측 85%가 목표 대비 10%+ 초과 60~80% 절감 가능
가시성 68%가 개발자별 비용 추적 불가 팀·프로젝트·모델별 실시간 집계
모델 선택 모두 프리미엄 모델 기본 사용 태스크 복잡도에 따라 자동 라우팅
한도 설정 12%만 예산·차지백 구현 팀·개인별 소비 한도 및 알림

지금 당장 시작하는 토큰 거버넌스 3단계

기업 예산이 새는 걸 막으려면 도구를 끊는 게 아니라 통제하면 돼요. Cursor가 2026년 6월 3일에 출시한 Organizations 기능이 정확히 이 문제를 겨냥해요. Linux Foundation 산하 Tokenomics Foundation도 2026년 7월 공식 출범해 오픈 표준을 만들고 있어요.

  1. 토큰 가시성 확보: 팀별 실시간 대시보드부터
    월 청구서가 아닌 실시간 대시보드로 팀·프로젝트·모델별 소비를 추적해요. Datadog, New Relic, Pay-i 같은 도구가 이걸 해줘요. Cursor Organizations는 조직 전체 지출을 단일 대시보드에서 확인해줘요. 첫 달 데이터만 쌓아도 어디서 새는지가 눈에 들어와요.
  2. 모델 라우팅: 작업 복잡도에 맞게 분류해요
    단순 요약·반복 작업은 저렴한 모델($0.04~0.10/M 토큰)로, 복잡한 멀티파일 작업만 프리미엄 모델($100~180/M)로 라우팅해요. 토큰 단가 차이는 최대 4,500배예요. 이것만으로 비용의 60~80%를 줄일 수 있어요. 팀 기능별로도 분리해요 — 엔지니어링·프로덕트는 최고 모델, 마케팅·재무는 제한된 접근으로.
  3. 예산 한도 설정: 팀·개인별 소비 캡을 명시해요
    Chamath Palihapitiya가 말했어요. 한도 없이 배포하면 비용이 폭발하고, 에이전트가 다른 직원 대비 최소 2배 생산성을 증명해야 한다고요. API 키 수준에서 소비 한도를 설정하고, 초과 시 알림 → 차단 흐름을 만들어요. Cursor Enterprise라면 그룹·팀·조직 3단계 예산 계층이 기본 제공돼요.

아직 통제 시스템 없이 배포 중이라면

한 의료기업이 6개월 동안 1조 토큰을 소비해 $600만 이상의 예상 외 비용이 발생했어요. 한도 없이 에이전트를 풀어놓으면 이게 현실이에요. "일단 배포하고 나중에 통제"는 이 경우 통하지 않아요.