他们向5,000名工程师部署了AI编码工具。四个月后,年度预算耗尽了。 这是Uber的真实故事。发生在2026年4月。
不只是Uber一家的问题
Microsoft也经历了同样的事。2025年12月他们给工程师提供了Claude Code,六个月后却取消了大多数许可证。 原因很简单:基于Token的账单比预期更快耗尽了年度AI预算。
NVIDIA副总裁Bryan Catanzaro直接说:"在我的团队,计算成本已经远超员工薪资。" 风险投资人Jason Calacanis透露,他们组织的Claude API代理成本每天达到$300,年化$109,500。 相当于一个员工的年薪了。
Uber是怎么走到这一步的?他们向5,000名工程师部署了Claude Code,采用率从2月的32%飙升到3月的84%。 大约70%的提交代码来自AI。生产力指标看起来不错。但COO Andrew Macdonald说:"和消费者功能的直接联系还不明显。"
为什么Token越便宜总成本反而越高
听起来像悖论,但这确实正在发生。高盛预测到2030年Token消耗将增长24倍。 同期Token单价可能下降90%,但总成本仍然会上升。
原因有两个。第一,智能体AI执行同样的任务需要多10倍的Token。 它不是简单的一问一答,而是规划、写代码、验证、修改——不断循环。第二,Token越便宜用得越多。经济学称之为杰文斯悖论:当煤炭发动机效率提高时,煤炭消耗反而增加了。
OpenAI改变了对话主题
OpenAI的Alexander Embiricos说:"我们与企业客户的对话现在完全不谈能力了。现在谈的是支出可见性、审计追踪、Token控制和模型效率。"
Faros AI的研究揭示了一个有趣的事实。使用Token最多的工程师生产力约高出2倍。但他们消耗的Token是10倍。 生产力提升了,但成本提升得更多。而且bug发生率和重写频率也同步上升。这就是ROI计算复杂的原因。
| 无治理部署 | 有治理部署 | |
|---|---|---|
| 成本可预测性 | 85%超出目标10%以上 | 可降低60~80% |
| 可见性 | 68%无法追踪每位开发者成本 | 按团队、项目、模型实时汇总 |
| 模型选择 | 所有人默认使用高端模型 | 按任务复杂度自动路由 |
| 限额设置 | 仅12%实施了预算/成本回收 | 按团队和个人设置消费上限及告警 |
现在就能开始的3步Token治理框架
阻止预算泄漏的方法不是停用工具,而是控制它们。Cursor于2026年6月3日推出的Organizations功能正是针对这个问题。 Linux Foundation旗下的Tokenomics Foundation也将于2026年7月正式成立,制定开放标准。
- 首先建立可见性:团队级实时仪表板
从月度账单转向按团队、项目、模型实时追踪消耗的仪表板。Datadog、New Relic、Pay-i等工具可以实现这一点。 Cursor Organizations提供单一仪表板查看整个组织的支出。 积累一个月的数据通常就能清楚看出钱花在哪了。 - 模型路由:按任务复杂度分类
简单摘要和重复性工作路由到低价模型($0.04~0.10/M Token),只有复杂的多文件工作才使用高端模型($100~180/M)。 最便宜和最贵模型之间的单价差距高达4,500倍。 仅此一项就能削减60~80%的成本。也可以按团队职能分层——工程和产品使用最高端模型,市场和财务使用受限访问。 - 设置预算上限:明确团队和个人消费限额
Chamath Palihapitiya的规则:没有限额的部署会导致成本爆炸,代理需要证明至少比其他员工高出2倍的生产力才能证明其价值。 在API密钥级别设置消费上限,建立超额告警→封锁流程。Cursor Enterprise标配三层预算层级(组、团队、组织)。
如果还在没有控制系统的情况下运行
某医疗企业6个月内消耗了1万亿Token,产生了超过$600万的意外成本。 这就是无限制代理部署的现实。"先部署后治理"在这里行不通。
想深入了解?
The token bill comes due TechCrunch对AI编码成本危机的行业深度报道 techcrunch.com
Uber burned its AI budget in 4 months — COO questions ROI Uber COO亲述AI支出与ROI脱节的困境 fortune.com
AI Token Cost Enterprise: Stop Budget Blowouts in 2026 企业Token治理框架与模型路由策略实战指南 elvex.com
Cursor Organizations: Govern Enterprise AI Coding at Scale Cursor三层治理架构详解 digitalapplied.com
Microsoft Cancels Claude Code Licenses, Pushes Engineers to Copilot CLI Microsoft取消Claude Code的来龙去脉与成本对比 opentools.ai
.png)



