Uber CTO 在 The Information 的采访里轻描淡写地说了一句:"我原本预估需要的预算,已经全部烧光了(blown away already)。"

2026年1月到4月,短短4个月,这家研发预算35亿美元公司的全年 AI 预算就被消耗殆尽。罪魁祸首是 Claude Code。但这不是"AI 太贵"的故事 — 这是激励机制制造 token 暴涨的故事。其他所有公司,正在朝着同一个方向狂奔。

这是什么?

Uber CTO Praveen Neppalli Naga 在 The Information 上正式承认 — 2026年全年的 AI 预算,4月就已经花光了。运营数据的关键数字也一并曝光 —

  • Uber 工程师中 95% 每月使用 AI 编码工具,84% 被归类为"agentic coding 用户"
  • 提交代码中 70% 由 AI 生成,后端线上代码变更里 11% 由 AI agent 自动撰写
  • 每周 1,800 次代码变更出自 AI
  • 对比 2024 年,AI 成本约增长 6 倍,2025 年 R&D 支出 34 亿美元(同比 +9%)
  • Cursor 渗透停滞,Claude Code 实际成为公司内部标准

但同期 Uber 的 R&D 支出涨幅只有 9%。代码 70% 来自 AI,产出却只增长 9%,那剩下的 token 都去哪了? Om Bharatiya 的分析是 — 一部分发布上线了,一部分是探索性尝试,一部分则是"摩擦降到 0 之后,本来不该写的代码也写了"。

为什么真正的原因是治理?

Uber 做过的所有决定里,最致命的一个就是内部排行榜。把工程师按 AI 用量从高到低排序。

这为什么是问题 — 这就像把销售团队按"打了多少通电话"评分,而不是按"成交了多少单"。一旦把消费当成优化目标,飙升的就不是价值,而是消费本身。同期 Meta 也搞了个内部仪表盘叫"Claudeonomics",追踪 8.5 万员工的 token 使用量。结果数据出来 —— 有一个人在 30 天里烧了 281B token(约 140 万美元),Meta 两天内就关掉了仪表盘。 不是因为数据错了,而是因为太尴尬了。

维度 Uber(消费最优化) 务实的治理方案
预算模型 全公司共享池 按团队·按用例分配
模型路由 清一色顶配模型 按任务分流(代码评审=Sonnet,样板代码=Haiku)
衡量指标 "使用 AI 的工程师占比" 每个 sprint 的 PR 数、AI 代码 bug 率、部署时长
激励机制 token 用量排行榜 取消排行榜 + 按结果评估
降本杠杆 提示词缓存(-90%)+ 批处理 API(-50%)

Uber 表示 4 月起正在转向"agent engineers"模式 — AI 全程负责编码、测试、部署,人类只扮演调度者(orchestrator)的角色。同时也在评估引入 OpenAI Codex。 但更大的问题在另一个层面 —

上手指南

  1. 立刻砍掉排行榜
    停止衡量"AI 工具使用率"。这是 vanity metric(虚荣指标),一旦开始量化就会被游戏化。
  2. 按团队设 token 预算 + 告警
    不要全公司一个池子,要按团队拆分。在 50%/75%/90% 阈值自动告警。和云成本分摊是同一个逻辑。
  3. 引入模型路由层
    代码评审走 Sonnet,样板代码走 Haiku,只在架构推理时上 Opus。能省 5~15 倍成本,而简单任务的质量几乎无差别。
  4. 开启提示词缓存和批处理 API
    Anthropic 的提示词缓存 -90%,批处理 API -50%。企业级工作负载里上下文重复度很高,光这两项就能省 30~50%。
  5. 更换衡量指标
    不要再看"AI 使用率",改看"每 sprint 合并的 PR 数"、"AI 代码 bug 率"、"生产环境部署时长" — 用业务结果打分。

常见问题

(由 FAQSection 自动渲染 — 不写入 content)

深入了解

Project Flux — Blown by April 对 The Information 报道里运营数据的拆解 — 84% 渗透率、11% 线上代码自动写入等数字的整理 projectflux.ai

Om Bharatiya — Uber Blew Its AI Budget in One Quarter 从基础设施和治理视角给出的处方 — 排行榜、模型路由、缓存策略 ombharatiya.com

Yahoo Finance — Uber's Anthropic AI Push Hits a Wall 引用 Naga CTO 原话,内部工具对比(Claude Code vs Cursor) finance.yahoo.com

Hacker News 讨论串 工程师视角的真正原因 — 包括"每位工程师中位支出 1,250 美元"等估算 news.ycombinator.com