单个AI token的价格在三年内下降了1000倍。GPT-3时代每百万token需要60美元,现在同等性能的模型只需0.06美元。

然而企业的AI账单却翻了三倍。价格下跌了,但支出增加了——这个悖论有个名字。1865年,英国经济学家威廉·斯坦利·杰文斯发现,煤炭效率提高并不会减少煤炭消耗,反而会导致消耗急剧增加。现在,我们正在AI领域目睹同样的现象。

3秒摘要
智能成本崩跌1000倍 使用量暴增50~500倍 中国加速价格战 杰文斯悖论发动 新竞争法则诞生

大家原来是这么认为的

"AI成本降低了,我们的AI账单也会减少。"听起来理所当然,对吧?token价格降一半,同样的工作就能以一半的价格完成。

1,000x
AI推理成本下降 (2021→2024)
320%
企业AI支出增加 (2024→2025)
3x
企业AI账单平均涨幅

但实际数据完全相反。企业AI支出从2024年的115亿美元飙升至2025年的370亿美元,增长了320%。而在此期间,token单价却下降了1000倍。

马克·安德森在a16z播客中说AI是"我这辈子经历过的最大技术革命"。他同时说"智能的单位成本正在以超越摩尔定律的速度崩跌"。然后——在同一口气里——他还说"市场还处于非常早期的阶段"。

这两句话需要放在一起读。成本降低时需求会爆炸式增长——这就是杰文斯悖论的核心。一个智能体工作流消耗的token比简单对话多50到500倍。更便宜的token让更复杂的任务变得可行,而这又需要更多的token。实际上,AI成本的72%并不在模型账单里,而是在编排、重试和监控的费用中。

中国点燃了价格战

这个方程式还有另一个变量:中国。

安德森在播客中坦承"DeepSeek让硅谷震惊了"。数据也证实了这一点——DeepSeek、Kimi(月之暗面)、Qwen(阿里巴巴)、字节跳动的模型在发布后12个月内就达到了与Claude 3.5 Sonnet、GPT-4o几乎相同的基准分数。

美国顶尖模型 中国顶尖模型
综合基准 Claude Opus 4.6 — 88分 DeepSeek V4 Pro — 87分
编程得分 Claude: 93.9% (SWE-Bench) DeepSeek: 91.2% (SWE-Bench)
API价格差异 基准 (100%) 便宜约10~13倍
开源情况 闭源 开放权重,可自行部署

性能差距在基准测试中只有5~7%,但成本差距超过10倍。安德森认为这是"通过开源策略重塑全球价格竞争"。

中国AI研究人员的年龄层也值得关注。正如安德森提到的,主要研究人员只有22~24岁。这不是说他们没经验,而是他们对现有范式没有任何先入之见。这些团队把GPU效率优化到极致,以比美国更低的成本实现了同等性能。

按照a16z的预测,目前的GPU短缺状况将在五年内转变为供应过剩。随着大型科技公司自研芯片,AMD和中国企业大规模生产,届时AI单位成本将进一步大幅下降。

安德森的核心主张

他将AI称为"我这辈子经历过的最大技术革命",比互联网更大,可与电力和微处理器相提并论。但同时说市场"还处于非常早期"。数亿人在用ChatGPT,怎么还是早期?——他的意思是现有的产品形态还不够成熟。杰文斯悖论要真正发挥作用,还需要涌现出更多的应用场景。

现在就该在你的业务中检查的事项

  1. 拆分AI支出结构来看
    把模型API成本和其他成本分开来看。实际AI成本的72%在模型账单之外——编排、重试、监控的费用。如果账单异常偏高,先从这里入手。
  2. 引入智能体之前模拟token消耗
    智能体工作流比简单对话多消耗50~500倍的token。先跑一个小规模试点,测量每个任务的实际token消耗量,以此为基准制定预算。
  3. 对开源和中国模型进行A/B测试
    DeepSeek V4 Pro与美国顶尖模型的性能差距只有5~7%,但API单价便宜10~13倍。与其全面切换,不如在特定工作流上先做A/B对比。也可以选择自行部署。
  4. 设定月度AI预算上限
    Uber在4个月内就耗尽了全年AI预算,被迫对每位员工设置每月1,500美元的上限。知道杰文斯悖论的存在,但没有明确预算上限,支出就会无止境增长。按团队和功能设定上限。
  5. 把节省的费用转化为新的自动化投资
    不要把token价格下降带来的节省记为成本削减,而是将其再投资于新的工作流自动化。这就是把杰文斯悖论用于进攻而非防御的方法。现在不做规划,竞争对手就会率先抢占这个优势。

想深入了解?

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI 可以直接收听安德森本人81分钟深度分享的a16z AMA播客 a16z.com

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing 36kr英文采访整理——关于成本崩跌和中国AI崛起的核心发言 36kr.com

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses 36kr对GPU供应过剩转变预测和AI芯片市场结构变化的分析 36kr.com

The Inference Cost Paradox: Why Generative AI Spending Surged 320% Despite Per-Token Costs Dropping 1,000x 深入数据分析杰文斯悖论如何在AI领域发挥作用 arturmarkus.com

AI Token Cost Over Time: Down 99.7%, Bills Up 3x NavyaAI整理的token价格下降与账单增加悖论数据报告 navyaai.com

Best Chinese LLMs in 2026: DeepSeek V4, Kimi K2.6, Qwen and Every Model Ranked 中国AI模型基准比较及与美国模型的性能和成本分析 benchlm.ai