img.36krcdn.com

AI便宜了1000倍，账单却涨了3倍 — 杰文斯悖论重写竞争法则

AI价格崩落, 杰文斯悖论, 马克·安德森, 中美AI竞争, 智能成本, DeepSeek商业

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses

单个AI token的价格在三年内下降了1000倍。GPT-3时代每百万token需要60美元，现在同等性能的模型只需0.06美元。

然而企业的AI账单却翻了三倍。价格下跌了，但支出增加了——这个悖论有个名字。1865年，英国经济学家威廉·斯坦利·杰文斯发现，煤炭效率提高并不会减少煤炭消耗，反而会导致消耗急剧增加。现在，我们正在AI领域目睹同样的现象。

3秒摘要

智能成本崩跌1000倍 → 使用量暴增50~500倍 → 中国加速价格战 → 杰文斯悖论发动 → 新竞争法则诞生

大家原来是这么认为的

"AI成本降低了，我们的AI账单也会减少。"听起来理所当然，对吧？token价格降一半，同样的工作就能以一半的价格完成。

1,000x

AI推理成本下降 (2021→2024)

320%

企业AI支出增加 (2024→2025)

企业AI账单平均涨幅

但实际数据完全相反。企业AI支出从2024年的115亿美元飙升至2025年的370亿美元，增长了320%。而在此期间，token单价却下降了1000倍。

马克·安德森在a16z播客中说AI是"我这辈子经历过的最大技术革命"。他同时说"智能的单位成本正在以超越摩尔定律的速度崩跌"。然后——在同一口气里——他还说"市场还处于非常早期的阶段"。

这两句话需要放在一起读。成本降低时需求会爆炸式增长——这就是杰文斯悖论的核心。一个智能体工作流消耗的token比简单对话多50到500倍。更便宜的token让更复杂的任务变得可行，而这又需要更多的token。实际上，AI成本的72%并不在模型账单里，而是在编排、重试和监控的费用中。

中国点燃了价格战

这个方程式还有另一个变量：中国。

安德森在播客中坦承"DeepSeek让硅谷震惊了"。数据也证实了这一点——DeepSeek、Kimi(月之暗面)、Qwen(阿里巴巴)、字节跳动的模型在发布后12个月内就达到了与Claude 3.5 Sonnet、GPT-4o几乎相同的基准分数。

	美国顶尖模型	中国顶尖模型
综合基准	Claude Opus 4.6 — 88分	DeepSeek V4 Pro — 87分
编程得分	Claude: 93.9% (SWE-Bench)	DeepSeek: 91.2% (SWE-Bench)
API价格差异	基准 (100%)	便宜约10~13倍
开源情况	闭源	开放权重，可自行部署

性能差距在基准测试中只有5~7%，但成本差距超过10倍。安德森认为这是"通过开源策略重塑全球价格竞争"。

中国AI研究人员的年龄层也值得关注。正如安德森提到的，主要研究人员只有22~24岁。这不是说他们没经验，而是他们对现有范式没有任何先入之见。这些团队把GPU效率优化到极致，以比美国更低的成本实现了同等性能。

按照a16z的预测，目前的GPU短缺状况将在五年内转变为供应过剩。随着大型科技公司自研芯片，AMD和中国企业大规模生产，届时AI单位成本将进一步大幅下降。

安德森的核心主张

他将AI称为"我这辈子经历过的最大技术革命"，比互联网更大，可与电力和微处理器相提并论。但同时说市场"还处于非常早期"。数亿人在用ChatGPT，怎么还是早期？——他的意思是现有的产品形态还不够成熟。杰文斯悖论要真正发挥作用，还需要涌现出更多的应用场景。

现在就该在你的业务中检查的事项

拆分AI支出结构来看
把模型API成本和其他成本分开来看。实际AI成本的72%在模型账单之外——编排、重试、监控的费用。如果账单异常偏高，先从这里入手。
引入智能体之前模拟token消耗
智能体工作流比简单对话多消耗50~500倍的token。先跑一个小规模试点，测量每个任务的实际token消耗量，以此为基准制定预算。
对开源和中国模型进行A/B测试
DeepSeek V4 Pro与美国顶尖模型的性能差距只有5~7%，但API单价便宜10~13倍。与其全面切换，不如在特定工作流上先做A/B对比。也可以选择自行部署。
设定月度AI预算上限
Uber在4个月内就耗尽了全年AI预算，被迫对每位员工设置每月1,500美元的上限。知道杰文斯悖论的存在，但没有明确预算上限，支出就会无止境增长。按团队和功能设定上限。
把节省的费用转化为新的自动化投资
不要把token价格下降带来的节省记为成本削减，而是将其再投资于新的工作流自动化。这就是把杰文斯悖论用于进攻而非防御的方法。现在不做规划，竞争对手就会率先抢占这个优势。

想深入了解？

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI 可以直接收听安德森本人81分钟深度分享的a16z AMA播客 a16z.com

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing 36kr英文采访整理——关于成本崩跌和中国AI崛起的核心发言 36kr.com

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses 36kr对GPU供应过剩转变预测和AI芯片市场结构变化的分析 36kr.com

The Inference Cost Paradox: Why Generative AI Spending Surged 320% Despite Per-Token Costs Dropping 1,000x 深入数据分析杰文斯悖论如何在AI领域发挥作用 arturmarkus.com

AI Token Cost Over Time: Down 99.7%, Bills Up 3x NavyaAI整理的token价格下降与账单增加悖论数据报告 navyaai.com

Best Chinese LLMs in 2026: DeepSeek V4, Kimi K2.6, Qwen and Every Model Ranked 中国AI模型基准比较及与美国模型的性能和成本分析 benchlm.ai

常见问题

杰文斯悖论究竟是什么?

这是1865年英国经济学家威廉·斯坦利·杰文斯发现的原理。他发现煤炭效率提高后，煤炭消耗不减反增。成本越低，使用越广泛，总消耗量反而增加——这就是悖论所在。在AI领域，token价格越低，越多的智能体工作流变得经济可行，导致总AI账单上升。

在生产环境中使用中国AI模型安全吗?

需要从数据安全和合规角度进行评估。DeepSeek等中国模型是开放权重的，可以部署在自己的服务器上，无需与中国企业共享数据。但如果涉及医疗、金融或政府数据，请先咨询法务团队。现实的做法是：先在非敏感工作流上进行A/B测试。

AI预算增长速度超过预期时，第一个该查的地方是哪里?

先看模型账单以外的费用。实际AI成本的72%是编排、重试、监控等基础设施费用。如果有智能体工作流，测量一下每个任务的实际token消耗量。很可能比你预估的多50~500倍。

GPU短缺真的能在5年内转变为供应过剩吗?

这是安德森和a16z的预测。逻辑上是有根据的——大型科技公司正在自研AI芯片(Meta MTIA、Google TPU、Microsoft Maia等)，AMD和中国企业也在扩大GPU替代品的生产。技术基础设施历史上一直遵循初期短缺→大规模投资→供应过剩的模式。具体时间线不确定，但方向性已有行业共识。