AIトークン1個の価格が3年で1,000分の1になりましたよ。GPT-3の時代に100万トークンあたり60ドルだったのが、今は同等性能のモデルが0.06ドルで使えるんです。
でも企業のAI請求書は3倍になったんですよ。値段が下がったのに支出が増えた——この逆説には名前があります。1865年、英国の経済学者ウィリアム・スタンリー・ジェヴォンズが、石炭の効率が上がると石炭消費がむしろ急増することを発見したんです。今AIでまさにそれが起きているわけです。
みんなこう思っていましたよね
「AIのコストが下がれば、AI請求書も減るだろう」。当然の話に聞こえますよね。トークン代が半分になれば、同じ作業が半額でできるはずだって。
でも実際のデータは真逆でした。企業のAI支出は2024年の115億ドルから2025年の370億ドルへ、320%も増加したんです。その間、トークン単価は1,000倍も下がっているのに。
マーク・アンドリーセンはa16zのポッドキャストで「AIは私が経験した中で最大の技術革命だ」と言いました。同時に「知性の単位コストはムーアの法則を超える速度で崩落している」とも。そして「市場はまだ非常に初期段階だ」とも言ったんです。
この二つの発言は一緒に読む必要があります。コストが下がれば需要が爆発する——これがジェヴォンズのパラドックスの核心です。エージェントワークフロー一つが、単純なチャットより50倍から500倍多くトークンを使うんです。安くなったトークンでより複雑な作業をさせるようになり、するとさらに多くのトークンが必要になる構造です。実際、AIコストの72%がモデルの請求書の外にある、オーケストレーション・リトライ・モニタリングの費用なんですよ。
中国が価格戦争に火をつけた
ここにもう一つ変数があります。中国です。
アンドリーセンはポッドキャストで「DeepSeekがシリコンバレーを驚かせた」と認めました。実際、DeepSeek、Kimi(Moonshot AI)、Qwen(Alibaba)、ByteDanceのモデルが、Claude 3.5 SonnetやGPT-4oとほぼ同等のベンチマークを達成したんです——リリースから12ヶ月以内に。
| 米国トップモデル | 中国トップモデル | |
|---|---|---|
| 総合ベンチマーク | Claude Opus 4.6 — 88点 | DeepSeek V4 Pro — 87点 |
| コーディングスコア | Claude: 93.9% (SWE-Bench) | DeepSeek: 91.2% (SWE-Bench) |
| API単価の差 | 基準 (100%) | 約10〜13倍安い |
| オープンソース | クローズドソース | オープンウェイト、自己ホスト可 |
ベンチマークの性能差は5〜7%程度なのに、コスト差は10倍以上あるんです。アンドリーセンはこれを「オープンソース戦略でグローバルな価格競争を再編している」と見ています。
中国のAI研究者の年齢層も注目ポイントです。アンドリーセンが言及したように、主要な研究者が22〜24歳なんです。経験がないという意味じゃなくて、既存パラダイムへの先入観もないということです。このチームたちがGPUの効率を極限まで最適化して、米国より安いコストで同等の性能を実現したわけです。
a16zの予測通りなら、現在のGPU不足状況は5年以内に供給過剰へと転換されます。ビッグテックが自社チップを作り、AMD・中国企業が大規模生産に入ることで。そのときAIの単位コストは今よりさらに下がります。
アンドリーセンの核心的主張
AIを「私の生涯で経験した最大の技術革命」と言い、インターネットより大きく、電気・マイクロプロセッサと並ぶレベルだとしました。でも同時に「市場はまだ非常に初期段階だ」とも言ったんです。数億人がChatGPTを使っているのに初期段階って何?——今の製品形態がまだ未成熟だということです。ジェヴォンズのパラドックスが本格的に機能するには、まだはるかに多くのユースケースが生まれる必要があるという意味でもあります。
今すぐビジネスで確認すべきこと
- AI支出の構造を分けて見る
モデルAPIのコストとその他のコストを分けて確認してください。実際のAIコストの72%がモデル請求書の外にあります——オーケストレーション・リトライ・モニタリングの費用です。請求書がおかしいと思ったら、まずここを見てください。 - エージェント導入前にトークン消費をシミュレーション
エージェントワークフローは単純なチャットより50〜500倍多くトークンを使います。まず小規模パイロットを走らせて、タスクあたりの実際のトークン消費量を測定し、それを予算の基準にしてください。 - オープンソース・中国モデルのA/Bテスト
DeepSeek V4 Proは米国トップモデルとの性能差が5〜7%なのに、API単価が10〜13倍安いです。全面切り替えより、特定のワークフローでA/B比較から始めてみてください。自己ホスティングも可能です。 - 月次AI予算の上限設定
Uberが年間AI予算を4ヶ月で使い果たし、従業員一人当たり月$1,500のキャップを設けました。ジェヴォンズのパラドックスを知っていても、明示的な予算上限がなければ支出は増え続けます。チーム・機能単位で上限を先に設定してください。 - 節約分を新しい自動化投資へ転換
トークン代の下落による節約分をコスト削減として計上せず、新しいワークフロー自動化への再投資に回してください。ジェヴォンズのパラドックスを防御ではなく攻撃に使うわけです。今計画しなければ、競合他社が先にその優位性を奪います。
さらに深く掘り下げたいなら
Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI アンドリーセン本人の展望を81分かけて直接聞けるa16z AMAポッドキャスト a16z.com
2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing 36krの英語インタビューまとめ——コスト崩壊と中国AI台頭に関する核心発言が確認できます 36kr.com
a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses GPU供給過剰への転換予測とAIチップ市場の構造変化を扱った36krの分析 36kr.com
The Inference Cost Paradox: Why Generative AI Spending Surged 320% Despite Per-Token Costs Dropping 1,000x ジェヴォンズのパラドックスがAIでどう機能しているかを数字で掘り下げるデータ分析 arturmarkus.com
AI Token Cost Over Time: Down 99.7%, Bills Up 3x トークン単価下落と請求書増加の逆説をデータで整理したNavyaAIレポート navyaai.com
Best Chinese LLMs in 2026: DeepSeek V4, Kimi K2.6, Qwen and Every Model Ranked 中国AIモデルのベンチマーク比較と米国モデルとの性能・コスト分析 benchlm.ai



