img.36krcdn.com

AIが1,000分の1に安くなったのに請求書は3倍になった — ジェヴォンズのパラドックスが競争ルールを書き換える

AI価格崩落, ジェヴォンズのパラドックス, マーク・アンドリーセン, 米中AI競争, 知性コスト, DeepSeekビジネス

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses

AIトークン1個の価格が3年で1,000分の1になりましたよ。GPT-3の時代に100万トークンあたり60ドルだったのが、今は同等性能のモデルが0.06ドルで使えるんです。

でも企業のAI請求書は3倍になったんですよ。値段が下がったのに支出が増えた——この逆説には名前があります。1865年、英国の経済学者ウィリアム・スタンリー・ジェヴォンズが、石炭の効率が上がると石炭消費がむしろ急増することを発見したんです。今AIでまさにそれが起きているわけです。

3秒でまとめると

知性コストが1,000倍崩落 → 使用量が50〜500倍爆増 → 中国が価格戦争を加速 → ジェヴォンズのパラドックス発動 → 新たな競争法則

みんなこう思っていましたよね

「AIのコストが下がれば、AI請求書も減るだろう」。当然の話に聞こえますよね。トークン代が半分になれば、同じ作業が半額でできるはずだって。

1,000x

AI推論コスト下落 (2021→2024)

320%

企業AI支出増加 (2024→2025)

企業AI請求書の平均増加

でも実際のデータは真逆でした。企業のAI支出は2024年の115億ドルから2025年の370億ドルへ、320%も増加したんです。その間、トークン単価は1,000倍も下がっているのに。

マーク・アンドリーセンはa16zのポッドキャストで「AIは私が経験した中で最大の技術革命だ」と言いました。同時に「知性の単位コストはムーアの法則を超える速度で崩落している」とも。そして「市場はまだ非常に初期段階だ」とも言ったんです。

この二つの発言は一緒に読む必要があります。コストが下がれば需要が爆発する——これがジェヴォンズのパラドックスの核心です。エージェントワークフロー一つが、単純なチャットより50倍から500倍多くトークンを使うんです。安くなったトークンでより複雑な作業をさせるようになり、するとさらに多くのトークンが必要になる構造です。実際、AIコストの72%がモデルの請求書の外にある、オーケストレーション・リトライ・モニタリングの費用なんですよ。

中国が価格戦争に火をつけた

ここにもう一つ変数があります。中国です。

アンドリーセンはポッドキャストで「DeepSeekがシリコンバレーを驚かせた」と認めました。実際、DeepSeek、Kimi(Moonshot AI)、Qwen(Alibaba)、ByteDanceのモデルが、Claude 3.5 SonnetやGPT-4oとほぼ同等のベンチマークを達成したんです——リリースから12ヶ月以内に。

	米国トップモデル	中国トップモデル
総合ベンチマーク	Claude Opus 4.6 — 88点	DeepSeek V4 Pro — 87点
コーディングスコア	Claude: 93.9% (SWE-Bench)	DeepSeek: 91.2% (SWE-Bench)
API単価の差	基準 (100%)	約10〜13倍安い
オープンソース	クローズドソース	オープンウェイト、自己ホスト可

ベンチマークの性能差は5〜7%程度なのに、コスト差は10倍以上あるんです。アンドリーセンはこれを「オープンソース戦略でグローバルな価格競争を再編している」と見ています。

中国のAI研究者の年齢層も注目ポイントです。アンドリーセンが言及したように、主要な研究者が22〜24歳なんです。経験がないという意味じゃなくて、既存パラダイムへの先入観もないということです。このチームたちがGPUの効率を極限まで最適化して、米国より安いコストで同等の性能を実現したわけです。

a16zの予測通りなら、現在のGPU不足状況は5年以内に供給過剰へと転換されます。ビッグテックが自社チップを作り、AMD・中国企業が大規模生産に入ることで。そのときAIの単位コストは今よりさらに下がります。

アンドリーセンの核心的主張

AIを「私の生涯で経験した最大の技術革命」と言い、インターネットより大きく、電気・マイクロプロセッサと並ぶレベルだとしました。でも同時に「市場はまだ非常に初期段階だ」とも言ったんです。数億人がChatGPTを使っているのに初期段階って何？——今の製品形態がまだ未成熟だということです。ジェヴォンズのパラドックスが本格的に機能するには、まだはるかに多くのユースケースが生まれる必要があるという意味でもあります。

今すぐビジネスで確認すべきこと

AI支出の構造を分けて見る
モデルAPIのコストとその他のコストを分けて確認してください。実際のAIコストの72%がモデル請求書の外にあります——オーケストレーション・リトライ・モニタリングの費用です。請求書がおかしいと思ったら、まずここを見てください。
エージェント導入前にトークン消費をシミュレーション
エージェントワークフローは単純なチャットより50〜500倍多くトークンを使います。まず小規模パイロットを走らせて、タスクあたりの実際のトークン消費量を測定し、それを予算の基準にしてください。
オープンソース・中国モデルのA/Bテスト
DeepSeek V4 Proは米国トップモデルとの性能差が5〜7%なのに、API単価が10〜13倍安いです。全面切り替えより、特定のワークフローでA/B比較から始めてみてください。自己ホスティングも可能です。
月次AI予算の上限設定
Uberが年間AI予算を4ヶ月で使い果たし、従業員一人当たり月$1,500のキャップを設けました。ジェヴォンズのパラドックスを知っていても、明示的な予算上限がなければ支出は増え続けます。チーム・機能単位で上限を先に設定してください。
節約分を新しい自動化投資へ転換
トークン代の下落による節約分をコスト削減として計上せず、新しいワークフロー自動化への再投資に回してください。ジェヴォンズのパラドックスを防御ではなく攻撃に使うわけです。今計画しなければ、競合他社が先にその優位性を奪います。

さらに深く掘り下げたいなら

Marc Andreessen's 2026 Outlook: AI Timelines, US vs. China, and The Price of AI アンドリーセン本人の展望を81分かけて直接聞けるa16z AMAポッドキャスト a16z.com

2026 Early Interview with Marc Andreessen: AI Revolution Just Started, Intelligence Price Collapsing 36krの英語インタビューまとめ——コスト崩壊と中国AI台頭に関する核心発言が確認できます 36kr.com

a16z's 2026 Outlook: Shortages Will Eventually Lead to Surpluses GPU供給過剰への転換予測とAIチップ市場の構造変化を扱った36krの分析 36kr.com

The Inference Cost Paradox: Why Generative AI Spending Surged 320% Despite Per-Token Costs Dropping 1,000x ジェヴォンズのパラドックスがAIでどう機能しているかを数字で掘り下げるデータ分析 arturmarkus.com

AI Token Cost Over Time: Down 99.7%, Bills Up 3x トークン単価下落と請求書増加の逆説をデータで整理したNavyaAIレポート navyaai.com

Best Chinese LLMs in 2026: DeepSeek V4, Kimi K2.6, Qwen and Every Model Ranked 中国AIモデルのベンチマーク比較と米国モデルとの性能・コスト分析 benchlm.ai

よくある質問

ジェヴォンズのパラドックスって正確には何ですか?

1865年に英国の経済学者ウィリアム・スタンリー・ジェヴォンズが発見した原理です。石炭の効率が上がれば石炭消費が減ると思いきや、実際には石炭需要が急増したんです。コストが下がるほど使いやすくなって、より多くの場面で使われるようになり、結果として総消費量が増えるという逆説です。AIでは、トークン代が下がるほど多くのエージェントワークフローを動かすようになって、総AI請求書が増加するパターンとして現れています。

中国のAIモデルをプロダクションで使っても安全ですか?

データセキュリティとコンプライアンスの観点で確認が必要です。DeepSeekなど中国モデルはオープンウェイトなので、自社サーバーにホスティングすれば中国企業とデータを共有しなくて済みます。ただし、医療・金融・政府データを扱う場合は法務チームと事前に確認してください。センシティブでないワークフローでのA/Bテストから始めるのが現実的です。

AI予算が想定より速く膨らんでいるとき、最初に見るべき場所は?

モデルAPIの請求書ではなく、その外のコストをまず確認してください。実際のAIコストの72%がオーケストレーション・リトライ・モニタリングのようなインフラコストです。エージェントワークフローがあるなら、タスクあたりの実際のトークン消費量を測定してみてください。想定より50〜500倍多く使っている可能性が高いです。

GPU不足が5年以内に供給過剰に転換するというのは現実的な話ですか?

アンドリーセンとa16zの予測です。論理的な根拠はあります——ビッグテックが自社AIチップを作っており(Meta MTIA、Google TPU、Microsoft Maiaなど)、AMDと中国企業もGPUの代替品の生産を増やしています。技術インフラは歴史的に初期不足→大規模投資→供給過剰のパターンを繰り返してきました。正確なタイムラインは分かりませんが、方向性自体は業界の共通認識があります。