要約DeepSeek V4-Proが出力1Mトークン$3.48で出荷され、GPT-5.5($30)との差は9倍に。中間価格帯モデルは消滅中で、ビルダーは「フロンティア+格安オープン」のルーティング設計に切り替える必要があります。

2026年4月、DeepSeekがV4を公開しました。1.6兆パラメータ・49B活性のMoE、MITライセンス、出力$3.48。 同週にOpenAIGPT-5.5を発表、出力は$30

表面的には「また値下げ」というニュースですが、The New StackのJanakiram MSVが指摘した本質は別です。市場の真ん中ごとが抜け落ちているのです。

何が起きているのか

LLM市場は以前、入門→ミドル→フロンティアの3段階でした。2026年春、その真ん中が崩れました。

上位はフロンティアモデル(GPT-5.5、Opus 4.7)。複雑な推論やエージェント実行に強く、出力は$25〜$30。

下位は格安オープンモデル。V4-Flashは出力$0.28、V4-Proは$3.48。 V4-ProはBrowseCompで83.4%、Opus 4.7(79.3%)を上回りました。 一部ベンチではフロンティアを超えます。

真ん中は?GPT-5.4($2.50/$15)、Sonnet 4($3/$15)など。V4-Proの4〜5倍の価格で性能差は僅か。「使う理由」が急速に失われています。

DeepSeek V4とGPT-5.5の価格比較
V4-ProとGPT-5.5の出力価格は9倍差。中間価格帯は急速に空洞化中。

何が変わるのか

Janakiram MSVが「AIミドルクラスの消滅」と呼ぶ理由は、ミドル依存のビルダーに逃げ場がないから。上は高すぎ、下はビジネスモデル自体が違います。

これが単なる価格変動ではなく構造再編である理由は3つ。

項目 フロンティア (GPT-5.5) 格安オープン (V4-Pro) 消えるミドル (GPT-5.4)
入力/出力 (1Mあたり)$5 / $30$1.74 / $3.48$2.50 / $15
Terminal-Bench(コーディング)82.7%67.9% (Pro-Max)約60%台
SWE-Bench Pro58.6%55.4%50%未満
BrowseComp(Web推論)83.4%
ライセンス独占APIMIT(セルフホスト可)独占API
存在意義最難タスク日常90%不明確

ベンチ出典:Artificial Analysis、OpenAI公式、DeepSeek API Docs。

9倍出力価格差
GPT-5.5 vs V4-Pro
1.6TV4-Pro総パラメータ
活性49B(MoE)
83.4%V4-Pro BrowseComp
Opus 4.7(79.3%)超え
MITV4ライセンス
セルフホスト合法

1. 価格曲線がU字に

以前は価格-性能がほぼ直線。倍払えば倍良い、でした。今は真ん中が深く凹んだU字。$3前後でV4-ProとSonnet 4が同等性能ですが、V4-Proはオープンウェイトでルーティング・セルフホスト自由度が桁違い。

2. ルーティングが選択肢から義務に

Augment Codeの2026年ガイドは明快:「単一モデル賭けは終わった」。コーディングエージェントでもタスク複雑度でV4-Flash→V4-Pro→GPT-5.5に分岐しないと単価が崩れます。

3. オープンウェイトがゲームチェンジャー

V4-ProはMITで公開され、Together AI、Fireworks、Hyperbolic等が即日サービング。 中国本土へのデータ送信を避けたければ米欧ホスターを使えばOK。「中国モデルだから使えない」言い訳は小さくなりました。

現実チェック。 既存のミドル層プロダクションを今すぐ刷新する必要はありません。新機能、トラフィック増、単価が悪いエンドポイントから順に導入を。

始め方

4ステップでルーティング層を構築できます。最初はif文5行で十分。

  1. ワークロード分類(1日): 直近1ヶ月のAPI呼び出しを「単純分類・要約・翻訳」「コード生成・複雑推論」「エージェントマルチステップ」に分類。比率で無駄が見えます。
  2. 2分岐で開始(半日): 単純はV4-Flash($0.14/$0.28)、複雑はGPT-5.5Opus 4.7へ。V4-Proは「単純が複雑化」のフォールバック。
  3. ゲートウェイ導入(1週): トラフィック増ならOpenRouter、Portkey、LiteLLMへ。SDK1行差し替えで重み・コスト上限・自動フォールバックが揃います。
  4. 観測・チューニング: ドメインごとに100〜300件の評価データセットで週次回帰テスト。「精度-コスト」パレート前線でモデルを入れ替え。
ヒント。 最初の指標は単価ではなく「タスクあたり平均コスト」。1Mトークン単価はマーケティング用、実マージンは「タスクあたりトークン数×価格」。V4-Flashが速く終われば結果的にGPT-5.5より安くなります。

もっと深く知りたい方へ

The New Stack 原文 — ミドルクラス消滅論 Janakiram MSVが市場構造を3段階に分解しビルダー対応策を提示。thenewstack.io

DeepSeek V4公式リリースノート Pro/Flash価格、MoE構造、コンテキスト長、ライセンスを整理。api-docs.deepseek.com

Artificial Analysis V4ベンチマーク Terminal-Bench、SWE-Bench、BrowseCompの独立評価。artificialanalysis.ai

Augment Code — 2026コーディングモデルルーティングガイド タスク複雑度→モデルマッピングをコード例で解説。augmentcode.com

VentureBeat — V4が1/6コスト分析 同性能基準のコスト比較、ホスティング動向、エンタープライズ導入シグナル。venturebeat.com