要約DeepSeek V4-Proが出力1Mトークン$3.48で出荷され、GPT-5.5($30)との差は9倍に。中間価格帯モデルは消滅中で、ビルダーは「フロンティア+格安オープン」のルーティング設計に切り替える必要があります。
2026年4月、DeepSeekがV4を公開しました。1.6兆パラメータ・49B活性のMoE、MITライセンス、出力$3.48。 同週にOpenAIがGPT-5.5を発表、出力は$30。
表面的には「また値下げ」というニュースですが、The New StackのJanakiram MSVが指摘した本質は別です。市場の真ん中ごとが抜け落ちているのです。
何が起きているのか
LLM市場は以前、入門→ミドル→フロンティアの3段階でした。2026年春、その真ん中が崩れました。
上位はフロンティアモデル(GPT-5.5、Opus 4.7)。複雑な推論やエージェント実行に強く、出力は$25〜$30。
下位は格安オープンモデル。V4-Flashは出力$0.28、V4-Proは$3.48。 V4-ProはBrowseCompで83.4%、Opus 4.7(79.3%)を上回りました。 一部ベンチではフロンティアを超えます。
真ん中は?GPT-5.4($2.50/$15)、Sonnet 4($3/$15)など。V4-Proの4〜5倍の価格で性能差は僅か。「使う理由」が急速に失われています。
何が変わるのか
Janakiram MSVが「AIミドルクラスの消滅」と呼ぶ理由は、ミドル依存のビルダーに逃げ場がないから。上は高すぎ、下はビジネスモデル自体が違います。
これが単なる価格変動ではなく構造再編である理由は3つ。
| 項目 | フロンティア (GPT-5.5) | 格安オープン (V4-Pro) | 消えるミドル (GPT-5.4) |
|---|---|---|---|
| 入力/出力 (1Mあたり) | $5 / $30 | $1.74 / $3.48 | $2.50 / $15 |
| Terminal-Bench(コーディング) | 82.7% | 67.9% (Pro-Max) | 約60%台 |
| SWE-Bench Pro | 58.6% | 55.4% | 50%未満 |
| BrowseComp(Web推論) | — | 83.4% | — |
| ライセンス | 独占API | MIT(セルフホスト可) | 独占API |
| 存在意義 | 最難タスク | 日常90% | 不明確 |
ベンチ出典:Artificial Analysis、OpenAI公式、DeepSeek API Docs。
GPT-5.5 vs V4-Pro
活性49B(MoE)
Opus 4.7(79.3%)超え
セルフホスト合法
1. 価格曲線がU字に
以前は価格-性能がほぼ直線。倍払えば倍良い、でした。今は真ん中が深く凹んだU字。$3前後でV4-ProとSonnet 4が同等性能ですが、V4-Proはオープンウェイトでルーティング・セルフホスト自由度が桁違い。
2. ルーティングが選択肢から義務に
Augment Codeの2026年ガイドは明快:「単一モデル賭けは終わった」。コーディングエージェントでもタスク複雑度でV4-Flash→V4-Pro→GPT-5.5に分岐しないと単価が崩れます。
3. オープンウェイトがゲームチェンジャー
V4-ProはMITで公開され、Together AI、Fireworks、Hyperbolic等が即日サービング。 中国本土へのデータ送信を避けたければ米欧ホスターを使えばOK。「中国モデルだから使えない」言い訳は小さくなりました。
始め方
4ステップでルーティング層を構築できます。最初はif文5行で十分。
- ワークロード分類(1日): 直近1ヶ月のAPI呼び出しを「単純分類・要約・翻訳」「コード生成・複雑推論」「エージェントマルチステップ」に分類。比率で無駄が見えます。
- 2分岐で開始(半日): 単純は
V4-Flash($0.14/$0.28)、複雑はGPT-5.5かOpus 4.7へ。V4-Proは「単純が複雑化」のフォールバック。 - ゲートウェイ導入(1週): トラフィック増ならOpenRouter、Portkey、LiteLLMへ。SDK1行差し替えで重み・コスト上限・自動フォールバックが揃います。
- 観測・チューニング: ドメインごとに100〜300件の評価データセットで週次回帰テスト。「精度-コスト」パレート前線でモデルを入れ替え。
もっと深く知りたい方へ
The New Stack 原文 — ミドルクラス消滅論 Janakiram MSVが市場構造を3段階に分解しビルダー対応策を提示。thenewstack.io
DeepSeek V4公式リリースノート Pro/Flash価格、MoE構造、コンテキスト長、ライセンスを整理。api-docs.deepseek.com
Artificial Analysis V4ベンチマーク Terminal-Bench、SWE-Bench、BrowseCompの独立評価。artificialanalysis.ai
Augment Code — 2026コーディングモデルルーティングガイド タスク複雑度→モデルマッピングをコード例で解説。augmentcode.com
VentureBeat — V4が1/6コスト分析 同性能基準のコスト比較、ホスティング動向、エンタープライズ導入シグナル。venturebeat.com



