要点DeepSeek V4-Pro以每百万输出token $3.48发布,GPT-5.5($30)贵了9倍。中间档位正在崩塌,能存活的开发者会在前沿模型与廉价开源模型之间做路由。

2026年4月,DeepSeek发布V4:1.6万亿参数MoE、活跃49B、MIT开源,输出价$3.48。 同周OpenAI推出GPT-5.5,输出$30

表面上又是"价格再降"的新闻。但The New Stack的Janakiram MSV指出真正的变化:整个市场中段正在漏空

到底发生了什么

LLM市场曾是入门→中段→前沿的三段式阶梯。到2026年春天,中间一级塌陷。

顶部是前沿模型(GPT-5.5、Opus 4.7)。复杂推理、多步代理、高安全性。输出每百万token $25–$30。

底部是廉价开源模型。V4-Flash输出$0.28、V4-Pro $3.48。 V4-Pro在BrowseComp拿到83.4%,超过Opus 4.7(79.3%)。 不只是"够用",在部分基准上它已超越前沿。

中间档?GPT-5.4($2.50/$15)、Sonnet 4($3/$15)。价格是V4-Pro的4–5倍,但通用性能差距很小。"使用理由"正在迅速消失。

DeepSeek V4与GPT-5.5价格对比
V4-Pro与GPT-5.5的输出价差9倍,中间档位正在快速清空。

这次有什么不同

Janakiram MSV称之为"AI中产阶级的消亡",因为依赖中间档的开发者无处可逃:向上太贵,向下是另一种商业模式。

这不是简单的价格波动,而是结构重组,有三个原因。

维度 前沿 (GPT-5.5) 廉价开源 (V4-Pro) 消失的中段 (GPT-5.4)
输入/输出(每1M)$5 / $30$1.74 / $3.48$2.50 / $15
Terminal-Bench(编码)82.7%67.9% (Pro-Max)约60%
SWE-Bench Pro58.6%55.4%低于50%
BrowseComp(Web推理)83.4%
许可证闭源APIMIT(可自托管)闭源API
存在意义最难任务90%日常工作越来越模糊

基准来源:Artificial Analysis、OpenAI官方、DeepSeek API Docs。

9倍输出价差
GPT-5.5 vs V4-Pro
1.6TV4-Pro总参数
活跃49B(MoE)
83.4%V4-Pro BrowseComp
超过Opus 4.7(79.3%)
MITV4许可证
可合法自托管

1. 价格曲线变成U形

过去价格与性能近乎线性,翻倍价钱翻倍效果。现在曲线中段被深挖空。$3档位上V4-Pro与Sonnet 4性能相近,但V4-Pro是开源权重,路由与自托管自由度高得多。

2. 路由从可选变为必修

Augment Code的2026年指南说得直白:"押注单一模型的时代结束了"。即使是编码代理,也必须按任务复杂度在V4-Flash → V4-Pro → GPT-5.5之间分流,否则单位经济崩盘。

3. 开源权重彻底改变规则

V4-Pro以MIT许可发布后,Together AI、Fireworks、Hyperbolic等托管商当天即上线。 不想把数据送往中国大陆,可走美/欧托管。"中国模型不能用"这个借口正在缩小。

现实提醒。 不必立刻把现有中段产品推倒。从新功能、流量峰值、单位经济差的端点开始引入路由更稳。

如何起步

四步搭建路由层。第一版5行if语句就够。

  1. 分类工作负载(1天): 把过去一个月的API调用分为"简单分类/摘要/翻译"、"代码生成/复杂推理"、"代理多步"。看比例就知道贵模型浪费在哪。
  2. 双分支起步(半天): 简单任务发V4-Flash($0.14/$0.28),复杂任务发GPT-5.5Opus 4.7。V4-Pro作为"简单变复杂"的回退。
  3. 引入网关(1周): 流量上来后切到OpenRouter、Portkey或LiteLLM。换一行SDK,权重、成本上限、自动回退一并到位。
  4. 观测与调优: 为每个模型建100–300条领域评估集,每周做回归。在"准确度-成本"帕累托前沿上换模型。
提示。 第一个指标不是单价,而是"每任务平均成本"。每百万token的报价是营销数字,实际利润看"每任务token数 × 模型价格"。V4-Flash若能更快出结果,绝对成本会比GPT-5.5更低。

想深入了解

The New Stack 原文 — 中产阶级消亡论 Janakiram MSV把市场结构拆为三段并提出开发者对策。thenewstack.io

DeepSeek V4官方发布说明 Pro/Flash定价、MoE结构、上下文长度、许可证。api-docs.deepseek.com

Artificial Analysis V4基准 Terminal-Bench、SWE-Bench、BrowseComp独立评测。artificialanalysis.ai

Augment Code — 2026编码模型路由指南 用代码示例讲解任务复杂度到模型的映射。augmentcode.com

VentureBeat — V4以1/6成本登场 同性能成本对比、托管伙伴动向、企业采用信号。venturebeat.com