要点DeepSeek V4-Pro以每百万输出token $3.48发布,GPT-5.5($30)贵了9倍。中间档位正在崩塌,能存活的开发者会在前沿模型与廉价开源模型之间做路由。
2026年4月,DeepSeek发布V4:1.6万亿参数MoE、活跃49B、MIT开源,输出价$3.48。 同周OpenAI推出GPT-5.5,输出$30。
表面上又是"价格再降"的新闻。但The New Stack的Janakiram MSV指出真正的变化:整个市场中段正在漏空。
到底发生了什么
LLM市场曾是入门→中段→前沿的三段式阶梯。到2026年春天,中间一级塌陷。
顶部是前沿模型(GPT-5.5、Opus 4.7)。复杂推理、多步代理、高安全性。输出每百万token $25–$30。
底部是廉价开源模型。V4-Flash输出$0.28、V4-Pro $3.48。 V4-Pro在BrowseComp拿到83.4%,超过Opus 4.7(79.3%)。 不只是"够用",在部分基准上它已超越前沿。
中间档?GPT-5.4($2.50/$15)、Sonnet 4($3/$15)。价格是V4-Pro的4–5倍,但通用性能差距很小。"使用理由"正在迅速消失。
这次有什么不同
Janakiram MSV称之为"AI中产阶级的消亡",因为依赖中间档的开发者无处可逃:向上太贵,向下是另一种商业模式。
这不是简单的价格波动,而是结构重组,有三个原因。
| 维度 | 前沿 (GPT-5.5) | 廉价开源 (V4-Pro) | 消失的中段 (GPT-5.4) |
|---|---|---|---|
| 输入/输出(每1M) | $5 / $30 | $1.74 / $3.48 | $2.50 / $15 |
| Terminal-Bench(编码) | 82.7% | 67.9% (Pro-Max) | 约60% |
| SWE-Bench Pro | 58.6% | 55.4% | 低于50% |
| BrowseComp(Web推理) | — | 83.4% | — |
| 许可证 | 闭源API | MIT(可自托管) | 闭源API |
| 存在意义 | 最难任务 | 90%日常工作 | 越来越模糊 |
基准来源:Artificial Analysis、OpenAI官方、DeepSeek API Docs。
GPT-5.5 vs V4-Pro
活跃49B(MoE)
超过Opus 4.7(79.3%)
可合法自托管
1. 价格曲线变成U形
过去价格与性能近乎线性,翻倍价钱翻倍效果。现在曲线中段被深挖空。$3档位上V4-Pro与Sonnet 4性能相近,但V4-Pro是开源权重,路由与自托管自由度高得多。
2. 路由从可选变为必修
Augment Code的2026年指南说得直白:"押注单一模型的时代结束了"。即使是编码代理,也必须按任务复杂度在V4-Flash → V4-Pro → GPT-5.5之间分流,否则单位经济崩盘。
3. 开源权重彻底改变规则
V4-Pro以MIT许可发布后,Together AI、Fireworks、Hyperbolic等托管商当天即上线。 不想把数据送往中国大陆,可走美/欧托管。"中国模型不能用"这个借口正在缩小。
如何起步
四步搭建路由层。第一版5行if语句就够。
- 分类工作负载(1天): 把过去一个月的API调用分为"简单分类/摘要/翻译"、"代码生成/复杂推理"、"代理多步"。看比例就知道贵模型浪费在哪。
- 双分支起步(半天): 简单任务发
V4-Flash($0.14/$0.28),复杂任务发GPT-5.5或Opus 4.7。V4-Pro作为"简单变复杂"的回退。 - 引入网关(1周): 流量上来后切到OpenRouter、Portkey或LiteLLM。换一行SDK,权重、成本上限、自动回退一并到位。
- 观测与调优: 为每个模型建100–300条领域评估集,每周做回归。在"准确度-成本"帕累托前沿上换模型。
想深入了解
The New Stack 原文 — 中产阶级消亡论 Janakiram MSV把市场结构拆为三段并提出开发者对策。thenewstack.io
DeepSeek V4官方发布说明 Pro/Flash定价、MoE结构、上下文长度、许可证。api-docs.deepseek.com
Artificial Analysis V4基准 Terminal-Bench、SWE-Bench、BrowseComp独立评测。artificialanalysis.ai
Augment Code — 2026编码模型路由指南 用代码示例讲解任务复杂度到模型的映射。augmentcode.com
VentureBeat — V4以1/6成本登场 同性能成本对比、托管伙伴动向、企业采用信号。venturebeat.com



