DeepSeek V4可能是2026年最受期待的AI模型。但截至3月底,它仍然没有正式发布——这本身就是一个值得分析的信号。
根据多家媒体和基准测试平台的信息,DeepSeek V4的核心技术规格已经基本明确:
万亿级参数,但只激活320亿。 V4延续了V3的MoE(Mixture-of-Experts,混合专家)架构,总参数量达到1万亿(1T),但每次推理只激活约320亿参数。这意味着它的计算成本远低于同等参数规模的密集模型。
100万token上下文窗口。 与Google Gemini系列看齐,V4可以一次性处理约80万中文字符——大约相当于一部完整的长篇小说或数百页的技术文档。
原生多模态。 不同于V3只处理文本,V4将原生支持图像、视频和文本的联合理解与生成。这是从"语言模型"到"通用模型"的关键跨越。
编码和长上下文优化。 V4在SWE-bench(软件工程基准)上的得分据称达到81%,显示出在代码理解和生成方面的显著提升。
指标 | DeepSeek V3 | DeepSeek V4(预期) |
|---|---|---|
总参数量 | 671B | ~1T |
激活参数 | 37B | ~32B |
上下文窗口 | 128K | 1M |
多模态 | 文本 | 文本+图像+视频 |
SWE-bench | ~49% | ~81% |
为什么一直在"即将发布"
DeepSeek V4的发布时间表已经跳票多次:
• 2月中旬:最初传言的发布窗口,未兑现
• 2月底(春节后):第二个预期窗口,未兑现
• 3月初:多家媒体报道"本周发布",未兑现
• 3月9日:官网出现"V4 Lite"版本,但完整版仍未上线
• 3月18日:一个匿名提交的Hunter Alpha模型引发V4猜测,后被证实是小米的MiMo-V2-Pro
截至3月底,DeepSeek的公开API文档中仍然没有V4的模型ID。
这种"渐进式发布"可能有几个原因:
安全评估。 万亿参数的多模态模型在安全性上的评估工作量远超纯文本模型。图像和视频的生成能力带来了更复杂的内容安全挑战。
基础设施准备。 V4的推理需求远大于V3。即使MoE架构降低了单次推理成本,支撑数百万用户同时使用仍然需要大规模的GPU集群部署。
竞争策略。 先放出V4 Lite试水市场反应,同时持续优化完整版的性能和稳定性,这是一种风险更低的发布策略。
V4 Lite已经透露了什么
3月9日在DeepSeek官网悄然上线的V4 Lite,虽然不是完整的V4,但透露了一些重要信息:
MoE效率进一步提升。 V4 Lite的推理速度比V3快约40%,同时保持了接近的输出质量。这说明DeepSeek在模型架构优化上取得了实质性进展。
中文能力显著增强。 在中文理解和生成的基准测试中,V4 Lite比V3有明显提升,特别是在长文本摘要、多轮对话一致性和专业领域术语准确性方面。
API定价继续保持低位。 DeepSeek一直以极低的API定价著称,V4 Lite延续了这一策略,据报道定价约为每百万输入token 0.30美元。
对行业格局的潜在影响
DeepSeek V3已经证明了一件事:开源模型可以在性能上接近甚至匹敌闭源旗舰模型。如果V4的实际表现接近预期参数,它可能带来几个重要变化:
开源与闭源的差距可能进一步缩小。 V3已经在多个基准上与GPT-4o和Claude 3.5 Sonnet竞争。V4如果在多模态和长上下文上也达到类似水平,"为什么不用免费的开源模型"将成为更多企业的真实问题。
MoE架构的验证。 V4将是迄今为止最大规模的MoE模型之一。如果它证明了"万亿参数 + 低激活成本"的路线可行,将会有更多团队跟进这一架构方向。
中国AI技术的标杆意义。 DeepSeek已经成为国际AI社区中最受关注的中国AI团队之一。V4的发布将进一步确立其在全球AI技术版图中的位置。
写在最后
DeepSeek V4最有意思的地方,不在于它的万亿参数或百万上下文窗口——这些数字在AI行业已经不再令人惊讶。真正值得关注的是它的发布策略:先Lite后完整版,先API后开源,每一步都在收集市场反馈和优化模型表现。
在一个"发布即是营销"的行业里,DeepSeek选择了慢一步。这种克制本身,可能比任何基准测试分数都更能说明问题。
GlobalNow