新浪新闻客户端

DeepSeek V4:万亿参数模型为什么迟迟不发布

DeepSeek V4:万亿参数模型为什么迟迟不发布
2026年04月01日 08:51 新浪网 作者
avatar
每日新闻摘录

  DeepSeek V4可能是2026年最受期待的AI模型。但截至3月底,它仍然没有正式发布——这本身就是一个值得分析的信号。

  根据多家媒体和基准测试平台的信息,DeepSeek V4的核心技术规格已经基本明确:

  万亿级参数,但只激活320亿。 V4延续了V3的MoE(Mixture-of-Experts,混合专家)架构,总参数量达到1万亿(1T),但每次推理只激活约320亿参数。这意味着它的计算成本远低于同等参数规模的密集模型。

  100万token上下文窗口。 与Google Gemini系列看齐,V4可以一次性处理约80万中文字符——大约相当于一部完整的长篇小说或数百页的技术文档。

  原生多模态。 不同于V3只处理文本,V4将原生支持图像、视频和文本的联合理解与生成。这是从"语言模型"到"通用模型"的关键跨越。

  编码和长上下文优化。 V4在SWE-bench(软件工程基准)上的得分据称达到81%,显示出在代码理解和生成方面的显著提升。

  指标

  DeepSeek V3

  DeepSeek V4(预期)

  总参数量

  671B

  ~1T

  激活参数

  37B

  ~32B

  上下文窗口

  128K

1M

  多模态

  文本

  文本+图像+视频

  SWE-bench

  ~49%

  ~81%

  为什么一直在"即将发布"

  DeepSeek V4的发布时间表已经跳票多次:

  •   • 2月中旬:最初传言的发布窗口,未兑现

  •   • 2月底(春节后):第二个预期窗口,未兑现

  •   • 3月初:多家媒体报道"本周发布",未兑现

  •   • 3月9日:官网出现"V4 Lite"版本,但完整版仍未上线

  •   • 3月18日:一个匿名提交的Hunter Alpha模型引发V4猜测,后被证实是小米的MiMo-V2-Pro

  截至3月底,DeepSeek的公开API文档中仍然没有V4的模型ID。

  这种"渐进式发布"可能有几个原因:

  安全评估。 万亿参数的多模态模型在安全性上的评估工作量远超纯文本模型。图像和视频的生成能力带来了更复杂的内容安全挑战。

  基础设施准备。 V4的推理需求远大于V3。即使MoE架构降低了单次推理成本,支撑数百万用户同时使用仍然需要大规模的GPU集群部署。

  竞争策略。 先放出V4 Lite试水市场反应,同时持续优化完整版的性能和稳定性,这是一种风险更低的发布策略。

  V4 Lite已经透露了什么

  3月9日在DeepSeek官网悄然上线的V4 Lite,虽然不是完整的V4,但透露了一些重要信息:

  MoE效率进一步提升。 V4 Lite的推理速度比V3快约40%,同时保持了接近的输出质量。这说明DeepSeek在模型架构优化上取得了实质性进展。

  中文能力显著增强。 在中文理解和生成的基准测试中,V4 Lite比V3有明显提升,特别是在长文本摘要、多轮对话一致性和专业领域术语准确性方面。

  API定价继续保持低位。 DeepSeek一直以极低的API定价著称,V4 Lite延续了这一策略,据报道定价约为每百万输入token 0.30美元。

  对行业格局的潜在影响

  DeepSeek V3已经证明了一件事:开源模型可以在性能上接近甚至匹敌闭源旗舰模型。如果V4的实际表现接近预期参数,它可能带来几个重要变化:

  开源与闭源的差距可能进一步缩小。 V3已经在多个基准上与GPT-4o和Claude 3.5 Sonnet竞争。V4如果在多模态和长上下文上也达到类似水平,"为什么不用免费的开源模型"将成为更多企业的真实问题。

  MoE架构的验证。 V4将是迄今为止最大规模的MoE模型之一。如果它证明了"万亿参数 + 低激活成本"的路线可行,将会有更多团队跟进这一架构方向。

  中国AI技术的标杆意义。 DeepSeek已经成为国际AI社区中最受关注的中国AI团队之一。V4的发布将进一步确立其在全球AI技术版图中的位置。

  写在最后

  DeepSeek V4最有意思的地方,不在于它的万亿参数或百万上下文窗口——这些数字在AI行业已经不再令人惊讶。真正值得关注的是它的发布策略:先Lite后完整版,先API后开源,每一步都在收集市场反馈和优化模型表现。

  在一个"发布即是营销"的行业里,DeepSeek选择了慢一步。这种克制本身,可能比任何基准测试分数都更能说明问题。

  GlobalNow

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

AI
0条评论|0人参与网友评论
最热评论

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2026 SINA Corporation

All Rights Reserved 新浪公司 版权所有