← 返回列表

中金公司 | DeepSeek-V4技术精读

Alpha 派 4 信息等级 4 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-04-26T20:54 抓取:2026-05-04 14:50
摘要

DeepSeek V4发布Pro和Flash模型,Pro参数量1.6T,支持百万token长上下文,推理效率大幅提升:百万token下推理flops仅V3.2的27%,KV cache仅10%。定价延续低价,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7。算法优化提升并发,算力需求仍旺盛,国产算力适配积极。

客观事实
  • DeepSeek V4含Pro(1.6T参数)和Flash模型,支持百万token上下文
  • Pro在百万token下推理flops为V3.2的27%,KV cache为10%
  • Pro输出定价3.5美元/百万tokens,为海外顶尖模型1/7
DeepSeek V4 DeepSeek Pro Flash SSD HBM 国产算力

原文

DeepSeek V4含Pro(1.6T总参数)和Flash模型,支持百万token长上下文,推理效率提升显著,Pro在百万token下仅需V3.2的27%单token推理flops和10%KV cache;采用混合注意力架构等优化,将部分KV cache存至SSD以缓解HBM压力;定价延续低价普惠,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7;对算力端,算法优化提升并发,需求仍旺盛,国产算力适配积极;模型端未来或分层竞争,Pro攻高质量任务、Flash拼性价比,短期竞争非主要矛盾。