中金公司 | DeepSeek-V4技术精读

Alpha 派 4 信息等级 4 发布：2026-04-26T20:54 抓取：2026-05-04 14:50

AI 算力行业研究

摘要

DeepSeek V4发布Pro和Flash模型，Pro参数量1.6T，支持百万token长上下文，推理效率大幅提升：百万token下推理flops仅V3.2的27%，KV cache仅10%。定价延续低价，Pro输出价3.5美元/百万tokens，为海外顶尖模型1/7。算法优化提升并发，算力需求仍旺盛，国产算力适配积极。

客观事实

DeepSeek V4含Pro（1.6T参数）和Flash模型，支持百万token上下文
Pro在百万token下推理flops为V3.2的27%，KV cache为10%
Pro输出定价3.5美元/百万tokens，为海外顶尖模型1/7

DeepSeek V4 DeepSeek Pro Flash SSD HBM 国产算力

原文

DeepSeek V4含Pro（1.6T总参数）和Flash模型，支持百万token长上下文，推理效率提升显著，Pro在百万token下仅需V3.2的27%单token推理flops和10%KV cache；采用混合注意力架构等优化，将部分KV cache存至SSD以缓解HBM压力；定价延续低价普惠，Pro输出价3.5美元/百万tokens，为海外顶尖模型1/7；对算力端，算法优化提升并发，需求仍旺盛，国产算力适配积极；模型端未来或分层竞争，Pro攻高质量任务、Flash拼性价比，短期竞争非主要矛盾。