DeepSeek V4发布Pro和Flash模型,Pro参数量1.6T,支持百万token长上下文,推理效率大幅提升:百万token下推理flops仅V3.2的27%,KV cache仅10%。定价延续低价,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7。算法优化提升并发,算力需求仍旺盛,国产算力适配积极。
DeepSeek V4含Pro(1.6T总参数)和Flash模型,支持百万token长上下文,推理效率提升显著,Pro在百万token下仅需V3.2的27%单token推理flops和10%KV cache;采用混合注意力架构等优化,将部分KV cache存至SSD以缓解HBM压力;定价延续低价普惠,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7;对算力端,算法优化提升并发,需求仍旺盛,国产算力适配积极;模型端未来或分层竞争,Pro攻高质量任务、Flash拼性价比,短期竞争非主要矛盾。