华创计算机｜DeepSeek 与海外大模型展望

Alpha 派 4 信息等级 4 发布：2026-04-26T12:44 抓取：2026-05-03 07:48

AI 算力行业动态

摘要

华创计算机梳理大模型行业动态，指出DeepSeek V4上下文窗口达100万token，采用MoE架构，训练主力使用英伟达B200，推理支持华为910C且下半年产能将释放。Anthropic推理迁移至谷歌TPU并绑定亚马逊训练。DeepSeek获腾讯与阿里投资，走自研路线。

客观事实

DeepSeek V4上下文窗口达100万token，采用MoE架构。
DeepSeek V4训练主力使用英伟达B200，推理支持华为910C。
Anthropic模型推理迁移至谷歌TPU，训练绑定亚马逊。

DeepSeek 英伟达 B200 华为 910C Anthropic 谷歌 TPU 亚马逊腾讯阿里

原文

DeepSeek V4上下文窗口达100万token，输入输出成本为Claude的1/50，采用MoE架构，智能体能力提升；训练主力用英伟达B200，推理支持华为910C，后半年910C产能释放；预览版无多模态，消费级显卡难运行，结果摇摆性较Kimi 2.6大，回复存在讨好倾向；海外Anthropic模型安全合规，买评估数据集提升可信度，推理迁移谷歌TPU，训练绑定亚马逊；OpenAI代际提升有限，谷歌Gemini依托自身生态；国内智谱蒸馏体系完备，Kimi为云厂商算力入口，DeepSeek走自研路线，受腾讯阿里投资，或扛国产化大旗。

华创计算机 ｜DeepSeek 与海外大模型展望

原文

华创计算机｜DeepSeek 与海外大模型展望