← 返回列表

华创计算机 |DeepSeek 与海外大模型展望

Alpha 派 4 信息等级 4 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-04-26T12:44 抓取:2026-05-03 07:48
摘要

华创计算机梳理大模型行业动态,指出DeepSeek V4上下文窗口达100万token,采用MoE架构,训练主力使用英伟达B200,推理支持华为910C且下半年产能将释放。Anthropic推理迁移至谷歌TPU并绑定亚马逊训练。DeepSeek获腾讯与阿里投资,走自研路线。

客观事实
  • DeepSeek V4上下文窗口达100万token,采用MoE架构。
  • DeepSeek V4训练主力使用英伟达B200,推理支持华为910C。
  • Anthropic模型推理迁移至谷歌TPU,训练绑定亚马逊。
DeepSeek 英伟达 B200 华为 910C Anthropic 谷歌 TPU 亚马逊 腾讯 阿里

原文

DeepSeek V4上下文窗口达100万token,输入输出成本为Claude的1/50,采用MoE架构,智能体能力提升;训练主力用英伟达B200,推理支持华为910C,后半年910C产能释放;预览版无多模态,消费级显卡难运行,结果摇摆性较Kimi 2.6大,回复存在讨好倾向;海外Anthropic模型安全合规,买评估数据集提升可信度,推理迁移谷歌TPU,训练绑定亚马逊;OpenAI代际提升有限,谷歌Gemini依托自身生态;国内智谱蒸馏体系完备,Kimi为云厂商算力入口,DeepSeek走自研路线,受腾讯阿里投资,或扛国产化大旗。