华创计算机梳理大模型行业动态,指出DeepSeek V4上下文窗口达100万token,采用MoE架构,训练主力使用英伟达B200,推理支持华为910C且下半年产能将释放。Anthropic推理迁移至谷歌TPU并绑定亚马逊训练。DeepSeek获腾讯与阿里投资,走自研路线。
DeepSeek V4上下文窗口达100万token,输入输出成本为Claude的1/50,采用MoE架构,智能体能力提升;训练主力用英伟达B200,推理支持华为910C,后半年910C产能释放;预览版无多模态,消费级显卡难运行,结果摇摆性较Kimi 2.6大,回复存在讨好倾向;海外Anthropic模型安全合规,买评估数据集提升可信度,推理迁移谷歌TPU,训练绑定亚马逊;OpenAI代际提升有限,谷歌Gemini依托自身生态;国内智谱蒸馏体系完备,Kimi为云厂商算力入口,DeepSeek走自研路线,受腾讯阿里投资,或扛国产化大旗。