英伟达开源新旗舰
Nemotron 3 Ultra 这个是什么
little_jeff

NVIDIA Nemotron 3 Ultra 是老黄家 2026年6月初刚发的开源旗舰大模型,Nemotron 3 家族里最强的那个(上面还有 Nano 和 Super 两个小弟)。

几个关键数字:

  • 550B 总参数,MoE 架构(混合专家),每个 token 只激活 ~55B,所以推理很快
  • 100 万 token 上下文窗口
  • Hybrid LatentMoE 架构,把 Mamba-2、MoE、Attention 揉在一起,还加了 Multi-Token Prediction(MTP)做投机解码
  • 推理速度能做到 300+ tokens/s(在 DeepInfra 等平台上)

定位很明确:专打长程 Agent 场景——多步推理、工具调用、代码生成、深度研究、复杂企业工作流(客服自动化、供应链、IT 安全这些)。

开源权重直接挂 HuggingFace,也上了 NVIDIA NIM、OpenRouter 等推理平台。在 Artificial Analysis 智能指数上拿了 48 分,是美国开源模型里最高的(不过 Kimi K2.6 等国产模型分更高)。

一句话:老黄在模型层也下场卷了,不是光卖铲子。这玩意对标的更像是 "给企业跑 Agent 的基建",跟他的硬件生态深度绑定。