← 返回列表

@jeremyphoward: RT @ctnzr: We've gone even farther: Nemotron 3 Super is 120B and pretrained on 25T tokens in NVFP4. Nemotron 3 Ultra is ~500B and also pret…

@jeremyphoward 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-05-15T22:05 抓取:2026-05-16 04:03
🔗 原文链接
摘要

Nvidia发布Nemotron 3 Super和Ultra模型,参数规模分别为120B和约500B,均预训练在NVFP4格式下,其中Super使用了25T tokens。

客观事实
  • Nemotron 3 Super参数120B,预训练25T tokens,NVFP4格式。
  • Nemotron 3 Ultra参数约500B,同样预训练于NVFP4。
Nemotron

原文

RT @ctnzr: We've gone even farther:
Nemotron 3 Super is 120B and pretrained on 25T tokens in NVFP4.
Nemotron 3 Ultra is ~500B and also pret…

likes: 451 | retweets: 48 | replies: 16 | views: 56414