← 返回列表

@NVIDIAAI: RT @sudoingX: nemotron 3 omni q8 on dgx spark 128gb vram cranking via hermes agent at 56 tok/s. first night of real local agentic on this b…

@NVIDIAAI 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-05-02T13:27 抓取:2026-05-06 04:02
🔗 原文链接
摘要

NVIDIA AI转发用户测试:在DGX Spark(128GB显存)上以q8量化运行nemotron 3 omni模型,通过Hermes Agent实现56 tok/s的推理速度。

客观事实
  • 在DGX Spark上运行nemotron 3 omni模型,q8量化
  • 通过Hermes Agent达到56 tok/s推理速度
NVIDIA DGX Spark nemotron 3 omni Hermes Agent

原文

RT @sudoingX: nemotron 3 omni q8 on dgx spark 128gb vram cranking via hermes agent at 56 tok/s. first night of real local agentic on this b…

likes: 182 | retweets: 13 | replies: 24 | views: 29239