@NVIDIAAI: RT @sudoingX: nemotron 3 omni q8 on dgx spark 128gb vram cranking via hermes agent at 56 tok/s. first night of real local agentic on this b…

@NVIDIAAI 3 信息等级 3 发布：2026-05-02T13:27 抓取：2026-05-06 04:02

AI 算力

摘要

NVIDIA AI转发用户测试：在DGX Spark（128GB显存）上以q8量化运行nemotron 3 omni模型，通过Hermes Agent实现56 tok/s的推理速度。

客观事实

NVIDIA DGX Spark nemotron 3 omni Hermes Agent

RT @sudoingX: nemotron 3 omni q8 on dgx spark 128gb vram cranking via hermes agent at 56 tok/s. first night of real local agentic on this b…

likes: 182 | retweets: 13 | replies: 24 | views: 29239