Sourcing — Feed

清除当前 1 条 / 共 3560 条

筛选已选

投研/平台

Alpha 派抓到：10 小时 7 分钟前 SemiAnalysis 抓到：3 天 7 小时前

官方/公司

OpenAI News 抓到：1 小时 13 分钟前 NVIDIA Technical Blog 抓到：7 小时 13 分钟前 Azure Blog 抓到：6 天 19 小时前 Google DeepMind Blog 抓到：8 天 1 小时前 Amazon Science 抓到：1 天 7 小时前 AWS ML Blog 抓到：1 天 1 小时前

微信公众号

微信公众号 · Founder Park 抓到：10 天 21 小时前微信公众号 · FundaAI 抓到：17 天 19 小时前微信公众号 · 九章智驾抓到：10 天 21 小时前微信公众号 · 晚点LatePost 抓到：10 天 21 小时前微信公众号 · 琢磨事抓到：24 天 15 小时前微信公众号 · 甲子光年抓到：21 天 5 小时前

重置

异常/暂停数据源 9

AI 基建 · 26 天 19 小时前微信公众号 · 42章经 · 4 天 14 小时前微信公众号 · DeepTech深科技 · 4 天 14 小时前微信公众号 · Founder Park · 4 天 14 小时前微信公众号 · FundaAI · 4 天 14 小时前微信公众号 · 九章智驾 · 4 天 14 小时前微信公众号 · 晚点LatePost · 4 天 14 小时前微信公众号 · 琢磨事 · 4 天 14 小时前微信公众号 · 甲子光年 · 4 天 14 小时前

3 @NVIDIAAI: What does it actually take to run agentic workloads at scale? ⚡Agents push token consumption, context length, and latency into extremely de...

2026-05-05T16:00

NVIDIA AI发文称，运行规模化agentic工作负载对token消耗、上下文长度和延迟要求极高。Vera Rubin平台通过极致协同设计，针对此类复杂工作负载，可在万亿参数MoE模型上实现每用户每秒400+ tokens。

NVIDIA推出Vera Rubin平台，用于运行agentic工作负载
该平台在万亿参数MoE模型上实现每用户每秒400+ tokens

@NVIDIAAI ↗ X AI 算力数据中心

1 共 1 页