Sourcing — Feed

3 @NVIDIAAI: Hours of video, now searchable by your agent. We just released a new set of agent skills and modular architecture for the Metropolis Bluepr...

2026-05-29T22:00

NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构，可部署于兼容编码agent，将视频转化为可搜索、可行动的情报，用户通过自然语言提问获得剪辑、摘要和答案，无需手动配置多个微服务。

NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构
该方案消除手动配置微服务，通过聊天界面搜索视频

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: This is a great read on post-training and open models. @harvey & @trajectorylabs post-trained Nemotron 3 Super on complex legal tasks w...

2026-05-29T20:39

NVIDIA AI转发消息，Harvey和Trajectory Labs对Nemotron 3 Super模型进行后训练应用于复杂法律任务，取得初步印象深刻结果，模型具有可审计权重、安全性和清晰来源。

Nemotron 3 Super被后训练用于复杂法律任务。
后训练由Harvey和Trajectory Labs完成，结果印象深刻。

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: We're adopting the Linux Foundation’s OpenMDW framework across our open model families. This helps make open model licensing simpler and mo...

2026-05-28T16:29

英伟达宣布在其开放模型系列中采用Linux基金会的OpenMDW框架，旨在简化开源许可，实现跨模型、代码、文档和数据的统一法律框架，减少开发者和企业构建开源软件的摩擦。

英伟达在开放模型系列中采用Linux基金会的OpenMDW框架
OpenMDW框架简化并统一了开源许可
该框架覆盖模型、代码、文档和数据

@NVIDIAAI ↗ X AI 行业动态公司

3 @NVIDIAAI: Introducing Dynamo Snapshot, our approach for fast startup for inference workloads on Kubernetes, which reduces startup time from minutes to...

2026-05-27T23:56

NVIDIA 推出 Dynamo Snapshot 技术，用于 Kubernetes 上的推理工作负载快速启动，将启动时间从分钟级降至5秒以内。该技术利用 GMS 实现并发权重恢复，并加速 CRIU 恢复性能，旨在应对生产环境中推理部署的波动需求。

Dynamo Snapshot 将启动时间从分钟级降至5秒内
技术利用 GMS 实现并发权重恢复和加速 CRIU 恢复
针对 Kubernetes 上推理工作负载的快速启动

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: From the Lab: Text Diffusion and Elastic Reasoning | Nemotron Labs https://t.co/BJt78rLjnb

2026-05-26T18:00

NVIDIA AI实验室发布了关于文本扩散和弹性推理的技术文章，介绍相关研究成果。

NVIDIA AI实验室发布文本扩散技术文章
文章涉及弹性推理方法

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: (2x DGX Sparks) + MiniMax M2.7 NVFP4 = 16 local AI agents running simultaneously 👀

2026-05-25T14:42

NVIDIA发布推文称，使用2台DGX Sparks服务器和MiniMax M2.7 NVFP4模型，可同时运行16个本地AI智能体。该配置展示了多智能体协同运行的可行性。

2台DGX Sparks服务器和MiniMax M2.7 NVFP4模型可同时运行16个本地AI智能体
该配置由NVIDIA官方账号发布并展示

@NVIDIAAI ↗ X AI 算力行业动态

3 @NVIDIAAI: Long video generation is a systems problem. Introducing LongLive-2.0 from NVIDIA Research: an end-to-end NVFP4 training and inference syste...

2026-05-22T20:21

英伟达研究院发布LongLive-2.0系统，用于长视频生成的端到端NVFP4训练和推理，通过对齐训练与推理，提升速度与内存效率。

英伟达研究院发布长视频生成系统LongLive-2.0
系统采用NVFP4低精度训练和W4A4推理
在保持基准质量的同时提升速度和内存效率

@NVIDIAAI ↗ X AI 行业

3 @NVIDIAAI: RT @ctnzr: So glad to be working with @MistralAI and the Nemotron Coalition to advance open technology for AI! https://t.co/metUbUhovB

2026-05-21T22:43

NVIDIA转发推文，宣布与MistralAI及Nemotron Coalition合作，共同推进开放AI技术。

NVIDIA宣布与MistralAI合作
合作旨在推进开放AI技术

@NVIDIAAI ↗ X AI 行业

3 @NVIDIAAI: We just shipped NVIDIA-Verified Agent Skills 🔐 Skills make your agent more capable, but can also introduce vulnerabilities. Verified skills...

2026-05-21T16:21

NVIDIA发布了NVIDIA-Verified Agent Skills，为AI代理技能提供认证和透明度，包括技能卡展示功能和风险。该技能基于开放规范构建，可兼容ClaudeAI Code、OpenAI Codex和Cursor AI。

NVIDIA发布了认证的Agent技能
每个技能附带技能卡，提供透明度和风险评估
技能基于开放规范，兼容多个AI代码助手

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: One image + text + camera trajectory = controllable worlds. All on a single GPU. Our research team just released SANA-WM, a 2.6B open sour...

2026-05-19T18:37

NVIDIA AI团队发布SANA-WM开源世界模型，参数26亿，单GPU运行，输入图像、文本和相机轨迹即可生成60秒可控视频。

NVIDIA发布SANA-WM开源世界模型
模型参数26亿，单GPU运行
支持60秒视频生成与精准相机控制

@NVIDIAAI ↗ X AI 算力行业

3 @NVIDIAAI: OpenShell v0.0.43 🛠️ bidirectional TTY streaming 🔒 OIDC auth in the TUI 🧩 HTTPS and mTLS decoupled 📦 TOML gateway config (RFC 0003) 🖥️ sand...

2026-05-18T16:30

OpenShell 发布 v0.0.43 版本，新增双向 TTY 流、OIDC 认证、HTTPS 与 mTLS 解耦、TOML 网关配置，沙箱从 ext4 磁盘启动，并移除 DNS 以防止数据泄露，改进了认证、流和沙箱隔离。

OpenShell v0.0.43 发布
新增双向 TTY 流和 OIDC 认证
移除 DNS 功能防止数据泄露

@NVIDIAAI ↗ X 行业动态云计算

3 @NVIDIAAI: OpenShell v0.0.40 🔀 local-domain service routing in the gateway ☸️ k8s node scheduling + tolerations 🔒 CLI TLS now uses the OS trust store ...

2026-05-13T17:13

OpenShell 发布 v0.0.40 版本，新增本地域服务路由和 Kubernetes 节点调度与容忍功能，CLI 的 TLS 改用操作系统信任存储，并修复两个安全漏洞，SecretResolver 调试不再泄漏密钥。

OpenShell 发布 v0.0.40 版本
新增本地域服务路由和 K8s 节点调度功能
修复两个安全漏洞

@NVIDIAAI ↗ X 行业动态

3 @NVIDIAAI: RT @perplexity_ai: We published new research on how we serve post-trained Qwen3 235B models on NVIDIA GB200 NVL72 Blackwell racks. GB200 i…

2026-05-12T15:44

Perplexity AI 发布新研究，详述如何在 NVIDIA GB200 NVL72 Blackwell 机架上服务后训练的 Qwen3 235B 模型，展示了高性能推理部署方案。

Perplexity AI 发布新研究
研究涉及服务 Qwen3 235B 模型
使用 NVIDIA GB200 NVL72 Blackwell 机架

@NVIDIAAI ↗ X AI 算力云计算行业

3 @NVIDIAAI: OpenShell v0.0.37 🧩 pluggable compute drivers: Docker, Podman, Kubernetes, MicroVM 🔒 OIDC + RBAC gateway auth ☸️ Helm chart + Kubernete...

2026-05-11T17:00

OpenShell发布v0.0.37版本，新增可插拔计算驱动（Docker、Podman、Kubernetes、MicroVM）、OIDC+RBAC网关认证、Helm chart及Kubernetes用户命名空间支持，并提供Debian、RPM和Homebrew包。升级前需重建网关。

OpenShell v0.0.37发布，支持多种计算驱动
新增OIDC+RBAC网关认证和Helm chart
提供Debian、RPM、Homebrew包安装

@NVIDIAAI ↗ X 行业动态

3 @NVIDIAAI: Most agentic stacks run into the same problems pretty quickly: reasoning and tool parsing drift across turns, KV cache reuse falls apart, or...

2026-05-08T19:36

NVIDIA通过Dynamo强化harness路径，支持Claude Code、OpenClaw和OpenAI Codex等agent模式，实现稳定提示词、交错推理与工具调用、流式工具调度等改进。

NVIDIA Dynamo强化harness路径以支持agent模式
改进包括流式工具调度和交错推理
针对Claude Code、OpenClaw、OpenAI Codex等工具

@NVIDIAAI ↗ X AI 算力云计算行业

3 @NVIDIAAI: What if every decode step gave the next one a head start? Meet Guess-Verify-Refine — a new hardware-aware sparse-attention algorithm from N...

2026-05-07T17:00

NVIDIA Research发布Guess-Verify-Refine算法，一种硬件感知的稀疏注意力机制，专为Blackwell上的TensorRT LLM设计，实现Top-K注意力1.88倍加速，端到端延迟提升9.3%。

NVIDIA Research发布Guess-Verify-Refine稀疏注意力算法
该算法专为Blackwell上的TensorRT LLM设计
实现Top-K注意力1.88倍加速，端到端延迟提升9.3%

@NVIDIAAI ↗ X AI 算力行业

3 @NVIDIAAI: TokenSpeed is a brand new inference engine purpose built for speed-of-light agentic workloads. Read their blog to learn more about its ad...

2026-05-06T16:21

NVIDIA AI宣布推出TokenSpeed推理引擎，专为高速智能体工作负载设计。该引擎具备高级KV缓存管理、安全高效调度器、可插拔分层内核系统，支持多芯片，并在NVIDIA Blackwell上实现最快的MLA注意力内核。

TokenSpeed是NVIDIA发布的全新推理引擎
TokenSpeed在NVIDIA Blackwell上拥有最快的MLA注意力内核
该引擎支持多芯片，采用可插拔分层内核系统

@NVIDIAAI ↗ X AI 算力行业

3 @NVIDIAAI: Internally at NVIDIA, we use cuOpt based agentic workflows with agent skills to optimize our supply chains. Since it’s open source, you can ...

2026-05-04T22:30

NVIDIA内部使用基于cuOpt的智能工作流优化供应链，该工具已开源，支持多智能体编排和GPU加速求解器，可在几分钟内完成优化，并提供预配置GPU环境供开发者试用。

NVIDIA内部使用cuOpt优化供应链
cuOpt已开源，支持多智能体编排
提供预配置GPU环境供开发者试用

@NVIDIAAI ↗ X AI 算力行业

3 @NVIDIAAI: Training Kimi K2 and Qwen3 30B-scale models efficiently requires more than standard data-parallel tricks. NVIDIA Megatron Core now provides...

2026-05-04T21:00

NVIDIA Megatron Core 新增对 Muon、MOP 和 REKLS 等优化器的支持，旨在提升 GB300 GPU 和 NVL72 系统上训练 Kimi K2、Qwen3 30B 等大模型的效率。

NVIDIA Megatron Core 支持 Muon 等高阶优化器
针对 GB300 GPU 和 NVL72 系统优化训练效率
用于训练 Kimi K2 和 Qwen3 30B 规模模型

@NVIDIAAI ↗ X AI 算力行业动态

3 @NVIDIAAI: Benchmarks should reflect real-world performance. That’s why we’re excited to share that Nemotron 3 Super has topped the open source catego...

2026-05-04T20:04

NVIDIA宣布其Nemotron 3 Super模型在EnterpriseOps-Gym排行榜开源类别中排名第一。该排行榜通过1150项任务和512个功能工具评估企业级AI代理性能。

Nemotron 3 Super在EnterpriseOps-Gym开源类别中排名第一
该排行榜基于1150项任务和512个功能工具评估

@NVIDIAAI ↗ X AI 行业动态

3 @NVIDIAAI: We created OpenShell to make AI agents safe for enterprises. Built in open source so any company can adopt and trust it, this secure sandbo...

2026-05-01T22:07

NVIDIA发布开源安全沙盒OpenShell，旨在为企业AI代理提供安全控制，限制代理的访问、共享和发送权限，保护企业数据安全。

NVIDIA发布开源安全沙盒OpenShell，用于企业AI代理安全控制。

@NVIDIAAI ↗ X AI 行业算力

3 @NVIDIAAI: SGLang is hitting 180 tok/s/GPU on DeepSeek-V4 decode with ~1M context on Blackwell. Good to see fast progress in open source DeepSeek-V4 ...

2026-04-30T21:31

英伟达AI宣布，SGLang在Blackwell硬件上对DeepSeek-V4推理达到180 tok/s/GPU，支持约1M上下文，该优化来自lmsysorg利用模型混合稀疏注意力的Blackwell特定优化。

SGLang在Blackwell上对DeepSeek-V4推理速度达180 tok/s/GPU
支持约1M上下文长度
优化来自lmsysorg的Blackwell特定混合稀疏注意力利用

@NVIDIAAI ↗ X AI 算力行业

3 @NVIDIAAI: Attn researchers working on world models… come work with Ming-Yu’s Cosmos team 👇

2026-04-30T14:04

英伟达AI官方推特发文，招聘世界模型研究员加入Ming-Yu领导的Cosmos团队，提供了研究岗位信息。

英伟达AI招聘世界模型研究员
招聘面向Ming-Yu的Cosmos团队

@NVIDIAAI ↗ X 行业 AI 动态

3 @NVIDIAAI: Congrats to the @MistralAI team on launching Mistral Medium 3.5! This new single 128B dense text-vision model merges instruction-following,...

2026-04-29T16:16

NVIDIA AI官方祝贺MistralAI发布Mistral Medium 3.5模型，该模型为128B参数稠密文本-视觉模型，在SWE-Bench Verified上得分77.6%，并可在NVIDIA平台运行或通过NIM微服务部署。

MistralAI发布Mistral Medium 3.5模型
模型为128B参数稠密文本-视觉模型
模型在SWE-Bench Verified上得分77.6%

@NVIDIAAI ↗ X AI 行业动态