清除 当前 24 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 19 小时前 微信公众号 · 42章经 · 4 天 14 小时前 微信公众号 · DeepTech深科技 · 4 天 14 小时前 微信公众号 · Founder Park · 4 天 14 小时前 微信公众号 · FundaAI · 4 天 14 小时前 微信公众号 · 九章智驾 · 4 天 14 小时前 微信公众号 · 晚点LatePost · 4 天 14 小时前 微信公众号 · 琢磨事 · 4 天 14 小时前 微信公众号 · 甲子光年 · 4 天 14 小时前

NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构,可部署于兼容编码agent,将视频转化为可搜索、可行动的情报,用户通过自然语言提问获得剪辑、摘要和答案,无需手动配置多个微服务。

  • NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构
  • 该方案消除手动配置微服务,通过聊天界面搜索视频

NVIDIA AI转发消息,Harvey和Trajectory Labs对Nemotron 3 Super模型进行后训练应用于复杂法律任务,取得初步印象深刻结果,模型具有可审计权重、安全性和清晰来源。

  • Nemotron 3 Super被后训练用于复杂法律任务。
  • 后训练由Harvey和Trajectory Labs完成,结果印象深刻。

英伟达宣布在其开放模型系列中采用Linux基金会的OpenMDW框架,旨在简化开源许可,实现跨模型、代码、文档和数据的统一法律框架,减少开发者和企业构建开源软件的摩擦。

  • 英伟达在开放模型系列中采用Linux基金会的OpenMDW框架
  • OpenMDW框架简化并统一了开源许可
  • 该框架覆盖模型、代码、文档和数据

NVIDIA 推出 Dynamo Snapshot 技术,用于 Kubernetes 上的推理工作负载快速启动,将启动时间从分钟级降至5秒以内。该技术利用 GMS 实现并发权重恢复,并加速 CRIU 恢复性能,旨在应对生产环境中推理部署的波动需求。

  • Dynamo Snapshot 将启动时间从分钟级降至5秒内
  • 技术利用 GMS 实现并发权重恢复和加速 CRIU 恢复
  • 针对 Kubernetes 上推理工作负载的快速启动

NVIDIA AI实验室发布了关于文本扩散和弹性推理的技术文章,介绍相关研究成果。

  • NVIDIA AI实验室发布文本扩散技术文章
  • 文章涉及弹性推理方法

NVIDIA发布推文称,使用2台DGX Sparks服务器和MiniMax M2.7 NVFP4模型,可同时运行16个本地AI智能体。该配置展示了多智能体协同运行的可行性。

  • 2台DGX Sparks服务器和MiniMax M2.7 NVFP4模型可同时运行16个本地AI智能体
  • 该配置由NVIDIA官方账号发布并展示

英伟达研究院发布LongLive-2.0系统,用于长视频生成的端到端NVFP4训练和推理,通过对齐训练与推理,提升速度与内存效率。

  • 英伟达研究院发布长视频生成系统LongLive-2.0
  • 系统采用NVFP4低精度训练和W4A4推理
  • 在保持基准质量的同时提升速度和内存效率

NVIDIA转发推文,宣布与MistralAI及Nemotron Coalition合作,共同推进开放AI技术。

  • NVIDIA宣布与MistralAI合作
  • 合作旨在推进开放AI技术

NVIDIA发布了NVIDIA-Verified Agent Skills,为AI代理技能提供认证和透明度,包括技能卡展示功能和风险。该技能基于开放规范构建,可兼容ClaudeAI Code、OpenAI Codex和Cursor AI。

  • NVIDIA发布了认证的Agent技能
  • 每个技能附带技能卡,提供透明度和风险评估
  • 技能基于开放规范,兼容多个AI代码助手

NVIDIA AI团队发布SANA-WM开源世界模型,参数26亿,单GPU运行,输入图像、文本和相机轨迹即可生成60秒可控视频。

  • NVIDIA发布SANA-WM开源世界模型
  • 模型参数26亿,单GPU运行
  • 支持60秒视频生成与精准相机控制

OpenShell 发布 v0.0.43 版本,新增双向 TTY 流、OIDC 认证、HTTPS 与 mTLS 解耦、TOML 网关配置,沙箱从 ext4 磁盘启动,并移除 DNS 以防止数据泄露,改进了认证、流和沙箱隔离。

  • OpenShell v0.0.43 发布
  • 新增双向 TTY 流和 OIDC 认证
  • 移除 DNS 功能防止数据泄露

OpenShell 发布 v0.0.40 版本,新增本地域服务路由和 Kubernetes 节点调度与容忍功能,CLI 的 TLS 改用操作系统信任存储,并修复两个安全漏洞,SecretResolver 调试不再泄漏密钥。

  • OpenShell 发布 v0.0.40 版本
  • 新增本地域服务路由和 K8s 节点调度功能
  • 修复两个安全漏洞

Perplexity AI 发布新研究,详述如何在 NVIDIA GB200 NVL72 Blackwell 机架上服务后训练的 Qwen3 235B 模型,展示了高性能推理部署方案。

  • Perplexity AI 发布新研究
  • 研究涉及服务 Qwen3 235B 模型
  • 使用 NVIDIA GB200 NVL72 Blackwell 机架

OpenShell发布v0.0.37版本,新增可插拔计算驱动(Docker、Podman、Kubernetes、MicroVM)、OIDC+RBAC网关认证、Helm chart及Kubernetes用户命名空间支持,并提供Debian、RPM和Homebrew包。升级前需重建网关。

  • OpenShell v0.0.37发布,支持多种计算驱动
  • 新增OIDC+RBAC网关认证和Helm chart
  • 提供Debian、RPM、Homebrew包安装

NVIDIA通过Dynamo强化harness路径,支持Claude Code、OpenClaw和OpenAI Codex等agent模式,实现稳定提示词、交错推理与工具调用、流式工具调度等改进。

  • NVIDIA Dynamo强化harness路径以支持agent模式
  • 改进包括流式工具调度和交错推理
  • 针对Claude Code、OpenClaw、OpenAI Codex等工具

NVIDIA Research发布Guess-Verify-Refine算法,一种硬件感知的稀疏注意力机制,专为Blackwell上的TensorRT LLM设计,实现Top-K注意力1.88倍加速,端到端延迟提升9.3%。

  • NVIDIA Research发布Guess-Verify-Refine稀疏注意力算法
  • 该算法专为Blackwell上的TensorRT LLM设计
  • 实现Top-K注意力1.88倍加速,端到端延迟提升9.3%

NVIDIA AI宣布推出TokenSpeed推理引擎,专为高速智能体工作负载设计。该引擎具备高级KV缓存管理、安全高效调度器、可插拔分层内核系统,支持多芯片,并在NVIDIA Blackwell上实现最快的MLA注意力内核。

  • TokenSpeed是NVIDIA发布的全新推理引擎
  • TokenSpeed在NVIDIA Blackwell上拥有最快的MLA注意力内核
  • 该引擎支持多芯片,采用可插拔分层内核系统

NVIDIA内部使用基于cuOpt的智能工作流优化供应链,该工具已开源,支持多智能体编排和GPU加速求解器,可在几分钟内完成优化,并提供预配置GPU环境供开发者试用。

  • NVIDIA内部使用cuOpt优化供应链
  • cuOpt已开源,支持多智能体编排
  • 提供预配置GPU环境供开发者试用

NVIDIA Megatron Core 新增对 Muon、MOP 和 REKLS 等优化器的支持,旨在提升 GB300 GPU 和 NVL72 系统上训练 Kimi K2、Qwen3 30B 等大模型的效率。

  • NVIDIA Megatron Core 支持 Muon 等高阶优化器
  • 针对 GB300 GPU 和 NVL72 系统优化训练效率
  • 用于训练 Kimi K2 和 Qwen3 30B 规模模型

NVIDIA宣布其Nemotron 3 Super模型在EnterpriseOps-Gym排行榜开源类别中排名第一。该排行榜通过1150项任务和512个功能工具评估企业级AI代理性能。

  • Nemotron 3 Super在EnterpriseOps-Gym开源类别中排名第一
  • 该排行榜基于1150项任务和512个功能工具评估

NVIDIA发布开源安全沙盒OpenShell,旨在为企业AI代理提供安全控制,限制代理的访问、共享和发送权限,保护企业数据安全。

  • NVIDIA发布开源安全沙盒OpenShell,用于企业AI代理安全控制。

英伟达AI宣布,SGLang在Blackwell硬件上对DeepSeek-V4推理达到180 tok/s/GPU,支持约1M上下文,该优化来自lmsysorg利用模型混合稀疏注意力的Blackwell特定优化。

  • SGLang在Blackwell上对DeepSeek-V4推理速度达180 tok/s/GPU
  • 支持约1M上下文长度
  • 优化来自lmsysorg的Blackwell特定混合稀疏注意力利用

英伟达AI官方推特发文,招聘世界模型研究员加入Ming-Yu领导的Cosmos团队,提供了研究岗位信息。

  • 英伟达AI招聘世界模型研究员
  • 招聘面向Ming-Yu的Cosmos团队

NVIDIA AI官方祝贺MistralAI发布Mistral Medium 3.5模型,该模型为128B参数稠密文本-视觉模型,在SWE-Bench Verified上得分77.6%,并可在NVIDIA平台运行或通过NIM微服务部署。

  • MistralAI发布Mistral Medium 3.5模型
  • 模型为128B参数稠密文本-视觉模型
  • 模型在SWE-Bench Verified上得分77.6%