清除 当前 116 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 20 小时前 微信公众号 · 42章经 · 4 天 15 小时前 微信公众号 · DeepTech深科技 · 4 天 15 小时前 微信公众号 · Founder Park · 4 天 15 小时前 微信公众号 · FundaAI · 4 天 15 小时前 微信公众号 · 九章智驾 · 4 天 15 小时前 微信公众号 · 晚点LatePost · 4 天 15 小时前 微信公众号 · 琢磨事 · 4 天 15 小时前 微信公众号 · 甲子光年 · 4 天 15 小时前

Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。

  • Stability AI发布Stable Audio 3
  • 提供三个开源变体

Cohere 发布其最强大的大语言模型 Command A+,并针对硬件需求进行了优化,以在尽可能少的计算资源上运行。

  • Coere 发布新一代大模型 Command A+
  • 该模型优化了硬件需求,可在少量算力上运行

llama.cpp 发布 b9235 版本,新增推理加速功能,并在 RTX 5090 上对 Qwen3.6 27B 模型进行了基准测试,展示了性能提升。

  • llama.cpp b9235 版本发布,新增推理加速功能
  • 在 RTX 5090 上对 Qwen3.6 27B 进行了基准测试

Hugging Face 数据集排行榜新增按模型参数量范围筛选基准测试结果的功能,用户可更精确地比较不同规模模型的性能。

  • Hugging Face 推出数据集排行榜筛选功能
  • 可依据模型参数范围过滤基准结果

Hugging Face团队启动一项新项目,旨在调查开源AI社区实际使用的硬件情况,基于真实使用而非基准测试或营销宣传。

  • Hugging Face启动项目调查开源AI硬件实际使用情况
  • 项目基于社区真实使用而非基准或营销

NVIDIA发布了Nemotron-Labs-Diffusion系列扩散语言模型,该模型能够同时生成多个token,不同于传统逐token生成的语言模型。

  • NVIDIA发布Nemotron-Labs-Diffusion扩散语言模型
  • 该模型可同时生成多个token

Hugging Face开源了基因组基础模型,推动AI在基因组学领域的应用。

  • Hugging Face开源了基因组基础模型

开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。

  • Marlin-2B模型开源
  • Marlin针对视频结构化信息提取微调

Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。

  • Hugging Face 发布 Carbon DNA 模型
  • Carbon 速度比次优模型快 275 倍

在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。

  • 发布Carbon系列开源生成式DNA基础模型
  • Carbon-3B性能匹配Evo2-7B
  • Carbon-3B运行速度快250倍

Hugging Face 与 tomaarsen 联合发布 Ettin Reranker 家族,包含六种新的 CrossEncoder 重排序模型,参数规模从 17M 到 1B,声称在同规模下达到最先进性能。

  • 发布 Ettin Reranker 家族,含六种新模型
  • CrossEncoder 重排序器参数 17M 至 1B
  • 宣称达到同规模最先进水平

戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。

  • 戴尔CEO称提供模型选择避免基础设施混乱
  • 演讲提及Kimi K2.6和DeepSeek V模型

huggingface的hf-mem工具更新,新增将混合专家模型(MoE)内存估计分解为基础权重、路由专家和KV缓存三个部分的功能。

  • hf-mem工具新增将MoE内存估计分解为三个部分的功能

llama.cpp 新增 MTP 支持,使本地模型运行速度足够日常使用。Qwen3.6-27B 模型在 A10 GPU 上实现快速文本生成。

  • llama.cpp 增加 MTP 支持,提升本地模型推理速度。
  • Qwen3.6-27B 模型在 A10 上实现快速生成。

llama.cpp 新增对 Qwen3.6 系列的多 Token 预测(MTP)支持,被视为本地 AI 生态的重要里程碑,带来性能提升。

  • llama.cpp 添加 MTP 支持 Qwen3.6 系列
  • 该更新被认为是本地 AI 生态的里程碑

推特用户ngxson宣布Qwen3.6-27B模型在WebGPU上实现100%运行,但速度并非最佳。该演示展示了AI模型在浏览器端推理的可行性。

  • Qwen3.6-27B模型在WebGPU上实现100%运行
  • 运行速度并非最佳

开发者正在将SAM模型移植到Apple silicon,并在MLX上实现1.25倍推理速度提升。

  • 正在将SAM模型移植到Apple silicon
  • 在MLX上推理速度提升1.25倍

用户ErikKaum在huggingface上发布了其首个kernel MaxSim,旨在优化延迟交互检索(ColBERT/PyLate)的瓶颈问题。

  • ErikKaum在huggingface发布了MaxSim kernel
  • MaxSim用于优化ColBERT/PyLate的交互检索瓶颈

微软在Hugging Face上发布了名为Lens的文本到图像模型,参数量为3.8B,该模型具有高效训练和高性能特点。

  • 微软发布3.8B参数文本到图像模型Lens
  • 模型已在Hugging Face平台上线

HuggingFace发布了一个30B-A3B推理模型,在物理和数学奥林匹克评估中达到金牌水平。该模型在推理能力上取得突破,引起广泛关注。

  • 发布30B-A3B推理模型
  • 物理和数学奥赛评估达金牌水平

Datadog 发布 Toto 2.0 时间序列基础模型权重,引发对时间序列模型规模定律的讨论。

  • Datadog 发布 Toto 2.0 模型权重

HuggingFace本周达到100万个数据集的里程碑,所有开源模型基于此,下一步目标为更多开放数据集。

  • HuggingFace数据集数量突破100万

Resemble AI研究团队发布了新语音AI模型Dramabox,该模型旨在提供奥斯卡级别的语音表现力。

  • Resemble AI发布新语音AI模型Dramabox
  • 该模型由研究团队开发

一条推文表示现在可以在笔记本电脑上免费运行Qwen3-35B-A3B模型,使用llama.cpp和4位量化,实现24/7运行。

  • 可以在笔记本电脑上免费运行Qwen3-35B-A3B模型
  • 使用llama.cpp和4位量化实现高效运行

Hugging Face 团队宣布发布 Diffusers 0.38.0 版本,新增多个管道(pipelines)并改进了库功能。

  • Diffusers 0.38.0 版本发布,新增多个管道和库改进。

Hugging Face 转发推文称,机器人 Reachy Mini 出现在科技博主 LinusTech 最新视频封面,获得产品展示曝光。

  • Reachy Mini 成为 LinusTech 视频封面主角

Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。

  • Marionette 工具可通过手部动作创建机器人运动
  • 支持 Reachy Mini 机器人
  • 基于浏览器,可在手机上使用

介绍physics-intern框架,这是一个用于理论物理的智能体框架。该框架使Gemini 3.1 Pro在CritP基准上的正确率从17.7%提升至31.4%。

  • physics-intern是一个用于理论物理的智能体框架
  • 该框架将Gemini 3.1 Pro在CritP上的正确率从17.7%提升至31.4%

Reachy Mini因RAM价格上涨和关税成本增加,将于6月1日调整价格。

  • Reachy Mini因RAM价格上涨和关税成本增加将于6月1日调价

Hugging Face 宣布其 Hub 上开放数据集数量达到 100 万个,强调开放数据对开放模型的重要性。

  • Hugging Face Hub 上开放数据集达到 100 万个

Hugging Face CEO Clement Delangue宣布,该平台公有数据集数量突破100万,提供PB级数据供AI开发者使用。

  • Hugging Face公有数据集达100万个
  • 数据总量达PB级别

Hugging Face Hub宣布开放数据集数量达到100万,强调开放数据对开放模型的重要性。

  • Hugging Face Hub开放数据集数量达到100万

Hugging Face转发消息称,本周将发布两个开源小型语言模型(SLM)。其中一个在比SOTA模型小93倍的情况下达到同等精度,另一个在更小尺寸下实现类似准确性。

  • 本周将发布两个开源SLM
  • 一个模型尺寸小93倍仍达SOTA精度
  • 另一个模型在更小尺寸下精度类似

Unsloth发布了支持MTP的量化GGUF格式,适用于Qwen3.6-35B-A3B模型。

  • Unsloth发布了MTP-enabled的量化GGUF文件
  • 针对Qwen3.6-35B-A3B模型

Hugging Face CEO Clement Delangue在推特宣布,由于RAM成本上涨和关税影响,公司产品价格将于6月1日起上调。

  • Hugging Face因RAM成本及关税上涨,将于6月1日提价

推特消息:Reason-ModernColBERT模型在BrowseComp-Plus任务上接近解决,性能超越当前最优水平,且模型大小仅为先前模型的1/54,展示出高效能。

  • Reason-ModernColBERT接近解决BrowseComp-Plus任务
  • 模型性能超越现有最优,且比54倍大的模型更好

Meta上周悄然发布Sapiens2模型家族,这是一组高分辨率模型,基于10亿张人类图像训练,主要用于姿态估计等任务。

  • Meta发布Sapiens2模型家族
  • 模型训练使用10亿张人类图像
  • 模型用于姿态估计等任务

OpenMed Agent 预览版发布,基于 Hugging Face 的端点,用于临床数据提取和术语处理。

  • OpenMed Agent 预览版发布
  • 构建在 Hugging Face 之上,支持临床提取和术语

ml-intern项目上线三周,已交换100万条消息,相当于在21天内完成了3.3个agent年的机器学习研究。

  • ml-intern上线3周内消息交换量达100万条。
  • 相当于3.3个agent年的ML研究在21天内完成。

用户sudoingX发布更新,称Qwen 3.6 27B dense q4模型在单张NVIDIA RTX 3090上一次性完成了Octopus Invaders游戏,由Hermes代理驱动整个过程。

  • Qwen 3.6 27B dense q4模型在单张3090上运行
  • 模型一次性完成了Octopus Invaders游戏

Claw-Eval评测榜单公布,小米MiMo-V2.5-Pro以1T参数获得第一,智谱GLM5.1以754B参数获得第二,小米MiMo-V2.5以310B参数获得第三。

  • Claw-Eval榜单前三名公布
  • 小米MiMo-V2.5-Pro以1T参数获第一
  • 智谱GLM5.1以754B参数获第二

Qwen发布WebWorld系列开放世界模型,专为Web代理设计,包含8B、14B、32B参数版本及数据集,采用Apache2.0许可,在MiniWob++任务上提升9.9%,在WebArena上提升10%。

  • Qwen发布WebWorld开放世界模型系列
  • 模型参数包括8B、14B、32B及配套数据集
  • 采用Apache2.0许可,性能提升9.9%至10%

Hugging Face宣布与Hermes Agent合作,将Hermes Agent集成到本地应用中,用户可本地运行任何兼容的GGUF/MLX模型。

  • Hugging Face与Hermes Agent合作
  • Hermes Agent可本地运行,支持GGUF/MLX模型

Adithya S K 发布了一项 RL Environment Creator Skill,允许用户通过 npx 命令创建强化学习环境。该技能旨在简化 RL 环境的搭建过程。

  • 发布 RL Environment Creator Skill
  • 可通过 npx skills add 命令使用

onusoz宣布加入Hugging Face,将负责改进本地模型在OpenClaw上的表现。该消息通过推特发布,获得一定关注。

  • onusoz加入Hugging Face
  • 将负责优化本地模型在OpenClaw上的性能

微软在Hugging Face上发布了Phi-Ground-Any视觉模型,具有4B参数,在GUI grounding任务上达到SOTA性能。

  • 微软发布Phi-Ground-Any模型
  • 模型参数为4B
  • 在GUI grounding任务上达到SOTA

Hugging Face宣布推出沙盒功能,用户可在该平台使用沙盒环境。

  • Hugging Face现在提供沙盒功能。

Hugging Face的TRL库发布v1.4版本,新增chunked NLL损失用于监督微调,使用更少显存且速度更快,并提及Qwen3模型。

  • TRL v1.4版本发布
  • 新增chunked NLL损失用于SFT
  • 显存更少,损失相同,速度更快

ClementDelangue在推特上表示本地AI正流行,并分享了过去8个月每月新增GGUF模型数量的图表数据。

  • 过去8个月每月新增GGUF模型数量持续增长

Hugging Face 用户 julien_c 发布了一个周末项目,一个用于测量从 HF CDN 下载速度的 CLI 扩展,可通过 hf extensions install 命令运行。

  • 发布测量 HF CDN 下载速度的 CLI 扩展
  • 可通过 hf extensions install 命令运行