Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。
Cohere 发布其最强大的大语言模型 Command A+,并针对硬件需求进行了优化,以在尽可能少的计算资源上运行。
llama.cpp 发布 b9235 版本,新增推理加速功能,并在 RTX 5090 上对 Qwen3.6 27B 模型进行了基准测试,展示了性能提升。
Hugging Face 数据集排行榜新增按模型参数量范围筛选基准测试结果的功能,用户可更精确地比较不同规模模型的性能。
Hugging Face团队启动一项新项目,旨在调查开源AI社区实际使用的硬件情况,基于真实使用而非基准测试或营销宣传。
NVIDIA发布了Nemotron-Labs-Diffusion系列扩散语言模型,该模型能够同时生成多个token,不同于传统逐token生成的语言模型。
Hugging Face开源了基因组基础模型,推动AI在基因组学领域的应用。
开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。
Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。
在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。
Hugging Face 与 tomaarsen 联合发布 Ettin Reranker 家族,包含六种新的 CrossEncoder 重排序模型,参数规模从 17M 到 1B,声称在同规模下达到最先进性能。
戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。
huggingface的hf-mem工具更新,新增将混合专家模型(MoE)内存估计分解为基础权重、路由专家和KV缓存三个部分的功能。
llama.cpp 新增 MTP 支持,使本地模型运行速度足够日常使用。Qwen3.6-27B 模型在 A10 GPU 上实现快速文本生成。
llama.cpp 新增对 Qwen3.6 系列的多 Token 预测(MTP)支持,被视为本地 AI 生态的重要里程碑,带来性能提升。
推特用户ngxson宣布Qwen3.6-27B模型在WebGPU上实现100%运行,但速度并非最佳。该演示展示了AI模型在浏览器端推理的可行性。
开发者正在将SAM模型移植到Apple silicon,并在MLX上实现1.25倍推理速度提升。
用户ErikKaum在huggingface上发布了其首个kernel MaxSim,旨在优化延迟交互检索(ColBERT/PyLate)的瓶颈问题。
微软在Hugging Face上发布了名为Lens的文本到图像模型,参数量为3.8B,该模型具有高效训练和高性能特点。
HuggingFace发布了一个30B-A3B推理模型,在物理和数学奥林匹克评估中达到金牌水平。该模型在推理能力上取得突破,引起广泛关注。
Datadog 发布 Toto 2.0 时间序列基础模型权重,引发对时间序列模型规模定律的讨论。
HuggingFace本周达到100万个数据集的里程碑,所有开源模型基于此,下一步目标为更多开放数据集。
Resemble AI研究团队发布了新语音AI模型Dramabox,该模型旨在提供奥斯卡级别的语音表现力。
一条推文表示现在可以在笔记本电脑上免费运行Qwen3-35B-A3B模型,使用llama.cpp和4位量化,实现24/7运行。
Hugging Face 团队宣布发布 Diffusers 0.38.0 版本,新增多个管道(pipelines)并改进了库功能。
Hugging Face 转发推文称,机器人 Reachy Mini 出现在科技博主 LinusTech 最新视频封面,获得产品展示曝光。
Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。
介绍physics-intern框架,这是一个用于理论物理的智能体框架。该框架使Gemini 3.1 Pro在CritP基准上的正确率从17.7%提升至31.4%。
Reachy Mini因RAM价格上涨和关税成本增加,将于6月1日调整价格。
Hugging Face 宣布其 Hub 上开放数据集数量达到 100 万个,强调开放数据对开放模型的重要性。
Hugging Face CEO Clement Delangue宣布,该平台公有数据集数量突破100万,提供PB级数据供AI开发者使用。
Hugging Face Hub宣布开放数据集数量达到100万,强调开放数据对开放模型的重要性。
Hugging Face转发消息称,本周将发布两个开源小型语言模型(SLM)。其中一个在比SOTA模型小93倍的情况下达到同等精度,另一个在更小尺寸下实现类似准确性。
Unsloth发布了支持MTP的量化GGUF格式,适用于Qwen3.6-35B-A3B模型。
Hugging Face CEO Clement Delangue在推特宣布,由于RAM成本上涨和关税影响,公司产品价格将于6月1日起上调。
推特消息:Reason-ModernColBERT模型在BrowseComp-Plus任务上接近解决,性能超越当前最优水平,且模型大小仅为先前模型的1/54,展示出高效能。
Meta上周悄然发布Sapiens2模型家族,这是一组高分辨率模型,基于10亿张人类图像训练,主要用于姿态估计等任务。
OpenMed Agent 预览版发布,基于 Hugging Face 的端点,用于临床数据提取和术语处理。
ml-intern项目上线三周,已交换100万条消息,相当于在21天内完成了3.3个agent年的机器学习研究。
用户sudoingX发布更新,称Qwen 3.6 27B dense q4模型在单张NVIDIA RTX 3090上一次性完成了Octopus Invaders游戏,由Hermes代理驱动整个过程。
Claw-Eval评测榜单公布,小米MiMo-V2.5-Pro以1T参数获得第一,智谱GLM5.1以754B参数获得第二,小米MiMo-V2.5以310B参数获得第三。
Qwen发布WebWorld系列开放世界模型,专为Web代理设计,包含8B、14B、32B参数版本及数据集,采用Apache2.0许可,在MiniWob++任务上提升9.9%,在WebArena上提升10%。
Hugging Face宣布与Hermes Agent合作,将Hermes Agent集成到本地应用中,用户可本地运行任何兼容的GGUF/MLX模型。
Adithya S K 发布了一项 RL Environment Creator Skill,允许用户通过 npx 命令创建强化学习环境。该技能旨在简化 RL 环境的搭建过程。
onusoz宣布加入Hugging Face,将负责改进本地模型在OpenClaw上的表现。该消息通过推特发布,获得一定关注。
微软在Hugging Face上发布了Phi-Ground-Any视觉模型,具有4B参数,在GUI grounding任务上达到SOTA性能。
Hugging Face宣布推出沙盒功能,用户可在该平台使用沙盒环境。
Hugging Face的TRL库发布v1.4版本,新增chunked NLL损失用于监督微调,使用更少显存且速度更快,并提及Qwen3模型。
ClementDelangue在推特上表示本地AI正流行,并分享了过去8个月每月新增GGUF模型数量的图表数据。
Hugging Face 用户 julien_c 发布了一个周末项目,一个用于测量从 HF CDN 下载速度的 CLI 扩展,可通过 hf extensions install 命令运行。