推特消息称,用户 @nasch 在消费级 AMD 显卡上运行 Qwen3.6 27B 模型,推理速度达到 87 tok/s,展示了 AI 本地推理的性能进展。
llama.cpp项目推出了官方网站,旨在让本地AI人人可用。
NVIDIA 发布了 Nemotron 3 Nano Omni,一个高效的开源多模态模型,统一处理视频、音频、图像和文本。
VikParuchuri 宣布发布 Surya OCR 2 模型,拥有 6.5 亿参数,在 olmocr 基准测试中得分 83.3%,在内部 91 语言基准测试中得分 87%,在其他多项基准测试中表现领先。
Gradio推文宣布一场名为Build Small的黑客马拉松,要求参赛模型参数不超过32B并能在笔记本电脑上运行,赞助商包括OpenAI、NVIDIA和OpenBMB。
Hugging Face转发Bidhan消息:将选择性发布巴黎2.0模型权重,并与对扩散视频感兴趣的研究人员和团队合作。
发布Paris 2.0,自称是全球首个去中心化训练的视频生成模型,并进行了基准测试。
液态AI(liquidai)发布LFM2.5-8B-A1B模型,该模型针对手机、笔记本电脑等设备进行优化,旨在支持实际应用。
Adithya S K 发布了 Repo2RLEnv,一个能将任何代码仓库转化为可运行、可验证的编码环境的工具,基于真实的 GitHub PR 和提交构建。
RF-DETR模型现已集成到Hugging Face Transformers库中,该模型在目标检测和分割任务上达到最先进水平。
LightOn在HuggingFace上的模型下载量突破5000万次,包括SOTA的后期交互和密集检索器、OCR模型和LLM。
NVIDIA的GLM5.1-NVFP4模型在Hugging Face平台上被发现,标志着NVIDIA在AI模型生态中的新动作。
开源数据集发布:含1.04亿图像-文本对,是目前最大的开放许可图像数据集之一,托管在Hugging Face上。
JAFFER发布MONET数据集,该数据集包含105M样本,经过去重和重新标注,采用Apache2.0许可,旨在促进可复现研究。
研究人员在Hugging Face上发布了最大的蛋白质数据集合,该数据集经过长时间整理,供社区使用。
Hugging Face 在 /models 页面推出了一个备受期待的功能:"Base only" 切换开关,可以隐藏所有微调模型,只显示基础模型。
Hugging Face 科学团队宣布异步强化学习权重同步在带宽成本上降低约100倍,无需共享集群即可实现。
RF-DETR目标检测与分割模型现已集成至Hugging Face Transformers库。该模型在检测和分割任务上达到最优性能,超越YOLO系列。项目由skalskip92在推特宣布,获得关注。
RF-DETR实时目标检测与分割模型已集成至HuggingFace Transformers,该模型由Roboflow开发,具备SOTA性能,可通过HuggingFace平台使用。
Hugging Face上发布了CHI-Bench,这是世界首个针对人工智能代理的长周期医疗保健基准测试,包含75个真实健康任务。
HuggingFace转发Victor Mustar消息:发布Marlin-2B开源视频视觉语言模型,采用Apache 2.0许可。该模型可理解视频内容及时间信息。
腾讯混元翻译模型在Hugging Face平台获得大量关注与支持,用户反馈热烈。
PrismML 发布了 1-bit 和 Ternary Bonsai Image 4B 系列图像生成模型,专注于运行高质量图像生成。
PrismML发布了Binary and Ternary Bonsai Image 4B模型,支持1-bit量化,声称将改变图像生成领域。该消息由xenovacom在推特上转发,获得较多关注。
英伟达发布PiD超分辨率技术,可在像素空间直接从模型潜在变量实现4倍分辨率提升,适用于任何生成图像。
Hugging Face 发布了名为 LeRobotHF 的开源人形机器人,成本约 2500 美元,并提供完整的开放堆栈,包括硬件和软件。该机器人旨在降低人形机器人研发门槛。
ModelScope宣布MiniCPM5-1B全面开源,包括权重、训练数据和部署代码。该模型拥有1B参数,在Artificial Analysis排行榜上位列第一。
huggingface转发消息,MiMo V2.5-Coder模型已发布,可在128GB RAM的本地环境运行,运行速度快。
Hugging Face转发宣布推出NayanaOCR语料库,包含超过100万张文档图像,覆盖22种语言,是最大的开源合成多语言OCR数据集。
LongCat 发布开源 talking-avatar 模型,采用 MIT 许可证,据称可能达到最先进水平(SOTA)。
HuggingFace转发推文称,llama.cpp增加MTP支持后,Qwen3.6-27B密集生成模型在本地运行速度足够作为日常使用。推文获122点赞、12转发、11回复、9051次浏览。
Hugging Face 创始人分享数据:30万 AI 开发者已填写硬件配置文件,并公布了结果。
研究人员发布SEGA工作,提出频谱能量引导注意力方法用于扩散模型分辨率外推。
llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。
微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。
Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。
Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。
CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。
llama.cpp 新增内置模型路由器功能,可替代 Ollama 和 Open WebUI 进行模型切换,提升易用性。
Cohere 发布新版本并推出 Cohere Transcribe,决定采用 Apache 2 许可证,由 Nick 大力推动。
AMD发布Ryzen AI Halo处理器,旨在为AI开发者提供本地硬件支持。Hugging Face联合创始人Clement Delangue在推特上表达了对该产品的兴奋之情。
团队发布名为Mosaic的概率天气模型,声称在ML天气预报的帕累托前沿上取得突破,达到或超越最先进的确定性模型,并具有概率校准功能。
腾讯混元发布新的开源多语言翻译模型Hy-MT2,该模型在翻译性能上有提升,已开源。
Cohere 的 Command A+ 模型在 Hugging Face 上线,支持 W4A4 量化,可大幅降低服务占用且几乎无性能损失。
Hugging Face发布了huggingface_hub v1.16.0版本,同时Together Compute在其推理提供商上新增了多模态功能。
Hugging Face模型现在可通过strands在AWS SageMaker AI上进行部署、工具使用和MCP集成。该转发由@alvarobartt发布,获得9次点赞、6次转推。
LeRobotHF团队宣布成功构建一款约2500美元的双足机器人,该机器人大部分部件由3D打印制成,具备可构建、维修、模拟和训练等特性。
Hugging Face 发布 physics-intern 科学问题测试框架,该框架使 Gemini 3.1 Pro 模型在科学问题上的性能从 17.7 提升至 31。
Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。
Cohere 发布其最强大的大语言模型 Command A+,并针对硬件需求进行了优化,以在尽可能少的计算资源上运行。