清除 当前 115 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 13 小时前 微信公众号 · DeepTech深科技 · 4 天 13 小时前 微信公众号 · Founder Park · 4 天 13 小时前 微信公众号 · FundaAI · 4 天 13 小时前 微信公众号 · 九章智驾 · 4 天 13 小时前 微信公众号 · 晚点LatePost · 4 天 13 小时前 微信公众号 · 琢磨事 · 4 天 13 小时前 微信公众号 · 甲子光年 · 4 天 13 小时前

推特消息称,用户 @nasch 在消费级 AMD 显卡上运行 Qwen3.6 27B 模型,推理速度达到 87 tok/s,展示了 AI 本地推理的性能进展。

  • 在消费级 AMD 显卡上,Qwen3.6 27B 模型推理速度达 87 tok/s

llama.cpp项目推出了官方网站,旨在让本地AI人人可用。

  • llama.cpp项目推出官方网站。

NVIDIA 发布了 Nemotron 3 Nano Omni,一个高效的开源多模态模型,统一处理视频、音频、图像和文本。

  • NVIDIA 发布 Nemotron 3 Nano Omni 模型
  • 该模型为高效开源模型,统一处理多模态数据

VikParuchuri 宣布发布 Surya OCR 2 模型,拥有 6.5 亿参数,在 olmocr 基准测试中得分 83.3%,在内部 91 语言基准测试中得分 87%,在其他多项基准测试中表现领先。

  • Surya OCR 2 模型参数规模为 650M。
  • olmocr 基准得分 83.3%,在 3B 以下排名第一。
  • 内部 91 语言基准得分 87%。

Gradio推文宣布一场名为Build Small的黑客马拉松,要求参赛模型参数不超过32B并能在笔记本电脑上运行,赞助商包括OpenAI、NVIDIA和OpenBMB。

  • Build Small黑客马拉松限制模型参数不超过32B
  • 活动要求模型可运行在笔记本电脑上
  • 赞助商包括OpenAI、NVIDIA和OpenBMB

Hugging Face转发Bidhan消息:将选择性发布巴黎2.0模型权重,并与对扩散视频感兴趣的研究人员和团队合作。

  • 选择性发布巴黎2.0权重
  • 与研究人员和团队合作扩散视频

发布Paris 2.0,自称是全球首个去中心化训练的视频生成模型,并进行了基准测试。

  • 发布Paris 2.0,首个去中心化训练的视频生成模型
  • 与其他视频生成模型进行了基准测试

液态AI(liquidai)发布LFM2.5-8B-A1B模型,该模型针对手机、笔记本电脑等设备进行优化,旨在支持实际应用。

  • 液态AI发布LFM2.5-8B-A1B模型
  • 该模型针对手机和笔记本等设备优化

Adithya S K 发布了 Repo2RLEnv,一个能将任何代码仓库转化为可运行、可验证的编码环境的工具,基于真实的 GitHub PR 和提交构建。

  • Repo2RLEnv 工具发布,可将仓库转化为可运行、可验证的编码环境

RF-DETR模型现已集成到Hugging Face Transformers库中,该模型在目标检测和分割任务上达到最先进水平。

  • RF-DETR 可在 Hugging Face Transformers 中使用
  • RF-DETR 在检测和分割任务上达到最先进水平

LightOn在HuggingFace上的模型下载量突破5000万次,包括SOTA的后期交互和密集检索器、OCR模型和LLM。

  • LightOn在HuggingFace上的模型下载量达到5000万次

NVIDIA的GLM5.1-NVFP4模型在Hugging Face平台上被发现,标志着NVIDIA在AI模型生态中的新动作。

  • NVIDIA GLM5.1-NVFP4模型出现在Hugging Face上

开源数据集发布:含1.04亿图像-文本对,是目前最大的开放许可图像数据集之一,托管在Hugging Face上。

  • 1.04亿图像-文本对数据集发布
  • 该数据集是最大开放许可图像数据集之一
  • 托管于Hugging Face平台

JAFFER发布MONET数据集,该数据集包含105M样本,经过去重和重新标注,采用Apache2.0许可,旨在促进可复现研究。

  • 发布MONET数据集,105M样本
  • 数据集采用Apache2.0许可
  • 数据集经过去重和重新标注

研究人员在Hugging Face上发布了最大的蛋白质数据集合,该数据集经过长时间整理,供社区使用。

  • 发布了最大的蛋白质数据集合在Hugging Face上
  • 团队为此工作了较长时间

Hugging Face平台上发布了最大的蛋白质数据集,供社区使用。

  • 最大的蛋白质数据集已在Hugging Face上发布

Hugging Face 在 /models 页面推出了一个备受期待的功能:"Base only" 切换开关,可以隐藏所有微调模型,只显示基础模型。

  • Hugging Face 推出 "Base only" 功能,隐藏微调模型,只显示基础模型。

Hugging Face 科学团队宣布异步强化学习权重同步在带宽成本上降低约100倍,无需共享集群即可实现。

  • Hugging Face 科学团队实现异步RL权重同步带宽成本降低约100倍
  • 该技术不需要共享集群

RF-DETR目标检测与分割模型现已集成至Hugging Face Transformers库。该模型在检测和分割任务上达到最优性能,超越YOLO系列。项目由skalskip92在推特宣布,获得关注。

  • RF-DETR在Hugging Face Transformers库中可用
  • 该模型在检测和分割任务上达到最优性能

RF-DETR实时目标检测与分割模型已集成至HuggingFace Transformers,该模型由Roboflow开发,具备SOTA性能,可通过HuggingFace平台使用。

  • RF-DETR模型已集成至HuggingFace Transformers
  • 该模型由Roboflow开发,支持实时检测与分割

Hugging Face上发布了CHI-Bench,这是世界首个针对人工智能代理的长周期医疗保健基准测试,包含75个真实健康任务。

  • CHI-Bench发布在Hugging Face上
  • 世界首个长周期医疗保健AI代理基准
  • 包含75个真实健康任务

HuggingFace转发Victor Mustar消息:发布Marlin-2B开源视频视觉语言模型,采用Apache 2.0许可。该模型可理解视频内容及时间信息。

  • Marlin-2B是一个开源的视频VLM模型
  • 模型采用Apache 2.0许可证
  • 模型能理解视频内容和时间信息

腾讯混元翻译模型在Hugging Face平台获得大量关注与支持,用户反馈热烈。

  • 腾讯混元翻译模型在Hugging Face上热度高

PrismML 发布了 1-bit 和 Ternary Bonsai Image 4B 系列图像生成模型,专注于运行高质量图像生成。

  • PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 模型
  • 新模型旨在运行高质量图像生成

PrismML发布了Binary and Ternary Bonsai Image 4B模型,支持1-bit量化,声称将改变图像生成领域。该消息由xenovacom在推特上转发,获得较多关注。

  • PrismML发布Binary and Ternary Bonsai Image 4B模型
  • 模型支持1-bit量化,可大幅降低计算需求

英伟达发布PiD超分辨率技术,可在像素空间直接从模型潜在变量实现4倍分辨率提升,适用于任何生成图像。

  • 英伟达发布PiD超分辨率技术
  • PiD技术可实现4倍分辨率提升

Hugging Face 发布了名为 LeRobotHF 的开源人形机器人,成本约 2500 美元,并提供完整的开放堆栈,包括硬件和软件。该机器人旨在降低人形机器人研发门槛。

  • Hugging Face 发布开源人形机器人 LeRobotHF
  • 机器人成本约 2500 美元
  • 提供完整开放堆栈

ModelScope宣布MiniCPM5-1B全面开源,包括权重、训练数据和部署代码。该模型拥有1B参数,在Artificial Analysis排行榜上位列第一。

  • MiniCPM5-1B模型完全开源
  • 模型在Artificial Analysis排名第一

huggingface转发消息,MiMo V2.5-Coder模型已发布,可在128GB RAM的本地环境运行,运行速度快。

  • MiMo V2.5-Coder模型发布
  • 需要128GB RAM本地运行

Hugging Face转发宣布推出NayanaOCR语料库,包含超过100万张文档图像,覆盖22种语言,是最大的开源合成多语言OCR数据集。

  • 发布NayanaOCR语料库
  • 100万+文档图像,22种语言
  • 最大开源合成多语言OCR数据集

LongCat 发布开源 talking-avatar 模型,采用 MIT 许可证,据称可能达到最先进水平(SOTA)。

  • LongCat 发布开源 talking-avatar 模型
  • 模型采用 MIT 许可证
  • 模型声称可能是 SOTA

HuggingFace转发推文称,llama.cpp增加MTP支持后,Qwen3.6-27B密集生成模型在本地运行速度足够作为日常使用。推文获122点赞、12转发、11回复、9051次浏览。

  • llama.cpp新增MTP支持
  • Qwen3.6-27B模型本地生成速度提升
  • 模型可日常使用

Hugging Face 创始人分享数据:30万 AI 开发者已填写硬件配置文件,并公布了结果。

  • 30万 AI 开发者填写了硬件配置文件。
  • Hugging Face 分享了硬件配置结果。

研究人员发布SEGA工作,提出频谱能量引导注意力方法用于扩散模型分辨率外推。

  • 研究人员发布SEGA工作,关注扩散模型分辨率外推。

llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。

  • llama.cpp 新增 WebGPU 后端支持
  • 该工作基于 ggml 库实现
  • 旨在实现完整的 WebGPU 支持

微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。

  • 微软Foundry与Hugging Face合作推出平台
  • 平台包含三个开源图像模型
  • 该平台为开发者提供最大AI创新目录

Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。

  • Allen AI发布ArtifactLinker系统
  • ArtifactLinker预测模型评估基准

Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。

  • Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face
  • 可通过SQL查询超过21.9亿网页,无需下载

CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。

  • CommonCrawl推荐使用Hugging Face Buckets处理大型训练数据集

llama.cpp 新增内置模型路由器功能,可替代 Ollama 和 Open WebUI 进行模型切换,提升易用性。

  • llama.cpp 新增内置模型路由器
  • 该功能可替代 Ollama 和 Open WebUI 进行模型切换

Cohere 发布新版本并推出 Cohere Transcribe,决定采用 Apache 2 许可证,由 Nick 大力推动。

  • Cohere 新发布采用 Apache 2 许可证
  • Cohere Transcribe 也采用 Apache 2 许可证

AMD发布Ryzen AI Halo处理器,旨在为AI开发者提供本地硬件支持。Hugging Face联合创始人Clement Delangue在推特上表达了对该产品的兴奋之情。

  • AMD发布Ryzen AI Halo处理器

团队发布名为Mosaic的概率天气模型,声称在ML天气预报的帕累托前沿上取得突破,达到或超越最先进的确定性模型,并具有概率校准功能。

  • 发布名为Mosaic的天气模型
  • 模型达到或超越最先进确定性模型
  • 模型具有概率校准功能

腾讯混元发布新的开源多语言翻译模型Hy-MT2,该模型在翻译性能上有提升,已开源。

  • 腾讯混元发布Hy-MT2多语言翻译模型
  • Hy-MT2为开源模型

Cohere 的 Command A+ 模型在 Hugging Face 上线,支持 W4A4 量化,可大幅降低服务占用且几乎无性能损失。

  • Command A+ 上线 Hugging Face
  • 支持 W4A4 量化,降低服务占用

Hugging Face发布了huggingface_hub v1.16.0版本,同时Together Compute在其推理提供商上新增了多模态功能。

  • Hugging Face发布huggingface_hub v1.16.0
  • Together Compute支持多模态推理

Hugging Face模型现在可通过strands在AWS SageMaker AI上进行部署、工具使用和MCP集成。该转发由@alvarobartt发布,获得9次点赞、6次转推。

  • Hugging Face模型可通过strands部署到AWS SageMaker AI。
  • 集成支持工具使用和MCP协议。

LeRobotHF团队宣布成功构建一款约2500美元的双足机器人,该机器人大部分部件由3D打印制成,具备可构建、维修、模拟和训练等特性。

  • LeRobotHF团队建造了约2500美元的双足机器人
  • 机器人大部分3D打印,可构建、维修、模拟、训练

Hugging Face 发布 physics-intern 科学问题测试框架,该框架使 Gemini 3.1 Pro 模型在科学问题上的性能从 17.7 提升至 31。

  • Hugging Face 发布了 physics-intern 科学问题测试框架。
  • 该框架使 Gemini 3.1 Pro 模型性能从 17.7 提升至 31。

Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。

  • Stability AI发布Stable Audio 3
  • 提供三个开源变体