OpenBMB发布了1500万个样本,可用于微调AI模型,使得GPT-4o级别的模型能够在手机或笔记本上运行。
llama.cpp 项目宣布推出官方网站,目标让本地 AI 易于访问,推动本地 AI 普及。
pibot项目实现全本地运行,采用Parakeet进行语音识别,Qwen3-TTS进行语音合成,并整合Qwen 3.6多模态大模型,全部在本地部署完成。
Hugging Face CEO表示,平台上50%的模型和数据集是私有的,该比例因企业使用其S3替代产品buckets而持续增长,更多公司开始内部构建AI而非依赖外部API。
NVIDIA的GLM5.1-NVFP4模型被发现在Hugging Face平台上,该模型由NVIDIA AI官方发布,表明技术进展。
一条推文指出,在过去一个月内,Factory平台上的开源模型使用量相比闭源模型增长了超过3倍,无论按总调用次数还是其他指标。
Jasper发布名为MONET的开放数据集,包含1.05亿样本,采用Apache2.0许可,旨在推动可复现研究。数据集经过去重和重新标注。
发布Paris 2.0,声称是全球首个去中心化训练的视频生成模型,并提供了基准测试结果。
Bidhan宣布选择性发布Paris 2.0权重,并与对扩散视频感兴趣的研究人员和团队合作。
Liquid AI发布LFM2.5-8B-A1B模型,该模型针对手机、笔记本电脑等设备优化,旨在驱动实际应用。
Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。
Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。
Hugging Face Transformers 现已集成 RF-DETR 模型,该模型在目标检测和分割任务上声称达到最先进水平,超越 YOLO。
开放团队发布MiniCPM5-1B模型,采用Apache 2.0许可证,支持混合推理能力。该模型参数规模为1B,适用于轻量级部署。
PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 图像生成模型,该系列模型旨在高质量运行。
Google发布Gemini Flash 3.5模型,同时呼吁开放100B参数的Gemma 4 MoE模型。
Hugging Face 发布了关于如何生成 1T 合成数据的资源,包含可用幻灯片,展示了大规模合成数据生成的方法。
Hugging Face 上发布了 CHI-Bench,号称全球首个面向 AI 代理的长期医疗健康基准,包含 75 个真实健康相关任务。
开源模型Kimi K2.6在Design Arena的3D设计排行榜上达到第一名。
开发者发布MiMo V2.5-Coder模型,需128GB RAM即可本地运行,速度较快。该模型为最新版本。
推文介绍了物理AI领域的新工作PhysX-Omni,称其为首个统一的模拟就绪生成框架,支持刚体和可变形物体。
llama.cpp 新增 MTP 支持,使本地模型运行速度显著提升。在 A10G 上,Qwen3.6-27B 密集生成速度从 25 tok/s 提升至 45 tok/s,增幅达 78%。
Hugging Face 宣布 30 万 AI 构建者填写了硬件资料,并分享调查结果。该公司表示期待未来几个月本地 AI 的发展。
Hugging Face发布名为LeRobotHF的人形机器人,成本约2500美元,提供完整开源硬件和软件堆栈。
llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。
机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。
HuggingFace 团队宣布推出开源双足机器人平台 LeRobot Humanoid,制造成本约 2500 美元。
Hugging Face 发布了开源低成本 3D 打印人形机器人 LeRobot Humanoid,成本约 2500 美元,专为机器人学习设计。
Cohere 的 Command A+ 模型现已在 Hugging Face 上提供 W4A4 量化版本,可大幅减少服务占用资源。
HuggingFace发布了一款完全开源的人形机器人,用户可购买。
LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。
Cohere发布开源模型,采用Apache 2.0许可证,旨在为开发者提供企业级代理能力的直接访问。
Cohere首次以Apache 2.0许可证发布Command A+模型,标志着开放许可策略的转变。
Cohere 宣布推出其最强大的大型语言模型 Command A+,并针对尽可能少的硬件进行了优化,以降低部署门槛。
Cohere发布Command A+模型,称其最佳模型,并采用Apache 2.0开源协议。
Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。
开源了一个名为Marlin-2B的小型视觉语言模型,用于从视频中提取结构化信息。
发布Carbon DNA模型,速度比现有最佳模型快275倍,可快速处理大量数据。
llama.cpp 新增 MTP(多令牌预测)支持,本地模型推理速度显著提升,足以作为日常驱动。Qwen3.6-27B 密集生成在 A10 GPU 上得到展示,推动本地 AI 部署实用性。
Hugging Face与戴尔在戴尔科技世界大会上宣布合作,旨在通过开源模型推动企业级本地AI部署,作为应对GPU短缺的解决方案。
Perplexity AI基于pplx-embed-0.6b继续训练了一个小型ColBERT模型,相关推文获得79点赞和16转发。
知名开源AI推理引擎llama.cpp新增对Qwen3.6系列模型的多标记预测(MTP)支持,被认为对本地AI生态具有里程碑意义。
Tether公司在iPhone 16上成功微调了一个130亿参数的AI模型,无需数据中心和企业级GPU,实现了完全隐私保护。这一技术突破展示了在移动设备上运行大模型的可行性。
Erik Kaum在HuggingFace上发布了首个kernel MaxSim,旨在解决延迟交互检索(ColBERT/PyLate)中材料化瓶颈问题。
Stingning发布一款30B-A3B推理模型,该模型在物理和数学奥林匹克评估中达到金牌水平。
Kevin X. Li 发布 SWE-ZERO-12M-trajectories 数据集,声称是迄今为止最大的开源 agentic trace 数据集,规模是此前最大数据集的 5.7 倍。
Datadog发布Toto 2.0时间序列基础模型系列,权重开源(Apache 2.0),参数规模从4M到2.5B,性能随规模提升,在BOOM、GIFT-Eval、TIME基准上取得领先。该模型首次在时间序列领域展示了缩放定律。
Datadog AI 发布了 Toto 2.0,包含 5 个开放权重的时序预测模型,参数规模从 4M 到 2.5B,声称实现了时间序列建模的规模化。
某公司通过推特宣布本周将发布两个开源小语言模型,其中一个在模型尺寸缩小93倍的情况下达到当前最佳准确率,另一个细节待公布。
OpenMed Agent 发布预览版,基于 Hugging Face 构建,利用其端点驱动临床信息提取和医学术语处理。