清除 当前 77 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 13 小时前 微信公众号 · DeepTech深科技 · 4 天 13 小时前 微信公众号 · Founder Park · 4 天 13 小时前 微信公众号 · FundaAI · 4 天 13 小时前 微信公众号 · 九章智驾 · 4 天 13 小时前 微信公众号 · 晚点LatePost · 4 天 13 小时前 微信公众号 · 琢磨事 · 4 天 13 小时前 微信公众号 · 甲子光年 · 4 天 13 小时前

OpenBMB发布了1500万个样本,可用于微调AI模型,使得GPT-4o级别的模型能够在手机或笔记本上运行。

  • OpenBMB发布1500万个样本用于微调AI模型

llama.cpp 项目宣布推出官方网站,目标让本地 AI 易于访问,推动本地 AI 普及。

  • llama.cpp 推出官方网站

pibot项目实现全本地运行,采用Parakeet进行语音识别,Qwen3-TTS进行语音合成,并整合Qwen 3.6多模态大模型,全部在本地部署完成。

  • pibot实现全本地运行
  • 使用Parakeet STT、Qwen3-TTS和Qwen 3.6多模态LLM

Hugging Face CEO表示,平台上50%的模型和数据集是私有的,该比例因企业使用其S3替代产品buckets而持续增长,更多公司开始内部构建AI而非依赖外部API。

  • Hugging Face上50%模型和数据集为私有
  • 私有比例因buckets产品增长而上升
  • 更多企业转向内部AI开发

NVIDIA的GLM5.1-NVFP4模型被发现在Hugging Face平台上,该模型由NVIDIA AI官方发布,表明技术进展。

  • NVIDIA的GLM5.1-NVFP4模型出现在Hugging Face平台
  • 该模型由NVIDIA AI官方发布

一条推文指出,在过去一个月内,Factory平台上的开源模型使用量相比闭源模型增长了超过3倍,无论按总调用次数还是其他指标。

  • 过去一个月Factory平台开源模型使用量是闭源模型的3倍以上
  • 该增长数据基于总调用次数等指标

Jasper发布名为MONET的开放数据集,包含1.05亿样本,采用Apache2.0许可,旨在推动可复现研究。数据集经过去重和重新标注。

  • Jasper发布MONET数据集,含1.05亿样本
  • 数据集采用Apache2.0许可,去重并重新标注

发布Paris 2.0,声称是全球首个去中心化训练的视频生成模型,并提供了基准测试结果。

  • 发布Paris 2.0视频生成模型
  • 宣称是全球首个去中心化训练的视频模型
  • 进行了基准测试

Bidhan宣布选择性发布Paris 2.0权重,并与对扩散视频感兴趣的研究人员和团队合作。

  • 选择性发布Paris 2.0权重
  • 与研究人员和团队合作扩散视频

Liquid AI发布LFM2.5-8B-A1B模型,该模型针对手机、笔记本电脑等设备优化,旨在驱动实际应用。

  • Liquid AI发布新模型LFM2.5-8B-A1B
  • 模型专为手机、笔记本电脑等设备优化

Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。

  • HF团队使异步RL权重同步带宽成本降低约100倍
  • 新方法在TRL中实现,只传输变化的权重元素
  • 在Qwen3-0.6B上,每步payload从1.2GB降至20-35MB

Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。

  • Sakana AI Labs发布DiffusionBlocks分块神经网络训练技术。
  • 该技术采用基于扩散解释的模型训练新架构。
  • 相关推文获得超39万次观看及1459次点赞。

Hugging Face Transformers 现已集成 RF-DETR 模型,该模型在目标检测和分割任务上声称达到最先进水平,超越 YOLO。

  • RF-DETR 现已在 Hugging Face Transformers 中可用。
  • RF-DETR 在目标检测和分割上声称超越 YOLO。

开放团队发布MiniCPM5-1B模型,采用Apache 2.0许可证,支持混合推理能力。该模型参数规模为1B,适用于轻量级部署。

  • MiniCPM5-1B模型发布
  • 采用Apache 2.0开源许可证
  • 支持混合推理能力

PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 图像生成模型,该系列模型旨在高质量运行。

  • PrismML 发布 1-bit 图像生成模型
  • PrismML 发布 Ternary Bonsai Image 4B 模型

Google发布Gemini Flash 3.5模型,同时呼吁开放100B参数的Gemma 4 MoE模型。

  • Gemini Flash 3.5已发布
  • 100B参数的Gemma 4 MoE模型被要求开放

Hugging Face 发布了关于如何生成 1T 合成数据的资源,包含可用幻灯片,展示了大规模合成数据生成的方法。

  • Hugging Face 发布了生成 1T 合成数据的资源
  • 该资源包含可用幻灯片

Hugging Face 上发布了 CHI-Bench,号称全球首个面向 AI 代理的长期医疗健康基准,包含 75 个真实健康相关任务。

  • Hugging Face 发布 CHI-Bench 基准
  • CHI-Bench 号称全球首个长期医疗健康 AI 代理基准
  • 该基准包含 75 个真实健康任务

开源模型Kimi K2.6在Design Arena的3D设计排行榜上达到第一名。

  • Kimi K2.6登上3D设计排行榜第一名

开发者发布MiMo V2.5-Coder模型,需128GB RAM即可本地运行,速度较快。该模型为最新版本。

  • MiMo V2.5-Coder模型发布
  • 需128GB RAM可本地运行

推文介绍了物理AI领域的新工作PhysX-Omni,称其为首个统一的模拟就绪生成框架,支持刚体和可变形物体。

  • PhysX-Omni是首个统一的模拟就绪生成框架
  • 该框架支持刚体和可变形物体

llama.cpp 新增 MTP 支持,使本地模型运行速度显著提升。在 A10G 上,Qwen3.6-27B 密集生成速度从 25 tok/s 提升至 45 tok/s,增幅达 78%。

  • llama.cpp 增加 MTP 支持
  • Qwen3.6-27B 在 A10G 上速度提升 78%

Hugging Face 宣布 30 万 AI 构建者填写了硬件资料,并分享调查结果。该公司表示期待未来几个月本地 AI 的发展。

  • 30 万 AI 构建者在 Hugging Face 填写硬件资料

Hugging Face发布名为LeRobotHF的人形机器人,成本约2500美元,提供完整开源硬件和软件堆栈。

  • Hugging Face发布人形机器人LeRobotHF
  • 成本约2500美元
  • 提供完整开源堆栈

llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。

  • llama.cpp/ggml 推出新 WebGPU 后端
  • 该项目开始全面支持 WebGPU

机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。

  • Reachy Mini在烹饪直播中故障
  • 推文获得51次点赞和25930次查看

HuggingFace 团队宣布推出开源双足机器人平台 LeRobot Humanoid,制造成本约 2500 美元。

  • HuggingFace 团队宣布 LeRobot Humanoid 开源双足机器人平台
  • 该平台制造成本约 2500 美元

Hugging Face 发布了开源低成本 3D 打印人形机器人 LeRobot Humanoid,成本约 2500 美元,专为机器人学习设计。

  • Hugging Face 发布 LeRobot Humanoid 开源人形机器人
  • 机器人成本约 2500 美元,采用 3D 打印
  • 专为机器人学习设计

Cohere 的 Command A+ 模型现已在 Hugging Face 上提供 W4A4 量化版本,可大幅减少服务占用资源。

  • Cohere 的 Command A+ 模型支持 W4A4 量化
  • 该量化版本已在 Hugging Face 上可用
  • 量化可显著降低模型部署的算力占用

HuggingFace发布了一款完全开源的人形机器人,用户可购买。

  • HuggingFace发布完全开源人形机器人

LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。

  • 双足机器人成本约2500美元
  • 大部分零件可3D打印
  • 支持构建、维修、模拟和训练

Cohere发布开源模型,采用Apache 2.0许可证,旨在为开发者提供企业级代理能力的直接访问。

  • Cohere发布开源模型
  • 采用Apache 2.0许可证
  • 目标为开发者提供企业级代理能力

Cohere首次以Apache 2.0许可证发布Command A+模型,标志着开放许可策略的转变。

  • Cohere以Apache 2.0许可证发布Command A+模型
  • 这是Cohere首次采用Apache 2.0许可

Cohere 宣布推出其最强大的大型语言模型 Command A+,并针对尽可能少的硬件进行了优化,以降低部署门槛。

  • Cohere 发布了 Command A+ 模型
  • 该模型是 Cohere 目前最强大的 LLM

Cohere发布Command A+模型,称其最佳模型,并采用Apache 2.0开源协议。

  • Cohere发布Command A+模型
  • 该模型采用Apache 2.0开源协议

Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。

  • Hugging Face 发布开源 DNA 基础模型 Carbon
  • Carbon 比同尺寸最佳模型快 275 倍
  • 模型采用 6-base 块 tokenizer 提高效率

开源了一个名为Marlin-2B的小型视觉语言模型,用于从视频中提取结构化信息。

  • Marlin-2B模型已开源
  • 模型用于从视频提取结构化信息

发布Carbon DNA模型,速度比现有最佳模型快275倍,可快速处理大量数据。

  • 发布Carbon DNA模型
  • 速度比次优模型快275倍

llama.cpp 新增 MTP(多令牌预测)支持,本地模型推理速度显著提升,足以作为日常驱动。Qwen3.6-27B 密集生成在 A10 GPU 上得到展示,推动本地 AI 部署实用性。

  • llama.cpp 新增 MTP 支持,加速本地模型推理。
  • 本地模型速度提升至可作为日常驱动。
  • Qwen3.6-27B 在 A10 上展示密集生成性能。

Hugging Face与戴尔在戴尔科技世界大会上宣布合作,旨在通过开源模型推动企业级本地AI部署,作为应对GPU短缺的解决方案。

  • Hugging Face与戴尔达成合作
  • 合作在戴尔科技世界大会主题演讲中宣布
  • 合作聚焦企业级本地AI部署

Perplexity AI基于pplx-embed-0.6b继续训练了一个小型ColBERT模型,相关推文获得79点赞和16转发。

  • Perplexity AI训练了一个小型ColBERT模型
  • 该模型是pplx-embed-0.6b的继续训练版本

知名开源AI推理引擎llama.cpp新增对Qwen3.6系列模型的多标记预测(MTP)支持,被认为对本地AI生态具有里程碑意义。

  • llama.cpp新增对Qwen3.6系列的MTP支持

Tether公司在iPhone 16上成功微调了一个130亿参数的AI模型,无需数据中心和企业级GPU,实现了完全隐私保护。这一技术突破展示了在移动设备上运行大模型的可行性。

  • Tether在iPhone 16上微调了13B参数的AI模型
  • 无需数据中心和企业级GPU
  • 实现了完全隐私保护

Erik Kaum在HuggingFace上发布了首个kernel MaxSim,旨在解决延迟交互检索(ColBERT/PyLate)中材料化瓶颈问题。

  • Erik Kaum在HuggingFace上发布MaxSim kernel
  • MaxSim针对ColBERT/PyLate延迟交互检索的材料化瓶颈

Stingning发布一款30B-A3B推理模型,该模型在物理和数学奥林匹克评估中达到金牌水平。

  • 发布30B-A3B推理模型
  • 模型在物理和数学奥林匹克评估中达到金牌水平

Kevin X. Li 发布 SWE-ZERO-12M-trajectories 数据集,声称是迄今为止最大的开源 agentic trace 数据集,规模是此前最大数据集的 5.7 倍。

  • SWE-ZERO-12M-trajectories 数据集发布。
  • 该数据集是最大开源 agentic trace 数据集。
  • 规模是之前最大数据集的 5.7 倍。

Datadog发布Toto 2.0时间序列基础模型系列,权重开源(Apache 2.0),参数规模从4M到2.5B,性能随规模提升,在BOOM、GIFT-Eval、TIME基准上取得领先。该模型首次在时间序列领域展示了缩放定律。

  • Datadog发布Toto 2.0开源权重,许可为Apache 2.0
  • 模型系列参数范围4M至2.5B,性能随规模提升
  • 在BOOM、GIFT-Eval、TIME基准测试中领先

Datadog AI 发布了 Toto 2.0,包含 5 个开放权重的时序预测模型,参数规模从 4M 到 2.5B,声称实现了时间序列建模的规模化。

  • Datadog AI 发布 Toto 2.0 时序预测模型
  • 推出 5 个开放权重模型,参数 4M-2.5B

某公司通过推特宣布本周将发布两个开源小语言模型,其中一个在模型尺寸缩小93倍的情况下达到当前最佳准确率,另一个细节待公布。

  • 本周将发布两个开源SLM
  • 其中一个在93倍更小尺寸下达到SOTA准确率

OpenMed Agent 发布预览版,基于 Hugging Face 构建,利用其端点驱动临床信息提取和医学术语处理。

  • OpenMed Agent 进入预览阶段
  • 基于 Hugging Face 平台开发
  • 用于临床提取和术语处理