Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。
Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。
LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。
Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。
Kevin X. Li 发布 SWE-ZERO-12M-trajectories 数据集,声称是迄今为止最大的开源 agentic trace 数据集,规模是此前最大数据集的 5.7 倍。
推文介绍了一个名为physics-intern的agentic框架,用于理论物理研究,该框架将Gemini 3.1 Pro在CritP基准上的性能从17.7%提升至31.4%。
结构化输出基准数据集已在 Hugging Face 平台上发布,用户可访问获取。