清除 当前 7 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 19 小时前 微信公众号 · 42章经 · 4 天 14 小时前 微信公众号 · DeepTech深科技 · 4 天 14 小时前 微信公众号 · Founder Park · 4 天 14 小时前 微信公众号 · FundaAI · 4 天 14 小时前 微信公众号 · 九章智驾 · 4 天 14 小时前 微信公众号 · 晚点LatePost · 4 天 14 小时前 微信公众号 · 琢磨事 · 4 天 14 小时前 微信公众号 · 甲子光年 · 4 天 14 小时前

Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。

  • HF团队使异步RL权重同步带宽成本降低约100倍
  • 新方法在TRL中实现,只传输变化的权重元素
  • 在Qwen3-0.6B上,每步payload从1.2GB降至20-35MB

Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。

  • Sakana AI Labs发布DiffusionBlocks分块神经网络训练技术。
  • 该技术采用基于扩散解释的模型训练新架构。
  • 相关推文获得超39万次观看及1459次点赞。

LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。

  • 双足机器人成本约2500美元
  • 大部分零件可3D打印
  • 支持构建、维修、模拟和训练

Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。

  • Hugging Face 发布开源 DNA 基础模型 Carbon
  • Carbon 比同尺寸最佳模型快 275 倍
  • 模型采用 6-base 块 tokenizer 提高效率

Kevin X. Li 发布 SWE-ZERO-12M-trajectories 数据集,声称是迄今为止最大的开源 agentic trace 数据集,规模是此前最大数据集的 5.7 倍。

  • SWE-ZERO-12M-trajectories 数据集发布。
  • 该数据集是最大开源 agentic trace 数据集。
  • 规模是之前最大数据集的 5.7 倍。

推文介绍了一个名为physics-intern的agentic框架,用于理论物理研究,该框架将Gemini 3.1 Pro在CritP基准上的性能从17.7%提升至31.4%。

  • physics-intern是一个用于理论物理的agentic框架
  • 该框架将Gemini 3.1 Pro在CritP上的准确率从17.7%提升到31.4%

结构化输出基准数据集已在 Hugging Face 平台上发布,用户可访问获取。

  • 结构化输出基准数据集在 Hugging Face 上发布