清除 当前 1 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 22 小时前 微信公众号 · 42章经 · 4 天 17 小时前 微信公众号 · DeepTech深科技 · 4 天 17 小时前 微信公众号 · Founder Park · 4 天 17 小时前 微信公众号 · FundaAI · 4 天 17 小时前 微信公众号 · 九章智驾 · 4 天 17 小时前 微信公众号 · 晚点LatePost · 4 天 17 小时前 微信公众号 · 琢磨事 · 4 天 17 小时前 微信公众号 · 甲子光年 · 4 天 17 小时前

华为研究人员测试了自研的4位精度训练格式HiFloat4,与开放计算项目的MXFP4格式相比,在HiFloat4在昇腾NPU上训练多种模型时,相对于BF16基线的损失误差更低(约1.0%对1.5%)。测试模型包括OpenPangu-1B、Llama3-8B和Qwen3-MoE-30B。

  • 华为HiFloat4格式在测试中优于MXFP4
  • HiFloat4相对损失约1.0%,MXFP4约1.5%
  • 测试模型包括OpenPangu-1B、Llama3-8B、Qwen3-MoE-30B