华为研究人员测试了自研的4位精度训练格式HiFloat4,与开放计算项目的MXFP4格式相比,在HiFloat4在昇腾NPU上训练多种模型时,相对于BF16基线的损失误差更低(约1.0%对1.5%)。测试模型包括OpenPangu-1B、Llama3-8B和Qwen3-MoE-30B。