清除 当前 2 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 21 小时前 微信公众号 · 42章经 · 4 天 16 小时前 微信公众号 · DeepTech深科技 · 4 天 16 小时前 微信公众号 · Founder Park · 4 天 16 小时前 微信公众号 · FundaAI · 4 天 16 小时前 微信公众号 · 九章智驾 · 4 天 16 小时前 微信公众号 · 晚点LatePost · 4 天 16 小时前 微信公众号 · 琢磨事 · 4 天 16 小时前 微信公众号 · 甲子光年 · 4 天 16 小时前

华为研究人员测试了自研的4位精度训练格式HiFloat4,与开放计算项目的MXFP4格式相比,在HiFloat4在昇腾NPU上训练多种模型时,相对于BF16基线的损失误差更低(约1.0%对1.5%)。测试模型包括OpenPangu-1B、Llama3-8B和Qwen3-MoE-30B。

  • 华为HiFloat4格式在测试中优于MXFP4
  • HiFloat4相对损失约1.0%,MXFP4约1.5%
  • 测试模型包括OpenPangu-1B、Llama3-8B、Qwen3-MoE-30B

METR和Epoch机构发布MirrorCode基准测试,用于评估AI自主重实现软件的能力。测试包含20多个目标程序,涵盖Unix工具、加密等领域。结果显示,Claude Opus 4.5成功重实现了约1.6万行Go代码的生物信息学工具,完成该任务所需时间远少于人类工程师。

  • MirrorCode基准测试包含20多个目标程序,覆盖Unix工具、数据序列化等
  • Claude Opus 4.5成功重实现约1.6万行Go代码的生物信息学工具
  • AI在复杂编码任务上的进展速度超出预期