← 返回列表

Minimax将发布M3模型采用稀疏注意力

Alpha 派 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 抓取:2026-05-27 04:20
摘要

Minimax工程负责人首次披露即将发布的M3模型将转向稀疏注意力架构,通过索引粗筛和稀疏精读,在百万级长上下文场景下实现超10倍推理速度提升,从根本上解决了长上下文成本瓶颈。

客观事实
  • Minimax工程负责人首次披露M3模型将转向稀疏注意力架构
  • 该架构在百万级长上下文场景下实现超10倍推理速度提升
  • 稀疏注意力架构从根本上解决了长上下文成本瓶颈
Minimax M3模型

原文

昨晚(5月26日),Minimax工程负责人首次披露其即将发布的M3模型将转向稀疏注意力架构,通过索引粗筛和稀疏精读的方式,在百万级长上下文场景下实现超10倍的推理速度提升。这一架构转向从根本上解决了长上下文的成本瓶颈,也标志着公司在模型“智价比”的竞争中重夺技术路线主导权,其ARR增长预期将因此得到显著强化。关注:Minimax(M3模型采用稀疏注意力架构,有望大幅降低推理成本并拓展长上下文能力,ARR增长预期强化),智谱(同为国产大模型头部厂商,面临竞争格局变化),阿里巴巴/百度/金山云(国产大模型及云服务生态中的核心参与者,受益于整体行业技术迭代和需求增长)