← 返回列表

MiniMax预告M3模型将升级稀疏注意力架构

Alpha 派 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 抓取:2026-05-27 13:20
摘要

MiniMax工程负责人于5月26日披露,M3模型将转向自研稀疏注意力架构,采用“先索引、后计算”模式,支持百万级上下文,推理速度提升超10倍。

客观事实
  • MiniMax M3模型将转向自研稀疏注意力架构
  • 新架构支持百万级上下文,推理速度提升超10倍
MiniMax M3模型

原文

5月26日晚间,MiniMax工程负责人于社交平台披露M3模型将转向自研稀疏注意力架构,通过“先索引、后计算”的模式,在支持百万级上下文的同时,实现超10倍的推理速度提升。此举标志着大模型技术路线正向“序列稀疏选择”收敛,根本上解决了长文本高成本的商业化瓶颈,M3有望凭借极致的性价比优势重塑竞争格局并显著加速ARR增长曲线。关注:MiniMax(M3模型采用稀疏注意力架构,在性能和成本上实现突破,有望凭借极致性价比加速商业化并重塑市场竞争格局),智谱/月之暗面(国内大模型赛道竞争白热化,面临M3在长文本和成本维度的强力挑战)