MiniMax预告M3模型将升级稀疏注意力架构

Alpha 派 3 信息等级 3 抓取：2026-05-27 13:20

行业 AI 算力

摘要

MiniMax工程负责人于5月26日披露，M3模型将转向自研稀疏注意力架构，采用“先索引、后计算”模式，支持百万级上下文，推理速度提升超10倍。

客观事实

MiniMax M3模型将转向自研稀疏注意力架构
新架构支持百万级上下文，推理速度提升超10倍

MiniMax M3模型

原文

5月26日晚间，MiniMax工程负责人于社交平台披露M3模型将转向自研稀疏注意力架构，通过“先索引、后计算”的模式，在支持百万级上下文的同时，实现超10倍的推理速度提升。此举标志着大模型技术路线正向“序列稀疏选择”收敛，根本上解决了长文本高成本的商业化瓶颈，M3有望凭借极致的性价比优势重塑竞争格局并显著加速ARR增长曲线。关注：MiniMax（M3模型采用稀疏注意力架构，在性能和成本上实现突破，有望凭借极致性价比加速商业化并重塑市场竞争格局），智谱/月之暗面（国内大模型赛道竞争白热化，面临M3在长文本和成本维度的强力挑战）