Minimax将发布M3模型采用稀疏注意力

Alpha 派 3 信息等级 3 抓取：2026-05-27 04:20

AI 算力行业

摘要

Minimax工程负责人首次披露即将发布的M3模型将转向稀疏注意力架构，通过索引粗筛和稀疏精读，在百万级长上下文场景下实现超10倍推理速度提升，从根本上解决了长上下文成本瓶颈。

客观事实

Minimax工程负责人首次披露M3模型将转向稀疏注意力架构
该架构在百万级长上下文场景下实现超10倍推理速度提升
稀疏注意力架构从根本上解决了长上下文成本瓶颈

Minimax M3模型

原文

昨晚（5月26日），Minimax工程负责人首次披露其即将发布的M3模型将转向稀疏注意力架构，通过索引粗筛和稀疏精读的方式，在百万级长上下文场景下实现超10倍的推理速度提升。这一架构转向从根本上解决了长上下文的成本瓶颈，也标志着公司在模型“智价比”的竞争中重夺技术路线主导权，其ARR增长预期将因此得到显著强化。关注：Minimax（M3模型采用稀疏注意力架构，有望大幅降低推理成本并拓展长上下文能力，ARR增长预期强化），智谱（同为国产大模型头部厂商，面临竞争格局变化），阿里巴巴/百度/金山云（国产大模型及云服务生态中的核心参与者，受益于整体行业技术迭代和需求增长）