MiniMax工程负责人于5月26日披露,M3模型将转向自研稀疏注意力架构,采用“先索引、后计算”模式,支持百万级上下文,推理速度提升超10倍。
5月26日晚间,MiniMax工程负责人于社交平台披露M3模型将转向自研稀疏注意力架构,通过“先索引、后计算”的模式,在支持百万级上下文的同时,实现超10倍的推理速度提升。此举标志着大模型技术路线正向“序列稀疏选择”收敛,根本上解决了长文本高成本的商业化瓶颈,M3有望凭借极致的性价比优势重塑竞争格局并显著加速ARR增长曲线。关注:MiniMax(M3模型采用稀疏注意力架构,在性能和成本上实现突破,有望凭借极致性价比加速商业化并重塑市场竞争格局),智谱/月之暗面(国内大模型赛道竞争白热化,面临M3在长文本和成本维度的强力挑战)