Minimax工程负责人首次披露即将发布的M3模型将转向稀疏注意力架构,通过索引粗筛和稀疏精读,在百万级长上下文场景下实现超10倍推理速度提升,从根本上解决了长上下文成本瓶颈。
昨晚(5月26日),Minimax工程负责人首次披露其即将发布的M3模型将转向稀疏注意力架构,通过索引粗筛和稀疏精读的方式,在百万级长上下文场景下实现超10倍的推理速度提升。这一架构转向从根本上解决了长上下文的成本瓶颈,也标志着公司在模型“智价比”的竞争中重夺技术路线主导权,其ARR增长预期将因此得到显著强化。关注:Minimax(M3模型采用稀疏注意力架构,有望大幅降低推理成本并拓展长上下文能力,ARR增长预期强化),智谱(同为国产大模型头部厂商,面临竞争格局变化),阿里巴巴/百度/金山云(国产大模型及云服务生态中的核心参与者,受益于整体行业技术迭代和需求增长)