智谱于5月22日面向企业客户发布GLM-5.1高速版API,通过系统级工程优化实现400 tokens/s的输出速度,创下行业纪录。此举显示大模型竞争从模型能力转向全栈工程化和商业化落地。
5月22日,智谱面向企业客户发布GLM-5.1高速版API,通过对旗舰模型进行系统级工程优化,实现了创纪录的400 tokens/s输出速度,打破了过去高性能与低延迟无法兼得的行业困境。这一进展标志着大模型竞争的重心正从单纯的模型能力转向全栈工程化和商业化落地,通过在商业化最快的Coding和Agent赛道建立极致体验护城河,智谱不仅巩固了其在国内的领先地位,也为其高端API服务打开了清晰的溢价空间。关注:智谱(模型与工程能力形成闭环,加速高价值场景商业化),锐捷网络/驭驯网络(作为ZCube网络架构核心供应商,深度绑定头部模型厂商的AI推理基础设施建设)