本月多家开源前沿实验室发布新模型,包括DeepSeek V4。AI标准与创新中心(CAISI)对DeepSeek V4进行评估,认为开源模型落后于美国前沿模型,且差距随时间扩大。CAISI基于项目反应理论计算Elo分数,使用了九个不同基准。DeepSeek V4在CTF-Archive-Diamond、PortBench和ARC-AGI-2等基准上得分较低,导致整体Elo差距显著。
文章探讨开源AI生态系统的成本优势,引用Ai2和Epoch AI的研究指出,前沿模型研发算力占总算力的约80%。中国开源生态通过避免重复研发,可降低算力成本,形成持续发展优势。