清除 当前 1 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 22 小时前 微信公众号 · 42章经 · 4 天 17 小时前 微信公众号 · DeepTech深科技 · 4 天 17 小时前 微信公众号 · Founder Park · 4 天 17 小时前 微信公众号 · FundaAI · 4 天 17 小时前 微信公众号 · 九章智驾 · 4 天 17 小时前 微信公众号 · 晚点LatePost · 4 天 17 小时前 微信公众号 · 琢磨事 · 4 天 17 小时前 微信公众号 · 甲子光年 · 4 天 17 小时前

本月多家开源前沿实验室发布新模型,包括DeepSeek V4。AI标准与创新中心(CAISI)对DeepSeek V4进行评估,认为开源模型落后于美国前沿模型,且差距随时间扩大。CAISI基于项目反应理论计算Elo分数,使用了九个不同基准。DeepSeek V4在CTF-Archive-Diamond、PortBench和ARC-AGI-2等基准上得分较低,导致整体Elo差距显著。

  • DeepSeek V4等新模型本月发布
  • CAISI评估认为开源模型与美前沿差距扩大
  • DeepSeek V4在多个基准上得分较低