Sourcing — Feed

清除当前 1 条 / 共 3563 条

筛选已选

投研/平台

Alpha 派抓到：1 小时 5 分钟前 SemiAnalysis 抓到：3 天 10 小时前

官方/公司

OpenAI News 抓到：4 小时 22 分钟前 NVIDIA Technical Blog 抓到：10 小时 22 分钟前 Azure Blog 抓到：6 天 22 小时前 Google DeepMind Blog 抓到：8 天 4 小时前 Amazon Science 抓到：1 天 10 小时前 AWS ML Blog 抓到：1 天 4 小时前

微信公众号

微信公众号 · Founder Park 抓到：11 天前微信公众号 · FundaAI 抓到：17 天 22 小时前微信公众号 · 九章智驾抓到：11 天前微信公众号 · 晚点LatePost 抓到：11 天前微信公众号 · 琢磨事抓到：24 天 18 小时前微信公众号 · 甲子光年抓到：21 天 8 小时前

重置

异常/暂停数据源 9

AI 基建 · 26 天 22 小时前微信公众号 · 42章经 · 4 天 17 小时前微信公众号 · DeepTech深科技 · 4 天 17 小时前微信公众号 · Founder Park · 4 天 17 小时前微信公众号 · FundaAI · 4 天 17 小时前微信公众号 · 九章智驾 · 4 天 17 小时前微信公众号 · 晚点LatePost · 4 天 17 小时前微信公众号 · 琢磨事 · 4 天 17 小时前微信公众号 · 甲子光年 · 4 天 17 小时前

3 Latest open artifacts (#21): Open model bonanza! Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5, GLM-5.1 & others. On CAISI's V4 assessment.

2026-05-16T17:00

本月多家开源前沿实验室发布新模型，包括DeepSeek V4。AI标准与创新中心（CAISI）对DeepSeek V4进行评估，认为开源模型落后于美国前沿模型，且差距随时间扩大。CAISI基于项目反应理论计算Elo分数，使用了九个不同基准。DeepSeek V4在CTF-Archive-Diamond、PortBench和ARC-AGI-2等基准上得分较低，导致整体Elo差距显著。

DeepSeek V4等新模型本月发布
CAISI评估认为开源模型与美前沿差距扩大
DeepSeek V4在多个基准上得分较低

Interconnects AI 行业动态

1 共 1 页