ARC-AGI-3竞赛出现首次有意义进展,tufalabs得分从0.68%提升至1.17%。
ARC-AGI 创建者 fchollet 指出,最新一批模型在 ARC-AGI-3 基准测试中得分仍低于 1%,并提问年底得分情况。