Hugging Face转发Bidhan消息:将选择性发布巴黎2.0模型权重,并与对扩散视频感兴趣的研究人员和团队合作。
Adithya S K 发布了 Repo2RLEnv,一个能将任何代码仓库转化为可运行、可验证的编码环境的工具,基于真实的 GitHub PR 和提交构建。
研究人员在Hugging Face上发布了最大的蛋白质数据集合,该数据集经过长时间整理,供社区使用。
Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。
Cohere 的 Command A+ 模型在 Hugging Face 上线,支持 W4A4 量化,可大幅降低服务占用且几乎无性能损失。
Hugging Face 发布 physics-intern 科学问题测试框架,该框架使 Gemini 3.1 Pro 模型在科学问题上的性能从 17.7 提升至 31。
开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。
Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。
在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。
Hugging Face 与 tomaarsen 联合发布 Ettin Reranker 家族,包含六种新的 CrossEncoder 重排序模型,参数规模从 17M 到 1B,声称在同规模下达到最先进性能。
HuggingFace发布了一个30B-A3B推理模型,在物理和数学奥林匹克评估中达到金牌水平。该模型在推理能力上取得突破,引起广泛关注。
介绍physics-intern框架,这是一个用于理论物理的智能体框架。该框架使Gemini 3.1 Pro在CritP基准上的正确率从17.7%提升至31.4%。
Meta上周悄然发布Sapiens2模型家族,这是一组高分辨率模型,基于10亿张人类图像训练,主要用于姿态估计等任务。
Qwen发布WebWorld系列开放世界模型,专为Web代理设计,包含8B、14B、32B参数版本及数据集,采用Apache2.0许可,在MiniWob++任务上提升9.9%,在WebArena上提升10%。
Hugging Face的TRL库发布v1.4版本,新增chunked NLL损失用于监督微调,使用更少显存且速度更快,并提及Qwen3模型。