在deepagents中,通过“Harness profiles”解决不同模型需要不同提示和工具的问题。
Braintrust 工程师利用 OpenAI 的 Codex 模型和 GPT-5.5 进行实验,实现更快的编码。该案例展示了 AI 在软件开发中的实际应用。
美伊就霍尔木兹海峡开放达成初步谅解备忘录但遭美方否认,双方分歧严重,冲突预计持续半年以上。波斯湾石油日供给减少超1300万桶,短期油价大幅震荡。阿联酋退出欧佩克并修建第二条跨海石油管道,2027年投产。9月为关键观察节点。
Aleph Prover 形式化了 OpenAI 对 Paul Erdős 平面单位问题的反驳,并发布了形式化内容。这是一个数学问题的 AI 形式化验证进展。
Yann LeCun转发招募信息,经过一年努力,现在可以轻松参与JEPA和World Models的研究工作。
Meta AI团队宣布启动ATLAS项目,这是迄今最大规模的自动化形式化验证努力之一。该项目旨在通过自动化技术提升形式化验证的效率与规模,推动AI在数学与软件验证领域的应用。
Hugging Face转发Bidhan消息:将选择性发布巴黎2.0模型权重,并与对扩散视频感兴趣的研究人员和团队合作。
NVIDIA AI研究团队在CVPR2026发表论文LocateAnything,一种视觉语言检测模型,采用并行解码边界框方式,在138M高质量样本上训练,显著提升定位精度和吞吐量,目前在HuggingFace上排名第一。
Adithya S K 发布了 Repo2RLEnv,一个能将任何代码仓库转化为可运行、可验证的编码环境的工具,基于真实的 GitHub PR 和提交构建。
研究人员在Hugging Face上发布了最大的蛋白质数据集合,该数据集经过长时间整理,供社区使用。
Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。
Nature发布新AI工具,生成超过十亿个预测蛋白质结构,以及数十亿更多蛋白质相关信息。
Ebetica发布仅需9行代码的蛋白质结构预测方法,无需多序列比对(MSA),达到最先进水平。
Endava利用OpenAI的Codex工具构建代理型组织,显著加速软件交付流程,将需求分析时间从数周缩短至数小时。
Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。
2026年ASCO年会即将召开,本次会议重点关注国产双抗、ADC等创新分子的进展。该摘要总结了行业最新动态,为医药生物领域提供了事实增量。
Biohub发布了蛋白质世界模型ESMC-6B和ESMFold2,包含68亿蛋白质和11亿结构,涉及抗体设计和稀疏自编码器。
Biohub发布蛋白质世界模型,包括ESMC-6B和ESMFold2,利用6.8B蛋白质和1.1B结构数据。科学负责人解释蛋白质语言模型可从序列学习结构与功能,并推出5亿美元虚拟生物学计划,旨在构建细胞、疾病和生理的预测模型。
David Klindt宣布可证明JEPA学习内容,提出可识别的世界模型理论,标志着在AI可解释性方面取得进展。
推文提及DeepSeek V4项目,其目标之一是实现在极端序列长度下的极低推理成本。
亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。
GoogleDeepMind发布Gemini Embedding 2原生多模态嵌入模型白皮书。该模型能够处理文本、图像等多种模态数据,提升检索与生成任务性能。
亚马逊科学团队提出一种新方法,通过引入全局分叉令牌使LLM产生多种推理路径,并采用集监督微调(SSFT)避免模式坍缩,该论文在ICLR 2026发表。
JEPA-WM研究的第二版被TMLR会议接收并获得可重复性认证,已发布新数据。
《新英格兰医学杂志》一项研究显示,美国人在各收入水平上均比欧洲人早逝,且差距在扩大,覆盖不同收入群体。
美国艺术与科学院(American Academy of Arts and Sciences)的《Daedalus》期刊出版了由James Manyika编辑的AI与科学特刊。
在 LLMs-from-scratch 仓库中新增了 DeepSeek Sparse Attention (DSA) 的从头实现,包含动机、概述和 GPT 风格模型参考实现,作为独立示例代码。
SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。
Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。
2025年乔治梅森大学研究发现,靠近数据中心的房屋价值更高,但该趋势的普遍性仍存疑。
新论文Gated DeltaNet-2发布,提出在线性注意力中解耦擦除和写入操作,是一项AI研究进展。
Cohere 的 Command A+ 模型在 Hugging Face 上线,支持 W4A4 量化,可大幅降低服务占用且几乎无性能损失。
Hugging Face 发布 physics-intern 科学问题测试框架,该框架使 Gemini 3.1 Pro 模型在科学问题上的性能从 17.7 提升至 31。
NVIDIA在技术博客中介绍了一种大规模合成高质量三维医学影像数据的方法,用于预训练模型,以解决真实数据稀缺、隐私限制和标注成本高的问题,从而提升模型的鲁棒性和泛化能力。
OpenAI模型否定了埃尔德什的单位距离猜想,该猜想长期未解,证明过程精巧复杂。
LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。
OpenAI的通用推理模型(推测为GPT5.6)在32小时内以低于1000美元的成本,解决了1946年提出的Erdős平面单位距离问题,发现了新的构造族。该结果得到数学家Timothy Gowers肯定,被认为是AI解决著名开放数学问题的首个明确例子。
Google DeepMind 推出 Science Skills for Google Antigravity,整合了包括 UniProt 和 AlphaFold 数据库在内的超过 30 个主要生命科学数据源,旨在加速科研工作流程。
OpenAI声称其推理模型反驳了一个自1946年以来未解的几何猜想,并且此前指出其错误声称的数学家此次证实了该结果。
OpenAI 模型在数学领域取得重大突破,自主推翻了一个由 Paul Erdős 于 1946 年提出的离散几何中心猜想。这是 AI 首次独立解决一个数学领域的重大开放问题。
OpenAI宣布其模型在平面单位距离问题上取得突破,发现全新构造族,推翻近80年传统认知,这是AI首次自主解决数学领域著名开放问题。
GBrain工具新增功能,可通过嵌入利用'brainstorm'模式寻找反共识观点,并支持'lsd模式'。OpenCollider研究人员展示上下文工程技巧可提高原创性。
Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。
开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。
NVIDIA技术博客提出为Agent harnesses(如Claude Code、Codex、LangChain Deep Agents)添加专门深度研究技能,以克服其在多文档合成、企业数据决策简报和长周期分析等任务中的局限性,提升复杂研究能力。
伊利诺伊大学香槟分校研究人员发表论文,证明旋转位置编码(RoPE)在长上下文任务中既不能区分位置也不能区分token,对LLM长上下文理解提出挑战。
Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。
llm-gemini 0.32a0 版本发布,兼容 llm>=0.32a0 alpha,新增流式推理令牌功能。
Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。
在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。