清除 当前 282 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 12 小时前 微信公众号 · DeepTech深科技 · 4 天 12 小时前 微信公众号 · Founder Park · 4 天 12 小时前 微信公众号 · FundaAI · 4 天 12 小时前 微信公众号 · 九章智驾 · 4 天 12 小时前 微信公众号 · 晚点LatePost · 4 天 12 小时前 微信公众号 · 琢磨事 · 4 天 12 小时前 微信公众号 · 甲子光年 · 4 天 12 小时前

在deepagents中,通过“Harness profiles”解决不同模型需要不同提示和工具的问题。

  • Deepagents使用Harness profiles处理不同模型的提示和工具需求

Braintrust 工程师利用 OpenAI 的 Codex 模型和 GPT-5.5 进行实验,实现更快的编码。该案例展示了 AI 在软件开发中的实际应用。

  • Braintrust 使用 Codex 和 GPT-5.5 加速编码实验
  • 该技术由 OpenAI 提供支持

美伊就霍尔木兹海峡开放达成初步谅解备忘录但遭美方否认,双方分歧严重,冲突预计持续半年以上。波斯湾石油日供给减少超1300万桶,短期油价大幅震荡。阿联酋退出欧佩克并修建第二条跨海石油管道,2027年投产。9月为关键观察节点。

  • 美伊就霍尔木兹海峡开放达成初步谅解备忘录但遭美方否认
  • 波斯湾石油日供给减少超1300万桶
  • 阿联酋退出欧佩克,正修建第二条跨海石油管道

Aleph Prover 形式化了 OpenAI 对 Paul Erdős 平面单位问题的反驳,并发布了形式化内容。这是一个数学问题的 AI 形式化验证进展。

  • Aleph Prover 形式化了 OpenAI 对 Erdős 平面单位问题的反驳
  • 相关形式化内容已发布

Yann LeCun转发招募信息,经过一年努力,现在可以轻松参与JEPA和World Models的研究工作。

  • 经过一年努力,JEPA和World Models研究现可轻松参与

Meta AI团队宣布启动ATLAS项目,这是迄今最大规模的自动化形式化验证努力之一。该项目旨在通过自动化技术提升形式化验证的效率与规模,推动AI在数学与软件验证领域的应用。

  • Meta AI团队宣布启动名为ATLAS的自动化形式化验证项目
  • ATLAS是迄今最大规模的自动化形式化验证努力之一

Hugging Face转发Bidhan消息:将选择性发布巴黎2.0模型权重,并与对扩散视频感兴趣的研究人员和团队合作。

  • 选择性发布巴黎2.0权重
  • 与研究人员和团队合作扩散视频

NVIDIA AI研究团队在CVPR2026发表论文LocateAnything,一种视觉语言检测模型,采用并行解码边界框方式,在138M高质量样本上训练,显著提升定位精度和吞吐量,目前在HuggingFace上排名第一。

  • NVIDIA AI团队在CVPR2026发表LocateAnything论文
  • 模型在138M样本上训练,并行解码边界框
  • 该模型在HuggingFace趋势榜排名第一

Adithya S K 发布了 Repo2RLEnv,一个能将任何代码仓库转化为可运行、可验证的编码环境的工具,基于真实的 GitHub PR 和提交构建。

  • Repo2RLEnv 工具发布,可将仓库转化为可运行、可验证的编码环境

研究人员在Hugging Face上发布了最大的蛋白质数据集合,该数据集经过长时间整理,供社区使用。

  • 发布了最大的蛋白质数据集合在Hugging Face上
  • 团队为此工作了较长时间

Hugging Face科学团队推出异步强化学习权重同步优化,仅同步变化的权重,带宽成本降低约100倍,在Qwen3-0.6B上验证,payload从1.2GB降至20-35MB,无需共享集群即可实现完全解耦的训练。

  • HF团队使异步RL权重同步带宽成本降低约100倍
  • 新方法在TRL中实现,只传输变化的权重元素
  • 在Qwen3-0.6B上,每步payload从1.2GB降至20-35MB

Nature发布新AI工具,生成超过十亿个预测蛋白质结构,以及数十亿更多蛋白质相关信息。

  • AI新工具生成超十亿个预测蛋白质结构
  • 还有数十亿更多蛋白质数据

Ebetica发布仅需9行代码的蛋白质结构预测方法,无需多序列比对(MSA),达到最先进水平。

  • 新方法仅需9行代码实现蛋白质结构预测
  • 无需多序列比对(MSA)即可达到最先进水平

Endava利用OpenAI的Codex工具构建代理型组织,显著加速软件交付流程,将需求分析时间从数周缩短至数小时。

  • Endava使用Codex构建代理型组织
  • 软件交付加速,需求分析从周缩至小时

Sakana AI Labs通过社交平台正式发布名为DiffusionBlocks的新技术方案,提出基于扩散解释的分块神经网络训练方法。该动态由Clement Delangue转发,获得超39万次观看与1459次点赞。内容聚焦人工智能底层训练架构创新,属于技术发布类资讯。

  • Sakana AI Labs发布DiffusionBlocks分块神经网络训练技术。
  • 该技术采用基于扩散解释的模型训练新架构。
  • 相关推文获得超39万次观看及1459次点赞。

2026年ASCO年会即将召开,本次会议重点关注国产双抗、ADC等创新分子的进展。该摘要总结了行业最新动态,为医药生物领域提供了事实增量。

  • 2026年ASCO年会即将召开
  • 会议关注国产双抗、ADC等创新分子

Biohub发布了蛋白质世界模型ESMC-6B和ESMFold2,包含68亿蛋白质和11亿结构,涉及抗体设计和稀疏自编码器。

  • Biohub发布蛋白质世界模型ESMC-6B和ESMFold2
  • 模型包含68亿蛋白质和11亿结构

Biohub发布蛋白质世界模型,包括ESMC-6B和ESMFold2,利用6.8B蛋白质和1.1B结构数据。科学负责人解释蛋白质语言模型可从序列学习结构与功能,并推出5亿美元虚拟生物学计划,旨在构建细胞、疾病和生理的预测模型。

  • Biohub发布ESMC-6B和ESMFold2蛋白质模型
  • 模型基于6.8B蛋白质和1.1B结构数据训练
  • Biohub启动5亿美元虚拟生物学计划

David Klindt宣布可证明JEPA学习内容,提出可识别的世界模型理论,标志着在AI可解释性方面取得进展。

  • David Klindt宣布可证明JEPA学习内容
  • 提出可识别的世界模型理论

推文提及DeepSeek V4项目,其目标之一是实现在极端序列长度下的极低推理成本。

  • DeepSeek V4项目正在开发中
  • 项目目标包括降低极端序列长度的推理成本

亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。

  • 亚马逊研究奖公布68名获奖者,来自11国49所大学
  • 获奖提案涵盖AI安全、Agentic AI、自动推理等六类
  • 获奖者可获得AWS推广积分和亚马逊研究支持

GoogleDeepMind发布Gemini Embedding 2原生多模态嵌入模型白皮书。该模型能够处理文本、图像等多种模态数据,提升检索与生成任务性能。

  • GoogleDeepMind发布Gemini Embedding 2多模态嵌入模型
  • 该模型原生支持多种数据模态

亚马逊科学团队提出一种新方法,通过引入全局分叉令牌使LLM产生多种推理路径,并采用集监督微调(SSFT)避免模式坍缩,该论文在ICLR 2026发表。

  • 亚马逊提出全局分叉令牌引导LLM多种推理模式
  • 提出集监督微调(SSFT)防止模式坍缩
  • 该论文发表于ICLR 2026

JEPA-WM研究的第二版被TMLR会议接收并获得可重复性认证,已发布新数据。

  • JEPA-WM研究第二版被TMLR接收
  • 获得可重复性认证
  • 论文已发布新数据

《新英格兰医学杂志》一项研究显示,美国人在各收入水平上均比欧洲人早逝,且差距在扩大,覆盖不同收入群体。

  • 美国人比欧洲人早逝,且差距在扩大
  • 研究覆盖所有收入水平,不限于低收入群体

美国艺术与科学院(American Academy of Arts and Sciences)的《Daedalus》期刊出版了由James Manyika编辑的AI与科学特刊。

  • 《Daedalus》期刊出版AI与科学特刊,由James Manyika编辑。

在 LLMs-from-scratch 仓库中新增了 DeepSeek Sparse Attention (DSA) 的从头实现,包含动机、概述和 GPT 风格模型参考实现,作为独立示例代码。

  • 向 LLMs-from-scratch 仓库添加了 DSA 实现
  • 实现包含动机、概述和 GPT 风格模型参考代码

SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。

  • 中位数输入令牌为9.6万
  • 数据来源:432k个真实编码代理请求

Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。

  • Allen AI发布ArtifactLinker系统
  • ArtifactLinker预测模型评估基准

2025年乔治梅森大学研究发现,靠近数据中心的房屋价值更高,但该趋势的普遍性仍存疑。

  • 2025年乔治梅森大学研究发现靠近数据中心的房屋价值更高。

新论文Gated DeltaNet-2发布,提出在线性注意力中解耦擦除和写入操作,是一项AI研究进展。

  • Gated DeltaNet-2论文正式发布
  • 论文主题是解耦线性注意力中的擦除与写入

Cohere 的 Command A+ 模型在 Hugging Face 上线,支持 W4A4 量化,可大幅降低服务占用且几乎无性能损失。

  • Command A+ 上线 Hugging Face
  • 支持 W4A4 量化,降低服务占用

Hugging Face 发布 physics-intern 科学问题测试框架,该框架使 Gemini 3.1 Pro 模型在科学问题上的性能从 17.7 提升至 31。

  • Hugging Face 发布了 physics-intern 科学问题测试框架。
  • 该框架使 Gemini 3.1 Pro 模型性能从 17.7 提升至 31。

NVIDIA在技术博客中介绍了一种大规模合成高质量三维医学影像数据的方法,用于预训练模型,以解决真实数据稀缺、隐私限制和标注成本高的问题,从而提升模型的鲁棒性和泛化能力。

  • NVIDIA发布通过合成3D医学影像数据预训练模型的方法
  • 合成数据旨在解决真实数据稀缺、隐私和标注成本问题
  • 该方法可提高医学影像模型的鲁棒性和泛化能力

OpenAI模型否定了埃尔德什的单位距离猜想,该猜想长期未解,证明过程精巧复杂。

  • OpenAI模型否定了埃尔德什的单位距离猜想
  • 该证明过程被认为精巧且复杂

LeRobotHF团队展示了一款成本约2500美元的双足机器人,大部分零件可3D打印,支持构建、维修、模拟和训练,降低了机器人开发门槛。

  • 双足机器人成本约2500美元
  • 大部分零件可3D打印
  • 支持构建、维修、模拟和训练

OpenAI的通用推理模型(推测为GPT5.6)在32小时内以低于1000美元的成本,解决了1946年提出的Erdős平面单位距离问题,发现了新的构造族。该结果得到数学家Timothy Gowers肯定,被认为是AI解决著名开放数学问题的首个明确例子。

  • OpenAI通用推理模型解决Erdős平面单位距离问题
  • 模型运行时间<32小时,成本<1000美元
  • 结果获数学家Timothy Gowers高度评价

Google DeepMind 推出 Science Skills for Google Antigravity,整合了包括 UniProt 和 AlphaFold 数据库在内的超过 30 个主要生命科学数据源,旨在加速科研工作流程。

  • DeepMind 发布 Science Skills for Google Antigravity
  • 集成超过 30 个生命科学数据源
  • 包含 UniProt 和 AlphaFold 数据库

OpenAI声称其推理模型反驳了一个自1946年以来未解的几何猜想,并且此前指出其错误声称的数学家此次证实了该结果。

  • OpenAI推理模型反驳了1946年以来的几何猜想
  • 数学家证实了该结果

OpenAI 模型在数学领域取得重大突破,自主推翻了一个由 Paul Erdős 于 1946 年提出的离散几何中心猜想。这是 AI 首次独立解决一个数学领域的重大开放问题。

  • OpenAI 模型推翻了 1946 年提出的离散几何中心猜想
  • 这是 AI 首次自主解决数学领域的重大开放问题

OpenAI宣布其模型在平面单位距离问题上取得突破,发现全新构造族,推翻近80年传统认知,这是AI首次自主解决数学领域著名开放问题。

  • OpenAI模型在平面单位距离问题上发现新构造
  • 新构造推翻近80年来传统认知
  • AI首次自主解决数学领域著名开放问题

GBrain工具新增功能,可通过嵌入利用'brainstorm'模式寻找反共识观点,并支持'lsd模式'。OpenCollider研究人员展示上下文工程技巧可提高原创性。

  • GBrain可使用嵌入通过'brainstorm'模式寻找反共识观点
  • OpenCollider研究人员展示上下文工程技巧提高原创性

Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。

  • Hugging Face 发布开源 DNA 基础模型 Carbon
  • Carbon 比同尺寸最佳模型快 275 倍
  • 模型采用 6-base 块 tokenizer 提高效率

开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。

  • Marlin-2B模型开源
  • Marlin针对视频结构化信息提取微调

NVIDIA技术博客提出为Agent harnesses(如Claude Code、Codex、LangChain Deep Agents)添加专门深度研究技能,以克服其在多文档合成、企业数据决策简报和长周期分析等任务中的局限性,提升复杂研究能力。

  • NVIDIA技术博客提出为Agent harnesses添加深度研究技能
  • 现有Agent harnesses在复杂研究任务中存在局限

伊利诺伊大学香槟分校研究人员发表论文,证明旋转位置编码(RoPE)在长上下文任务中既不能区分位置也不能区分token,对LLM长上下文理解提出挑战。

  • 新论文证明RoPE在长上下文中无法区分位置和token

Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。

  • 当前AI模型能良好实现和运行实验
  • 无法可靠选择下一个正确问题或判断死胡同
2026-05-19T20:36

llm-gemini 0.32a0 版本发布,兼容 llm>=0.32a0 alpha,新增流式推理令牌功能。

  • llm-gemini 0.32a0 发布
  • 兼容 llm>=0.32a0 alpha
  • 新增流式推理令牌功能

Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。

  • Hugging Face 发布 Carbon DNA 模型
  • Carbon 速度比次优模型快 275 倍

在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。

  • 发布Carbon系列开源生成式DNA基础模型
  • Carbon-3B性能匹配Evo2-7B
  • Carbon-3B运行速度快250倍