清除 当前 2577 条 / 共 3565 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天前 微信公众号 · 42章经 · 4 天 19 小时前 微信公众号 · DeepTech深科技 · 4 天 19 小时前 微信公众号 · Founder Park · 4 天 19 小时前 微信公众号 · FundaAI · 4 天 19 小时前 微信公众号 · 九章智驾 · 4 天 19 小时前 微信公众号 · 晚点LatePost · 4 天 19 小时前 微信公众号 · 琢磨事 · 4 天 19 小时前 微信公众号 · 甲子光年 · 4 天 19 小时前

Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。

  • Hugging Face 发布开源 DNA 基础模型 Carbon
  • Carbon 比同尺寸最佳模型快 275 倍
  • 模型采用 6-base 块 tokenizer 提高效率

Lab0推出AI FDE产品,自动化企业软件售后交付流程,从客户流程发现、配置、测试到上线,将原本六个月的部署时间缩短至十天。

  • Lab0发布AI驱动的FDE产品
  • 自动化企业软件售后交付全流程
  • 部署时间从六个月缩短至十天

罗尔斯罗伊斯动力系统在伦敦数据中心直播活动中发表主题演讲,探讨AI时代的电力挑战。演讲人Vittorio Pierangeli,演讲标题为“为AI时代提供动力”。

  • 罗尔斯罗伊斯动力系统在Data Centre LIVE: London发表主题演讲
  • 演讲主题为'为AI时代提供动力'
  • 演讲人Vittorio Pierangeli

Google在I/O大会上发布了一系列基于Gemini的新产品和功能,包括Omni模型、Gemini 3.5 Flash、Spark代理、Antigravity 2.0以及搜索升级,旨在将Gemini打造成其所有产品的代理引擎。

  • Google I/O发布Gemini Omni模型,支持多模态输入输出
  • Gemini 3.5 Flash性能接近Opus等竞品
  • Google计划将Gemini作为其所有产品的代理引擎

EU负责关键IT系统的机构讨论了AI在政府数据中心运营中的愿景,认为AI将带来变革但需要时间,短期内不会完全实现。

  • EU agency认为AI将改变数据中心运营但非一夜之间
  • 该机构管理政府关键IT系统
  • 讨论了AI在数据中心运营中的愿景

英伟达RTX 5090D V2游戏芯片被加入海关禁令列表,发生在黄仁勋访问北京期间,传递出降级芯片无机会的明确信号。

  • RTX 5090D V2被列入海关禁令列表
  • 禁令发生在黄仁勋访问北京时

推特用户爆料,中国已禁止进口被削弱版本的NVIDIA RTX 5090显卡。

  • 中国禁止削弱版RTX 5090

Jabil在JP Morgan炉边谈话中确认,与Sivers合作的1.6T LRO光收发器量产时间提前,未来1-4个月进入认证,认证周期2-6个月。该产品功耗约11千瓦,远低于现有1.6T方案,形成显著竞争壁垒。需求极度旺盛,供应不足,任何生产的产品都将被市场采购,收入实现窗口预计在2026年底至2027年初。

  • Jabil的1.6T LRO将在未来1-4个月进入认证,认证期2-6个月。
  • 1.6T光收发器功耗约11千瓦,远低于当前方案。
  • 需求远超供应,Sivers和Jabil的产品基本会被市场全部购买。

Zepto联合创始人Aadit Palicha在Startup School India分享公司发展历程:从新冠期间在孟买通过WhatsApp群组配送杂货起家,现已成长为拥有超过20万员工、日处理数百万订单的印度最大即时电商平台之一。公司基于10分钟配送模式,自建暗店网络,并利用AI和机器人提升供应链效率,同时拓展广告业务。

  • Zepto现雇佣超20万人,每日处理数百万订单。
  • Zepto基于10分钟配送模式,拥有暗店网络。
  • Zepto正使用AI和机器人提高供应链效率并扩展广告业务。

OpenAI宣布向Y Combinator当前批次的每家初创公司提供200万美元API积分,用于支持下一代AI应用的计算需求。

  • OpenAI向YC当前批次每家初创公司提供200万美元API积分
  • 积分用于支持AI应用的计算需求

OpenAI计划用价值8亿美元的算力换取400家YC初创公司约2%的股权,这是一项直接交易,涉及金额和股权比例明确。

  • OpenAI用8亿美元算力换取400家YC初创公司约2%股权

@levie 在推特分享与多家财富500强企业CIO晚餐后的观察,指出Token成本将成为企业应用AI的主导话题。CIO们尝试多种成本管理策略,但尚未找到完美方案。

  • Token成本成为企业AI应用中的主导话题
  • 众多CIO尝试多种成本管理策略但无完美方案

OpenAI愿意用8亿美元的计算资源换取400家YC创业公司约2%的股权。该交易涉及大量计算资源与初创企业股权交换,可能影响AI初创生态。

  • OpenAI用8亿美元计算资源换取400家YC初创公司约2%股权

OpenAI向Y Combinator当前批次每家初创公司提供200万美元API信用额度,用于计算资源支持,推动下一代技术发展。

  • OpenAI向YC每家公司投资200万美元API额度
  • 资金用于提供计算资源

OpenAI宣布向Y Combinator当前批次每家初创公司提供200万美元API积分投资,旨在为新一代初创企业提供算力支持。

  • OpenAI向Y Combinator当前批次每家初创公司提供200万美元API积分
  • 该投资旨在为新一代初创企业提供算力支持

Google在I/O 2026发布Gemini 3.5 Flash,月处理token量达3.2万亿同比增长7倍,Gemini应用月活超9亿覆盖230+国家。同时展示Gemini Live语音、Omni视频等模态及Antigravity代理栈。

  • Gemini 3.5 Flash正式发布,定位快速代理/编码模型
  • Google月处理token量3.2万亿,同比增长7倍
  • Gemini应用月活9亿+,覆盖230国70+语言

RADAR 宣布完成 1.7 亿美元 B 轮融资,估值超过 10 亿美元。该公司专注于 Physical AI 领域。

  • RADAR 完成 1.7 亿美元 B 轮融资
  • 估值超过 10 亿美元
  • 专注于 Physical AI

Gemini Flash 3.5 模型上线 CursorBench 编码智能体评估基准,团队将随新模型发布持续更新排行榜。

  • Gemini Flash 3.5 已加入 CursorBench 评测
  • 该评测将随新模型发布动态更新排行

一家大型保险公司使用Runway AI工具进行广告本地化,仅花费7美元积分即完成唇形同步和音频生成,避免了超过1万美元的重拍成本,实现99%的成本降低。

  • 保险公司使用Runway降低重拍成本99%
  • Runway积分花费7美元 vs 传统重拍超1万美元

OpenAI CEO Sam Altman表示对代币化初创公司充满期待,并宣布OpenAI向YC当前批次的每家初创公司投资200万美元代币。

  • OpenAI向YC当前批次每家初创公司提供200万美元代币投资
  • Sam Altman表示期待代币化初创公司的发展

GBrain 推出新功能,可将技能、代码、测试、解析器及其触发器和评估打包成 SKILLPACK,方便用户分享和安装。

  • GBrain 可将技能、代码、测试等打包为 SKILLPACK
  • SKILLPACK 是 tarball 格式,可通过命令安装

OpenAI CEO Sam Altman在Y Combinator活动中宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI tokens。涉及金额明确,对象具体。

  • Sam Altman在YC活动上承诺200万美元OpenAI tokens给每个YC创业公司
  • 该承诺针对当前批次所有YC初创企业

OpenAI CEO Sam Altman在Y Combinator活动上宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI代币资助。

  • Sam Altman在YC活动上宣布向每个YC初创公司提供200万美元OpenAI代币。

Google I/O 2026 首日发布多项重大产品:Gemini 3.5 Flash 模型、Anti-Gravity 2.0 开发平台、AI Studio Workspace 集成、Gemini 消费端重新设计、Omni 视频生成模型、Flow 视频编辑工具等。

  • Google 发布 Gemini 3.5 Flash 模型
  • 推出 Anti-Gravity 2.0 开发平台
  • 发布 Omni 视频生成模型和 Flow 编辑工具

NVIDIA发布了Nemotron-Labs-Diffusion系列扩散语言模型,该模型能够同时生成多个token,不同于传统逐token生成的语言模型。

  • NVIDIA发布Nemotron-Labs-Diffusion扩散语言模型
  • 该模型可同时生成多个token

Hugging Face开源了基因组基础模型,推动AI在基因组学领域的应用。

  • Hugging Face开源了基因组基础模型

开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。

  • Marlin-2B模型开源
  • Marlin针对视频结构化信息提取微调

在Google I/O大会上,NVIDIA和Google Cloud宣布联合开发者社区在一年内突破10万名开发者。社区成员已构建RAG应用、多智能体管道等。今年新增JAX学习路径、NVIDIA Dynamo优化codelab和月度开发者直播。此外,NVIDIA与Google DeepMind合作,使用SynthID为NVIDIA Cosmos模型输出添加水印。

  • NVIDIA与Google Cloud开发者社区一年内超10万名开发者
  • 新增JAX学习路径、NVIDIA Dynamo on GKE codelab
  • NVIDIA与Google DeepMind合作使用SynthID水印

GBrain v0.36.6版本发布,新增完整多模态图像嵌入功能,用户可加载照片和图像并随时检索。

  • GBrain v0.36.6版本发布
  • 新增完整多模态图像嵌入功能
  • 用户可加载图像并随时检索

谷歌Q1云业务同比增长63%,积压订单达4620亿美元,环比增90%;今年TPU出货指引400-480万颗,明年1500万颗,后年3000万颗,产业链预计明年增长3倍;Anthropic年化收入4月初300亿美元,预期5月底达500亿美元;谷歌I/O大会将发布新Gemini模型、安卓17等,利好TPU、OCS、液冷产业链。

  • 谷歌Q1云业务同比增63%,积压订单环比增90%
  • 今年TPU出货指引400-480万颗,明年1500万颗
  • Anthropic年化收入4月初300亿美元,预期5月底500亿美元

OpenAI的一个模型解决了80年历史的单位距离问题,否定了离散几何中的主要猜想,标志着AI驱动数学的里程碑。

  • OpenAI模型否定了存在80年的单位距离问题猜想。
  • 这是AI在数学证明领域的重大突破。

Ramp公司工程师利用Codex与GPT-5.5进行代码审查,显著加速开发流程,将获取实质性反馈的时间从数小时缩短至数分钟。

  • Ramp工程师使用Codex GPT-5.5进行代码审查
  • 反馈时间从数小时缩短至数分钟

OpenAI 推进“Education for Countries”计划,通过新合作伙伴关系、教师培训和工具,扩大 AI 在学校中的应用,旨在改善全球学习成果。

  • OpenAI 推进“Education for Countries”计划
  • 与学校建立新合作伙伴关系
  • 提供教师培训和工具

NVIDIA发布Nemotron-Labs-Diffusion系列扩散语言模型,参数规模3B至14B,支持并行生成多个token并在生成过程中进行修订,提升推理速度,还包括视觉语言变体。

  • NVIDIA发布Nemotron-Labs-Diffusion扩散语言模型家族
  • 模型可并行生成多个token并支持修订
  • 模型参数范围3B至14B,含视觉语言变体

NVIDIA技术博客提出为Agent harnesses(如Claude Code、Codex、LangChain Deep Agents)添加专门深度研究技能,以克服其在多文档合成、企业数据决策简报和长周期分析等任务中的局限性,提升复杂研究能力。

  • NVIDIA技术博客提出为Agent harnesses添加深度研究技能
  • 现有Agent harnesses在复杂研究任务中存在局限
2026-05-19T23:46

llm-gemini 发布0.32版本,新增gemini-3.5-flash模型,用于Gemini 3.5 Flash。

  • llm-gemini 0.32版本发布
  • 新增gemini-3.5-flash模型

NVIDIA 发布验证代理技能功能,为 AI 代理提供能力治理,旨在增强透明度和信任,确保代理使用的技能可信。

  • NVIDIA 推出 NVIDIA-Verified Agent Skills 功能
  • 该功能用于 AI 代理能力治理,增强透明度和信任

开源了一个名为Marlin-2B的小型视觉语言模型,用于从视频中提取结构化信息。

  • Marlin-2B模型已开源
  • 模型用于从视频提取结构化信息

谷歌将Gemini CLI替换为Agy(antigravity cli),但Agy并非开源且不再支持ACP。该消息来自Twitter,引起社区关注。

  • 谷歌用Agy替换Gemini CLI
  • Agy不开源
  • Agy不再支持ACP

2026年AI工程调查启动,与Notion合作,旨在收集AI工程师相关数据。

  • 2026年AI工程调查已启动
  • 此次调查与Notion合作

开发者宣布Chrome开发者工具将支持llms.txt验证功能,该消息来自推特,引起少量讨论。

  • Chrome开发者工具将支持llms.txt验证。

伊利诺伊大学香槟分校研究人员发表论文,证明旋转位置编码(RoPE)在长上下文任务中既不能区分位置也不能区分token,对LLM长上下文理解提出挑战。

  • 新论文证明RoPE在长上下文中无法区分位置和token

根据Twitter用户@simonw的笔记,Google计划将Gemini 3.5 Flash模型用于其多个自有产品,该模型定价是Gemini 3 Flash的三倍。

  • Google计划将Gemini 3.5 Flash用于其多个自有产品
  • Gemini 3.5 Flash定价是Gemini 3 Flash的三倍

谷歌在I/O大会发布Gemini 3.5 Flash,直接进入通用可用阶段,用于Gemini应用、AI搜索、Antigravity平台等。新模型价格上涨,输入每百万tokens 1.5美元,输出9美元,是上一代Flash的3-6倍。支持104万输入token,知识截止2025年1月。同时推出Interactions API测试版,对标OpenAI的Responses模式。

  • 谷歌发布Gemini 3.5 Flash并直接通用可用
  • Gemini 3.5 Flash价格较前代上涨3-6倍
  • 新模型支持104万输入token,知识截止2025年1月

gdb在推特宣布,提供折扣token和容量保证以换取1-3年承诺,并预期未来模型持续进步将导致容量日益紧张。

  • gdb提供折扣token和容量保证以换取1-3年承诺
  • gdb预期未来模型进步将导致容量持续紧张

推文指出,Gemini 3.5 Flash定价9美元,较15个月前发布的Gemini 2.0 Flash的0.4美元上涨22.5倍。

  • Gemini 3.5 Flash定价9美元
  • Gemini 2.0 Flash定价0.4美元
  • 3.5 Flash价格是2.0 Flash的22.5倍

Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。

  • 当前AI模型能良好实现和运行实验
  • 无法可靠选择下一个正确问题或判断死胡同

JeffDean在推特宣布Google发布新模型Gemini 3.5 Flash,强调其快速且能力强大。

  • Google发布Gemini 3.5 Flash模型
  • 该模型强调快速与能力兼备

OpenAI 宣布 ChatGPT 每周生成超过 15 亿张图片,产品负责人和研究专家探讨图像 2.0 的新用例和趋势。

  • ChatGPT 每周生成超 15 亿张图片
  • OpenAI 产品负责人与研究专家讨论图像 2.0 新趋势

在Google IO 2026上,Google宣布为Gmail的AI收件箱增加对话式语音搜索功能,允许用户通过语音指令让Gemini AI查找邮件中的特定信息。

  • Google IO 2026宣布Gmail新增对话式语音搜索
  • 用户可语音让Gemini查找邮件细节