当前 3571 条 / 共 3571 条
筛选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 1 小时前 微信公众号 · 42章经 · 4 天 20 小时前 微信公众号 · DeepTech深科技 · 4 天 20 小时前 微信公众号 · Founder Park · 4 天 20 小时前 微信公众号 · FundaAI · 4 天 20 小时前 微信公众号 · 九章智驾 · 4 天 20 小时前 微信公众号 · 晚点LatePost · 4 天 20 小时前 微信公众号 · 琢磨事 · 4 天 20 小时前 微信公众号 · 甲子光年 · 4 天 20 小时前

英伟达RTX 5090D V2游戏芯片被加入海关禁令列表,发生在黄仁勋访问北京期间,传递出降级芯片无机会的明确信号。

  • RTX 5090D V2被列入海关禁令列表
  • 禁令发生在黄仁勋访问北京时

推特用户爆料,中国已禁止进口被削弱版本的NVIDIA RTX 5090显卡。

  • 中国禁止削弱版RTX 5090

Jabil在JP Morgan炉边谈话中确认,与Sivers合作的1.6T LRO光收发器量产时间提前,未来1-4个月进入认证,认证周期2-6个月。该产品功耗约11千瓦,远低于现有1.6T方案,形成显著竞争壁垒。需求极度旺盛,供应不足,任何生产的产品都将被市场采购,收入实现窗口预计在2026年底至2027年初。

  • Jabil的1.6T LRO将在未来1-4个月进入认证,认证期2-6个月。
  • 1.6T光收发器功耗约11千瓦,远低于当前方案。
  • 需求远超供应,Sivers和Jabil的产品基本会被市场全部购买。

三星电子管理层与工会宣布将于下午4点重启谈判,韩国劳动部长将亲自主持。此次谈判旨在解决双方分歧,避免进一步影响公司运营。

  • 三星电子管理层与工会将于下午4点重启谈判
  • 韩国劳动部长将亲自主持谈判

Zepto联合创始人Aadit Palicha在Startup School India分享公司发展历程:从新冠期间在孟买通过WhatsApp群组配送杂货起家,现已成长为拥有超过20万员工、日处理数百万订单的印度最大即时电商平台之一。公司基于10分钟配送模式,自建暗店网络,并利用AI和机器人提升供应链效率,同时拓展广告业务。

  • Zepto现雇佣超20万人,每日处理数百万订单。
  • Zepto基于10分钟配送模式,拥有暗店网络。
  • Zepto正使用AI和机器人提高供应链效率并扩展广告业务。

OpenAI宣布向Y Combinator当前批次的每家初创公司提供200万美元API积分,用于支持下一代AI应用的计算需求。

  • OpenAI向YC当前批次每家初创公司提供200万美元API积分
  • 积分用于支持AI应用的计算需求

OpenAI计划用价值8亿美元的算力换取400家YC初创公司约2%的股权,这是一项直接交易,涉及金额和股权比例明确。

  • OpenAI用8亿美元算力换取400家YC初创公司约2%股权

@levie 在推特分享与多家财富500强企业CIO晚餐后的观察,指出Token成本将成为企业应用AI的主导话题。CIO们尝试多种成本管理策略,但尚未找到完美方案。

  • Token成本成为企业AI应用中的主导话题
  • 众多CIO尝试多种成本管理策略但无完美方案

OpenAI愿意用8亿美元的计算资源换取400家YC创业公司约2%的股权。该交易涉及大量计算资源与初创企业股权交换,可能影响AI初创生态。

  • OpenAI用8亿美元计算资源换取400家YC初创公司约2%股权

OpenAI向Y Combinator当前批次每家初创公司提供200万美元API信用额度,用于计算资源支持,推动下一代技术发展。

  • OpenAI向YC每家公司投资200万美元API额度
  • 资金用于提供计算资源

OpenAI宣布向Y Combinator当前批次每家初创公司提供200万美元API积分投资,旨在为新一代初创企业提供算力支持。

  • OpenAI向Y Combinator当前批次每家初创公司提供200万美元API积分
  • 该投资旨在为新一代初创企业提供算力支持

Google在I/O 2026发布Gemini 3.5 Flash,月处理token量达3.2万亿同比增长7倍,Gemini应用月活超9亿覆盖230+国家。同时展示Gemini Live语音、Omni视频等模态及Antigravity代理栈。

  • Gemini 3.5 Flash正式发布,定位快速代理/编码模型
  • Google月处理token量3.2万亿,同比增长7倍
  • Gemini应用月活9亿+,覆盖230国70+语言

RADAR 宣布完成 1.7 亿美元 B 轮融资,估值超过 10 亿美元。该公司专注于 Physical AI 领域。

  • RADAR 完成 1.7 亿美元 B 轮融资
  • 估值超过 10 亿美元
  • 专注于 Physical AI

Gemini Flash 3.5 模型上线 CursorBench 编码智能体评估基准,团队将随新模型发布持续更新排行榜。

  • Gemini Flash 3.5 已加入 CursorBench 评测
  • 该评测将随新模型发布动态更新排行

一家大型保险公司使用Runway AI工具进行广告本地化,仅花费7美元积分即完成唇形同步和音频生成,避免了超过1万美元的重拍成本,实现99%的成本降低。

  • 保险公司使用Runway降低重拍成本99%
  • Runway积分花费7美元 vs 传统重拍超1万美元

OpenAI CEO Sam Altman表示对代币化初创公司充满期待,并宣布OpenAI向YC当前批次的每家初创公司投资200万美元代币。

  • OpenAI向YC当前批次每家初创公司提供200万美元代币投资
  • Sam Altman表示期待代币化初创公司的发展

GBrain 推出新功能,可将技能、代码、测试、解析器及其触发器和评估打包成 SKILLPACK,方便用户分享和安装。

  • GBrain 可将技能、代码、测试等打包为 SKILLPACK
  • SKILLPACK 是 tarball 格式,可通过命令安装

OpenAI CEO Sam Altman在Y Combinator活动中宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI tokens。涉及金额明确,对象具体。

  • Sam Altman在YC活动上承诺200万美元OpenAI tokens给每个YC创业公司
  • 该承诺针对当前批次所有YC初创企业

三星电子罢工谈判破裂,双方未能达成协议,后续影响待观察。

  • 三星电子罢工谈判破裂

OpenAI CEO Sam Altman在Y Combinator活动上宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI代币资助。

  • Sam Altman在YC活动上宣布向每个YC初创公司提供200万美元OpenAI代币。

Google I/O 2026 首日发布多项重大产品:Gemini 3.5 Flash 模型、Anti-Gravity 2.0 开发平台、AI Studio Workspace 集成、Gemini 消费端重新设计、Omni 视频生成模型、Flow 视频编辑工具等。

  • Google 发布 Gemini 3.5 Flash 模型
  • 推出 Anti-Gravity 2.0 开发平台
  • 发布 Omni 视频生成模型和 Flow 编辑工具

NVIDIA发布了Nemotron-Labs-Diffusion系列扩散语言模型,该模型能够同时生成多个token,不同于传统逐token生成的语言模型。

  • NVIDIA发布Nemotron-Labs-Diffusion扩散语言模型
  • 该模型可同时生成多个token

Hugging Face开源了基因组基础模型,推动AI在基因组学领域的应用。

  • Hugging Face开源了基因组基础模型

开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。

  • Marlin-2B模型开源
  • Marlin针对视频结构化信息提取微调

半导体分销巨头大联大控股表示,第二季度营收、营业利润和净利润均将创下历史新高。

  • 第二季度营收将创历史新高
  • 营业利润和净利润也将创历史新高

在Google I/O大会上,NVIDIA和Google Cloud宣布联合开发者社区在一年内突破10万名开发者。社区成员已构建RAG应用、多智能体管道等。今年新增JAX学习路径、NVIDIA Dynamo优化codelab和月度开发者直播。此外,NVIDIA与Google DeepMind合作,使用SynthID为NVIDIA Cosmos模型输出添加水印。

  • NVIDIA与Google Cloud开发者社区一年内超10万名开发者
  • 新增JAX学习路径、NVIDIA Dynamo on GKE codelab
  • NVIDIA与Google DeepMind合作使用SynthID水印

GBrain v0.36.6版本发布,新增完整多模态图像嵌入功能,用户可加载照片和图像并随时检索。

  • GBrain v0.36.6版本发布
  • 新增完整多模态图像嵌入功能
  • 用户可加载图像并随时检索

谷歌Q1云业务同比增长63%,积压订单达4620亿美元,环比增90%;今年TPU出货指引400-480万颗,明年1500万颗,后年3000万颗,产业链预计明年增长3倍;Anthropic年化收入4月初300亿美元,预期5月底达500亿美元;谷歌I/O大会将发布新Gemini模型、安卓17等,利好TPU、OCS、液冷产业链。

  • 谷歌Q1云业务同比增63%,积压订单环比增90%
  • 今年TPU出货指引400-480万颗,明年1500万颗
  • Anthropic年化收入4月初300亿美元,预期5月底500亿美元

OpenAI的一个模型解决了80年历史的单位距离问题,否定了离散几何中的主要猜想,标志着AI驱动数学的里程碑。

  • OpenAI模型否定了存在80年的单位距离问题猜想。
  • 这是AI在数学证明领域的重大突破。

Ramp公司工程师利用Codex与GPT-5.5进行代码审查,显著加速开发流程,将获取实质性反馈的时间从数小时缩短至数分钟。

  • Ramp工程师使用Codex GPT-5.5进行代码审查
  • 反馈时间从数小时缩短至数分钟

消费行业社零增速继续放缓,对美出口形势出现改善迹象,但整体消费复苏仍面临压力。

  • 消费行业社零增速继续放缓

OpenAI 推进“Education for Countries”计划,通过新合作伙伴关系、教师培训和工具,扩大 AI 在学校中的应用,旨在改善全球学习成果。

  • OpenAI 推进“Education for Countries”计划
  • 与学校建立新合作伙伴关系
  • 提供教师培训和工具

NVIDIA发布Nemotron-Labs-Diffusion系列扩散语言模型,参数规模3B至14B,支持并行生成多个token并在生成过程中进行修订,提升推理速度,还包括视觉语言变体。

  • NVIDIA发布Nemotron-Labs-Diffusion扩散语言模型家族
  • 模型可并行生成多个token并支持修订
  • 模型参数范围3B至14B,含视觉语言变体

NVIDIA技术博客提出为Agent harnesses(如Claude Code、Codex、LangChain Deep Agents)添加专门深度研究技能,以克服其在多文档合成、企业数据决策简报和长周期分析等任务中的局限性,提升复杂研究能力。

  • NVIDIA技术博客提出为Agent harnesses添加深度研究技能
  • 现有Agent harnesses在复杂研究任务中存在局限
2026-05-19T23:46

llm-gemini 发布0.32版本,新增gemini-3.5-flash模型,用于Gemini 3.5 Flash。

  • llm-gemini 0.32版本发布
  • 新增gemini-3.5-flash模型

4月欧洲中系电车市占率达20%,销量较3月季节性回落但环比2月增长30%-40%,终端库存不足1个月,单台毛利回升至2500-3000欧元。欧盟反补贴政策未落地,中国车企仍具成本优势。预计2025年欧洲新能源渗透率达40%,中系品牌市占率逐季提升3-5个百分点。

  • 4月欧洲中系电车市占率20%
  • 终端库存不足1个月,单台毛利2500-3000欧元
  • 预计2025年欧洲新能源渗透率40%,中系市占率逐季提升3-5个百分点

NVIDIA 发布验证代理技能功能,为 AI 代理提供能力治理,旨在增强透明度和信任,确保代理使用的技能可信。

  • NVIDIA 推出 NVIDIA-Verified Agent Skills 功能
  • 该功能用于 AI 代理能力治理,增强透明度和信任

摩根士丹利向香港投行员工发放仅限中国使用的iPhone和iPad,覆盖整个投行部300多人,从初级到董事总经理。设备仅限工作邮箱和Zoom使用。高盛、摩根大通等尚未实施类似政策。

  • 摩根士丹利向香港投行员工发放仅限中国使用的iPhone和iPad
  • 覆盖整个投行部300多人,从初级到董事总经理
  • 设备仅限工作邮箱和Zoom使用

推特用户@aleabitoreddit确认苹果Apple Watch路线图:2026年下半年高端机型将重大改版,新增血压监测功能,采用TASC光电二极管;后续健康监测重点为非侵入式血糖监测,暗示Sivers可能为其提供定制激光器。

  • 苹果计划2026年下半年对高端Apple Watch进行重大改版,加入血压监测功能
  • 苹果后续健康监测重点将转向非侵入式血糖监测
  • 消息暗示Sivers可能为苹果提供定制激光器

开源了一个名为Marlin-2B的小型视觉语言模型,用于从视频中提取结构化信息。

  • Marlin-2B模型已开源
  • 模型用于从视频提取结构化信息

谷歌将Gemini CLI替换为Agy(antigravity cli),但Agy并非开源且不再支持ACP。该消息来自Twitter,引起社区关注。

  • 谷歌用Agy替换Gemini CLI
  • Agy不开源
  • Agy不再支持ACP

2026年AI工程调查启动,与Notion合作,旨在收集AI工程师相关数据。

  • 2026年AI工程调查已启动
  • 此次调查与Notion合作

开发者宣布Chrome开发者工具将支持llms.txt验证功能,该消息来自推特,引起少量讨论。

  • Chrome开发者工具将支持llms.txt验证。

伊利诺伊大学香槟分校研究人员发表论文,证明旋转位置编码(RoPE)在长上下文任务中既不能区分位置也不能区分token,对LLM长上下文理解提出挑战。

  • 新论文证明RoPE在长上下文中无法区分位置和token

根据Twitter用户@simonw的笔记,Google计划将Gemini 3.5 Flash模型用于其多个自有产品,该模型定价是Gemini 3 Flash的三倍。

  • Google计划将Gemini 3.5 Flash用于其多个自有产品
  • Gemini 3.5 Flash定价是Gemini 3 Flash的三倍

谷歌在I/O大会发布Gemini 3.5 Flash,直接进入通用可用阶段,用于Gemini应用、AI搜索、Antigravity平台等。新模型价格上涨,输入每百万tokens 1.5美元,输出9美元,是上一代Flash的3-6倍。支持104万输入token,知识截止2025年1月。同时推出Interactions API测试版,对标OpenAI的Responses模式。

  • 谷歌发布Gemini 3.5 Flash并直接通用可用
  • Gemini 3.5 Flash价格较前代上涨3-6倍
  • 新模型支持104万输入token,知识截止2025年1月

英特尔在JPM会议上表示,一些客户担心竞争对手知道他们与英特尔合作。该言论反映了客户对商业机密泄露的顾虑。

  • 英特尔在JPM会议上提到客户担忧竞争者知道合作
  • 部分客户担心合作信息被竞争对手获知

gdb在推特宣布,提供折扣token和容量保证以换取1-3年承诺,并预期未来模型持续进步将导致容量日益紧张。

  • gdb提供折扣token和容量保证以换取1-3年承诺
  • gdb预期未来模型进步将导致容量持续紧张

推特用户转述,有人从Lumentum在JPM会议上的发言得知,Lumentum已将其所有激光器出售给英伟达。该消息为市场传闻,非官方确认。

  • Lumentum在JPM会议上表示其所有激光器已卖给英伟达

推文指出,Gemini 3.5 Flash定价9美元,较15个月前发布的Gemini 2.0 Flash的0.4美元上涨22.5倍。

  • Gemini 3.5 Flash定价9美元
  • Gemini 2.0 Flash定价0.4美元
  • 3.5 Flash价格是2.0 Flash的22.5倍