当前 3560 条 / 共 3575 条
筛选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 8 小时前 微信公众号 · 42章经 · 5 天 3 小时前 微信公众号 · DeepTech深科技 · 5 天 3 小时前 微信公众号 · Founder Park · 5 天 3 小时前 微信公众号 · FundaAI · 5 天 3 小时前 微信公众号 · 九章智驾 · 5 天 3 小时前 微信公众号 · 晚点LatePost · 5 天 3 小时前 微信公众号 · 琢磨事 · 5 天 3 小时前 微信公众号 · 甲子光年 · 5 天 3 小时前

戴尔、HPE、联想、超微等厂商受益于创纪录的AI服务器需求,但企业客户要求超越芯片的完整服务,供应商正从硬件转向服务导向。

  • AI服务器需求创历史新高
  • 供应商从芯片转向服务以赢得企业客户

谷歌在Android Show活动上推出多项Gemini集成和硬件,包括与戴尔、惠普、联想、宏碁、华硕合作开发的AI原生Googlebook笔记本、Gemini Intelligence系统、AI鼠标光标等,这些产品将于秋季发货,融合手机应用与文件,进一步统一AI设备生态。

  • 谷歌发布AI原生Googlebook笔记本,与戴尔等厂商合作
  • 推出Gemini Intelligence系统及AI鼠标光标
  • Googlebook将于秋季发货,运行安卓应用和文件

Ecolab发布2025 Growth & Impact Report,扩展AI与冷却水战略,以应对数据中心需求增长对能源和淡水资源的压力。

  • Ecolab发布2025 Growth & Impact Report
  • 报告扩展了AI和冷却水战略
  • 数据中心需求加剧能源和淡水压力

Anthropic CFO Krishna Rao在播客中讨论计算资源分配策略,公司灵活使用Trainium、TPUs和GPUs三种芯片平台,每日开会分配算力用于模型开发、内部使用和客户需求,并解释前沿智能的回报如何提高,尤其在企业领域。

  • Anthropic使用三种芯片平台:Trainium、TPUs和GPUs
  • 每日会议分配计算资源给模型开发、内部使用和客户需求
  • 前沿智能回报在企业领域持续提高

Hugging Face 团队宣布发布 Diffusers 0.38.0 版本,新增多个管道(pipelines)并改进了库功能。

  • Diffusers 0.38.0 版本发布,新增多个管道和库改进。

Google今日推出Gemini Intelligence,将Gemini的最佳功能集成到其最先进的设备中。

  • Google推出Gemini Intelligence产品
  • 该产品将集成到最先进的设备中

Long Lake完成了全球首例AI驱动的上市公司私有化收购,交易金额63亿美元,目标公司为一家百年老店。

  • Long Lake完成全球首例AI驱动的上市公司私有化
  • 收购金额63亿美元
  • 目标公司为百年老店

AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。

  • AMD向vLLM/SGLang维护者提供MI355X集群持续访问
  • 此前仅有NVIDIA提供类似开发集群访问

Coherent Lite是相干下沉光模块,适配OCS场景可节省端口,2.4T产品单价约3000美元,价值量高于普通FR模块。谷歌有望率先落地相关应用,国内光模块厂商旭创、新易盛、光迅、德科立等均有技术储备。

  • Coherent Lite是相干下沉光模块,适配OCS场景可节省端口。
  • 2.4T产品单价约3000美金,价值量高于普通FR模块。
  • 谷歌有望率先落地,国内光模块厂商有技术储备。

推特称模型具备同步语音能力,使Horace最近更易用。

  • 模型具备同步语音能力
  • Horace易用性提升

美国医疗保险Medicare推出全新支付模型ACCESS,首次为AI代理服务(如患者监测、随访、协调住房等)建立支付机制,旨在支持AI在患者间期护理中的应用。

  • 美国Medicare推出ACCESS支付模型
  • ACCESS首次为AI代理服务建立支付机制

微软CEO纳德拉宣布推出新的多模型代理安全系统,集成超过100个专用代理,在CyberGym基准测试中表现优异,已提前发现并修复16个漏洞,现开放客户注册私人预览。

  • 微软发布多模型代理安全系统,集成超100个专用代理
  • 该系统在CyberGym基准测试中取得顶级性能
  • 系统已帮助发现并修复16个漏洞,现开放私人预览

OpenAI 详细介绍了对 TanStack npm 供应链攻击(代号 Mini Shai-Hulud)的响应,包括保护系统和签名证书的措施,并要求 macOS 用户在 2026 年 6 月 12 日前更新 OpenAI 应用。

  • TanStack 遭受 npm 供应链攻击
  • OpenAI 要求 macOS 用户在 2026 年 6 月 12 日前更新应用
  • OpenAI 已采取保护系统和签名证书的措施

NVIDIA发布Metropolis Blueprint for视频搜索与摘要(VSS),可将数百万实时视频流或数小时录像转化为可搜索、可操作的情报。

  • NVIDIA发布Metropolis Blueprint VSS技术方案
  • 该方案将视频转化为可搜索情报
  • 支持实时视频流和录像处理

Vapi AI 宣布完成 5000 万美元 B 轮融资,累计通话量达 10 亿次,企业 ARR 增长 10 倍。

  • Vapi AI 完成 5000 万美元 B 轮融资
  • 累计通话量达到 10 亿次
  • 企业 ARR 同比增长 10 倍

SemiAnalysis指出,随着伊朗战争持续,半导体供应链中一种非常隐蔽的原料——石脑油(Naphtha)可能成为AI芯片的潜在制约因素。该推文引发关注,但尚未提供具体数据或细节。

  • 伊朗战争持续,可能影响半导体供应链中的石脑油供应
  • 石脑油是AI芯片制造中的一种原料
  • SemiAnalysis认为石脑油可能成为AI芯片的潜在约束

该推文指出,随着TPU v8、Rubin和Trainium3于2026年第四季度开始量产,PCB/互连瓶颈问题将受到更多关注。

  • 预计TPU v8、Rubin和Trainium3将在2026年Q4开始量产
  • 该量产将引发PCB/互连瓶颈的更多讨论

Hugging Face 转发推文称,机器人 Reachy Mini 出现在科技博主 LinusTech 最新视频封面,获得产品展示曝光。

  • Reachy Mini 成为 LinusTech 视频封面主角

Andrea Michi宣布启动开放防御计划,为关键开源项目提供高达500万美元的depthfirstlabs信用额度。

  • 开放防御计划正式启动
  • 提供500万美元信用额度用于关键开源项目

Y Combinator 祝贺 Lumius 推出通用 3D 身体摄像头,该设备使超声更快速、可及和智能化,标志着 3D 超声成像技术的进步。

  • Lumius 推出通用 3D 摄像头用于身体
  • 该产品使超声成像更快速、可及和智能化

台媒报道,富士康已在越南工厂生产全光CPO交换机机架,并开始向英伟达提前出货。出货预测从此前2026年1万台以上上调至2026-2027年5万台以上。供应极为紧张,甚至演示样机也被调拨给英伟达。

  • 富士康开始向英伟达提前出货全光CPO交换机机架
  • 出货预测从2026年1万+上调至2026-2027年5万+台
  • 供应紧张,演示样机也被占用

LangChain宣布Deep Agents内置持久化执行功能,每个代理步骤都被检查点记录,提供可观测性、容错等特性。技术产品发布。

  • LangChain发布Deep Agents,支持持久化执行和检查点记录

LangGraph 1.2版本发布,新增delta channels功能,针对长上下文场景优化全状态检查点,减少完整状态存储开销。

  • LangGraph 1.2发布delta channels功能
  • 该功能优化长上下文场景的全状态检查点

NBIS宣布与LangChain合作,将Nebius Token Factory与LangChain的Deep Agents整合,旨在提升AI代理功能。

  • NBIS与LangChain达成合作
  • 整合Nebius Token Factory与LangChain的Deep Agents

Claude推出面向法律行业的最新插件和技能,包括与Box的集成,允许企业合同和文档以无头方式在Claude中安全处理。这标志着AI在行业特定工作流中的应用进展。

  • Claude推出法律行业插件和技能,包括Box集成。
  • 企业合同和文档可在Claude中以无头方式安全处理。

OpenMed Agent 发布预览版,基于 Hugging Face 构建,利用其端点驱动临床信息提取和医学术语处理。

  • OpenMed Agent 进入预览阶段
  • 基于 Hugging Face 平台开发
  • 用于临床提取和术语处理

AI初创公司Klarify推出服务,自动化处理治疗师除治疗本身以外的所有工作,包括笔记、治疗计划、保险索赔和寻找新客户。创始人Moody AbdulFattah和Berglind Ýr Ásbjörnsdóttir发布产品。

  • Klarify AI可自动化治疗师的非治疗工作
  • 功能包括笔记、治疗计划、保险索赔和寻找客户

Vapi_AI 宣布完成 5000 万美元 B 轮融资,已处理 10 亿次通话,企业 ARR 增长 10 倍。

  • Vapi_AI 完成 5000 万美元 B 轮融资
  • 累计处理 10 亿次通话
  • 企业 ARR 增长 10 倍

三星电子工会宣布与公司的谈判已破裂,可能引发罢工行动,影响公司运营。

  • 三星电子工会宣布与公司谈判破裂。

Altman 作证称,Musk 曾考虑将 OpenAI 交给他的孩子。Altman 对 Musk 控制初始营利实体表示担忧,因为 OpenAI 致力于防止高级 AI 落入个人之手,且他深知创始人通常不会放弃控制权。

  • Musk 曾考虑将 OpenAI 交给他的孩子
  • Altman 担忧 Musk 对营利实体的控制权

在SAP Sapphire 2026上,微软与SAP宣布深化合作,以Azure为基础推动企业AI转型,推出Frontier Transformation和agentic intelligence。双方扩展主权云解决方案,扩大Cloud Acceleration Factory和RISE with SAP加速项目,并强化统一数据基础,助力企业实现自主化运营。

  • 微软与SAP推出Frontier Transformation,以Azure为基础推动企业AI转型
  • 双方扩展主权云解决方案,提供可信企业云服务
  • 微软与SAP扩大Cloud Acceleration Factory,推动SAP AI创新

InstaAgent 是一家帮助B2C公司在社交媒体上进行大规模营销的AI公司,在10个月内实现了100万美元的年度经常性收入(ARR)。该公司已正式上线发布。

  • InstaAgent 帮助B2C公司扩展社交媒体营销
  • 10个月内达到100万美元ARR

Hugging Face Hub 上的开放数据集数量达到100万个,标志着开源数据资源的重要里程碑。

  • Hugging Face Hub 开放数据集突破100万个。
2026-05-12T17:45

LLM工具发布0.32a2版本,新增对OpenAI推理模型的支持,使用/v1/responses端点实现GPT-5类模型的工具调用推理,并可显示推理令牌。

  • LLM 0.32a2版本发布
  • OpenAI推理模型改用/v1/responses端点
  • 支持显示推理令牌并可用-R参数隐藏

Anthropic 发布声明,警告投资者不要通过二级市场平台购买其股票,称此类交易无效且不会在公司账簿上确认。

  • Anthropic 警告投资者不要通过二级平台购买其股票
  • 公司声明此类股票交易无效且不被承认

根据PJM最新数据,AI基础设施项目在获得并网批准后,等待时间比在排队阶段更长,导致项目面临数年延迟。

  • PJM数据显示AI数据中心获批后等待时间超过排队时间

谷歌与SpaceX正谈判建设在轨数据中心,将太空作为AI计算场所,尽管当前成本远高于地面。

  • 谷歌与SpaceX谈判建设轨道数据中心
  • 计划将太空用于AI计算
  • 在轨数据中心成本目前远高于地面

推文介绍了一个名为physics-intern的agentic框架,用于理论物理研究,该框架将Gemini 3.1 Pro在CritP基准上的性能从17.7%提升至31.4%。

  • physics-intern是一个用于理论物理的agentic框架
  • 该框架将Gemini 3.1 Pro在CritP上的准确率从17.7%提升到31.4%

Superlog是一款可观测性工具,由Y Combinator支持推出。该工具每日自动设置日志、追踪、告警和仪表盘,并配备AI代理调查事件,生成可合并的PR至Slack。产品正在发布推广中。

  • Superlog可每日自动设置日志、追踪、告警和仪表盘
  • AI代理可调查事件并生成合并PR到Slack
  • Superlog由Y Combinator支持并已发布

Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。

  • Marionette 工具可通过手部动作创建机器人运动
  • 支持 Reachy Mini 机器人
  • 基于浏览器,可在手机上使用

Soumith Chintala在Twitter发布招聘信息,正在寻找超算工程师,负责构建实时交互模型和大规模训练基础设施,包括调度、存储、网络、可靠性及分布式系统,工作地点在纽约和旧金山。

  • 正在招聘超算工程师
  • 工作地点在纽约和旧金山
  • 涉及实时交互模型和大型训练基础设施

Google DeepMind宣布用AI重新设计鼠标指针,展示了通过动作、语音和自然简写与Gemini交互的实验演示,旨在提升人机交互的直观性。

  • DeepMind用AI重新想象鼠标指针界面
  • 演示通过动作、语音和自然简写与Gemini交互

一篇推文介绍通过组合多个B200 8-GPU机器,使用RoCEv2 CX-7以太网和Tomahawk交换机,并应用PD分解推理优化,使每GPU token吞吐量提升高达7倍,每百万token成本降低7倍。

  • 通过RoCEv2和Tomahawk交换机组合B200机器实现PD分解优化
  • 每GPU token吞吐量提升高达7倍
  • 每百万token成本降低7倍

谷歌在Android Show上发布多项更新,包括AI-first的Googlebooks笔记本、更智能的Gemini功能、vibe-coded Android小部件、Chrome中的Gemini集成以及改进的Android Auto等。

  • 谷歌发布AI-first Googlebooks笔记本
  • Gemini功能获得更多智能化升级
  • 推出vibe-coded Android小部件和Gemini in Chrome

Aseon Labs推出用于自动驾驶汽车的机器人维修站,可在运营区域直接为自动驾驶车队提供充电、清洁和检查服务。该产品已正式发布。

  • Aseon Labs推出机器人维修站,用于自动驾驶汽车
  • 维修站可提供充电、清洁和检查服务
  • 产品针对自动驾驶车队在运营区域使用

NVIDIA与科罗拉多州立大学合作,利用Earth-2和PhysicsNeMo,结合生成式AI与高分辨率雷达数据,将冰雹预警提前时间从分钟级延长至小时级,实现实时可扩展的天气预报。

  • NVIDIA与科罗拉多州立大学合作改进天气预报
  • 使用Earth-2和PhysicsNeMo结合生成式AI与雷达数据
  • 冰雹预警时间从分钟级延长到小时级

谷歌在Gboard中集成Gemini驱动的听写功能,初始支持三星Galaxy和谷歌Pixel手机。

  • 谷歌在Gboard中加入Gemini驱动的听写功能
  • 该功能初始在三星Galaxy和谷歌Pixel手机上推出

亚马逊金融科技团队使用Amazon Bedrock等AWS服务构建生成式AI应用,自动化处理来自不同管辖区的监管问询。该方案允许各团队创建和维护自己的专用知识库,以提高信息检索和响应效率。

  • 亚马逊金融科技团队基于AWS构建AI应用处理监管问询
  • 各团队可创建和维护自己的专用知识库

Madrone公司开发数据中心冷却系统,采用新型露点冷却技术,在得克萨斯州可节省30%的电力和水。

  • Madrone开发数据中心冷却系统
  • 采用露点冷却技术
  • 在Texas可节省30%电力与水
2026-05-12T16:28

来源:alphapai
发布时间:2026-05-12T16:28:53.367000+00:00
热度次数 66; 涨跌幅 16.56%