清除 当前 2582 条 / 共 3572 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 5 小时前 微信公众号 · 42章经 · 4 天 23 小时前 微信公众号 · DeepTech深科技 · 4 天 23 小时前 微信公众号 · Founder Park · 4 天 23 小时前 微信公众号 · FundaAI · 4 天 23 小时前 微信公众号 · 九章智驾 · 4 天 23 小时前 微信公众号 · 晚点LatePost · 4 天 23 小时前 微信公众号 · 琢磨事 · 4 天 23 小时前 微信公众号 · 甲子光年 · 4 天 23 小时前

亚马逊在搜索栏中推出基于Alexa+的AI购物助手Alexa for Shopping,替代了之前的Rufus助手。该功能旨在为用户提供个性化购物体验。

  • 亚马逊推出AI购物助手Alexa for Shopping
  • 该助手基于Alexa+并位于搜索栏
  • 替代了之前的Rufus助手

文章指出随着AI计算密度增加,数据移动、冷却和光学互连成为影响性能和扩展的关键瓶颈。

  • AI计算密度增加导致数据移动成为瓶颈
  • 冷却和光学互连对性能和规模至关重要

Fireworks AI宣布其平台现已支持Kimi K2.6模型的全参数强化学习(Full-Param RL),强调最佳AI应用不限于少数实验室。

  • Kimi K2.6模型现支持全参数强化学习

据GFHK月度电话会,苹果与英特尔已于2025年12月签署协议。苹果M7芯片将采用英特尔18A-P工艺,预计2027年底投产;智能手机芯片将采用英特尔14A工艺,预计2028年底投产。

  • 苹果与英特尔2025年12月签署协议
  • M7芯片采用英特尔18A-P,2027年底投产
  • 智能手机芯片采用英特尔14A,2028年底投产

Meta宣布WhatsApp在Meta AI聊天中增加无痕模式,此模式下对话不会被保存,关闭聊天后消息自动消失。

  • WhatsApp在Meta AI聊天中增加无痕模式
  • 无痕模式下对话不保存,关闭后消息消失

根据金融科技公司Ramp的AI指数,Anthropic的认证业务客户数量首次超过OpenAI,显示AI市场竞争格局变化。

  • Anthropic的认证商业客户数首次超过OpenAI

英伟达宣布与IneffableLabs合作,共同设计用于大规模强化学习代理的基础设施,旨在加速科学和产业领域的发现。双方工程师正在探索构建训练流程,以实现跨知识领域的突破。

  • 英伟达与IneffableLabs合作设计大规模RL代理基础设施
  • 合作目标为加速科学和产业领域的发现
  • 双方工程师正探索构建训练流程以驱动突破

一条推文表示现在可以在笔记本电脑上免费运行Qwen3-35B-A3B模型,使用llama.cpp和4位量化,实现24/7运行。

  • 可以在笔记本电脑上免费运行Qwen3-35B-A3B模型
  • 使用llama.cpp和4位量化实现高效运行

立讯精密将为OpenAI制造消费设备,并进入共封装光学(CPO)供应链。此消息来自社交媒体,表明立讯精密在AI硬件领域的业务拓展。

  • 立讯精密将为OpenAI制造消费设备
  • 立讯精密进入CPO供应链

Unsloth发布实验性Qwen3.6 MTP GGUF版本,27B模型在单GPU上达到140 tokens/s,35B-A3B模型达到220 tokens/s,相比原始GGUF速度提升1.4倍,且精度不变。建议最大草稿token数为2。

  • 发布Qwen3.6 MTP GGUF版本,支持推测解码
  • 27B模型单GPU推理速度140 tokens/s
  • 35B-A3B模型速度220 tokens/s,提升1.4倍

Anthropic CFO Krishna Rao首次参加播客,透露公司收入从2.5亿美元增长至300亿美元,已筹集约750亿美元资金。他在播客中讨论了计算资源分配、投资者误解等话题。

  • Anthropic CFO Krishna Rao首次亮相播客
  • 公司收入从2.5亿美元增至300亿美元
  • 已筹集约750亿美元资金

日本味之素宣布将ABF薄膜核心产品价格上调30%,新价格2026年Q3生效。台湾封装基板厂商已收到涨价通知,当前IC基板供应链成本压力高企,上游CCL多次涨价是最主要成本负担。味之素全球ABF市占率超95%,此次涨价系近一年来首次,受AI芯片客户需求支撑,预计ABF和BT基板季度涨价将持续至年底。

  • 味之素将ABF薄膜价格上调30%,2026年Q3生效
  • 味之素全球ABF市场份额超过95%
  • 前一次涨价发生在2025年初,此次为近一年来首次

据Mizuho报告,英伟达因液态金属TIM2性能不稳定,将Rubin冷却模块设计回退至更保守的Griffin方案。

  • 英伟达因液态金属TIM2性能不稳定重新设计冷板模块
  • Rubin冷却模块设计回退至Griffin方案

Nebius财报表现强劲,重申2026年ARR达70-90亿美元,调整后EBITDA利润率40%,已签约4 GW容量,并通过英伟达支持的融资结构获得6.3亿美元资金。

  • 重申2026年ARR70-90亿美元
  • 预计调整后EBITDA利润率40%
  • 签约4GW容量,获英伟达支持融资6.3亿美元

OpenAI宣布在Windows上为Codex构建安全沙箱,提供受控文件访问和网络限制,实现安全高效的编码代理。

  • OpenAI在Windows上为Codex构建安全沙箱
  • 沙箱提供受控文件访问和网络限制

Nebius在密苏里州的千兆瓦级AI工厂已进入一期建设,该工厂战略设计用于支持大规模AI工作负载。

  • Nebius首个千兆瓦级AI工厂进入一期建设
  • 工厂位于密苏里州
  • 战略设计用于支持大规模AI工作负载

OpenAI成立新公司OpenAI Deployment Company,初始投资超40亿美元,并收购AI咨询公司Tomoro,以帮助企业部署AI系统。Google计划招聘数百名工程师帮助客户使用其商业AI。

  • OpenAI成立新公司,初始投资超40亿美元
  • OpenAI收购AI咨询公司Tomoro,约150名AI工程师加入
  • Google计划招聘数百名工程师帮助客户使用其商业AI

戴尔、HPE、联想、超微等厂商受益于创纪录的AI服务器需求,但企业客户要求超越芯片的完整服务,供应商正从硬件转向服务导向。

  • AI服务器需求创历史新高
  • 供应商从芯片转向服务以赢得企业客户

谷歌在Android Show活动上推出多项Gemini集成和硬件,包括与戴尔、惠普、联想、宏碁、华硕合作开发的AI原生Googlebook笔记本、Gemini Intelligence系统、AI鼠标光标等,这些产品将于秋季发货,融合手机应用与文件,进一步统一AI设备生态。

  • 谷歌发布AI原生Googlebook笔记本,与戴尔等厂商合作
  • 推出Gemini Intelligence系统及AI鼠标光标
  • Googlebook将于秋季发货,运行安卓应用和文件

Anthropic CFO Krishna Rao在播客中讨论计算资源分配策略,公司灵活使用Trainium、TPUs和GPUs三种芯片平台,每日开会分配算力用于模型开发、内部使用和客户需求,并解释前沿智能的回报如何提高,尤其在企业领域。

  • Anthropic使用三种芯片平台:Trainium、TPUs和GPUs
  • 每日会议分配计算资源给模型开发、内部使用和客户需求
  • 前沿智能回报在企业领域持续提高

Hugging Face 团队宣布发布 Diffusers 0.38.0 版本,新增多个管道(pipelines)并改进了库功能。

  • Diffusers 0.38.0 版本发布,新增多个管道和库改进。

Google今日推出Gemini Intelligence,将Gemini的最佳功能集成到其最先进的设备中。

  • Google推出Gemini Intelligence产品
  • 该产品将集成到最先进的设备中

Long Lake完成了全球首例AI驱动的上市公司私有化收购,交易金额63亿美元,目标公司为一家百年老店。

  • Long Lake完成全球首例AI驱动的上市公司私有化
  • 收购金额63亿美元
  • 目标公司为百年老店

AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。

  • AMD向vLLM/SGLang维护者提供MI355X集群持续访问
  • 此前仅有NVIDIA提供类似开发集群访问

推特称模型具备同步语音能力,使Horace最近更易用。

  • 模型具备同步语音能力
  • Horace易用性提升

美国医疗保险Medicare推出全新支付模型ACCESS,首次为AI代理服务(如患者监测、随访、协调住房等)建立支付机制,旨在支持AI在患者间期护理中的应用。

  • 美国Medicare推出ACCESS支付模型
  • ACCESS首次为AI代理服务建立支付机制

微软CEO纳德拉宣布推出新的多模型代理安全系统,集成超过100个专用代理,在CyberGym基准测试中表现优异,已提前发现并修复16个漏洞,现开放客户注册私人预览。

  • 微软发布多模型代理安全系统,集成超100个专用代理
  • 该系统在CyberGym基准测试中取得顶级性能
  • 系统已帮助发现并修复16个漏洞,现开放私人预览

OpenAI 详细介绍了对 TanStack npm 供应链攻击(代号 Mini Shai-Hulud)的响应,包括保护系统和签名证书的措施,并要求 macOS 用户在 2026 年 6 月 12 日前更新 OpenAI 应用。

  • TanStack 遭受 npm 供应链攻击
  • OpenAI 要求 macOS 用户在 2026 年 6 月 12 日前更新应用
  • OpenAI 已采取保护系统和签名证书的措施

NVIDIA发布Metropolis Blueprint for视频搜索与摘要(VSS),可将数百万实时视频流或数小时录像转化为可搜索、可操作的情报。

  • NVIDIA发布Metropolis Blueprint VSS技术方案
  • 该方案将视频转化为可搜索情报
  • 支持实时视频流和录像处理

Vapi AI 宣布完成 5000 万美元 B 轮融资,累计通话量达 10 亿次,企业 ARR 增长 10 倍。

  • Vapi AI 完成 5000 万美元 B 轮融资
  • 累计通话量达到 10 亿次
  • 企业 ARR 同比增长 10 倍

SemiAnalysis指出,随着伊朗战争持续,半导体供应链中一种非常隐蔽的原料——石脑油(Naphtha)可能成为AI芯片的潜在制约因素。该推文引发关注,但尚未提供具体数据或细节。

  • 伊朗战争持续,可能影响半导体供应链中的石脑油供应
  • 石脑油是AI芯片制造中的一种原料
  • SemiAnalysis认为石脑油可能成为AI芯片的潜在约束

该推文指出,随着TPU v8、Rubin和Trainium3于2026年第四季度开始量产,PCB/互连瓶颈问题将受到更多关注。

  • 预计TPU v8、Rubin和Trainium3将在2026年Q4开始量产
  • 该量产将引发PCB/互连瓶颈的更多讨论

Hugging Face 转发推文称,机器人 Reachy Mini 出现在科技博主 LinusTech 最新视频封面,获得产品展示曝光。

  • Reachy Mini 成为 LinusTech 视频封面主角

Y Combinator 祝贺 Lumius 推出通用 3D 身体摄像头,该设备使超声更快速、可及和智能化,标志着 3D 超声成像技术的进步。

  • Lumius 推出通用 3D 摄像头用于身体
  • 该产品使超声成像更快速、可及和智能化

台媒报道,富士康已在越南工厂生产全光CPO交换机机架,并开始向英伟达提前出货。出货预测从此前2026年1万台以上上调至2026-2027年5万台以上。供应极为紧张,甚至演示样机也被调拨给英伟达。

  • 富士康开始向英伟达提前出货全光CPO交换机机架
  • 出货预测从2026年1万+上调至2026-2027年5万+台
  • 供应紧张,演示样机也被占用

LangChain宣布Deep Agents内置持久化执行功能,每个代理步骤都被检查点记录,提供可观测性、容错等特性。技术产品发布。

  • LangChain发布Deep Agents,支持持久化执行和检查点记录

LangGraph 1.2版本发布,新增delta channels功能,针对长上下文场景优化全状态检查点,减少完整状态存储开销。

  • LangGraph 1.2发布delta channels功能
  • 该功能优化长上下文场景的全状态检查点

NBIS宣布与LangChain合作,将Nebius Token Factory与LangChain的Deep Agents整合,旨在提升AI代理功能。

  • NBIS与LangChain达成合作
  • 整合Nebius Token Factory与LangChain的Deep Agents

Claude推出面向法律行业的最新插件和技能,包括与Box的集成,允许企业合同和文档以无头方式在Claude中安全处理。这标志着AI在行业特定工作流中的应用进展。

  • Claude推出法律行业插件和技能,包括Box集成。
  • 企业合同和文档可在Claude中以无头方式安全处理。

OpenMed Agent 发布预览版,基于 Hugging Face 构建,利用其端点驱动临床信息提取和医学术语处理。

  • OpenMed Agent 进入预览阶段
  • 基于 Hugging Face 平台开发
  • 用于临床提取和术语处理

AI初创公司Klarify推出服务,自动化处理治疗师除治疗本身以外的所有工作,包括笔记、治疗计划、保险索赔和寻找新客户。创始人Moody AbdulFattah和Berglind Ýr Ásbjörnsdóttir发布产品。

  • Klarify AI可自动化治疗师的非治疗工作
  • 功能包括笔记、治疗计划、保险索赔和寻找客户

Vapi_AI 宣布完成 5000 万美元 B 轮融资,已处理 10 亿次通话,企业 ARR 增长 10 倍。

  • Vapi_AI 完成 5000 万美元 B 轮融资
  • 累计处理 10 亿次通话
  • 企业 ARR 增长 10 倍

Altman 作证称,Musk 曾考虑将 OpenAI 交给他的孩子。Altman 对 Musk 控制初始营利实体表示担忧,因为 OpenAI 致力于防止高级 AI 落入个人之手,且他深知创始人通常不会放弃控制权。

  • Musk 曾考虑将 OpenAI 交给他的孩子
  • Altman 担忧 Musk 对营利实体的控制权

在SAP Sapphire 2026上,微软与SAP宣布深化合作,以Azure为基础推动企业AI转型,推出Frontier Transformation和agentic intelligence。双方扩展主权云解决方案,扩大Cloud Acceleration Factory和RISE with SAP加速项目,并强化统一数据基础,助力企业实现自主化运营。

  • 微软与SAP推出Frontier Transformation,以Azure为基础推动企业AI转型
  • 双方扩展主权云解决方案,提供可信企业云服务
  • 微软与SAP扩大Cloud Acceleration Factory,推动SAP AI创新

InstaAgent 是一家帮助B2C公司在社交媒体上进行大规模营销的AI公司,在10个月内实现了100万美元的年度经常性收入(ARR)。该公司已正式上线发布。

  • InstaAgent 帮助B2C公司扩展社交媒体营销
  • 10个月内达到100万美元ARR

Hugging Face Hub 上的开放数据集数量达到100万个,标志着开源数据资源的重要里程碑。

  • Hugging Face Hub 开放数据集突破100万个。
2026-05-12T17:45

LLM工具发布0.32a2版本,新增对OpenAI推理模型的支持,使用/v1/responses端点实现GPT-5类模型的工具调用推理,并可显示推理令牌。

  • LLM 0.32a2版本发布
  • OpenAI推理模型改用/v1/responses端点
  • 支持显示推理令牌并可用-R参数隐藏

根据PJM最新数据,AI基础设施项目在获得并网批准后,等待时间比在排队阶段更长,导致项目面临数年延迟。

  • PJM数据显示AI数据中心获批后等待时间超过排队时间

谷歌与SpaceX正谈判建设在轨数据中心,将太空作为AI计算场所,尽管当前成本远高于地面。

  • 谷歌与SpaceX谈判建设轨道数据中心
  • 计划将太空用于AI计算
  • 在轨数据中心成本目前远高于地面

推文介绍了一个名为physics-intern的agentic框架,用于理论物理研究,该框架将Gemini 3.1 Pro在CritP基准上的性能从17.7%提升至31.4%。

  • physics-intern是一个用于理论物理的agentic框架
  • 该框架将Gemini 3.1 Pro在CritP上的准确率从17.7%提升到31.4%