清除 当前 2575 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 22 小时前 微信公众号 · 42章经 · 4 天 17 小时前 微信公众号 · DeepTech深科技 · 4 天 17 小时前 微信公众号 · Founder Park · 4 天 17 小时前 微信公众号 · FundaAI · 4 天 17 小时前 微信公众号 · 九章智驾 · 4 天 17 小时前 微信公众号 · 晚点LatePost · 4 天 17 小时前 微信公众号 · 琢磨事 · 4 天 17 小时前 微信公众号 · 甲子光年 · 4 天 17 小时前

Runway 发布了升级版视频编辑模型 Aleph 2.0,该模型允许用户精确修改视频内容并保留其余部分。

  • Runway 发布 Aleph 2.0 视频编辑模型
  • 新模型允许精确修改视频内容

Google DeepMind宣布扩大与新加坡的合作,旨在安全部署AI,重点加速科学发现、推进大流行防范和改善医疗保健。

  • Google DeepMind与新加坡扩展合作伙伴关系
  • 合作聚焦AI安全部署、科学发现、大流行防范和医疗

人们利用AI对驾驶舱录音的频谱图进行处理,重建已故飞行员的声音,导致美国国家运输安全委员会(NTSB)暂时阻止公众访问其案卷系统。

  • AI被用于重建已故飞行员的声音
  • NTSB暂时阻止公众访问其案卷系统

Y Combinator举办"Call My Agent"黑客马拉松,吸引全球200余名顶尖黑客参与,提交了80多个项目。

  • YC举办黑客马拉松,200+黑客参与
  • 80+项目提交

内存短缺导致消费电子重新定价。三大内存制造商将HBM晶圆分配从2%提升至2026年底的20%,HBM每GB消耗的晶圆容量是DDR或LPDDR的三倍以上,挤压消费设备RAM产能。低于100美元的智能手机市场已感受到影响。

  • 内存制造商将HBM晶圆分配比例从2%提升至2026年底的20%
  • HBM每GB消耗的晶圆容量是DDR或LPDDR的三倍以上
  • 低于100美元的智能手机市场已感受到内存短缺影响

AI可观测性平台已累计筹集超过10亿美元,旨在解决智能体时代手动调试不可扩展的问题,行业融资活跃。

  • AI可观测性平台累计融资超10亿美元

ARC-AGI-3竞赛出现首次有意义进展,tufalabs得分从0.68%提升至1.17%。

  • tufalabs在ARC-AGI-3竞赛中得分从0.68%升至1.17%

推特用户@dwarkesh_sp分享了@reinerpope关于AI芯片时钟周期的解释:芯片内部电路每秒数十亿次暂停,由时钟周期控制。内容包含视频链接,属于技术普及。

  • AI芯片电路每秒暂停数十亿次,原因在于时钟周期。

AI初创公司在公开宣传中夸大ARR指标,且其投资者对此知情。该现象反映了行业内对收入指标的操纵趋势。

  • AI初创公司夸大传统收入指标ARR。
  • 投资者知晓初创公司夸大ARR的行为。

英伟达研究院发布LongLive-2.0系统,用于长视频生成的端到端NVFP4训练和推理,通过对齐训练与推理,提升速度与内存效率。

  • 英伟达研究院发布长视频生成系统LongLive-2.0
  • 系统采用NVFP4低精度训练和W4A4推理
  • 在保持基准质量的同时提升速度和内存效率

隔夜美股道指创历史新高,受美伊停战谈判乐观情绪及AI板块强劲需求推动。Dell股价创52周新高,Marvell Technology因AI定制芯片上涨。SpaceX提交IPO申请,估值或达1.75万亿美元。Workday和Zoom财报超预期,股价大涨。Estée Lauder与Puig合并谈判终止,股价上涨13%。

  • 道琼斯工业平均指数创历史新高
  • SpaceX提交IPO申请,估值可能高达1.75万亿美元
  • Workday和Zoom财报超预期,股价分别上涨8.5%和走高

Anthropic 推出协作AI网络安全倡议Project Glasswing,一个月内与合作伙伴共同发现超过1万个高危或严重级别的软件漏洞。

  • Anthropic 启动 Project Glasswing 安全倡议
  • 一个月内发现超1万个高危漏洞

白宫新政策要求绿卡申请者从美国境外申请,据称会影响家庭、医生、教师、科学家,并削弱美国在AI领域的竞争力。

  • 白宫要求绿卡申请者从美国境外申请
  • 该政策被指影响美国AI竞争力

reinerpope发布新黑板讲座,从逻辑门开始讲解AI训练和推理的构建过程,并手工演示4位乘累加操作,指出该操作是训练中矩阵乘法的基础。

  • reinerpope发布黑板讲座视频,讲解AI训练和推理如何从逻辑门构建
  • 手工演示4位乘累加,作为训练中矩阵乘法的基础操作

Abinitio Bio 推出生物制造基础模型,将原本6-18个月的工艺决策过程缩短至数小时计算,每延迟一个月可为制药公司节省超1亿美元。

  • Abinitio Bio 构建生物制造基础模型
  • 将工艺决策从6-18个月缩短为数小时计算
  • 每延迟一个月可节省制药公司超1亿美元

Google DeepMind宣布将AI水印技术SynthID扩展至更多合作伙伴,并在Gemini App和Google搜索中新增AI生成内容检测功能。

  • SynthID扩展至更多合作伙伴
  • 新增AI内容检测方式

机器人公司Synphony部署机器人采摘草莓,加州草莓市场价值30亿美元,劳动力成本占60%且劳动力萎缩。机器人已跨越与田间劳动力竞争的成本拐点,草莓为切入点,浆果市场150亿美元,该部署层可扩展至其他作物。

  • Synphony部署机器人采摘草莓
  • 加州草莓市场规模30亿美元,劳动力占成本60%
  • 机器人成本已接近田间劳动力,草莓为切入点

摩根士丹利发布NVL72 BoM分析,指出内存价值不含HBM;Nvidia对内存加价;PCB因无缆设计面积和材料升级;BoM价格为OEM渠道价格,超大规模云和Neocloud成本更低。

  • NVL72 BoM中内存成本不含HBM,HBM计入GPU项
  • Nvidia对采购内存加价,供应商收入低于BoM显示
  • PCB内容因无缆设计导致面积和材料升级

Zalando通过整合ALLSIDES的AI扫描平台(基于NVIDIA Cosmos等),实现48小时从扫描到上架的高保真3D产品生产,带来购物车添加率提升3%-4%并显著降低鞋类退货。

  • Zalando推出Scan to Storefront in 48 Hours工作流
  • 该流程带来3%-4%的购物车添加率提升
  • 鞋类退货显著减少

SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。

  • 中位数输入令牌为9.6万
  • 数据来源:432k个真实编码代理请求

电商AI自动化工具Amboras上线,能自动运行、优化和A/B测试店铺。早期商户转化率提升超80%。

  • Amboras推出AI电商全自动运营工具
  • 早期商户使用后转化率提升超80%

谷歌搜索AI更新后,输入单词“disregard”会导致搜索界面失效,这是一个已知的技术问题。

  • 谷歌搜索AI更新后,单词“disregard”会破坏搜索界面
  • 该问题涉及谷歌搜索的AI功能

llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。

  • llama.cpp 新增 WebGPU 后端支持
  • 该工作基于 ggml 库实现
  • 旨在实现完整的 WebGPU 支持

微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。

  • 微软Foundry与Hugging Face合作推出平台
  • 平台包含三个开源图像模型
  • 该平台为开发者提供最大AI创新目录

Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。

  • Allen AI发布ArtifactLinker系统
  • ArtifactLinker预测模型评估基准

NVIDIA 发布 AI-Q agent skill 开源深度研究工具,可将研究管道打包成便携技能,集成到 agent harness 中,委托本地或托管 AI-Q 服务器执行任务并返回带引用的详细报告。

  • NVIDIA 发布开源深度研究工具 AI-Q agent skill
  • 该工具可将研究管道打包成便携技能,集成到 agent harness
  • 代理可委托 AI-Q 服务器执行任务并返回带引用报告

a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。

  • Google每月处理超过3.2 quadrillion tokens
  • 同比去年增长7倍

知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。

  • MiniMax采用Perplexity搜索基础设施
  • MiniMax是一家领先的开源模型和智能体公司

谷歌演示了原型Android XR眼镜,该眼镜将Gemini AI集成到用户视野中,提供翻译、导航等信息叠加功能。

  • 谷歌演示了原型Android XR眼镜
  • 眼镜集成Gemini AI,提供翻译和导航
  • 信息直接叠加到用户视野中

Google DeepMind宣布Project Genie与Google Maps街景集成,用户可将美国真实地点转化为互动虚拟世界。该功能目前仅支持美国地区。

  • Project Genie与Google Maps街景集成
  • 支持将美国真实地点转化为互动世界

Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。

  • Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face
  • 可通过SQL查询超过21.9亿网页,无需下载

llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。

  • llama.cpp/ggml 推出新 WebGPU 后端
  • 该项目开始全面支持 WebGPU

Google DeepMind宣布推出Gemini Omni模型,并展示了一周内用户创作的杰出作品。

  • Google DeepMind推出Gemini Omni模型
  • 展示用户一周内创作的杰出作品

在Data Centre LIVE会议第二天,演讲者讨论了AI增长与能源需求、可持续性目标及未来基础设施之间的紧张关系。

  • Data Centre LIVE第二天聚焦AI增长与能源需求的矛盾。
  • 演讲者探讨了可持续性目标与基础设施未来的挑战。
  • 会议涉及AI、能源和基础设施的交叉议题。

CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。

  • CommonCrawl推荐使用Hugging Face Buckets处理大型训练数据集

机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。

  • Reachy Mini在烹饪直播中故障
  • 推文获得51次点赞和25930次查看

德州超越弗吉尼亚,在全球数据中心排名中领先。达拉斯、西得克萨斯和奥斯汀-圣安东尼奥在Cushman全球排名中上升,原因是AI基础设施对电力和土地的需求。

  • 德州超越弗吉尼亚成为全球数据中心排名领先
  • 达拉斯、西得克萨斯、奥斯汀-圣安东尼奥在Cushman排名中上升

AI推理工作负载正推动数据中心从郊区回迁至城市区域。Mathpix在布鲁克林部署GPU,表明生产型AI需求驱动城市托管基础设施增长。

  • AI推理工作负载推动数据中心回迁至城市区域
  • Mathpix在布鲁克林部署GPU基础设施
  • 生产型AI需求驱动城市托管基础设施增长

在Data Centre LIVE会议上,Centrica研究与创新总监Ben Krikler博士探讨了AI数据中心的能源挑战,包括AI对电网的影响是威胁还是机遇,以及如何通过智能解决方案应对。

  • Centrica总监在Data Centre LIVE会议讨论AI数据中心能源挑战
  • 探讨AI是电网最大威胁还是智能解决方案

微软本周取消了内部Claude Code许可证,原因是基于token的计费导致成本难以承受。

  • 微软取消了内部Claude Code许可证
  • 取消原因是token计费成本过高

摩根士丹利分析称,英伟达下一代Rubin机架售价约780万美元,价值提升主要来自PCB、MLCC和ABF基板,带动中国PCB概念股上涨。

  • 摩根士丹利分析英伟达Rubin机架ASP约780万美元。
  • 价值提升主要来自PCB、MLCC和ABF基板。
  • 中国PCB概念股丁泰高科涨停,胜宏科技涨13.3%。

在Data Centre LIVE: London会议上,Bastille公司专家Ivan O'Sullivan警告AI基础设施运营商,无线威胁已成为数据中心行业不可忽视的盲点。

  • Bastille专家警告AI基础设施运营商关注无线威胁
  • 无线威胁被认为是数据中心行业的盲点

Google CEO Sundar Pichai在I/O 2026接受独家专访,表示Omni模型将赋能创作者,但YouTube保持创作者优先,维持人与人连接。他预测当前AI在三年后会显得过时。同期,OpenAI发布Codex升级,加州推出保护受AI影响工人的措施。

  • Sundar Pichai在I/O 2026专访中阐述Google AI方向,强调赋能创作者
  • Pichai表示YouTube将保持创作者优先,维持人与人连接
  • OpenAI发布最新Codex升级,加州推出工人保护措施

Runway 发布 Aleph 2.0,新版本支持无限控制、多镜头拍摄、1080p 输出、最长 30 秒视频生成。

  • Aleph 2.0 支持无限控制和多镜头拍摄
  • 输出分辨率为 1080p,最长 30 秒

AI基础设施初创公司Turbopuffer实现1亿美元年收入并盈利,Exa以22亿美元估值完成2.5亿美元C轮融资,Modal以47亿美元估值完成3.55亿美元C轮融资。此外,AI Twitter摘要报道了RAEv2等模型及基准更新。

  • Turbopuffer实现1

AI半导体内存墙问题催生新方案:GPU与HBM解耦,通过光学互连远距离安装更多HBM。国内大型内存厂商研究人员于5月22日透露正与客户讨论该方案,以突破HBM带宽和容量扩展瓶颈,同时HBM堆叠超过16层面临物理极限。

  • 国内外内存和封装行业提出GPU-HBM通过光学互连解耦方案。
  • 国内大型内存厂商5月22日表示正与客户讨论光学互连方案。
  • HBM堆叠超过16层面临工艺难度和物理极限。

美国联邦贸易委员会(FTC)对Cox Media Group、MindSift和1010 Digital Works三家公司提起诉讼,指控其宣称的“主动监听”AI营销服务实际上并未监听消费者对话,而是转售从其他数据经纪商获取的邮件列表。三家公司同意支付近100万美元和解。

  • FTC要求三家公司支付近100万美元和解虚假宣传指控
  • Cox Media Group等宣称的“主动监听”服务实际未使用语音数据
  • 该服务实质是高价转售从其他数据经纪商获取的邮件列表

推文指出LLM训练依赖快速矩阵乘法,但许多周围操作仍受内存限制。CODA方法对这些内核进行重新参数化优化。

  • LLM训练中许多周围操作是内存受限的内核
  • CODA重新参数化这些内存受限的内核

作者指出AI从廉价聊天工具转向高成本AI代理,上下文窗口更大,推理成本高一个数量级。AI能力持续提升,高端用例继续使用前沿模型,低端任务转向低成本模型。成本分层扩大,企业需管理AI成本。

  • AI从廉价聊天工具转向具有大上下文窗口和更高推理成本的AI代理
  • 高端用例继续使用前沿模型,低端任务转向低成本模型
  • AI推理成本分层扩大,企业需管理成本

Y Combinator宣布延长夏季批次申请截止日期,以便更多团队利用与OpenAI的新合作协议。

  • YC延长夏季批次截止日期
  • 此举为了让更多团队利用与OpenAI的新合作