Runway 发布了升级版视频编辑模型 Aleph 2.0,该模型允许用户精确修改视频内容并保留其余部分。
Google DeepMind宣布扩大与新加坡的合作,旨在安全部署AI,重点加速科学发现、推进大流行防范和改善医疗保健。
人们利用AI对驾驶舱录音的频谱图进行处理,重建已故飞行员的声音,导致美国国家运输安全委员会(NTSB)暂时阻止公众访问其案卷系统。
Y Combinator举办"Call My Agent"黑客马拉松,吸引全球200余名顶尖黑客参与,提交了80多个项目。
内存短缺导致消费电子重新定价。三大内存制造商将HBM晶圆分配从2%提升至2026年底的20%,HBM每GB消耗的晶圆容量是DDR或LPDDR的三倍以上,挤压消费设备RAM产能。低于100美元的智能手机市场已感受到影响。
AI可观测性平台已累计筹集超过10亿美元,旨在解决智能体时代手动调试不可扩展的问题,行业融资活跃。
ARC-AGI-3竞赛出现首次有意义进展,tufalabs得分从0.68%提升至1.17%。
推特用户@dwarkesh_sp分享了@reinerpope关于AI芯片时钟周期的解释:芯片内部电路每秒数十亿次暂停,由时钟周期控制。内容包含视频链接,属于技术普及。
AI初创公司在公开宣传中夸大ARR指标,且其投资者对此知情。该现象反映了行业内对收入指标的操纵趋势。
英伟达研究院发布LongLive-2.0系统,用于长视频生成的端到端NVFP4训练和推理,通过对齐训练与推理,提升速度与内存效率。
隔夜美股道指创历史新高,受美伊停战谈判乐观情绪及AI板块强劲需求推动。Dell股价创52周新高,Marvell Technology因AI定制芯片上涨。SpaceX提交IPO申请,估值或达1.75万亿美元。Workday和Zoom财报超预期,股价大涨。Estée Lauder与Puig合并谈判终止,股价上涨13%。
Anthropic 推出协作AI网络安全倡议Project Glasswing,一个月内与合作伙伴共同发现超过1万个高危或严重级别的软件漏洞。
白宫新政策要求绿卡申请者从美国境外申请,据称会影响家庭、医生、教师、科学家,并削弱美国在AI领域的竞争力。
reinerpope发布新黑板讲座,从逻辑门开始讲解AI训练和推理的构建过程,并手工演示4位乘累加操作,指出该操作是训练中矩阵乘法的基础。
Abinitio Bio 推出生物制造基础模型,将原本6-18个月的工艺决策过程缩短至数小时计算,每延迟一个月可为制药公司节省超1亿美元。
Google DeepMind宣布将AI水印技术SynthID扩展至更多合作伙伴,并在Gemini App和Google搜索中新增AI生成内容检测功能。
机器人公司Synphony部署机器人采摘草莓,加州草莓市场价值30亿美元,劳动力成本占60%且劳动力萎缩。机器人已跨越与田间劳动力竞争的成本拐点,草莓为切入点,浆果市场150亿美元,该部署层可扩展至其他作物。
摩根士丹利发布NVL72 BoM分析,指出内存价值不含HBM;Nvidia对内存加价;PCB因无缆设计面积和材料升级;BoM价格为OEM渠道价格,超大规模云和Neocloud成本更低。
Zalando通过整合ALLSIDES的AI扫描平台(基于NVIDIA Cosmos等),实现48小时从扫描到上架的高保真3D产品生产,带来购物车添加率提升3%-4%并显著降低鞋类退货。
SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。
电商AI自动化工具Amboras上线,能自动运行、优化和A/B测试店铺。早期商户转化率提升超80%。
谷歌搜索AI更新后,输入单词“disregard”会导致搜索界面失效,这是一个已知的技术问题。
llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。
微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。
Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。
NVIDIA 发布 AI-Q agent skill 开源深度研究工具,可将研究管道打包成便携技能,集成到 agent harness 中,委托本地或托管 AI-Q 服务器执行任务并返回带引用的详细报告。
a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。
知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。
谷歌演示了原型Android XR眼镜,该眼镜将Gemini AI集成到用户视野中,提供翻译、导航等信息叠加功能。
Google DeepMind宣布Project Genie与Google Maps街景集成,用户可将美国真实地点转化为互动虚拟世界。该功能目前仅支持美国地区。
Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。
llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。
Google DeepMind宣布推出Gemini Omni模型,并展示了一周内用户创作的杰出作品。
在Data Centre LIVE会议第二天,演讲者讨论了AI增长与能源需求、可持续性目标及未来基础设施之间的紧张关系。
CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。
机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。
德州超越弗吉尼亚,在全球数据中心排名中领先。达拉斯、西得克萨斯和奥斯汀-圣安东尼奥在Cushman全球排名中上升,原因是AI基础设施对电力和土地的需求。
AI推理工作负载正推动数据中心从郊区回迁至城市区域。Mathpix在布鲁克林部署GPU,表明生产型AI需求驱动城市托管基础设施增长。
在Data Centre LIVE会议上,Centrica研究与创新总监Ben Krikler博士探讨了AI数据中心的能源挑战,包括AI对电网的影响是威胁还是机遇,以及如何通过智能解决方案应对。
微软本周取消了内部Claude Code许可证,原因是基于token的计费导致成本难以承受。
摩根士丹利分析称,英伟达下一代Rubin机架售价约780万美元,价值提升主要来自PCB、MLCC和ABF基板,带动中国PCB概念股上涨。
在Data Centre LIVE: London会议上,Bastille公司专家Ivan O'Sullivan警告AI基础设施运营商,无线威胁已成为数据中心行业不可忽视的盲点。
Google CEO Sundar Pichai在I/O 2026接受独家专访,表示Omni模型将赋能创作者,但YouTube保持创作者优先,维持人与人连接。他预测当前AI在三年后会显得过时。同期,OpenAI发布Codex升级,加州推出保护受AI影响工人的措施。
Runway 发布 Aleph 2.0,新版本支持无限控制、多镜头拍摄、1080p 输出、最长 30 秒视频生成。
AI基础设施初创公司Turbopuffer实现1亿美元年收入并盈利,Exa以22亿美元估值完成2.5亿美元C轮融资,Modal以47亿美元估值完成3.55亿美元C轮融资。此外,AI Twitter摘要报道了RAEv2等模型及基准更新。
AI半导体内存墙问题催生新方案:GPU与HBM解耦,通过光学互连远距离安装更多HBM。国内大型内存厂商研究人员于5月22日透露正与客户讨论该方案,以突破HBM带宽和容量扩展瓶颈,同时HBM堆叠超过16层面临物理极限。
美国联邦贸易委员会(FTC)对Cox Media Group、MindSift和1010 Digital Works三家公司提起诉讼,指控其宣称的“主动监听”AI营销服务实际上并未监听消费者对话,而是转售从其他数据经纪商获取的邮件列表。三家公司同意支付近100万美元和解。
推文指出LLM训练依赖快速矩阵乘法,但许多周围操作仍受内存限制。CODA方法对这些内核进行重新参数化优化。
作者指出AI从廉价聊天工具转向高成本AI代理,上下文窗口更大,推理成本高一个数量级。AI能力持续提升,高端用例继续使用前沿模型,低端任务转向低成本模型。成本分层扩大,企业需管理AI成本。
Y Combinator宣布延长夏季批次申请截止日期,以便更多团队利用与OpenAI的新合作协议。