戴尔、HPE、联想、超微等厂商受益于创纪录的AI服务器需求,但企业客户要求超越芯片的完整服务,供应商正从硬件转向服务导向。
谷歌在Android Show活动上推出多项Gemini集成和硬件,包括与戴尔、惠普、联想、宏碁、华硕合作开发的AI原生Googlebook笔记本、Gemini Intelligence系统、AI鼠标光标等,这些产品将于秋季发货,融合手机应用与文件,进一步统一AI设备生态。
Ecolab发布2025 Growth & Impact Report,扩展AI与冷却水战略,以应对数据中心需求增长对能源和淡水资源的压力。
Anthropic CFO Krishna Rao在播客中讨论计算资源分配策略,公司灵活使用Trainium、TPUs和GPUs三种芯片平台,每日开会分配算力用于模型开发、内部使用和客户需求,并解释前沿智能的回报如何提高,尤其在企业领域。
Hugging Face 团队宣布发布 Diffusers 0.38.0 版本,新增多个管道(pipelines)并改进了库功能。
Google今日推出Gemini Intelligence,将Gemini的最佳功能集成到其最先进的设备中。
Long Lake完成了全球首例AI驱动的上市公司私有化收购,交易金额63亿美元,目标公司为一家百年老店。
AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。
Coherent Lite是相干下沉光模块,适配OCS场景可节省端口,2.4T产品单价约3000美元,价值量高于普通FR模块。谷歌有望率先落地相关应用,国内光模块厂商旭创、新易盛、光迅、德科立等均有技术储备。
推特称模型具备同步语音能力,使Horace最近更易用。
美国医疗保险Medicare推出全新支付模型ACCESS,首次为AI代理服务(如患者监测、随访、协调住房等)建立支付机制,旨在支持AI在患者间期护理中的应用。
微软CEO纳德拉宣布推出新的多模型代理安全系统,集成超过100个专用代理,在CyberGym基准测试中表现优异,已提前发现并修复16个漏洞,现开放客户注册私人预览。
OpenAI 详细介绍了对 TanStack npm 供应链攻击(代号 Mini Shai-Hulud)的响应,包括保护系统和签名证书的措施,并要求 macOS 用户在 2026 年 6 月 12 日前更新 OpenAI 应用。
NVIDIA发布Metropolis Blueprint for视频搜索与摘要(VSS),可将数百万实时视频流或数小时录像转化为可搜索、可操作的情报。
Vapi AI 宣布完成 5000 万美元 B 轮融资,累计通话量达 10 亿次,企业 ARR 增长 10 倍。
SemiAnalysis指出,随着伊朗战争持续,半导体供应链中一种非常隐蔽的原料——石脑油(Naphtha)可能成为AI芯片的潜在制约因素。该推文引发关注,但尚未提供具体数据或细节。
该推文指出,随着TPU v8、Rubin和Trainium3于2026年第四季度开始量产,PCB/互连瓶颈问题将受到更多关注。
Hugging Face 转发推文称,机器人 Reachy Mini 出现在科技博主 LinusTech 最新视频封面,获得产品展示曝光。
Andrea Michi宣布启动开放防御计划,为关键开源项目提供高达500万美元的depthfirstlabs信用额度。
Y Combinator 祝贺 Lumius 推出通用 3D 身体摄像头,该设备使超声更快速、可及和智能化,标志着 3D 超声成像技术的进步。
台媒报道,富士康已在越南工厂生产全光CPO交换机机架,并开始向英伟达提前出货。出货预测从此前2026年1万台以上上调至2026-2027年5万台以上。供应极为紧张,甚至演示样机也被调拨给英伟达。
LangChain宣布Deep Agents内置持久化执行功能,每个代理步骤都被检查点记录,提供可观测性、容错等特性。技术产品发布。
LangGraph 1.2版本发布,新增delta channels功能,针对长上下文场景优化全状态检查点,减少完整状态存储开销。
NBIS宣布与LangChain合作,将Nebius Token Factory与LangChain的Deep Agents整合,旨在提升AI代理功能。
Claude推出面向法律行业的最新插件和技能,包括与Box的集成,允许企业合同和文档以无头方式在Claude中安全处理。这标志着AI在行业特定工作流中的应用进展。
OpenMed Agent 发布预览版,基于 Hugging Face 构建,利用其端点驱动临床信息提取和医学术语处理。
AI初创公司Klarify推出服务,自动化处理治疗师除治疗本身以外的所有工作,包括笔记、治疗计划、保险索赔和寻找新客户。创始人Moody AbdulFattah和Berglind Ýr Ásbjörnsdóttir发布产品。
Vapi_AI 宣布完成 5000 万美元 B 轮融资,已处理 10 亿次通话,企业 ARR 增长 10 倍。
三星电子工会宣布与公司的谈判已破裂,可能引发罢工行动,影响公司运营。
Altman 作证称,Musk 曾考虑将 OpenAI 交给他的孩子。Altman 对 Musk 控制初始营利实体表示担忧,因为 OpenAI 致力于防止高级 AI 落入个人之手,且他深知创始人通常不会放弃控制权。
在SAP Sapphire 2026上,微软与SAP宣布深化合作,以Azure为基础推动企业AI转型,推出Frontier Transformation和agentic intelligence。双方扩展主权云解决方案,扩大Cloud Acceleration Factory和RISE with SAP加速项目,并强化统一数据基础,助力企业实现自主化运营。
InstaAgent 是一家帮助B2C公司在社交媒体上进行大规模营销的AI公司,在10个月内实现了100万美元的年度经常性收入(ARR)。该公司已正式上线发布。
Hugging Face Hub 上的开放数据集数量达到100万个,标志着开源数据资源的重要里程碑。
LLM工具发布0.32a2版本,新增对OpenAI推理模型的支持,使用/v1/responses端点实现GPT-5类模型的工具调用推理,并可显示推理令牌。
Anthropic 发布声明,警告投资者不要通过二级市场平台购买其股票,称此类交易无效且不会在公司账簿上确认。
根据PJM最新数据,AI基础设施项目在获得并网批准后,等待时间比在排队阶段更长,导致项目面临数年延迟。
谷歌与SpaceX正谈判建设在轨数据中心,将太空作为AI计算场所,尽管当前成本远高于地面。
推文介绍了一个名为physics-intern的agentic框架,用于理论物理研究,该框架将Gemini 3.1 Pro在CritP基准上的性能从17.7%提升至31.4%。
Superlog是一款可观测性工具,由Y Combinator支持推出。该工具每日自动设置日志、追踪、告警和仪表盘,并配备AI代理调查事件,生成可合并的PR至Slack。产品正在发布推广中。
Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。
Soumith Chintala在Twitter发布招聘信息,正在寻找超算工程师,负责构建实时交互模型和大规模训练基础设施,包括调度、存储、网络、可靠性及分布式系统,工作地点在纽约和旧金山。
Google DeepMind宣布用AI重新设计鼠标指针,展示了通过动作、语音和自然简写与Gemini交互的实验演示,旨在提升人机交互的直观性。
一篇推文介绍通过组合多个B200 8-GPU机器,使用RoCEv2 CX-7以太网和Tomahawk交换机,并应用PD分解推理优化,使每GPU token吞吐量提升高达7倍,每百万token成本降低7倍。
谷歌在Android Show上发布多项更新,包括AI-first的Googlebooks笔记本、更智能的Gemini功能、vibe-coded Android小部件、Chrome中的Gemini集成以及改进的Android Auto等。
Aseon Labs推出用于自动驾驶汽车的机器人维修站,可在运营区域直接为自动驾驶车队提供充电、清洁和检查服务。该产品已正式发布。
NVIDIA与科罗拉多州立大学合作,利用Earth-2和PhysicsNeMo,结合生成式AI与高分辨率雷达数据,将冰雹预警提前时间从分钟级延长至小时级,实现实时可扩展的天气预报。
谷歌在Gboard中集成Gemini驱动的听写功能,初始支持三星Galaxy和谷歌Pixel手机。
亚马逊金融科技团队使用Amazon Bedrock等AWS服务构建生成式AI应用,自动化处理来自不同管辖区的监管问询。该方案允许各团队创建和维护自己的专用知识库,以提高信息检索和响应效率。
Madrone公司开发数据中心冷却系统,采用新型露点冷却技术,在得克萨斯州可节省30%的电力和水。
来源:alphapai
发布时间:2026-05-12T16:28:53.367000+00:00
热度次数 66; 涨跌幅 16.56%