英伟达财报显示,AI基础设施支出正从GPU集群扩展到网络和光学领域,网络业务增长强劲,并建立了新的光学合作伙伴关系,表明AI支出正在分散化。
Devin(AI编程助手)宣布支持Windows虚拟机,并展示在Windows环境下运行游戏扫雷。
特朗普推迟签署一项行政命令,该命令要求AI模型在发布前接受政府安全审查,因其对命令措辞不满。
LangChain 发布沙箱身份验证代理,用于控制 AI 代理行为与外部世界之间的边界。
一季度美股AI相关业绩贡献70%,五大云厂商资本开支同比增长90%近1500亿美元,拉动美国GDP增长超50%。伊朗局势推升油价通胀预期,若油价突破120美元可能使美国CPI升至近6%。中美经济呈现科技景气、传统需求疲弱的分化格局。
英伟达宣布将允许客户自行采购DRAM,并开始销售不带DRAM的系统。这一变化可能影响其硬件销售模式和内存供应链格局。
AWS 发布技术方案,通过 Amazon Bedrock AgentCore Runtime 集成 MCP 服务器,使 Amazon Quick 能够将自然语言查询转换为 AWS CLI 命令,无需切换工具,并保留 IAM 权限和 CloudWatch 审计。
NVIDIA发布了NVIDIA-Verified Agent Skills,为AI代理技能提供认证和透明度,包括技能卡展示功能和风险。该技能基于开放规范构建,可兼容ClaudeAI Code、OpenAI Codex和Cursor AI。
AWS博客发布系列文章第一篇,介绍Amazon Bedrock AgentCore服务,该服务是构建多租户代理应用的托管无服务器平台,支持身份管理、内存、可观测性等功能,并探讨了多租户代理架构的设计考量,包括隔离模式等。
本文介绍了使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM)的方法,以突破上下文窗口限制,处理任意长度的文档,通过子LLM调用分析特定文档段落。
OPLOG使用Amazon Bedrock AgentCore构建AI代理驱动的商业智能系统,整合Hubspot CRM等数据源,实现销售周期缩短35%、CRM数据完整性提升91%、手动研究时间减少98%。系统结合Anthropic Cloude Sonnet和Amazon Bedrock Knowledge Bases。
Claude Code 在 MCP(模型上下文协议)流量中占比达到 78%,且该比例仍在加速增长。该数据来自用户分享,引发行业关注。
AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。
Cursor宣布,未来一个月内,Teams计划用户每邀请一位新用户,双方均可获得双倍使用量。
微软研究院发布Vega技术,可将完整凭证转换为单一证明,仅分享必要信息,性能适用于实际应用。
Spotify宣布推出由ElevenLabs驱动的有声书创作工具,并计划于今年晚些时候发布新的有声书计划。
Spotify在播客中新增AI驱动的问答和简报生成功能,用户可根据提示生成每日或每周简报。
Spotify发布新桌面应用,对标谷歌NotebookLM,以研究预览形式在20多个市场上线。
全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。
Datasette Agent 0.1a3 版本发布,新增查看SQL查询按钮、不显示空推理块、改进截断处理等功能。
LangChain 宣布其托管式深度代理(Managed Deep Agents)进入私有测试阶段,提供模型无关的基础设施。
AI初创公司Hark完成7亿美元A轮融资,投资者估值达60亿美元。该公司由Brett Adcock创立,专注于开发“通用”AI界面。
The Path公司宣称其AI心理健康模型在Vera-MH安全基准测试中得分95,远高于消费者机器人最高分65。该公司由Tony Robbins和Calm前员工创立,旨在提供更安全的AI疗法。
据The Information报道,Anthropic正与微软谈判租用其自研AI芯片Maia的服务器,以应对AI需求增长。微软已向Anthropic提供额外Nvidia服务器资源并建设新集群,同时通过Maia 200芯片降低Copilot工具成本,该工具使用Claude模型已产生至少5亿美元支出。
SpaceX提交IPO文件,将其重新定义为垂直整合的AI基础设施平台,覆盖计算、网络、能源和轨道系统。
AdventHealth正在使用OpenAI的ChatGPT for Healthcare来简化工作流程,减少行政负担,从而将更多时间用于患者护理。
Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。
施耐德电气对达拉斯和巴黎数据中心的预测显示,闭环液体冷却工程可将AI带来的年用水量削减一半以上。
据传闻,由于内存价格上涨导致BOM占比过高,英伟达正进行系统级优化,内部讨论在部分Vera Rubin配置中减少系统DDR内存(可能指LPDDR),HBM容量不变。
AI数据中心面临内存墙瓶颈,GPU处理速度远超内存带宽和容量,HBM和CXL等技术用于解决该问题。
OpenAI 宣布其内部通用推理模型自主推翻了一个 80 年的数学猜想(Erdős 单位距离问题),使用了代数数论方法,并经过专家验证,公司称这是 AI 在数学发现领域的首次。
OpenAI的通用推理模型(推测为GPT5.6)在32小时内以低于1000美元的成本,解决了1946年提出的Erdős平面单位距离问题,发现了新的构造族。该结果得到数学家Timothy Gowers肯定,被认为是AI解决著名开放数学问题的首个明确例子。
据WSJ报道,Anthropic预计于2026年第二季度实现盈利,大幅早于此前预测的2028年。该公司自身也未预料到如此快速的增长。
SpaceX S-1文件显示,Starlink ARPU从2023年的99美元/月降至2026年第一季度的66美元/月。公司与Anthropic签署云服务协议,潜在月收入可达12.5亿美元。2025年AI资本支出127亿美元,占公司总资本支出61%。IPO初步文件未披露发行规模和价格范围。
Socionext CEO承认公司可能参与Arm的AGI CPU项目,此前有分析师预测其将宣布超大规模客户。消息公布后股价上涨18%。
Google为开源生产Kubernetes分布式推理工具llm-d添加了夜间CI。TPU在llm-d的CI和代码质量上正在追赶NVIDIA。AMD尚未将其GPU或NIC加入该CI。
韩国5月1-20日DRAM出口数据:出口额115.27亿美元,同比增长498%,环比增长27%;出口单价60319美元/千克,同比上涨432%,较4月20日上涨5%。
Demis Hassabis发推文称,Gemini 3.5 Flash模型在编码和智能体任务上优于3.1 Pro,速度比其他前沿模型快4倍。
Nvidia CEO黄仁勋预测,用于AI代理的CPU将成为公司下一个重大增长点,市场规模达2000亿美元。
Google DeepMind 推出 Science Skills for Google Antigravity,整合了包括 UniProt 和 AlphaFold 数据库在内的超过 30 个主要生命科学数据源,旨在加速科研工作流程。
英伟达在电话会议中预计,其独立Vera CPU市场在2027财年将达到200亿美元。Vera作为Grace的继任者,针对AI代理工作负载优化,预计售价更高。
亚马逊SageMaker AI推出OpenAI兼容API支持,实时推理端点新增/openai/v1路径,接受Chat Completions请求并支持流式响应。用户无需自定义客户端或SigV4包装,只需更改端点URL即可使用OpenAI SDK、LangChain等调用模型。同时支持为端点创建限时bearer令牌,简化认证。此举降低了AI工作负载在SageMaker上部署和调用的复杂性。
Emkara宣布推出全自主AI代理,用于处理IT、合规和采购等内部任务。该代理可独立完成指定工作,代表内部任务自动化领域的进展。
xAI 表示 Colossus 1/2 数据中心有重大扩展计划,计划部署超过 100 万 GPU,容量将远超 1.2GW。
Railway 宣布其 Agent-Native Cloud 拥有 300 万用户,每周新增 10 万注册用户,编码代理支出超过 20 万美元。创始人称 AI 代理需要新云,并认为手动编码已过时。
成立于2020年的云计算公司Railway,创始人Jake Cooper曾任职于Bloomberg和Uber。公司已融资1.24亿美元,35人团队服务300万用户,周增10万注册。其裸机数据中心3个月回本,硬件增值超过融资额。
视频剪辑初创公司Clouted完成700万美元种子轮融资,由Slow Ventures领投,旨在帮助用户制作热门短视频。
SpaceX在S-1文件中披露,与Anthropic签订云服务协议,每月提供COLOSSUS和COLOSSUS II算力,费用12.5亿美元,期限至2029年5月。协议支持自有Grok 5训练,并出售第三方算力。
SpaceX的IPO文件显示,xAI在2025年亏损64亿美元,并计划大规模扩展Grok模型,首次公开了埃隆·马斯克AI业务的财务状况。
ExaAILabs宣布完成2.5亿美元C轮融资,估值22亿美元,由a16z领投,该资金将用于组织网络数据以支持AI应用。