清除 当前 2575 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 23 小时前 微信公众号 · 42章经 · 4 天 18 小时前 微信公众号 · DeepTech深科技 · 4 天 18 小时前 微信公众号 · Founder Park · 4 天 18 小时前 微信公众号 · FundaAI · 4 天 18 小时前 微信公众号 · 九章智驾 · 4 天 18 小时前 微信公众号 · 晚点LatePost · 4 天 18 小时前 微信公众号 · 琢磨事 · 4 天 18 小时前 微信公众号 · 甲子光年 · 4 天 18 小时前

英伟达财报显示,AI基础设施支出正从GPU集群扩展到网络和光学领域,网络业务增长强劲,并建立了新的光学合作伙伴关系,表明AI支出正在分散化。

  • 英伟达网络业务增长强劲
  • 英伟达建立了新的光学合作伙伴关系
  • AI基础设施支出超出GPU集群范围

Devin(AI编程助手)宣布支持Windows虚拟机,并展示在Windows环境下运行游戏扫雷。

  • Devin现在支持Windows虚拟机
  • 创建者以77秒完成扫雷游戏

特朗普推迟签署一项行政命令,该命令要求AI模型在发布前接受政府安全审查,因其对命令措辞不满。

  • 特朗普推迟签署AI安全审查行政命令
  • 该命令要求AI模型发布前接受政府安全审查
  • 特朗普对命令措辞表示不满

LangChain 发布沙箱身份验证代理,用于控制 AI 代理行为与外部世界之间的边界。

  • LangChain 推出沙箱身份验证代理产品
  • 该产品用于控制代理生成行为与外部世界的边界

一季度美股AI相关业绩贡献70%,五大云厂商资本开支同比增长90%近1500亿美元,拉动美国GDP增长超50%。伊朗局势推升油价通胀预期,若油价突破120美元可能使美国CPI升至近6%。中美经济呈现科技景气、传统需求疲弱的分化格局。

  • 一季度美股AI相关业绩贡献70%,拉动GDP超50%
  • 五大云厂商资本开支同比增90%,近1500亿美元
  • 伊朗局势推升油价通胀预期,若油价破120美元或推升美国CPI至近6%

英伟达宣布将允许客户自行采购DRAM,并开始销售不带DRAM的系统。这一变化可能影响其硬件销售模式和内存供应链格局。

  • 英伟达允许客户自行采购DRAM
  • 英伟达将销售不带DRAM的系统

AWS 发布技术方案,通过 Amazon Bedrock AgentCore Runtime 集成 MCP 服务器,使 Amazon Quick 能够将自然语言查询转换为 AWS CLI 命令,无需切换工具,并保留 IAM 权限和 CloudWatch 审计。

  • AWS 推出 Bedrock AgentCore Runtime 集成 MCP 服务器的方案
  • 该方案将自然语言查询直接转换为 AWS CLI 命令
  • 方案运行在现有 IAM 权限内并提供 CloudWatch 审计

NVIDIA发布了NVIDIA-Verified Agent Skills,为AI代理技能提供认证和透明度,包括技能卡展示功能和风险。该技能基于开放规范构建,可兼容ClaudeAI Code、OpenAI Codex和Cursor AI。

  • NVIDIA发布了认证的Agent技能
  • 每个技能附带技能卡,提供透明度和风险评估
  • 技能基于开放规范,兼容多个AI代码助手

AWS博客发布系列文章第一篇,介绍Amazon Bedrock AgentCore服务,该服务是构建多租户代理应用的托管无服务器平台,支持身份管理、内存、可观测性等功能,并探讨了多租户代理架构的设计考量,包括隔离模式等。

  • Amazon Bedrock AgentCore是AWS的托管无服务器服务
  • 该服务支持构建多租户代理应用,内置身份管理和可观测性

本文介绍了使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM)的方法,以突破上下文窗口限制,处理任意长度的文档,通过子LLM调用分析特定文档段落。

  • Amazon Bedrock AgentCore Code Interpreter可用于实现RLM处理超长文档
  • RLM方法通过子LLM调用分析文档特定段落
  • Strands Agents SDK用于构建RLM工作流

OPLOG使用Amazon Bedrock AgentCore构建AI代理驱动的商业智能系统,整合Hubspot CRM等数据源,实现销售周期缩短35%、CRM数据完整性提升91%、手动研究时间减少98%。系统结合Anthropic Cloude Sonnet和Amazon Bedrock Knowledge Bases。

  • OPLOG使用Amazon Bedrock AgentCore构建BI系统
  • 系统将销售周期缩短35%
  • CRM数据完整性提升91%,手动研究时间减少98%

Claude Code 在 MCP(模型上下文协议)流量中占比达到 78%,且该比例仍在加速增长。该数据来自用户分享,引发行业关注。

  • Claude Code 占 MCP 流量的 78%
  • 该占比正在加速增长

AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。

  • Amazon Bedrock AgentCore与Strands Agents及Amazon Quick集成构建多智能体架构
  • 该方案包含三个专用代理:查找仪表板代理、转换数据代理、构建仪表板代理
  • 旨在将仪表板修改周期从天级缩短至实时

Cursor宣布,未来一个月内,Teams计划用户每邀请一位新用户,双方均可获得双倍使用量。

  • Cursor对Teams计划邀请的新用户提供双倍使用量,为期一个月

微软研究院发布Vega技术,可将完整凭证转换为单一证明,仅分享必要信息,性能适用于实际应用。

  • Vega可将完整凭证转换为单一证明
  • 性能适用于实际应用

Spotify宣布推出由ElevenLabs驱动的有声书创作工具,并计划于今年晚些时候发布新的有声书计划。

  • Spotify推出与ElevenLabs合作的有声书创作工具
  • Spotify计划今年晚些时候发布新有声书计划

Spotify在播客中新增AI驱动的问答和简报生成功能,用户可根据提示生成每日或每周简报。

  • Spotify为播客添加AI问答和简报生成功能
  • 用户可基于提示生成每日或每周简报

Spotify发布新桌面应用,对标谷歌NotebookLM,以研究预览形式在20多个市场上线。

  • Spotify发布新桌面应用
  • 应用以研究预览形式在20多个市场推出

全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。

  • 全球电信公司基于NVIDIA Cloud Partner架构建设主权AI工厂
  • 工厂为政府、企业和初创公司提供国内AI基础设施
  • 文章讨论构建按token计费的企业AI服务
2026-05-21T15:04

Datasette Agent 0.1a3 版本发布,新增查看SQL查询按钮、不显示空推理块、改进截断处理等功能。

  • 新增查看SQL查询按钮
  • 不显示空推理块
  • 改进截断处理

LangChain 宣布其托管式深度代理(Managed Deep Agents)进入私有测试阶段,提供模型无关的基础设施。

  • LangChain Managed Deep Agents 进入私有测试阶段

AI初创公司Hark完成7亿美元A轮融资,投资者估值达60亿美元。该公司由Brett Adcock创立,专注于开发“通用”AI界面。

  • Hark完成7亿美元A轮融资
  • 公司估值达60亿美元
  • 由Brett Adcock创立

The Path公司宣称其AI心理健康模型在Vera-MH安全基准测试中得分95,远高于消费者机器人最高分65。该公司由Tony Robbins和Calm前员工创立,旨在提供更安全的AI疗法。

  • The Path的AI模型在Vera-MH基准测试中得分95
  • 消费者机器人最高得分为65
  • 公司由Tony Robbins和Calm前员工创立

据The Information报道,Anthropic正与微软谈判租用其自研AI芯片Maia的服务器,以应对AI需求增长。微软已向Anthropic提供额外Nvidia服务器资源并建设新集群,同时通过Maia 200芯片降低Copilot工具成本,该工具使用Claude模型已产生至少5亿美元支出。

  • Anthropic正谈判租用微软自研AI芯片Maia的服务器
  • 微软已向Anthropic提供额外Nvidia服务器资源并建设新集群
  • 微软为Copilot使用Claude模型已支付至少5亿美元

SpaceX提交IPO文件,将其重新定义为垂直整合的AI基础设施平台,覆盖计算、网络、能源和轨道系统。

  • SpaceX递交IPO文件
  • 文件将公司定位为AI基础设施平台

AdventHealth正在使用OpenAI的ChatGPT for Healthcare来简化工作流程,减少行政负担,从而将更多时间用于患者护理。

  • AdventHealth使用ChatGPT for Healthcare
  • 目的是简化工作流程并减少行政负担

Stability AI发布Stable Audio 3,提供三个开源变体,包括Medium等版本。

  • Stability AI发布Stable Audio 3
  • 提供三个开源变体

施耐德电气对达拉斯和巴黎数据中心的预测显示,闭环液体冷却工程可将AI带来的年用水量削减一半以上。

  • 施耐德电气预测闭环工程可削减AI数据中心年用水量一半以上
  • 预测基于达拉斯和巴黎的设施

据传闻,由于内存价格上涨导致BOM占比过高,英伟达正进行系统级优化,内部讨论在部分Vera Rubin配置中减少系统DDR内存(可能指LPDDR),HBM容量不变。

  • 内存价格上涨导致BOM占比过高
  • 英伟达内部讨论减少Vera Rubin配置中的系统DDR内存
  • HBM容量维持不变

AI数据中心面临内存墙瓶颈,GPU处理速度远超内存带宽和容量,HBM和CXL等技术用于解决该问题。

  • AI数据中心面临内存墙瓶颈
  • GPU处理速度远超内存带宽和容量

OpenAI 宣布其内部通用推理模型自主推翻了一个 80 年的数学猜想(Erdős 单位距离问题),使用了代数数论方法,并经过专家验证,公司称这是 AI 在数学发现领域的首次。

  • OpenAI 推理模型自主推翻了一个 80 年的数学猜想
  • 该猜想源自 Erdős 1946 年的单位距离问题
  • 证明采用了代数数论,并得到专家验证

OpenAI的通用推理模型(推测为GPT5.6)在32小时内以低于1000美元的成本,解决了1946年提出的Erdős平面单位距离问题,发现了新的构造族。该结果得到数学家Timothy Gowers肯定,被认为是AI解决著名开放数学问题的首个明确例子。

  • OpenAI通用推理模型解决Erdős平面单位距离问题
  • 模型运行时间<32小时,成本<1000美元
  • 结果获数学家Timothy Gowers高度评价

据WSJ报道,Anthropic预计于2026年第二季度实现盈利,大幅早于此前预测的2028年。该公司自身也未预料到如此快速的增长。

  • Anthropic预计今年二季度实现盈利
  • 此前预测2028年才盈利,预期大幅提前
2026-05-21T04:16

SpaceX S-1文件显示,Starlink ARPU从2023年的99美元/月降至2026年第一季度的66美元/月。公司与Anthropic签署云服务协议,潜在月收入可达12.5亿美元。2025年AI资本支出127亿美元,占公司总资本支出61%。IPO初步文件未披露发行规模和价格范围。

  • Starlink ARPU从2023年99美元降至2026年Q1的66美元
  • 与Anthropic协议可产生月收入12.5亿美元至2029年
  • 2025年AI资本支出127亿美元,占总资本支出61%

Socionext CEO承认公司可能参与Arm的AGI CPU项目,此前有分析师预测其将宣布超大规模客户。消息公布后股价上涨18%。

  • Socionext CEO承认公司可能参与Arm的AGI CPU项目
  • 消息公布后股价上涨18%

Google为开源生产Kubernetes分布式推理工具llm-d添加了夜间CI。TPU在llm-d的CI和代码质量上正在追赶NVIDIA。AMD尚未将其GPU或NIC加入该CI。

  • Google为llm-d添加夜间CI。
  • TPU在llm-d CI和代码质量上追赶NVIDIA。
  • AMD尚未将GPU或NIC加入llm-d CI。

韩国5月1-20日DRAM出口数据:出口额115.27亿美元,同比增长498%,环比增长27%;出口单价60319美元/千克,同比上涨432%,较4月20日上涨5%。

  • 韩国5月1-20日DRAM出口额115.27亿美元,同比增498%
  • DRAM出口单价60319美元/千克,同比增432%
  • DRAM出口额环比4月同期增27%

Demis Hassabis发推文称,Gemini 3.5 Flash模型在编码和智能体任务上优于3.1 Pro,速度比其他前沿模型快4倍。

  • Gemini 3.5 Flash在编码和智能体任务上优于3.1 Pro
  • Gemini 3.5 Flash速度是其他前沿模型的4倍

Nvidia CEO黄仁勋预测,用于AI代理的CPU将成为公司下一个重大增长点,市场规模达2000亿美元。

  • 黄仁勋预测AI代理CPU市场达2000亿美元
  • 黄仁勋称发现'全新'市场

Google DeepMind 推出 Science Skills for Google Antigravity,整合了包括 UniProt 和 AlphaFold 数据库在内的超过 30 个主要生命科学数据源,旨在加速科研工作流程。

  • DeepMind 发布 Science Skills for Google Antigravity
  • 集成超过 30 个生命科学数据源
  • 包含 UniProt 和 AlphaFold 数据库

英伟达在电话会议中预计,其独立Vera CPU市场在2027财年将达到200亿美元。Vera作为Grace的继任者,针对AI代理工作负载优化,预计售价更高。

  • 英伟达预计Vera CPU市场在FY2027达到200亿美元

亚马逊SageMaker AI推出OpenAI兼容API支持,实时推理端点新增/openai/v1路径,接受Chat Completions请求并支持流式响应。用户无需自定义客户端或SigV4包装,只需更改端点URL即可使用OpenAI SDK、LangChain等调用模型。同时支持为端点创建限时bearer令牌,简化认证。此举降低了AI工作负载在SageMaker上部署和调用的复杂性。

  • SageMaker AI端点新增/openai/v1路径支持OpenAI兼容API
  • 支持Chat Completions请求和流式响应
  • 用户可创建限时bearer令牌用于OpenAI客户端

Emkara宣布推出全自主AI代理,用于处理IT、合规和采购等内部任务。该代理可独立完成指定工作,代表内部任务自动化领域的进展。

  • Emkara发布用于内部任务的自主AI代理
  • 代理可处理IT、合规和采购等职能

xAI 表示 Colossus 1/2 数据中心有重大扩展计划,计划部署超过 100 万 GPU,容量将远超 1.2GW。

  • xAI 计划扩展 Colossus 数据中心
  • 计划部署超过 100 万 GPU
  • 容量将超过 1.2GW

Railway 宣布其 Agent-Native Cloud 拥有 300 万用户,每周新增 10 万注册用户,编码代理支出超过 20 万美元。创始人称 AI 代理需要新云,并认为手动编码已过时。

  • Railway 拥有 300 万用户
  • 每周新增 10 万注册用户
  • 编码代理支出超过 20 万美元

成立于2020年的云计算公司Railway,创始人Jake Cooper曾任职于Bloomberg和Uber。公司已融资1.24亿美元,35人团队服务300万用户,周增10万注册。其裸机数据中心3个月回本,硬件增值超过融资额。

  • Railway成立于2020年,创始人Jake Cooper
  • 公司融资1.24亿美元,35人团队服务300万用户
  • 裸机数据中心3个月回本,硬件增值超过融资额

视频剪辑初创公司Clouted完成700万美元种子轮融资,由Slow Ventures领投,旨在帮助用户制作热门短视频。

  • Clouted完成700万美元种子轮融资
  • 领投方为Slow Ventures
2026-05-20T22:26

SpaceX在S-1文件中披露,与Anthropic签订云服务协议,每月提供COLOSSUS和COLOSSUS II算力,费用12.5亿美元,期限至2029年5月。协议支持自有Grok 5训练,并出售第三方算力。

  • SpaceX与Anthropic签订云服务协议,月费12.5亿美元
  • 协议期限至2029年5月,提供COLOSSUS及COLOSSUS II算力
  • 双方可90天通知终止协议

SpaceX的IPO文件显示,xAI在2025年亏损64亿美元,并计划大规模扩展Grok模型,首次公开了埃隆·马斯克AI业务的财务状况。

  • xAI 2025年亏损64亿美元
  • xAI计划大规模扩展Grok模型

ExaAILabs宣布完成2.5亿美元C轮融资,估值22亿美元,由a16z领投,该资金将用于组织网络数据以支持AI应用。

  • ExaAILabs完成2.5亿美元C轮融资
  • 融资后估值22亿美元
  • 由a16z领投