清除 当前 197 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 21 小时前 微信公众号 · 42章经 · 4 天 16 小时前 微信公众号 · DeepTech深科技 · 4 天 16 小时前 微信公众号 · Founder Park · 4 天 16 小时前 微信公众号 · FundaAI · 4 天 16 小时前 微信公众号 · 九章智驾 · 4 天 16 小时前 微信公众号 · 晚点LatePost · 4 天 16 小时前 微信公众号 · 琢磨事 · 4 天 16 小时前 微信公众号 · 甲子光年 · 4 天 16 小时前

AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。

  • Amazon Bedrock AgentCore与Strands Agents及Amazon Quick集成构建多智能体架构
  • 该方案包含三个专用代理:查找仪表板代理、转换数据代理、构建仪表板代理
  • 旨在将仪表板修改周期从天级缩短至实时

全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。

  • 全球电信公司基于NVIDIA Cloud Partner架构建设主权AI工厂
  • 工厂为政府、企业和初创公司提供国内AI基础设施
  • 文章讨论构建按token计费的企业AI服务

LangChain 宣布其托管式深度代理(Managed Deep Agents)进入私有测试阶段,提供模型无关的基础设施。

  • LangChain Managed Deep Agents 进入私有测试阶段

Google为开源生产Kubernetes分布式推理工具llm-d添加了夜间CI。TPU在llm-d的CI和代码质量上正在追赶NVIDIA。AMD尚未将其GPU或NIC加入该CI。

  • Google为llm-d添加夜间CI。
  • TPU在llm-d CI和代码质量上追赶NVIDIA。
  • AMD尚未将GPU或NIC加入llm-d CI。

亚马逊SageMaker AI推出OpenAI兼容API支持,实时推理端点新增/openai/v1路径,接受Chat Completions请求并支持流式响应。用户无需自定义客户端或SigV4包装,只需更改端点URL即可使用OpenAI SDK、LangChain等调用模型。同时支持为端点创建限时bearer令牌,简化认证。此举降低了AI工作负载在SageMaker上部署和调用的复杂性。

  • SageMaker AI端点新增/openai/v1路径支持OpenAI兼容API
  • 支持Chat Completions请求和流式响应
  • 用户可创建限时bearer令牌用于OpenAI客户端

Railway 宣布其 Agent-Native Cloud 拥有 300 万用户,每周新增 10 万注册用户,编码代理支出超过 20 万美元。创始人称 AI 代理需要新云,并认为手动编码已过时。

  • Railway 拥有 300 万用户
  • 每周新增 10 万注册用户
  • 编码代理支出超过 20 万美元

成立于2020年的云计算公司Railway,创始人Jake Cooper曾任职于Bloomberg和Uber。公司已融资1.24亿美元,35人团队服务300万用户,周增10万注册。其裸机数据中心3个月回本,硬件增值超过融资额。

  • Railway成立于2020年,创始人Jake Cooper
  • 公司融资1.24亿美元,35人团队服务300万用户
  • 裸机数据中心3个月回本,硬件增值超过融资额
2026-05-20T22:26

SpaceX在S-1文件中披露,与Anthropic签订云服务协议,每月提供COLOSSUS和COLOSSUS II算力,费用12.5亿美元,期限至2029年5月。协议支持自有Grok 5训练,并出售第三方算力。

  • SpaceX与Anthropic签订云服务协议,月费12.5亿美元
  • 协议期限至2029年5月,提供COLOSSUS及COLOSSUS II算力
  • 双方可90天通知终止协议

亚马逊云科技宣布自2025年11月起,Amazon SageMaker AI支持双向流式推理,结合vLLM的Realtime API实现WebSocket双向流,用于构建实时语音转文本服务。文章展示了部署Mistral AI的Voxtral-Mini-4B-Realtime-2602模型至SageMaker端点,支持语音代理、实时字幕等应用。

  • Amazon SageMaker AI自2025年11月起支持双向流式推理
  • vLLM Realtime API通过WebSocket实现双向流
  • 部署Voxtral-Mini-4B-Realtime-2602模型实现实时语音转文本

Google Cloud宣布与多家领先组织合作,在其环境中验证Gemini 3.5系列模型。

  • Google Cloud与多家组织合作验证Gemini 3.5系列
  • 验证在合作方的自有环境中进行

微软推出的开源项目 mimalloc 用于现代应用和服务的大规模内存管理,旨在应对十年前不存在的规模需求。

  • 微软开源项目 mimalloc 用于内存管理
  • mimalloc 应对现代应用和服务的大规模内存需求

Google在I/O 2026发布Gemini 3.5 Flash,月处理token量达3.2万亿同比增长7倍,Gemini应用月活超9亿覆盖230+国家。同时展示Gemini Live语音、Omni视频等模态及Antigravity代理栈。

  • Gemini 3.5 Flash正式发布,定位快速代理/编码模型
  • Google月处理token量3.2万亿,同比增长7倍
  • Gemini应用月活9亿+,覆盖230国70+语言

在Google I/O大会上,NVIDIA和Google Cloud宣布联合开发者社区在一年内突破10万名开发者。社区成员已构建RAG应用、多智能体管道等。今年新增JAX学习路径、NVIDIA Dynamo优化codelab和月度开发者直播。此外,NVIDIA与Google DeepMind合作,使用SynthID为NVIDIA Cosmos模型输出添加水印。

  • NVIDIA与Google Cloud开发者社区一年内超10万名开发者
  • 新增JAX学习路径、NVIDIA Dynamo on GKE codelab
  • NVIDIA与Google DeepMind合作使用SynthID水印

谷歌Q1云业务同比增长63%,积压订单达4620亿美元,环比增90%;今年TPU出货指引400-480万颗,明年1500万颗,后年3000万颗,产业链预计明年增长3倍;Anthropic年化收入4月初300亿美元,预期5月底达500亿美元;谷歌I/O大会将发布新Gemini模型、安卓17等,利好TPU、OCS、液冷产业链。

  • 谷歌Q1云业务同比增63%,积压订单环比增90%
  • 今年TPU出货指引400-480万颗,明年1500万颗
  • Anthropic年化收入4月初300亿美元,预期5月底500亿美元

OpenAI CEO Sam Altman在推特表示,客户对算力确定性需求增加,随着模型进步,全球算力将长期供不应求。公司推出1-3年承诺的折扣令牌,以帮助规划并实现双赢。

  • OpenAI提供1-3年承诺的折扣令牌。
  • 客户对算力确定性需求增加。
  • 算力可能长期供不应求。

OpenAI推出新服务Guaranteed Capacity,允许客户长期保证对OpenAI计算资源的访问。该服务基于OpenAI在基础设施、合作伙伴关系和容量规划方面的长期投资,帮助客户在计算资源受限的环境下提前规划关键工作负载。

  • OpenAI推出Guaranteed Capacity新服务
  • 该服务让客户长期保证OpenAI计算资源访问

微软宣布Azure Files SMB的Entra-Only身份验证正式可用,无需本地Active Directory或混合同步,简化架构降低成本,支持Azure虚拟桌面FSLogix配置文件和B2B外部身份。

  • Azure Files SMB的Entra-Only身份验证正式可用
  • 无需Active Directory或混合同步,简化架构
  • 支持Azure虚拟桌面FSLogix配置文件和B2B外部身份

谷歌顶级客户每日处理超过10亿个tokens,若转向使用Gemini 3.5 Flash模型,每年可节省高达10亿美元的成本。

  • 谷歌顶级客户每日处理超10亿tokens

MongoDB 宣布 LangGraph.js Long-Term Memory Store 正式可用,该集成提供跨会话长期记忆功能。

  • LangGraph.js Long-Term Memory Store 正式可用
  • 该集成提供跨会话长期记忆

Google与Blackstone达成50亿美元合作,推动其TPU定制AI加速器突破传统云模式,为企业提供独立于NVIDIA的AI基础设施替代方案。

  • Google与Blackstone达成50亿美元TPU合作
  • 该合作旨在推动Google TPU作为NVIDIA基础设施的企业替代方案

Zibra Labs正在构建高性能计算(HPC)集群,允许量化交易公司大规模运行比以往多100倍的回测。该集群利用跨多个超大规模云和neocloud的spot实例处理并行工作负载。

  • Zibra Labs构建HPC集群使量化交易公司回测效率提升100倍
  • 集群使用跨超大规模云和neocloud的spot实例运行并行工作负载

AWS 博客介绍通过自定义 MCP 服务器扩展 Kiro CLI 的对话记忆,集成 Amazon Bedrock AgentCore Memory 托管服务,实现持久上下文存储与语义检索,支持短期工作记忆和长期智能记忆。

  • Amazon Bedrock AgentCore Memory 是托管服务,提供持久记忆和语义搜索
  • Kiro CLI 可自定义 MCP 服务器集成该记忆功能

亚马逊宣布SageMaker Feature Store新增支持Apache Iceberg表格式、流式摄取、批量摄取以及通过Lake Formation进行细粒度访问控制,解决元数据膨胀和访问控制难题。

  • 支持Apache Iceberg表格式和流式摄取
  • 支持Lake Formation细粒度访问控制
  • 新功能在SageMaker Python SDK v3.8.0中可用

AWS 介绍了在 Amazon Bedrock 上实现程序化工具调用(PTC)的三种方式:自托管 Docker 沙箱、托管解决方案和基于 Anthropic SDK 的代理。PTC 通过模型生成代码并在沙箱中执行,减少多工具工作流中的延迟和 token 消耗。

  • AWS 发布 Amazon Bedrock 上程序化工具调用的三种实现方式
  • 程序化工具调用通过模型生成代码在沙箱执行,仅返回最终结果
  • 三种方式包括自托管 Docker 沙箱、托管解决方案和代理 SDK

Modal 宣布现支持 Claude AI 的托管代理,通过 Modal Sandboxes 提供运行环境。

  • Modal 支持 Claude AI 的托管代理
  • 使用 Modal Sandboxes 作为运行环境

Vercel 创始人宣布,其平台上所有防火墙缓解措施(包括 DDoS、系统级缓解及自定义规则)现已完全免费,Vercel 将承担所有攻击或流量缓解的计算和网络成本。

  • Vercel 所有防火墙缓解措施(含 DDoS、系统级及自定义规则)现已免费
  • Vercel 承担攻击缓解的计算和网络成本

戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。

  • 戴尔CEO称提供模型选择避免基础设施混乱
  • 演讲提及Kimi K2.6和DeepSeek V模型

本文介绍如何使用Amazon Nova 2 Lite进行内容审核,基于MLCommons AILuminate标准,支持自定义审核政策。文章展示了该模型在三个公共数据集上与其他基础模型的基准测试结果,强调通过提示调整审核策略无需训练数据。

  • Amazon Nova 2 Lite可用于内容审核。
  • 使用MLCommons AILuminate v1.1作为审核政策。
  • 对Amazon Nova 2 Lite与多个基础模型进行了基准测试。

Y Combinator发布InsForge产品,该工具可将编程代理转化为后端工程师,管理后端服务器、数据库、LLM网关、前端部署等基础设施,专为编码代理工作流设计。

  • InsForge产品发布,定位为编码代理的后端工程工具
  • 支持后端服务器、数据库、LLM网关、前端部署等功能

法律行业软件公司Aderant利用Amazon Quick的AI能力,统一了六个知识系统的搜索,并自动化文档流程,实现了搜索时间加快90%、文档处理加速75%,提升了云运营团队的效率。

  • Aderant使用Amazon Quick统一了六个知识系统的搜索
  • 搜索时间加快90%,文档处理加速75%
  • Aderant的Expert Sierra云解决方案获得更高效支持

OpenShell 发布 v0.0.43 版本,新增双向 TTY 流、OIDC 认证、HTTPS 与 mTLS 解耦、TOML 网关配置,沙箱从 ext4 磁盘启动,并移除 DNS 以防止数据泄露,改进了认证、流和沙箱隔离。

  • OpenShell v0.0.43 发布
  • 新增双向 TTY 流和 OIDC 认证
  • 移除 DNS 功能防止数据泄露

微软研究团队公布最新研究进展,涵盖云效率优化、智能体成本削减、3D远程医疗随机试验,并开放非洲包容性AI语言项目申请。

  • 微软发布云效率与智能体成本削减研究
  • 开展3D远程医疗随机试验
  • 开放非洲包容性AI语言项目申请

亚马逊AWS宣布Atlassian Confluence Cloud与Quick平台集成,用户可通过自然语言查询和管理Confluence文档,减少上下文切换。集成支持知识库创建、语义搜索及操作执行,并连接Amazon S3、JIRA等系统。文章详细介绍了设置步骤。

  • Quick平台集成Atlassian Confluence Cloud
  • 支持通过自然语言查询和管理Confluence页面
  • 集成包括知识库和Actions两类功能

Amazon Bedrock AgentCore推出自定义代码评估器功能,允许用户通过AWS Lambda函数进行确定性质量检查,满足金融等专业领域的特定需求,如实时股价验证、JSON模式校验和PII过滤。该功能可应用于开发CI/CD管道和在线评估场景。

  • Amazon Bedrock AgentCore推出自定义代码评估器
  • 评估器基于AWS Lambda实现确定性逻辑
  • 支持金融领域实时股价验证和JSON模式检查

OpenAI与Dell达成合作,将AI编码工具Codex引入混合云和本地环境,帮助企业安全部署AI编码代理,实现数据和工作流程的集成。

  • OpenAI与Dell建立合作伙伴关系
  • Codex将支持混合云和本地部署
  • 目标是为企业提供安全的AI编码代理

Vercel宣布其平台现在支持通过Okta等SSO保护代理部署,包括生产环境,确保应用安全。同时推出vercel curl命令,允许用户和代理轻松访问Vercel生态系统内的任何URL。

  • Vercel支持SSO保护代理部署,包括生产环境
  • Vercel推出vercel curl命令简化生态内URL访问

Basedash宣布其平台现已支持MCP连接器,可读取数据库和SaaS工具并执行操作。

  • Basedash已推出MCP连接器功能。

AWS发布Amazon Quick知识库的文档级访问控制功能,允许对S3中的敏感文档进行细粒度权限管理。当用户提问时,系统会验证身份并仅显示授权内容,从而满足合规和数据治理要求。本文提供了配置和验证ACL的详细步骤。

  • Amazon Quick新增对S3知识库的文档级ACL支持
  • 基于用户身份限制敏感文档访问
  • 提供全局ACL文件和文档级元数据两种配置方法

AWS推出搭载Graviton芯片的新Redshift实例,融合数据仓库与数据湖分析能力,推动定制芯片在AI数据基础设施中的应用。

  • AWS发布新Redshift实例,整合数据仓库与数据湖分析
  • AWS将Graviton芯片用于更上层的AI数据基础设施

OpenGov正在为旧金山许可证办理流程带来透明度和简化,该流程曾被描述为全球最糟糕的官僚机构之一。推文还提到Connie Chan及其公共部门工会的反对态度。

  • OpenGov正在简化旧金山许可证办理流程
  • 旧金山许可证流程曾被视为全球最糟糕的官僚机构之一

Sea Limited首席产品官阐述公司在亚洲工程团队中部署OpenAI的Codex,以加速AI原生软件开发。

  • Sea Limited在工程团队部署Codex
  • Codex用于加速AI原生软件开发

Josh Woodward在Twitter上更新称,某产品存在一个bug,将在下一个版本中修复,计划在Google I/O大会之后发布。该帖获得236次点赞、2次转发和9条回复。

  • 某产品存在一个bug
  • 修复计划在Google I/O大会之后的下一版本中

亚马逊Lex推出Assisted NLU功能,利用大语言模型提升机器人准确率,无需手动配置,包括主要模式、回退模式和意图消歧,包含在标准定价中。

  • 亚马逊Lex发布Assisted NLU特性,提升机器人准确率。
  • 该功能利用大语言模型处理自然语言变体,无需手动配置。
  • Assisted NLU包含主要模式、回退模式和意图消歧,无额外费用。

本文介绍如何将Stream的Vision Agents开源框架与Amazon Bedrock和Amazon Nova 2 Sonic结合,构建实时语音代理。该方案支持低延迟音频流、函数调用、自动重连和多语言,解决生产级语音应用的工程挑战。

  • Stream推出Vision Agents框架集成Amazon Nova 2 Sonic
  • 实现实时语音交互、函数调用和自动重连
  • 通过Amazon Bedrock提供语音代理能力

AWS宣布Amazon Quick Sight支持跨账户Athena访问,允许用户在中心化Quick部署中查询多个业务单元账户的Athena数据,无需管理多个订阅或承担所有查询成本,提升了数据统一分析与洞察能力。

  • AWS发布Amazon Quick Sight跨账户Athena访问功能
  • 用户可在中心化Quick部署中查询多账户的Athena数据

Amazon Bedrock AgentCore Browser 新增支持 Chrome 企业策略和自定义根 CA 证书,允许组织对 AI 浏览器代理进行细粒度控制,包括 URL 过滤、下载限制和密码管理器配置,并可连接内部服务。

  • Amazon Bedrock AgentCore Browser 支持 Chrome 企业策略。
  • 支持自定义根 CA 证书以连接内部服务和 SSL 代理。
  • 可配置超过 450 种浏览器设置。

LangSmith Sandboxes 正式发布,提供安全可扩展的代理代码执行环境,并集成 Deep A...(原文截断)。

  • LangSmith Sandboxes 正式可用
  • 提供安全可扩展的代理代码执行环境
  • 集成 Deep A...(原文未完整)

阿里巴巴发布2026财年Q4财报,集团营收2434亿元同比增11%;云业务收入增40%,AI相关收入三位数增长占云外收入30%,年规模超358亿元;中国电商CMR增8%,即时零售收入增57%,订单量达去年2.7倍;董事会批准每股ADS派息1.05美元。

  • 阿里巴巴2026财年Q4营收2434亿元,同比增11%
  • 云业务AI相关收入三位数增长,占云外收入30%
  • 即时零售收入增57%,订单量为去年2.7倍

Snap工程平台负责人Prudhvi Vatala介绍团队将日均10+PB数据处理迁移至Google Cloud GPU加速管线,实现成本降低76%、内存占用减少80%,且无需代码更改。

  • Snap迁移10+PB日数据处理至GPU加速管线
  • 成本降低76%,内存减少80%
  • 无需更改代码

Pulse AI 在 AWS ML Blog 发布新文章,介绍如何使用 AWS Inferentia 和 Jamba 1.5 mini 进行部署。

  • Pulse AI 在 AWS ML Blog 发布新文章
  • 文章介绍使用 AWS Inferentia 和 Jamba 1.5 mini