清除 当前 195 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 12 小时前 微信公众号 · DeepTech深科技 · 4 天 12 小时前 微信公众号 · Founder Park · 4 天 12 小时前 微信公众号 · FundaAI · 4 天 12 小时前 微信公众号 · 九章智驾 · 4 天 12 小时前 微信公众号 · 晚点LatePost · 4 天 12 小时前 微信公众号 · 琢磨事 · 4 天 12 小时前 微信公众号 · 甲子光年 · 4 天 12 小时前

LangSmith LLM Gateway 新增功能,可在请求到达模型前强制执行支出限制和脱敏个人身份信息,提升AI应用的安全性和成本控制能力。

  • LangSmith LLM Gateway 支持在请求到达模型前强制执行支出限制和PII脱敏。

Azercell与AWS合作,在Amazon SageMaker AI上训练阿塞拜疆语大语言模型。通过内核级优化,训练吞吐量提升23%,峰值GPU内存降低58%;自定义分词器使每词token数提升2倍,有效增加上下文窗口中的阿塞拜疆文本量。

  • Azercell与AWS合作训练阿塞拜疆语大语言模型
  • 训练吞吐量提升23%,峰值GPU内存降低58%
  • 自定义分词器使每词token数提升2倍

AWS、Cloudflare等云服务商正在重新设计云基础设施,以适应AI代理从实验转向生产带来的机器生成互联网流量增长,而非人类用户流量。

  • AI代理从实验转向生产,推动云基础设施重新设计
  • AWS、Cloudflare等云服务商针对机器生成流量优化基础设施

Vercel CEO宣布其CLI已重构为自更新二进制,零外部依赖,旨在更好地支持代理进入云基础设施。通过与OpenClaw、Claude Code、Codex等工具集成,新客户持续涌入。

  • Vercel CLI已成为自更新二进制,零外部依赖
  • 该CLI是代理进入云基础设施的关键接口
  • 与OpenClaw等工具集成后新客户持续增加

AWS发布一篇技术博客,介绍如何构建基于Flask的MLflow代理服务,通过REST API代理实现HTTPS方式安全访问Amazon SageMaker MLflow,支持IAM认证和URL预签名,帮助企业在云转型中集成现有系统。

  • AWS提供Flask-based MLflow代理服务方案
  • 方案支持HTTPS访问和IAM认证
  • 实现URL预签名和请求转换

Amazon Bedrock AgentCore 推出数据集管理功能,支持版本化测试用例,允许用户从生产失败案例中捕获测试用例,并以金融市场情报代理为例演示工作流。

  • Amazon Bedrock AgentCore 新增数据集管理功能,支持版本化测试用例
  • 用户可从生产失败案例中捕获测试用例
  • 文章以金融市场情报代理为例演示工作流

Snowflake与AWS签署60亿美元合作协议,推动企业AI工作负载从试点转向持久运营基础设施,重塑超大规模计算需求。

  • Snowflake与AWS达成60亿美元合作
  • 企业AI工作负载从试点转向持久运营基础设施
  • 该合作可能重塑超大规模计算需求

Digital Realty在伦敦开设首个EMEA创新实验室(DRIL),为企业提供在真实条件下试验AI和混合云基础设施的空间。

  • Digital Realty在伦敦开设首个EMEA创新实验室
  • 该实验室支持AI和混合云基础设施的真实环境试验

CoreWeave 推出新平台,结合推理、强化学习和可观测性,利用实时生产数据持续优化 AI 代理。

  • CoreWeave 发布结合推理、强化学习和可观测性的新平台
  • 该平台利用实时生产数据持续优化 AI 代理

阿里巴巴近期在杭州和新加坡召开千问大会,发布千问3.7max模型,重点布局全栈AI能力及智能体生态。阿里云MaaS业务预计2026年底年度经常性收入(ARR)超300亿元,并计划提升云业务EBITA利润率。

  • 阿里发布千问3.7max模型
  • 阿里云MaaS业务预计年底ARR超300亿元
  • 阿里计划提升云业务EBITA利润率

AWS发布Amazon Bedrock Data Automation服务,用于自动化处理金融文档(如银行对账单、税务表格、合同),通过基础模型实现上下文理解、数据提取和验证,提供自定义提取和视觉定位功能。

  • Amazon Bedrock Data Automation可自动化提取和分析金融文档数据
  • 该服务使用基础模型理解文档上下文并提取结构化数据
  • 支持银行对账单、W-2、1099-B税务表格和供应商合同等文档

MiMo API进行价格下调,最高降幅达99%针对Input (Cache Hit),核心原因是推理效率提升。

  • MiMo API价格下调,最高降幅99%针对Input (Cache Hit)
  • 价格下调核心原因是推理效率提升

今日,一台Chromebook成功运行了NVIDIA Isaac Sim,一台iPad以4K分辨率渲染了Blender,一部手机同时运行了10个并行代理。此外,ProjectX_Cloud推出了InfinityOS,这是一个基于Web的操作系统,允许在任何设备上运行Windows/Linux桌面应用,并为每个应用分配独立GPU,实现统一工作区和文件系统。

  • Chromebook成功运行NVIDIA Isaac Sim
  • iPad以4K分辨率渲染Blender
  • 手机同时运行10个并行代理

Snowflake与亚马逊AWS签署了一项为期五年、总价值60亿美元的合作协议,旨在为AI应用获取CPU芯片供应。该协议将强化AWS在云计算市场的竞争力,并对英伟达等AI芯片供应商形成竞争压力。

  • Snowflake与AWS签署五年期协议,价值60亿美元。
  • 协议目标是为AI应用确保CPU芯片供应。

AWS Generative AI Innovation Center 与 Works Human Intelligence 合作,使用 Amazon Bedrock AgentCore 构建两个 AI 代理,分别处理通勤津贴审批和浏览器操作自动化,成功将成本降低 97% 并提升运营效率。

  • AWS GenAIIC 与 WHI 合作构建两个 AI 代理
  • 使用 Amazon Bedrock AgentCore 开发
  • 成本降低 97%,运营效率提升

AWS SMGS 使用基于 Amazon Bedrock AgentCore 和 Amazon Quick 的对话式AI助手 NarrateAI,为管理层提供实时业务智能,解决传统BI数据延迟问题,支持自然语言查询业务绩效。

  • AWS SMGS 推出AI助手 NarrateAI,用于业务管理
  • NarrateAI 基于 Amazon Bedrock AgentCore 构建
  • NarrateAI 通过 Amazon Quick 界面提供自然语言问答

AWS销售组织部署了20多个领域特定的AI代理,但面临编排挑战。他们基于Amazon Bedrock AgentCore构建了Field Advisor系统,提供隔离执行环境、统一网关、持久记忆、身份传播和内置可观测性,以解决代理泛滥问题,提高销售效率。

  • AWS销售组织有20多个领域特定代理
  • AWS构建了Field Advisor on Bedrock AgentCore
  • Field Advisor提供隔离执行和统一网关

SemiAnalysis指出,Anthropic的增长以及Amazon Bedrock的产品组合推动了AWS利润率上升,使AWS在云计算竞争对手中领先。

  • Anthropic增长和Bedrock Mix推动AWS利润率上升
  • AWS利润率领先于竞争对手

LangChain宣布Fleet agents新增安全编写和运行代码功能,结合LangSmith Fleet的计算机使用能力,提供隔离执行环境。

  • LangChain发布Fleet agents安全写代码功能
  • 新功能提供隔离执行环境

亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。

  • 亚马逊研究奖公布68名获奖者,来自11国49所大学
  • 获奖提案涵盖AI安全、Agentic AI、自动推理等六类
  • 获奖者可获得AWS推广积分和亚马逊研究支持

据SemiAnalysis报告,Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升,显示出更强的运营杠杆。与同行相比,AWS在Bedrock和Anthropic交易中表现出优势。

  • Anthropic增长推动AWS利润率提高
  • Bedrock Mix提升AWS运营杠杆

塔塔咨询服务(TCS)推出新的主权云平台,聚焦欧洲数据中心,旨在解决数据主权问题,并帮助运营商实现网络、AI系统和关键基础设施的现代化。

  • TCS推出主权云平台
  • 平台针对欧洲数据中心的数据主权问题
  • 目标帮助运营商现代化网络、AI和关键基础设施

开源截图工具Screendrop发布,支持用户使用R2和Hono Worker自建云存储,项目托管于GitHub。

  • Screendrop是一款开源的截图工具
  • 用户可通过R2和Hono Worker自建云存储

AWS发布技术博文,介绍Amazon Bedrock AgentCore平台,该平台帮助开发者构建和运营生成式AI代理,并集成支付功能以解决代理访问付费服务时的账单管理问题。文章还提到AI代理流量快速增长,推动内容提供商和API向按使用付费模式转变。

  • AgentCore是一个模块化托管平台,用于构建和部署生成式AI代理
  • AgentCore集成了支付功能,支持代理动态交易
  • AI代理流量快速增长,推动付费模式变革

AWS发布博客介绍如何使用LangGraph与Amazon Bedrock AgentCore结合AWS Lambda和Step Functions构建高可扩展的无服务器多智能体系统,解决推理延迟、状态管理和可观测性等挑战。

  • AWS提出结合LangGraph和Bedrock AgentCore构建多智能体系统
  • 方案使用Lambda和Step Functions实现无服务器自动扩展
  • LangGraph提供图执行模型以协调多智能体工作流

AWS博客介绍使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建高性能生成式AI代理系统,解决推理延迟、无状态执行等问题,支持多代理并行推理、上下文持久化和可追踪执行。

  • 使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建多代理系统
  • 架构可减少手动工作,实时响应,扩展到数千交互
  • 支持并行推理、上下文持久化和可追踪执行路径

AgentWatch是AWS推出的主动监控代理,能够自动检测CloudWatch告警滞后、Lambda错误堆积、EC2性能下降等问题,帮助DevOps团队从被动响应转向主动预防,减少运维负担和客户影响。

  • AgentWatch是AWS发布的主动监控代理
  • 它解决CloudWatch告警滞后、Lambda错误堆积等问题
  • 旨在帮助团队从被动响应转向主动预防

AWS博客介绍使用Strands Agents开源框架和AWS服务(如Amazon Bedrock、Kiro IDE)构建AI研究助手,仅需30行代码即可实现,展示了快速开发AI应用的方法。

  • Strands Agents是开源框架,简化AI代理创建
  • 结合AWS服务可在30行代码内构建AI研究助手
  • Kiro IDE提供超过50个 curated powers 加速开发

AWS 发布了一篇博客,介绍如何为 Amazon Quick 构建企业可观测性解决方案。该方案将 Amazon CloudWatch vended logs 和 AWS CloudTrail 事件整合到 Amazon S3 数据湖中,可通过 Amazon Athena、QuickSight 仪表盘和自定义 Chat Agent 进行查询,以跟踪用户采用情况、满意度、成本和治理。

  • Amazon Quick 是一个生成式 AI 平台,整合了 Spaces、Chat agents、Flows 等功能
  • 解决方案将 Amazon CloudWatch 和 CloudTrail 数据汇聚到 S3 数据湖
  • 用户可使用 Athena、QuickSight 和 Chat Agent 查询分析数据

亚马逊Quick服务可从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据,生成Word、Excel等格式文档,并利用Spaces知识库融入组织上下文。

  • Quick从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据
  • 支持生成Word、Excel等格式的专业文档
  • 利用Spaces知识库生成符合组织上下文的文档

一位CEO透露公司用3周自建CRM替代了60万美元的Salesforce合同,计划削减80%内部SaaS,并表示即使Anthropic提价一倍也不会改变使用量。

  • 用3周自建CRM替代60万美元的Salesforce合同
  • 计划砍掉80%的内部SaaS工具
  • 即便Anthropic提价一倍也不改变用量

与6家Snowflake销售合作伙伴交流发现,Cortex Code产品推动1Q26消费增长加速,北美合作伙伴A消费增速从3Q25的20-25%YoY增至1Q26的25-30%YoY,并预期2Q26达30-35%YoY。AI/GenAI产品从试点转向生产为主要驱动力。合作伙伴B在1Q26实现增长。

  • Cortex Code驱动Snowflake 1Q26消费增长加速
  • 北美合作伙伴A 1Q26消费增速25-30%YoY
  • AI/GenAI产品从试点转向生产是增长主因

微软宣布Azure Kubernetes Fleet Manager跨集群网络功能进入公开预览,该功能基于Advanced Container Networking Services,提供透明的东西向多集群网络连接,旨在简化多集群管理,支持故障转移和跨区域工作负载迁移。

  • Azure Kubernetes Fleet Manager跨集群网络功能公开预览。
  • 该功能由Advanced Container Networking Services提供支持。
  • 用于简化多集群网络管理,支持故障转移和跨区域迁移。

微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。

  • 微软Foundry与Hugging Face合作推出平台
  • 平台包含三个开源图像模型
  • 该平台为开发者提供最大AI创新目录

a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。

  • Google每月处理超过3.2 quadrillion tokens
  • 同比去年增长7倍

Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。

  • Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face
  • 可通过SQL查询超过21.9亿网页,无需下载

Microsoft Azure 宣布 Azure NetApp Files 在 EDA 工作负载中取得性能突破,通过新独立基准测试证实其可提供可预测的高性能共享存储,支持大规模并发,并已获得领先半导体公司采用,推动芯片设计上云。

  • Azure NetApp Files 实现低延迟、高吞吐的 EDA 存储性能突破
  • 新独立基准测试验证了其大规模并发下的可预测性能
  • 领先半导体公司正在采用 Azure NetApp Files 进行芯片设计

Lightsprint发布协作平台,帮助团队进行视觉规划、并行管理云代理、实时预览变化并可靠地发布产品。

  • Lightsprint发布协作平台
  • 平台支持视觉规划、并行管理云代理
  • 平台可实时预览变化并可靠发布产品

Amazon Nova Act 成为 HIPAA 合格服务,可在涉及电子受保护健康信息(ePHI)的场景中部署浏览器 AI 代理,自动化医疗保健工作流如理赔处理和转诊协调。

  • Amazon Nova Act 获得 HIPAA 资格认证
  • 可用于自动化涉及 ePHI 的浏览器工作流
  • 面向医疗保健和生命科学组织

Daytona发布Agent-Native Compute产品,宣称60ms沙箱启动,75秒内注册5万初创公司,日运行850万次,支持RL/评估,CLI优于MCP。

  • 沙箱启动仅60ms
  • 75秒内注册5万初创公司
  • 日运行量达850万次

Limrun 推出基础设施,支持在移动开发中使用云端代理,提供远程 XCode、iOS 和 Android 模拟器,已集成 Replit、Rork、Momentic AI 等平台。

  • Limrun 提供远程 XCode、iOS 和 Android 模拟器基础设施
  • 产品已集成 Replit、Rork、Momentic AI 等平台

Daytona发布Agent-Native Compute服务,沙箱启动仅60ms,75秒内可启动5万个初创环境,日运行85万次。CEO解释AI代理需要可组合计算机,RL工作负载占比从0%增至约50%。

  • 沙箱启动时间60ms,75秒启动5万初创环境
  • 日运行次数85万次
  • RL工作负载使用占比从0%增至约50%

Hugging Face模型现在可通过strands在AWS SageMaker AI上进行部署、工具使用和MCP集成。该转发由@alvarobartt发布,获得9次点赞、6次转推。

  • Hugging Face模型可通过strands部署到AWS SageMaker AI。
  • 集成支持工具使用和MCP协议。
2026-05-21T18:21

Datasette Agent插件datasette-agent-sprites发布0.1a0版本,支持在Fly Sprites沙箱中运行命令。

  • datasette-agent-sprites 0.1a0版本发布
  • 该插件用于在Fly Sprites沙箱中运行命令

AWS 发布技术方案,通过 Amazon Bedrock AgentCore Runtime 集成 MCP 服务器,使 Amazon Quick 能够将自然语言查询转换为 AWS CLI 命令,无需切换工具,并保留 IAM 权限和 CloudWatch 审计。

  • AWS 推出 Bedrock AgentCore Runtime 集成 MCP 服务器的方案
  • 该方案将自然语言查询直接转换为 AWS CLI 命令
  • 方案运行在现有 IAM 权限内并提供 CloudWatch 审计

AWS博客发布系列文章第一篇,介绍Amazon Bedrock AgentCore服务,该服务是构建多租户代理应用的托管无服务器平台,支持身份管理、内存、可观测性等功能,并探讨了多租户代理架构的设计考量,包括隔离模式等。

  • Amazon Bedrock AgentCore是AWS的托管无服务器服务
  • 该服务支持构建多租户代理应用,内置身份管理和可观测性

本文介绍了使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM)的方法,以突破上下文窗口限制,处理任意长度的文档,通过子LLM调用分析特定文档段落。

  • Amazon Bedrock AgentCore Code Interpreter可用于实现RLM处理超长文档
  • RLM方法通过子LLM调用分析文档特定段落
  • Strands Agents SDK用于构建RLM工作流

OPLOG使用Amazon Bedrock AgentCore构建AI代理驱动的商业智能系统,整合Hubspot CRM等数据源,实现销售周期缩短35%、CRM数据完整性提升91%、手动研究时间减少98%。系统结合Anthropic Cloude Sonnet和Amazon Bedrock Knowledge Bases。

  • OPLOG使用Amazon Bedrock AgentCore构建BI系统
  • 系统将销售周期缩短35%
  • CRM数据完整性提升91%,手动研究时间减少98%

AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。

  • Amazon Bedrock AgentCore与Strands Agents及Amazon Quick集成构建多智能体架构
  • 该方案包含三个专用代理:查找仪表板代理、转换数据代理、构建仪表板代理
  • 旨在将仪表板修改周期从天级缩短至实时

全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。

  • 全球电信公司基于NVIDIA Cloud Partner架构建设主权AI工厂
  • 工厂为政府、企业和初创公司提供国内AI基础设施
  • 文章讨论构建按token计费的企业AI服务