LangSmith LLM Gateway 新增功能,可在请求到达模型前强制执行支出限制和脱敏个人身份信息,提升AI应用的安全性和成本控制能力。
Azercell与AWS合作,在Amazon SageMaker AI上训练阿塞拜疆语大语言模型。通过内核级优化,训练吞吐量提升23%,峰值GPU内存降低58%;自定义分词器使每词token数提升2倍,有效增加上下文窗口中的阿塞拜疆文本量。
AWS、Cloudflare等云服务商正在重新设计云基础设施,以适应AI代理从实验转向生产带来的机器生成互联网流量增长,而非人类用户流量。
Vercel CEO宣布其CLI已重构为自更新二进制,零外部依赖,旨在更好地支持代理进入云基础设施。通过与OpenClaw、Claude Code、Codex等工具集成,新客户持续涌入。
AWS发布一篇技术博客,介绍如何构建基于Flask的MLflow代理服务,通过REST API代理实现HTTPS方式安全访问Amazon SageMaker MLflow,支持IAM认证和URL预签名,帮助企业在云转型中集成现有系统。
Amazon Bedrock AgentCore 推出数据集管理功能,支持版本化测试用例,允许用户从生产失败案例中捕获测试用例,并以金融市场情报代理为例演示工作流。
Snowflake与AWS签署60亿美元合作协议,推动企业AI工作负载从试点转向持久运营基础设施,重塑超大规模计算需求。
Digital Realty在伦敦开设首个EMEA创新实验室(DRIL),为企业提供在真实条件下试验AI和混合云基础设施的空间。
CoreWeave 推出新平台,结合推理、强化学习和可观测性,利用实时生产数据持续优化 AI 代理。
阿里巴巴近期在杭州和新加坡召开千问大会,发布千问3.7max模型,重点布局全栈AI能力及智能体生态。阿里云MaaS业务预计2026年底年度经常性收入(ARR)超300亿元,并计划提升云业务EBITA利润率。
AWS发布Amazon Bedrock Data Automation服务,用于自动化处理金融文档(如银行对账单、税务表格、合同),通过基础模型实现上下文理解、数据提取和验证,提供自定义提取和视觉定位功能。
MiMo API进行价格下调,最高降幅达99%针对Input (Cache Hit),核心原因是推理效率提升。
今日,一台Chromebook成功运行了NVIDIA Isaac Sim,一台iPad以4K分辨率渲染了Blender,一部手机同时运行了10个并行代理。此外,ProjectX_Cloud推出了InfinityOS,这是一个基于Web的操作系统,允许在任何设备上运行Windows/Linux桌面应用,并为每个应用分配独立GPU,实现统一工作区和文件系统。
Snowflake与亚马逊AWS签署了一项为期五年、总价值60亿美元的合作协议,旨在为AI应用获取CPU芯片供应。该协议将强化AWS在云计算市场的竞争力,并对英伟达等AI芯片供应商形成竞争压力。
AWS Generative AI Innovation Center 与 Works Human Intelligence 合作,使用 Amazon Bedrock AgentCore 构建两个 AI 代理,分别处理通勤津贴审批和浏览器操作自动化,成功将成本降低 97% 并提升运营效率。
AWS SMGS 使用基于 Amazon Bedrock AgentCore 和 Amazon Quick 的对话式AI助手 NarrateAI,为管理层提供实时业务智能,解决传统BI数据延迟问题,支持自然语言查询业务绩效。
AWS销售组织部署了20多个领域特定的AI代理,但面临编排挑战。他们基于Amazon Bedrock AgentCore构建了Field Advisor系统,提供隔离执行环境、统一网关、持久记忆、身份传播和内置可观测性,以解决代理泛滥问题,提高销售效率。
SemiAnalysis指出,Anthropic的增长以及Amazon Bedrock的产品组合推动了AWS利润率上升,使AWS在云计算竞争对手中领先。
LangChain宣布Fleet agents新增安全编写和运行代码功能,结合LangSmith Fleet的计算机使用能力,提供隔离执行环境。
亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。
据SemiAnalysis报告,Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升,显示出更强的运营杠杆。与同行相比,AWS在Bedrock和Anthropic交易中表现出优势。
塔塔咨询服务(TCS)推出新的主权云平台,聚焦欧洲数据中心,旨在解决数据主权问题,并帮助运营商实现网络、AI系统和关键基础设施的现代化。
开源截图工具Screendrop发布,支持用户使用R2和Hono Worker自建云存储,项目托管于GitHub。
AWS发布技术博文,介绍Amazon Bedrock AgentCore平台,该平台帮助开发者构建和运营生成式AI代理,并集成支付功能以解决代理访问付费服务时的账单管理问题。文章还提到AI代理流量快速增长,推动内容提供商和API向按使用付费模式转变。
AWS发布博客介绍如何使用LangGraph与Amazon Bedrock AgentCore结合AWS Lambda和Step Functions构建高可扩展的无服务器多智能体系统,解决推理延迟、状态管理和可观测性等挑战。
AWS博客介绍使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建高性能生成式AI代理系统,解决推理延迟、无状态执行等问题,支持多代理并行推理、上下文持久化和可追踪执行。
AgentWatch是AWS推出的主动监控代理,能够自动检测CloudWatch告警滞后、Lambda错误堆积、EC2性能下降等问题,帮助DevOps团队从被动响应转向主动预防,减少运维负担和客户影响。
AWS博客介绍使用Strands Agents开源框架和AWS服务(如Amazon Bedrock、Kiro IDE)构建AI研究助手,仅需30行代码即可实现,展示了快速开发AI应用的方法。
AWS 发布了一篇博客,介绍如何为 Amazon Quick 构建企业可观测性解决方案。该方案将 Amazon CloudWatch vended logs 和 AWS CloudTrail 事件整合到 Amazon S3 数据湖中,可通过 Amazon Athena、QuickSight 仪表盘和自定义 Chat Agent 进行查询,以跟踪用户采用情况、满意度、成本和治理。
亚马逊Quick服务可从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据,生成Word、Excel等格式文档,并利用Spaces知识库融入组织上下文。
一位CEO透露公司用3周自建CRM替代了60万美元的Salesforce合同,计划削减80%内部SaaS,并表示即使Anthropic提价一倍也不会改变使用量。
与6家Snowflake销售合作伙伴交流发现,Cortex Code产品推动1Q26消费增长加速,北美合作伙伴A消费增速从3Q25的20-25%YoY增至1Q26的25-30%YoY,并预期2Q26达30-35%YoY。AI/GenAI产品从试点转向生产为主要驱动力。合作伙伴B在1Q26实现增长。
微软宣布Azure Kubernetes Fleet Manager跨集群网络功能进入公开预览,该功能基于Advanced Container Networking Services,提供透明的东西向多集群网络连接,旨在简化多集群管理,支持故障转移和跨区域工作负载迁移。
微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。
a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。
Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。
Microsoft Azure 宣布 Azure NetApp Files 在 EDA 工作负载中取得性能突破,通过新独立基准测试证实其可提供可预测的高性能共享存储,支持大规模并发,并已获得领先半导体公司采用,推动芯片设计上云。
Lightsprint发布协作平台,帮助团队进行视觉规划、并行管理云代理、实时预览变化并可靠地发布产品。
Amazon Nova Act 成为 HIPAA 合格服务,可在涉及电子受保护健康信息(ePHI)的场景中部署浏览器 AI 代理,自动化医疗保健工作流如理赔处理和转诊协调。
Daytona发布Agent-Native Compute产品,宣称60ms沙箱启动,75秒内注册5万初创公司,日运行850万次,支持RL/评估,CLI优于MCP。
Limrun 推出基础设施,支持在移动开发中使用云端代理,提供远程 XCode、iOS 和 Android 模拟器,已集成 Replit、Rork、Momentic AI 等平台。
Daytona发布Agent-Native Compute服务,沙箱启动仅60ms,75秒内可启动5万个初创环境,日运行85万次。CEO解释AI代理需要可组合计算机,RL工作负载占比从0%增至约50%。
Hugging Face模型现在可通过strands在AWS SageMaker AI上进行部署、工具使用和MCP集成。该转发由@alvarobartt发布,获得9次点赞、6次转推。
Datasette Agent插件datasette-agent-sprites发布0.1a0版本,支持在Fly Sprites沙箱中运行命令。
AWS 发布技术方案,通过 Amazon Bedrock AgentCore Runtime 集成 MCP 服务器,使 Amazon Quick 能够将自然语言查询转换为 AWS CLI 命令,无需切换工具,并保留 IAM 权限和 CloudWatch 审计。
AWS博客发布系列文章第一篇,介绍Amazon Bedrock AgentCore服务,该服务是构建多租户代理应用的托管无服务器平台,支持身份管理、内存、可观测性等功能,并探讨了多租户代理架构的设计考量,包括隔离模式等。
本文介绍了使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM)的方法,以突破上下文窗口限制,处理任意长度的文档,通过子LLM调用分析特定文档段落。
OPLOG使用Amazon Bedrock AgentCore构建AI代理驱动的商业智能系统,整合Hubspot CRM等数据源,实现销售周期缩短35%、CRM数据完整性提升91%、手动研究时间减少98%。系统结合Anthropic Cloude Sonnet和Amazon Bedrock Knowledge Bases。
AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。
全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。