AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。
全球电信公司正基于NVIDIA Cloud Partner参考架构建设主权AI工厂,为政府、企业和初创公司提供国内AI基础设施,并探讨如何构建按token计费的生产级企业AI服务。
LangChain 宣布其托管式深度代理(Managed Deep Agents)进入私有测试阶段,提供模型无关的基础设施。
Google为开源生产Kubernetes分布式推理工具llm-d添加了夜间CI。TPU在llm-d的CI和代码质量上正在追赶NVIDIA。AMD尚未将其GPU或NIC加入该CI。
亚马逊SageMaker AI推出OpenAI兼容API支持,实时推理端点新增/openai/v1路径,接受Chat Completions请求并支持流式响应。用户无需自定义客户端或SigV4包装,只需更改端点URL即可使用OpenAI SDK、LangChain等调用模型。同时支持为端点创建限时bearer令牌,简化认证。此举降低了AI工作负载在SageMaker上部署和调用的复杂性。
Railway 宣布其 Agent-Native Cloud 拥有 300 万用户,每周新增 10 万注册用户,编码代理支出超过 20 万美元。创始人称 AI 代理需要新云,并认为手动编码已过时。
成立于2020年的云计算公司Railway,创始人Jake Cooper曾任职于Bloomberg和Uber。公司已融资1.24亿美元,35人团队服务300万用户,周增10万注册。其裸机数据中心3个月回本,硬件增值超过融资额。
SpaceX在S-1文件中披露,与Anthropic签订云服务协议,每月提供COLOSSUS和COLOSSUS II算力,费用12.5亿美元,期限至2029年5月。协议支持自有Grok 5训练,并出售第三方算力。
亚马逊云科技宣布自2025年11月起,Amazon SageMaker AI支持双向流式推理,结合vLLM的Realtime API实现WebSocket双向流,用于构建实时语音转文本服务。文章展示了部署Mistral AI的Voxtral-Mini-4B-Realtime-2602模型至SageMaker端点,支持语音代理、实时字幕等应用。
Google Cloud宣布与多家领先组织合作,在其环境中验证Gemini 3.5系列模型。
微软推出的开源项目 mimalloc 用于现代应用和服务的大规模内存管理,旨在应对十年前不存在的规模需求。
Google在I/O 2026发布Gemini 3.5 Flash,月处理token量达3.2万亿同比增长7倍,Gemini应用月活超9亿覆盖230+国家。同时展示Gemini Live语音、Omni视频等模态及Antigravity代理栈。
在Google I/O大会上,NVIDIA和Google Cloud宣布联合开发者社区在一年内突破10万名开发者。社区成员已构建RAG应用、多智能体管道等。今年新增JAX学习路径、NVIDIA Dynamo优化codelab和月度开发者直播。此外,NVIDIA与Google DeepMind合作,使用SynthID为NVIDIA Cosmos模型输出添加水印。
谷歌Q1云业务同比增长63%,积压订单达4620亿美元,环比增90%;今年TPU出货指引400-480万颗,明年1500万颗,后年3000万颗,产业链预计明年增长3倍;Anthropic年化收入4月初300亿美元,预期5月底达500亿美元;谷歌I/O大会将发布新Gemini模型、安卓17等,利好TPU、OCS、液冷产业链。
OpenAI CEO Sam Altman在推特表示,客户对算力确定性需求增加,随着模型进步,全球算力将长期供不应求。公司推出1-3年承诺的折扣令牌,以帮助规划并实现双赢。
OpenAI推出新服务Guaranteed Capacity,允许客户长期保证对OpenAI计算资源的访问。该服务基于OpenAI在基础设施、合作伙伴关系和容量规划方面的长期投资,帮助客户在计算资源受限的环境下提前规划关键工作负载。
微软宣布Azure Files SMB的Entra-Only身份验证正式可用,无需本地Active Directory或混合同步,简化架构降低成本,支持Azure虚拟桌面FSLogix配置文件和B2B外部身份。
谷歌顶级客户每日处理超过10亿个tokens,若转向使用Gemini 3.5 Flash模型,每年可节省高达10亿美元的成本。
MongoDB 宣布 LangGraph.js Long-Term Memory Store 正式可用,该集成提供跨会话长期记忆功能。
Google与Blackstone达成50亿美元合作,推动其TPU定制AI加速器突破传统云模式,为企业提供独立于NVIDIA的AI基础设施替代方案。
Zibra Labs正在构建高性能计算(HPC)集群,允许量化交易公司大规模运行比以往多100倍的回测。该集群利用跨多个超大规模云和neocloud的spot实例处理并行工作负载。
AWS 博客介绍通过自定义 MCP 服务器扩展 Kiro CLI 的对话记忆,集成 Amazon Bedrock AgentCore Memory 托管服务,实现持久上下文存储与语义检索,支持短期工作记忆和长期智能记忆。
亚马逊宣布SageMaker Feature Store新增支持Apache Iceberg表格式、流式摄取、批量摄取以及通过Lake Formation进行细粒度访问控制,解决元数据膨胀和访问控制难题。
AWS 介绍了在 Amazon Bedrock 上实现程序化工具调用(PTC)的三种方式:自托管 Docker 沙箱、托管解决方案和基于 Anthropic SDK 的代理。PTC 通过模型生成代码并在沙箱中执行,减少多工具工作流中的延迟和 token 消耗。
Modal 宣布现支持 Claude AI 的托管代理,通过 Modal Sandboxes 提供运行环境。
Vercel 创始人宣布,其平台上所有防火墙缓解措施(包括 DDoS、系统级缓解及自定义规则)现已完全免费,Vercel 将承担所有攻击或流量缓解的计算和网络成本。
戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。
本文介绍如何使用Amazon Nova 2 Lite进行内容审核,基于MLCommons AILuminate标准,支持自定义审核政策。文章展示了该模型在三个公共数据集上与其他基础模型的基准测试结果,强调通过提示调整审核策略无需训练数据。
Y Combinator发布InsForge产品,该工具可将编程代理转化为后端工程师,管理后端服务器、数据库、LLM网关、前端部署等基础设施,专为编码代理工作流设计。
法律行业软件公司Aderant利用Amazon Quick的AI能力,统一了六个知识系统的搜索,并自动化文档流程,实现了搜索时间加快90%、文档处理加速75%,提升了云运营团队的效率。
OpenShell 发布 v0.0.43 版本,新增双向 TTY 流、OIDC 认证、HTTPS 与 mTLS 解耦、TOML 网关配置,沙箱从 ext4 磁盘启动,并移除 DNS 以防止数据泄露,改进了认证、流和沙箱隔离。
微软研究团队公布最新研究进展,涵盖云效率优化、智能体成本削减、3D远程医疗随机试验,并开放非洲包容性AI语言项目申请。
亚马逊AWS宣布Atlassian Confluence Cloud与Quick平台集成,用户可通过自然语言查询和管理Confluence文档,减少上下文切换。集成支持知识库创建、语义搜索及操作执行,并连接Amazon S3、JIRA等系统。文章详细介绍了设置步骤。
Amazon Bedrock AgentCore推出自定义代码评估器功能,允许用户通过AWS Lambda函数进行确定性质量检查,满足金融等专业领域的特定需求,如实时股价验证、JSON模式校验和PII过滤。该功能可应用于开发CI/CD管道和在线评估场景。
OpenAI与Dell达成合作,将AI编码工具Codex引入混合云和本地环境,帮助企业安全部署AI编码代理,实现数据和工作流程的集成。
Vercel宣布其平台现在支持通过Okta等SSO保护代理部署,包括生产环境,确保应用安全。同时推出vercel curl命令,允许用户和代理轻松访问Vercel生态系统内的任何URL。
Basedash宣布其平台现已支持MCP连接器,可读取数据库和SaaS工具并执行操作。
AWS发布Amazon Quick知识库的文档级访问控制功能,允许对S3中的敏感文档进行细粒度权限管理。当用户提问时,系统会验证身份并仅显示授权内容,从而满足合规和数据治理要求。本文提供了配置和验证ACL的详细步骤。
AWS推出搭载Graviton芯片的新Redshift实例,融合数据仓库与数据湖分析能力,推动定制芯片在AI数据基础设施中的应用。
OpenGov正在为旧金山许可证办理流程带来透明度和简化,该流程曾被描述为全球最糟糕的官僚机构之一。推文还提到Connie Chan及其公共部门工会的反对态度。
Sea Limited首席产品官阐述公司在亚洲工程团队中部署OpenAI的Codex,以加速AI原生软件开发。
Josh Woodward在Twitter上更新称,某产品存在一个bug,将在下一个版本中修复,计划在Google I/O大会之后发布。该帖获得236次点赞、2次转发和9条回复。
亚马逊Lex推出Assisted NLU功能,利用大语言模型提升机器人准确率,无需手动配置,包括主要模式、回退模式和意图消歧,包含在标准定价中。
本文介绍如何将Stream的Vision Agents开源框架与Amazon Bedrock和Amazon Nova 2 Sonic结合,构建实时语音代理。该方案支持低延迟音频流、函数调用、自动重连和多语言,解决生产级语音应用的工程挑战。
AWS宣布Amazon Quick Sight支持跨账户Athena访问,允许用户在中心化Quick部署中查询多个业务单元账户的Athena数据,无需管理多个订阅或承担所有查询成本,提升了数据统一分析与洞察能力。
Amazon Bedrock AgentCore Browser 新增支持 Chrome 企业策略和自定义根 CA 证书,允许组织对 AI 浏览器代理进行细粒度控制,包括 URL 过滤、下载限制和密码管理器配置,并可连接内部服务。
LangSmith Sandboxes 正式发布,提供安全可扩展的代理代码执行环境,并集成 Deep A...(原文截断)。
阿里巴巴发布2026财年Q4财报,集团营收2434亿元同比增11%;云业务收入增40%,AI相关收入三位数增长占云外收入30%,年规模超358亿元;中国电商CMR增8%,即时零售收入增57%,订单量达去年2.7倍;董事会批准每股ADS派息1.05美元。
Snap工程平台负责人Prudhvi Vatala介绍团队将日均10+PB数据处理迁移至Google Cloud GPU加速管线,实现成本降低76%、内存占用减少80%,且无需代码更改。
Pulse AI 在 AWS ML Blog 发布新文章,介绍如何使用 AWS Inferentia 和 Jamba 1.5 mini 进行部署。