清除 当前 64 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 19 小时前 微信公众号 · 42章经 · 4 天 13 小时前 微信公众号 · DeepTech深科技 · 4 天 13 小时前 微信公众号 · Founder Park · 4 天 13 小时前 微信公众号 · FundaAI · 4 天 13 小时前 微信公众号 · 九章智驾 · 4 天 13 小时前 微信公众号 · 晚点LatePost · 4 天 13 小时前 微信公众号 · 琢磨事 · 4 天 13 小时前 微信公众号 · 甲子光年 · 4 天 13 小时前

Azercell与AWS合作,在Amazon SageMaker AI上训练阿塞拜疆语大语言模型。通过内核级优化,训练吞吐量提升23%,峰值GPU内存降低58%;自定义分词器使每词token数提升2倍,有效增加上下文窗口中的阿塞拜疆文本量。

  • Azercell与AWS合作训练阿塞拜疆语大语言模型
  • 训练吞吐量提升23%,峰值GPU内存降低58%
  • 自定义分词器使每词token数提升2倍

AWS发布一篇技术博客,介绍如何构建基于Flask的MLflow代理服务,通过REST API代理实现HTTPS方式安全访问Amazon SageMaker MLflow,支持IAM认证和URL预签名,帮助企业在云转型中集成现有系统。

  • AWS提供Flask-based MLflow代理服务方案
  • 方案支持HTTPS访问和IAM认证
  • 实现URL预签名和请求转换

Amazon Bedrock AgentCore 推出数据集管理功能,支持版本化测试用例,允许用户从生产失败案例中捕获测试用例,并以金融市场情报代理为例演示工作流。

  • Amazon Bedrock AgentCore 新增数据集管理功能,支持版本化测试用例
  • 用户可从生产失败案例中捕获测试用例
  • 文章以金融市场情报代理为例演示工作流

AWS发布Amazon Bedrock Data Automation服务,用于自动化处理金融文档(如银行对账单、税务表格、合同),通过基础模型实现上下文理解、数据提取和验证,提供自定义提取和视觉定位功能。

  • Amazon Bedrock Data Automation可自动化提取和分析金融文档数据
  • 该服务使用基础模型理解文档上下文并提取结构化数据
  • 支持银行对账单、W-2、1099-B税务表格和供应商合同等文档

AWS Generative AI Innovation Center 与 Works Human Intelligence 合作,使用 Amazon Bedrock AgentCore 构建两个 AI 代理,分别处理通勤津贴审批和浏览器操作自动化,成功将成本降低 97% 并提升运营效率。

  • AWS GenAIIC 与 WHI 合作构建两个 AI 代理
  • 使用 Amazon Bedrock AgentCore 开发
  • 成本降低 97%,运营效率提升

Verizon Connect 通过 agentic AI 解决方案将车队管理数据转化为可行动洞察,支持 120 万活跃车辆订阅,日处理 5 亿数据点,服务 10 万用户。

  • Verizon Connect 拥有 120 万活跃车辆订阅
  • 每日处理超过 5 亿数据点
  • agentic AI 解决方案服务于 10 万用户

AWS SMGS 使用基于 Amazon Bedrock AgentCore 和 Amazon Quick 的对话式AI助手 NarrateAI,为管理层提供实时业务智能,解决传统BI数据延迟问题,支持自然语言查询业务绩效。

  • AWS SMGS 推出AI助手 NarrateAI,用于业务管理
  • NarrateAI 基于 Amazon Bedrock AgentCore 构建
  • NarrateAI 通过 Amazon Quick 界面提供自然语言问答

AWS销售组织部署了20多个领域特定的AI代理,但面临编排挑战。他们基于Amazon Bedrock AgentCore构建了Field Advisor系统,提供隔离执行环境、统一网关、持久记忆、身份传播和内置可观测性,以解决代理泛滥问题,提高销售效率。

  • AWS销售组织有20多个领域特定代理
  • AWS构建了Field Advisor on Bedrock AgentCore
  • Field Advisor提供隔离执行和统一网关

AWS发布技术博文,介绍Amazon Bedrock AgentCore平台,该平台帮助开发者构建和运营生成式AI代理,并集成支付功能以解决代理访问付费服务时的账单管理问题。文章还提到AI代理流量快速增长,推动内容提供商和API向按使用付费模式转变。

  • AgentCore是一个模块化托管平台,用于构建和部署生成式AI代理
  • AgentCore集成了支付功能,支持代理动态交易
  • AI代理流量快速增长,推动付费模式变革

AWS发布博客介绍如何使用LangGraph与Amazon Bedrock AgentCore结合AWS Lambda和Step Functions构建高可扩展的无服务器多智能体系统,解决推理延迟、状态管理和可观测性等挑战。

  • AWS提出结合LangGraph和Bedrock AgentCore构建多智能体系统
  • 方案使用Lambda和Step Functions实现无服务器自动扩展
  • LangGraph提供图执行模型以协调多智能体工作流

AWS博客介绍使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建高性能生成式AI代理系统,解决推理延迟、无状态执行等问题,支持多代理并行推理、上下文持久化和可追踪执行。

  • 使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建多代理系统
  • 架构可减少手动工作,实时响应,扩展到数千交互
  • 支持并行推理、上下文持久化和可追踪执行路径

AgentWatch是AWS推出的主动监控代理,能够自动检测CloudWatch告警滞后、Lambda错误堆积、EC2性能下降等问题,帮助DevOps团队从被动响应转向主动预防,减少运维负担和客户影响。

  • AgentWatch是AWS发布的主动监控代理
  • 它解决CloudWatch告警滞后、Lambda错误堆积等问题
  • 旨在帮助团队从被动响应转向主动预防

AWS博客介绍使用Strands Agents开源框架和AWS服务(如Amazon Bedrock、Kiro IDE)构建AI研究助手,仅需30行代码即可实现,展示了快速开发AI应用的方法。

  • Strands Agents是开源框架,简化AI代理创建
  • 结合AWS服务可在30行代码内构建AI研究助手
  • Kiro IDE提供超过50个 curated powers 加速开发

AWS 发布了一篇博客,介绍如何为 Amazon Quick 构建企业可观测性解决方案。该方案将 Amazon CloudWatch vended logs 和 AWS CloudTrail 事件整合到 Amazon S3 数据湖中,可通过 Amazon Athena、QuickSight 仪表盘和自定义 Chat Agent 进行查询,以跟踪用户采用情况、满意度、成本和治理。

  • Amazon Quick 是一个生成式 AI 平台,整合了 Spaces、Chat agents、Flows 等功能
  • 解决方案将 Amazon CloudWatch 和 CloudTrail 数据汇聚到 S3 数据湖
  • 用户可使用 Athena、QuickSight 和 Chat Agent 查询分析数据

亚马逊Quick服务可从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据,生成Word、Excel等格式文档,并利用Spaces知识库融入组织上下文。

  • Quick从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据
  • 支持生成Word、Excel等格式的专业文档
  • 利用Spaces知识库生成符合组织上下文的文档

Amazon Nova Act 成为 HIPAA 合格服务,可在涉及电子受保护健康信息(ePHI)的场景中部署浏览器 AI 代理,自动化医疗保健工作流如理赔处理和转诊协调。

  • Amazon Nova Act 获得 HIPAA 资格认证
  • 可用于自动化涉及 ePHI 的浏览器工作流
  • 面向医疗保健和生命科学组织

一篇AWS技术博客介绍使用AI代理优化放射科工作流。研究涵盖62家医院、220万次影像,发现传统规则系统导致紧急病例平均延迟17.7分钟,并产生210万至420万美元的额外成本。方案基于Amazon Bedrock AgentCore和Strands Agents SDK构建智能调度系统,可减少诊断延迟。

  • 62家医院220万次影像研究显示低效分配导致紧急病例延迟17.7分钟
  • 低效分配造成医院网络成本损失210万至420万美元
  • 传统放射科工作流依赖刚性规则,忽略医生专业和疲劳度

AWS 发布技术方案,通过 Amazon Bedrock AgentCore Runtime 集成 MCP 服务器,使 Amazon Quick 能够将自然语言查询转换为 AWS CLI 命令,无需切换工具,并保留 IAM 权限和 CloudWatch 审计。

  • AWS 推出 Bedrock AgentCore Runtime 集成 MCP 服务器的方案
  • 该方案将自然语言查询直接转换为 AWS CLI 命令
  • 方案运行在现有 IAM 权限内并提供 CloudWatch 审计

AWS博客发布系列文章第一篇,介绍Amazon Bedrock AgentCore服务,该服务是构建多租户代理应用的托管无服务器平台,支持身份管理、内存、可观测性等功能,并探讨了多租户代理架构的设计考量,包括隔离模式等。

  • Amazon Bedrock AgentCore是AWS的托管无服务器服务
  • 该服务支持构建多租户代理应用,内置身份管理和可观测性

本文介绍了使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM)的方法,以突破上下文窗口限制,处理任意长度的文档,通过子LLM调用分析特定文档段落。

  • Amazon Bedrock AgentCore Code Interpreter可用于实现RLM处理超长文档
  • RLM方法通过子LLM调用分析文档特定段落
  • Strands Agents SDK用于构建RLM工作流

OPLOG使用Amazon Bedrock AgentCore构建AI代理驱动的商业智能系统,整合Hubspot CRM等数据源,实现销售周期缩短35%、CRM数据完整性提升91%、手动研究时间减少98%。系统结合Anthropic Cloude Sonnet和Amazon Bedrock Knowledge Bases。

  • OPLOG使用Amazon Bedrock AgentCore构建BI系统
  • 系统将销售周期缩短35%
  • CRM数据完整性提升91%,手动研究时间减少98%

AWS发布博客介绍结合Amazon Bedrock AgentCore、Strands Agents和Amazon Quick的AI驱动仪表板自动化代理解决方案,采用多智能体架构,可实现自然语言驱动的仪表板修改,减少传统IT流程的等待时间。

  • Amazon Bedrock AgentCore与Strands Agents及Amazon Quick集成构建多智能体架构
  • 该方案包含三个专用代理:查找仪表板代理、转换数据代理、构建仪表板代理
  • 旨在将仪表板修改周期从天级缩短至实时

亚马逊SageMaker AI推出OpenAI兼容API支持,实时推理端点新增/openai/v1路径,接受Chat Completions请求并支持流式响应。用户无需自定义客户端或SigV4包装,只需更改端点URL即可使用OpenAI SDK、LangChain等调用模型。同时支持为端点创建限时bearer令牌,简化认证。此举降低了AI工作负载在SageMaker上部署和调用的复杂性。

  • SageMaker AI端点新增/openai/v1路径支持OpenAI兼容API
  • 支持Chat Completions请求和流式响应
  • 用户可创建限时bearer令牌用于OpenAI客户端

AWS宣布在Strands Evals SDK中推出四个新的多模态大语言模型评估器,用于图像到文本任务,包括整体质量、正确性、忠实度和指令遵循。评估器直接利用图像进行评分,可替代纯文本评估器,支持参考答案和自定义标准。Gartner预测到2030年80%的企业软件将支持多模态。

  • AWS发布四个MLLM-as-a-Judge评估器
  • 评估器用于图像到文本任务,支持图像输入
  • Gartner预测2030年80%企业软件将多模态

亚马逊云科技宣布自2025年11月起,Amazon SageMaker AI支持双向流式推理,结合vLLM的Realtime API实现WebSocket双向流,用于构建实时语音转文本服务。文章展示了部署Mistral AI的Voxtral-Mini-4B-Realtime-2602模型至SageMaker端点,支持语音代理、实时字幕等应用。

  • Amazon SageMaker AI自2025年11月起支持双向流式推理
  • vLLM Realtime API通过WebSocket实现双向流
  • 部署Voxtral-Mini-4B-Realtime-2602模型实现实时语音转文本

AWS 博客介绍通过自定义 MCP 服务器扩展 Kiro CLI 的对话记忆,集成 Amazon Bedrock AgentCore Memory 托管服务,实现持久上下文存储与语义检索,支持短期工作记忆和长期智能记忆。

  • Amazon Bedrock AgentCore Memory 是托管服务,提供持久记忆和语义搜索
  • Kiro CLI 可自定义 MCP 服务器集成该记忆功能

亚马逊宣布SageMaker Feature Store新增支持Apache Iceberg表格式、流式摄取、批量摄取以及通过Lake Formation进行细粒度访问控制,解决元数据膨胀和访问控制难题。

  • 支持Apache Iceberg表格式和流式摄取
  • 支持Lake Formation细粒度访问控制
  • 新功能在SageMaker Python SDK v3.8.0中可用

AWS 介绍了在 Amazon Bedrock 上实现程序化工具调用(PTC)的三种方式:自托管 Docker 沙箱、托管解决方案和基于 Anthropic SDK 的代理。PTC 通过模型生成代码并在沙箱中执行,减少多工具工作流中的延迟和 token 消耗。

  • AWS 发布 Amazon Bedrock 上程序化工具调用的三种实现方式
  • 程序化工具调用通过模型生成代码在沙箱执行,仅返回最终结果
  • 三种方式包括自托管 Docker 沙箱、托管解决方案和代理 SDK

本文介绍如何使用Amazon Nova 2 Lite进行内容审核,基于MLCommons AILuminate标准,支持自定义审核政策。文章展示了该模型在三个公共数据集上与其他基础模型的基准测试结果,强调通过提示调整审核策略无需训练数据。

  • Amazon Nova 2 Lite可用于内容审核。
  • 使用MLCommons AILuminate v1.1作为审核政策。
  • 对Amazon Nova 2 Lite与多个基础模型进行了基准测试。

法律行业软件公司Aderant利用Amazon Quick的AI能力,统一了六个知识系统的搜索,并自动化文档流程,实现了搜索时间加快90%、文档处理加速75%,提升了云运营团队的效率。

  • Aderant使用Amazon Quick统一了六个知识系统的搜索
  • 搜索时间加快90%,文档处理加速75%
  • Aderant的Expert Sierra云解决方案获得更高效支持

亚马逊AWS宣布Atlassian Confluence Cloud与Quick平台集成,用户可通过自然语言查询和管理Confluence文档,减少上下文切换。集成支持知识库创建、语义搜索及操作执行,并连接Amazon S3、JIRA等系统。文章详细介绍了设置步骤。

  • Quick平台集成Atlassian Confluence Cloud
  • 支持通过自然语言查询和管理Confluence页面
  • 集成包括知识库和Actions两类功能

Amazon Bedrock AgentCore推出自定义代码评估器功能,允许用户通过AWS Lambda函数进行确定性质量检查,满足金融等专业领域的特定需求,如实时股价验证、JSON模式校验和PII过滤。该功能可应用于开发CI/CD管道和在线评估场景。

  • Amazon Bedrock AgentCore推出自定义代码评估器
  • 评估器基于AWS Lambda实现确定性逻辑
  • 支持金融领域实时股价验证和JSON模式检查

AWS发布Amazon Quick知识库的文档级访问控制功能,允许对S3中的敏感文档进行细粒度权限管理。当用户提问时,系统会验证身份并仅显示授权内容,从而满足合规和数据治理要求。本文提供了配置和验证ACL的详细步骤。

  • Amazon Quick新增对S3知识库的文档级ACL支持
  • 基于用户身份限制敏感文档访问
  • 提供全局ACL文件和文档级元数据两种配置方法

亚马逊Lex推出Assisted NLU功能,利用大语言模型提升机器人准确率,无需手动配置,包括主要模式、回退模式和意图消歧,包含在标准定价中。

  • 亚马逊Lex发布Assisted NLU特性,提升机器人准确率。
  • 该功能利用大语言模型处理自然语言变体,无需手动配置。
  • Assisted NLU包含主要模式、回退模式和意图消歧,无额外费用。

本文介绍如何将Stream的Vision Agents开源框架与Amazon Bedrock和Amazon Nova 2 Sonic结合,构建实时语音代理。该方案支持低延迟音频流、函数调用、自动重连和多语言,解决生产级语音应用的工程挑战。

  • Stream推出Vision Agents框架集成Amazon Nova 2 Sonic
  • 实现实时语音交互、函数调用和自动重连
  • 通过Amazon Bedrock提供语音代理能力

AWS宣布Amazon Quick Sight支持跨账户Athena访问,允许用户在中心化Quick部署中查询多个业务单元账户的Athena数据,无需管理多个订阅或承担所有查询成本,提升了数据统一分析与洞察能力。

  • AWS发布Amazon Quick Sight跨账户Athena访问功能
  • 用户可在中心化Quick部署中查询多账户的Athena数据

Amazon Bedrock AgentCore Browser 新增支持 Chrome 企业策略和自定义根 CA 证书,允许组织对 AI 浏览器代理进行细粒度控制,包括 URL 过滤、下载限制和密码管理器配置,并可连接内部服务。

  • Amazon Bedrock AgentCore Browser 支持 Chrome 企业策略。
  • 支持自定义根 CA 证书以连接内部服务和 SSL 代理。
  • 可配置超过 450 种浏览器设置。

文章介绍基于Amazon Nova Sonic和Amazon Kinesis Video Streams WebRTC构建实时语音流应用的解决方案,解决网络带宽、语言障碍和跨浏览器兼容性挑战,提供低延迟、可扩展的语音交互能力。

  • Amazon Nova Sonic提供统一语音到语音架构,支持实时对话
  • 方案结合WebRTC动态调整比特率以维持音频质量
  • AWS提供开源示例作为应用起点

AWS和Cisco合作推出AI Defense,以解决企业部署AI代理时的可见性、安全和合规问题。MCP协议自2024年11月快速普及,A2A协议于2025年4月出现,企业面临安全缺口。合作提供自动扫描和统一治理方案。

  • MCP协议自2024年11月推出后采用加速
  • Agent-to-Agent协议于2025年4月出现
  • AWS与Cisco合作推出AI Defense解决安全挑战

本文介绍如何集成Databricks Unity Catalog与Amazon SageMaker AI,构建安全的LLM微调工作流。使用Amazon EMR Serverless进行预处理,微调Ministral-3-3B-Instruct模型,并将训练产物注册回Unity Catalog,确保数据治理和血缘追踪。

  • 使用Amazon EMR Serverless预处理Unity Catalog中的训练数据
  • 在SageMaker AI上微调Ministral-3-3B-Instruct模型
  • 训练后模型注册回Unity Catalog以维护数据血缘

亚马逊金融科技团队使用Amazon Bedrock等AWS服务构建生成式AI应用,自动化处理来自不同管辖区的监管问询。该方案允许各团队创建和维护自己的专用知识库,以提高信息检索和响应效率。

  • 亚马逊金融科技团队基于AWS构建AI应用处理监管问询
  • 各团队可创建和维护自己的专用知识库

AWS发布多文档发现功能,作为IDP加速器的预处理步骤,自动分析未知文档、聚类文档类型并生成提取模式,基于视觉嵌入和智能代理,降低人工创建模式的工作量。

  • AWS推出多文档发现功能,自动聚类文档并生成提取模式
  • 该功能作为IDP加速器的预处理,减少人工模式创建
  • 基于视觉嵌入和智能代理实现自动化和可扩展

EU AI Act要求LLM微调跟踪FLOPs以确定合规义务,AWS推出开源Fine-Tuning FLOPs Meter工具,集成到SageMaker AI,帮助用户通过配置标志生成审计文档。

  • EU AI Act要求LLM微调跟踪FLOPs
  • AWS推出Fine-Tuning FLOPs Meter工具
  • 工具集成到SageMaker AI管道

AWS 与 Exa 合作,将 Exa 的 AI 原生搜索和检索层集成到 Strands Agents SDK 中,使智能体能够直接获取结构化内容,无需后处理。该集成提供 exa_search 和 exa_get_contents 两个工具,支持新闻、论文、代码库等多种类别搜索,并可在模型驱动的工作流中实时调用网络知识。

  • Exa 集成 Strands Agents SDK,提供 AI 原生搜索和检索层
  • 集成提供 exa_search 和 exa_get_contents 两个工具
  • Strands Agents SDK 采用模型驱动架构,模型决定工具调用时机

Anthropic宣布Claude Platform on AWS正式可用,客户可通过AWS账户直接访问原生Claude平台体验,无需单独凭证或合同。AWS成为首个提供该服务的云提供商,支持IAM认证、AWS Marketplace计费及CloudTrail审计。

  • Claude Platform on AWS正式可用
  • AWS是首个提供原生Claude平台体验的云厂商
  • 服务通过AWS Marketplace计费,支持IAM认证

亚马逊推出Nova多模态嵌入模型,可将文本、图像和文档页面映射到同一向量空间,实现跨模态检索。在航空制造文档测试中,该多模态检索系统在26个查询上表现优于纯文本系统。

  • Amazon Nova多模态嵌入模型将文本与图像映射到共享向量空间
  • 该系统在航空制造文档的26个查询上进行了评估

Miro与AWS PACE团队合作,利用Amazon Bedrock开发BugManager,实现自动化的软件bug路由,将团队重新分配次数减少6倍,解决时间缩短5倍,解决了每年约42年累计生产力损失的痛点。

  • Miro使用Amazon Bedrock构建BugManager,实现bug自动路由
  • Bug路由错误导致Miro每年约42年累计生产力损失
  • BugManager使团队重新分配减少6倍,解决时间缩短5倍

Amazon Quick 发布五项新能力,包括数据集问答功能,可直接用自然语言查询大型企业数据,自动生成SQL并快速返回结果,加速从数据到AI决策的进程。

  • Amazon Quick 发布五项新能力
  • 新功能支持自然语言查询大型数据集并生成SQL
  • 旨在加速企业数据到AI决策的转化

Halliburton与AWS合作,利用Amazon Bedrock等生成式AI技术,为其Seismic Engine开发AI助手,将地震数据处理工作流创建从手动配置转为自然语言交互,实验显示工作流创建加速高达95%。

  • Halliburton与AWS合作开发AI助手
  • AI助手将工作流创建从手动转为对话
  • 工作流创建加速高达95%

AWS发布EC2 Capacity Blocks for ML和SageMaker training plans,帮助用户获取短期GPU容量,以应对GPU短缺问题。这些方案适用于负载测试、模型验证等短期工作负载。

  • AWS推出EC2 Capacity Blocks for ML和SageMaker training plans,保障短期GPU容量。