Sourcing — Feed

3 Control where your AI agents can browse with Chrome enterprise policies on Amazon Bedrock AgentCore

2026-05-14T17:17

Amazon Bedrock AgentCore Browser 新增支持 Chrome 企业策略和自定义根 CA 证书，允许组织对 AI 浏览器代理进行细粒度控制，包括 URL 过滤、下载限制和密码管理器配置，并可连接内部服务。

Amazon Bedrock AgentCore Browser 支持 Chrome 企业策略。
支持自定义根 CA 证书以连接内部服务和 SSL 代理。
可配置超过 450 种浏览器设置。

AWS ML Blog AI 云计算算力

4 @SemiAnalysis_: During their last Google Cloud Next conference in Las Vegas, Google unveiled their new inference-focused TPU, featuring a novel network topo...

2026-05-14T17:00

谷歌在Google Cloud Next大会上发布新型推理专用TPU，采用名为Broadfly的新型网络拓扑。利用高基数设计，单pod最多可扩展到1152个TPU，相比Ironwood，pod大小提升4.5倍，网络直径减小，任意两个芯片间最多7跳。

谷歌发布新型推理专用TPU，采用Broadfly网络拓扑
新TPU单pod可扩展至1152个芯片
相比Ironwood，pod大小提升4.5倍，最大7跳

@SemiAnalysis_ ↗ X 行业 AI 算力数据中心

3 @hwchase17: RT @william_markito: @nvidia Nemotron native support in Deep Agents 0.6 #interrupt #langchain https://t.co/jUvzhTOEMr

2026-05-14T16:30

Nvidia Nemotron 获得 Deep Agents 0.6 版本的原生支持，该消息由 William Markito 在 Twitter 上发布。这标志着 AI 开发框架与 Nvidia AI 工具进一步集成。

Deep Agents 0.6 版本原生支持 Nvidia Nemotron

Harrison Chase ↗ X AI 行业算力

3 @jukan05: OFFICIAL H100 SALES UNDERWAY IN CHINA https://t.co/KcQHJOHSVe

2026-05-14T15:29

据推特消息，英伟达H100芯片在中国已开始正式销售，但未提供具体细节和官方确认，需后续验证。

H100在中国已开始正式销售

Jukan ↗ X AI 半导体算力

3 @hwchase17: RT @0xLogicrw: LangChain 在 Interrupt 大会上发布了底层数据库 SmithDB 和自动化排障引擎 LangSmith Engine。 Agent 运行会产生海量 trace（执行轨迹），把旧数据库撑到了瓶颈。新底座 SmithDB 放弃了本地…

2026-05-14T12:46

LangChain 在 Interrupt 大会上发布了底层数据库 SmithDB 和自动化排障引擎 LangSmith Engine，解决 Agent 运行海量 trace 导致的数据库瓶颈。

LangChain 发布底层数据库 SmithDB 和自动化排障引擎 LangSmith Engine。
SmithDB 旨在解决 Agent 运行海量 trace 的数据库瓶颈。

Harrison Chase ↗ X 行业动态 AI 数据中心算力

4 @garrytan: Sanders and AOC introduced a bill to pause ALL AI data center construction. 300+ local bills filed. Half of planned 2026 data centers facing...

2026-05-14T12:38

美国参议员桑德斯和AOC提出法案，暂停所有AI数据中心建设。全美已有300多项地方法案，导致2026年计划建设的数据中心中一半面临延迟或取消。这些数据中心每个都会为当地经济带来数十亿美元投资。

桑德斯和AOC提出暂停AI数据中心建设的法案
超过300项地方法案已提交
2026年计划的数据中心中一半面临延迟或取消

Garry Tan ↗ X 宏观行业 AI 数据中心算力

3 Energy First: How Soluna Is Rethinking Data Centre Power

2026-05-14T08:38

Soluna CEO John Belizaire 指出，数据中心行业当前的核心挑战是确保能源获取，而非计算能力。公司正重新思考数据中心电力供应策略。

Soluna CEO 认为能源获取是数据中心行业当前最大挑战
Soluna 正在调整战略，优先解决数据中心电力问题

Data Centre Magazine 行业数据中心算力动态

3 国联民生电新 | AIDC（二十一）：重申AIDC当前布局思路

2026-05-14T08:06

AIDC板块景气度上行，金盘科技2025年海外订单31.6亿元，2026年一季度海外订单22亿元。美国变压器价格持续上涨，加急费达30%-50%。

金盘科技2025年海外订单31.6亿元，2026年一季度海外订单22亿元
美国变压器价格持续上涨，加急费达30%-50%

Alpha 派行业 AI 数据中心算力出海

3 Why TELUS Plans a Sovereign AI Factory Cluster in Canada

2026-05-14T08:00

TELUS将在加拿大不列颠哥伦比亚省建设一个由三个站点组成的AI数据中心集群，旨在支持加拿大在境内保留AI基础设施和数据的主权需求。

TELUS将建设一个三站点的AI数据中心集群
集群位于加拿大不列颠哥伦比亚省
目的是支持加拿大主权AI基础设施和数据安全

Data Centre Magazine 行业数据中心算力 AI

3 @hwchase17: RT @LangChain: Introducing Managed Deep Agents: the fastest way to ship a production deep agent. ✅ Harness ✅ Context ✅ Code execution All…

2026-05-13T22:39

LangChain宣布推出Managed Deep Agents，旨在加速生产级深度代理的部署，具备上下文处理和代码执行等功能。

LangChain推出Managed Deep Agents产品

Harrison Chase ↗ X AI 算力

3 @jeremyphoward: This is misleading. This policy redefines the term "interactive" to mean "using an Anthropic front-end". If you use `claude -p` or Agent S...

2026-05-13T21:59

Anthropic更新政策，重新定义“交互式”为使用其前端，导致通过claude -p或Agent SDK的交互操作消耗积分而非订阅限制。

Anthropic重新定义“交互式”为使用其前端。
使用claude -p或Agent SDK消耗积分而非订阅。

@jeremyphoward ↗ X AI 动态算力

2 @ycombinator: RT @sid_mnk: We co-authored a new post on the @awscloud ML Blog with Greg Fina, Jim Fratantoni, and ND Ngoka, walking through how @Pulse__A…

2026-05-13T21:09

Pulse AI 在 AWS ML Blog 发布新文章，介绍如何使用 AWS Inferentia 和 Jamba 1.5 mini 进行部署。

Pulse AI 在 AWS ML Blog 发布新文章
文章介绍使用 AWS Inferentia 和 Jamba 1.5 mini

@ycombinator ↗ X AI 云计算算力

3 Build real-time voice streaming applications with Amazon Nova Sonic and WebRTC

2026-05-13T17:46

文章介绍基于Amazon Nova Sonic和Amazon Kinesis Video Streams WebRTC构建实时语音流应用的解决方案，解决网络带宽、语言障碍和跨浏览器兼容性挑战，提供低延迟、可扩展的语音交互能力。

Amazon Nova Sonic提供统一语音到语音架构，支持实时对话
方案结合WebRTC动态调整比特率以维持音频质量
AWS提供开源示例作为应用起点

AWS ML Blog AI 云计算算力

3 Fine-tune LLM with Databricks Unity Catalog and Amazon SageMaker AI

2026-05-13T17:22

本文介绍如何集成Databricks Unity Catalog与Amazon SageMaker AI，构建安全的LLM微调工作流。使用Amazon EMR Serverless进行预处理，微调Ministral-3-3B-Instruct模型，并将训练产物注册回Unity Catalog，确保数据治理和血缘追踪。

使用Amazon EMR Serverless预处理Unity Catalog中的训练数据
在SageMaker AI上微调Ministral-3-3B-Instruct模型
训练后模型注册回Unity Catalog以维护数据血缘

AWS ML Blog AI 云计算算力行业

3 Live GPU Rental Listings Point to Early Price Compression

2026-05-13T15:36

新市场数据显示，AI计算租赁定价正变得透明、碎片化且波动，随着Neocloud容量扩张，早期价格压缩迹象出现。

AI计算定价日益透明、碎片化和波动
新市场数据表明GPU租赁价格出现压缩迹象
Neocloud容量扩张推动定价变化

Data Center Knowledge 行业 AI 算力数据中心

3 AI’s next bottleneck: moving data at scale

2026-05-13T14:54

文章指出随着AI计算密度增加，数据移动、冷却和光学互连成为影响性能和扩展的关键瓶颈。

AI计算密度增加导致数据移动成为瓶颈
冷却和光学互连对性能和规模至关重要

Data Centre Magazine AI 行业数据中心算力

3 @nvidia: We're working with @IneffableLabs to co-design the infrastructure for large-scale, reinforcement-learning agents and accelerate discovery ac...

2026-05-13T13:05

英伟达宣布与IneffableLabs合作，共同设计用于大规模强化学习代理的基础设施，旨在加速科学和产业领域的发现。双方工程师正在探索构建训练流程，以实现跨知识领域的突破。

英伟达与IneffableLabs合作设计大规模RL代理基础设施
合作目标为加速科学和产业领域的发现
双方工程师正探索构建训练流程以驱动突破

@nvidia ↗ X AI 算力行业

3 @danielhanchen: We released experimental MTP Qwen3.6 Unsloth GGUFs! Qwen3.6 27B MTP now runs at 140 tokens/s. Qwen3.6 35B-A3B MTP gets 220 tokens/s generat...

2026-05-13T12:20

Unsloth发布实验性Qwen3.6 MTP GGUF版本，27B模型在单GPU上达到140 tokens/s，35B-A3B模型达到220 tokens/s，相比原始GGUF速度提升1.4倍，且精度不变。建议最大草稿token数为2。

发布Qwen3.6 MTP GGUF版本，支持推测解码
27B模型单GPU推理速度140 tokens/s
35B-A3B模型速度220 tokens/s，提升1.4倍

Daniel Han ↗ X AI 算力

3 @aleabitoreddit: $NBIS earnings were stellar and it’s now trading $200+ premarket. Reiterated $7-9B ARR in 2026. 40% adj. EBITDA margin projections, which i...

2026-05-13T11:31

Nebius财报表现强劲，重申2026年ARR达70-90亿美元，调整后EBITDA利润率40%，已签约4 GW容量，并通过英伟达支持的融资结构获得6.3亿美元资金。

重申2026年ARR70-90亿美元
预计调整后EBITDA利润率40%
签约4GW容量，获英伟达支持融资6.3亿美元

Alea ↗ X 财报 AI 算力公司

3 Building a safe, effective sandbox to enable Codex on Windows

2026-05-13T11:00

OpenAI宣布在Windows上为Codex构建安全沙箱，提供受控文件访问和网络限制，实现安全高效的编码代理。

OpenAI在Windows上为Codex构建安全沙箱
沙箱提供受控文件访问和网络限制

OpenAI News AI 云计算算力

2 @zephyr_z9: Furukawa Electric up another 15% The optical fiber suppliers are going crazy after Corning-Nvidia deal Furukawa also produces Copper Foil fo...

2026-05-13T10:08

古河电工股价上涨15%，受康宁与英伟达交易提振，光纤供应商普遍上涨。古河电工还生产覆铜板用铜箔，并发布强劲指引。

古河电工股价上涨15%
康宁与英伟达成交易
古河电工生产覆铜板用铜箔

Zephyr ↗ X 行业算力美股动态

3 国联民生通信 | Coherent Lite和OCS 分析

2026-05-13T00:48

Coherent Lite是相干下沉光模块，适配OCS场景可节省端口，2.4T产品单价约3000美元，价值量高于普通FR模块。谷歌有望率先落地相关应用，国内光模块厂商旭创、新易盛、光迅、德科立等均有技术储备。

Coherent Lite是相干下沉光模块，适配OCS场景可节省端口。
2.4T产品单价约3000美金，价值量高于普通FR模块。
谷歌有望率先落地，国内光模块厂商有技术储备。

Alpha 派行业动态数据中心算力

3 @zephyr_z9: Read this article carefully U will be hearing a lot more about the PCB/interconnect bottleneck when mass production of TPU v8, Rubin, and T...

2026-05-12T21:58

该推文指出，随着TPU v8、Rubin和Trainium3于2026年第四季度开始量产，PCB/互连瓶颈问题将受到更多关注。

预计TPU v8、Rubin和Trainium3将在2026年Q4开始量产
该量产将引发PCB/互连瓶颈的更多讨论

Zephyr ↗ X 行业 AI 半导体算力

4 @jukan05: Taiwanese media reports that Foxconn has begun early shipments of all-optical CPO switch racks to NVIDIA, with shipment forecasts revised up...

2026-05-12T19:56

台媒报道，富士康已在越南工厂生产全光CPO交换机机架，并开始向英伟达提前出货。出货预测从此前2026年1万台以上上调至2026-2027年5万台以上。供应极为紧张，甚至演示样机也被调拨给英伟达。

富士康开始向英伟达提前出货全光CPO交换机机架
出货预测从2026年1万+上调至2026-2027年5万+台
供应紧张，演示样机也被占用

Jukan ↗ X 行业 AI 算力半导体

3 @hwchase17: RT @sydneyrunkle: we just shipped delta channels in langgraph 1.2. as agents run longer and use more context, full-state checkpointing does…

2026-05-12T19:38

LangGraph 1.2版本发布，新增delta channels功能，针对长上下文场景优化全状态检查点，减少完整状态存储开销。

LangGraph 1.2发布delta channels功能
该功能优化长上下文场景的全状态检查点

Harrison Chase ↗ X AI 算力

3 @soumithchintala: Cluster magicians and GPU whisperers, come join us! We’re looking for supercomputing engineers to build the infrastructure behind real-time...

2026-05-12T17:12

Soumith Chintala在Twitter发布招聘信息，正在寻找超算工程师，负责构建实时交互模型和大规模训练基础设施，包括调度、存储、网络、可靠性及分布式系统，工作地点在纽约和旧金山。

正在招聘超算工程师
工作地点在纽约和旧金山
涉及实时交互模型和大型训练基础设施

@soumithchintala ↗ X AI 算力行业动态

3 @SemiAnalysis_: THE MORE U BUY, THE MORE U SAVE: By ganging up multiple B200 8-GPU machines together over RoCEv2 CX-7 ethernet with Tomahawk switches with a...

2026-05-12T17:01

一篇推文介绍通过组合多个B200 8-GPU机器，使用RoCEv2 CX-7以太网和Tomahawk交换机，并应用PD分解推理优化，使每GPU token吞吐量提升高达7倍，每百万token成本降低7倍。

通过RoCEv2和Tomahawk交换机组合B200机器实现PD分解优化
每GPU token吞吐量提升高达7倍
每百万token成本降低7倍

@SemiAnalysis_ ↗ X AI 算力数据中心

3 @nvidia: Discover how @ColoradoStateU is revolutionizing severe weather prediction by using NVIDIA Earth-2 and PhysicsNeMo to extend hailstorm lead t...

2026-05-12T17:00

NVIDIA与科罗拉多州立大学合作，利用Earth-2和PhysicsNeMo，结合生成式AI与高分辨率雷达数据，将冰雹预警提前时间从分钟级延长至小时级，实现实时可扩展的天气预报。

NVIDIA与科罗拉多州立大学合作改进天气预报
使用Earth-2和PhysicsNeMo结合生成式AI与雷达数据
冰雹预警时间从分钟级延长到小时级

@nvidia ↗ X AI 算力行业

3 @ycombinator: Madrone (@madronelabs) builds cooling systems for data centers. In Texas, where most new sites are, Madrone can cool using 30% less power an...

2026-05-12T16:30

Madrone公司开发数据中心冷却系统，采用新型露点冷却技术，在得克萨斯州可节省30%的电力和水。

Madrone开发数据中心冷却系统
采用露点冷却技术
在Texas可节省30%电力与水

@ycombinator ↗ X 行业动态数据中心算力

3 How open model ecosystems compound

2026-05-12T15:54

文章探讨开源AI生态系统的成本优势，引用Ai2和Epoch AI的研究指出，前沿模型研发算力占总算力的约80%。中国开源生态通过避免重复研发，可降低算力成本，形成持续发展优势。

前沿模型研发算力占总算力的约80%
中国开源生态可避免重复研发算力支出
Ai2和Epoch AI的研究支持该估计

Interconnects 行业 AI 算力研究

3 Navigating EU AI Act requirements for LLM fine-tuning on Amazon SageMaker AI

2026-05-12T15:48

EU AI Act要求LLM微调跟踪FLOPs以确定合规义务，AWS推出开源Fine-Tuning FLOPs Meter工具，集成到SageMaker AI，帮助用户通过配置标志生成审计文档。

EU AI Act要求LLM微调跟踪FLOPs
AWS推出Fine-Tuning FLOPs Meter工具
工具集成到SageMaker AI管道

AWS ML Blog 行业 AI 动态算力

3 @NVIDIAAI: RT @perplexity_ai: We published new research on how we serve post-trained Qwen3 235B models on NVIDIA GB200 NVL72 Blackwell racks. GB200 i…

2026-05-12T15:44

Perplexity AI 发布新研究，详述如何在 NVIDIA GB200 NVL72 Blackwell 机架上服务后训练的 Qwen3 235B 模型，展示了高性能推理部署方案。

Perplexity AI 发布新研究
研究涉及服务 Qwen3 235B 模型
使用 NVIDIA GB200 NVL72 Blackwell 机架

@NVIDIAAI ↗ X AI 算力云计算行业

3 @ClementDelangue: We just crossed 1,000,000 public datasets on Hugging Face! That's petabytes of data available that millions of AI builders are downloading, ...

2026-05-12T15:16

Hugging Face 公开数据集数量突破100万个，过去8个月数量翻倍（从50万到100万），加速原因与AI Agents能力提升相关。数据被视为AI构建的下一个瓶颈。

Hugging Face 公开数据集达到100万个
过去8个月数据集数量翻倍
数据被认为是AI构建的下一个瓶颈

@ClementDelangue ↗ X AI 行业动态算力

3 @huggingface: RT @stevibe: Unsloth just published MTP-enabled quantized GGUFs for Qwen3.6-35B-A3B. https://t.co/9iuepdo5AW

2026-05-12T14:53

Unsloth发布了支持MTP的量化GGUF格式，适用于Qwen3.6-35B-A3B模型。

Unsloth发布了MTP-enabled的量化GGUF文件
针对Qwen3.6-35B-A3B模型

@huggingface ↗ X AI 算力行业

4 @zephyr_z9: RT @zerohedge: *CME TO CREATE FUTURES MARKET FOR COMPUTING POWER BACKING AI

2026-05-12T14:30

芝加哥商品交易所（CME）宣布将创建用于支持人工智能的计算能力期货市场，这是金融工具创新，旨在为AI算力提供定价和风险管理工具。

CME计划推出算力期货市场

Zephyr ↗ X 行业 AI 算力数据中心

3 @AravSrinivas: GB 200s change how one does the prefill and decode disaggregation when serving large MoEs like Qwen. We’ve published details of our stack qu...

2026-05-12T14:27

NVIDIA GB200芯片改变了服务大型MoE模型（如Qwen）时的prefill和decode分离方式，相比Hopper芯片有吞吐量优势，团队已发表量化对比结果。

GB200改变了大型MoE模型的prefill和decode分离方式
与Hopper相比，GB200在服务Qwen时吞吐量有提升

Aravind Srinivas ↗ X AI 算力行业

3 @AravSrinivas: RT @perplexity_ai: We published new research on how we serve post-trained Qwen3 235B models on NVIDIA GB200 NVL72 Blackwell racks. GB200 i…

2026-05-12T14:22

Perplexity AI发布新研究，展示在NVIDIA GB200 NVL72 Blackwell机架系统上部署后训练Qwen3 235B模型的成果，涉及硬件与模型推理优化。

Perplexity AI发布在NVIDIA GB200 NVL72上的模型部署研究
研究涉及后训练的Qwen3 235B模型
部署基于Blackwell架构的GB200系统

Aravind Srinivas ↗ X AI 算力行业

3 @huggingface: RT @mervenoyann: Meta silently dropped Sapiens2 last week 🔥 a family of high-res models trained on 1B human images > for pose estimati...

2026-05-12T14:20

Meta上周悄然发布Sapiens2模型家族，这是一组高分辨率模型，基于10亿张人类图像训练，主要用于姿态估计等任务。

Meta发布Sapiens2模型家族
模型训练使用10亿张人类图像
模型用于姿态估计等任务

@huggingface ↗ X AI 算力研究

4 Nscale’s $790M Financing Marks a Shift to Utility-Style Deals

2026-05-12T13:48

Nscale为挪威AI数据中心园区获得7.9亿美元融资，该交易采用公用事业风格，凸显AI基础设施正加剧对能源容量、工业资本和电网接入的竞争。

Nscale获得7.9亿美元融资用于挪威AI数据中心园区
该融资采用公用事业式交易结构
交易显示AI基础设施正竞争能源容量、资本和电网接入

Data Center Knowledge 行业数据中心 AI 算力

3 @zephyr_z9: Hyperscalers went from diversifying accelerator vendors to now even diversifying accelerator design vendors

2026-05-12T12:14

超大规模云服务商正在从多样化加速器供应商扩展到多样化加速器设计供应商，反映了其对计算加速器供应链的进一步多元化策略。

超大规模云服务商开始多样化加速器设计供应商
此前已多样化加速器供应商

Zephyr ↗ X 行业数据中心算力动态

3 @jukan05: I didn’t realize this, but it looks like AWS may be using EMIB for a lower-end version of Trainium through MediaTek. Similar to the TPU v9 ...

2026-05-12T12:05

推特消息称，AWS可能通过联发科在低端版Trainium中使用EMIB技术，类似TPU v9项目；下一代Trainium可能同时使用EMIB和CoWoS。

AWS可能通过联发科使用EMIB技术于低端版Trainium
下一代Trainium可能同时使用EMIB和CoWoS

Jukan ↗ X AI 半导体算力

3 Agent Infra 实践复盘：Kimi 如何搭建 Agent 背后的 Database 服务

2026-05-12T11:56

PingCAP 联合创始人黄东旭复盘了 TiDB Cloud 成为 Kimi Agent 服务商的合作细节。Kimi K2.6 Agent 为大众用户提供端到端在线应用构建服务，TiDB Cloud 为其提供动态大规模数据库支持，实现了 Agent Infrastructure 的规模化落地。

TiDB Cloud 正式成为 Kimi Agent 的数据库服务商
Kimi K2.6 Agent 面向非技术用户提供全托管建站服务
合作降低了 Agent 应用 hosting 成本，用户无需技术背景

微信公众号 · Founder Park AI 云计算算力行业

4 国泰海通｜海外之夜：GPU/CPU/存储与光互联超强共振

2026-05-11T23:58

MD将2030年CPU市场规模预期上调至超1200亿美元，年复合增速35%，CPU均价预计涨20%-25%，供应紧缺。小米Q1净利润59亿超预期，全年汽车交付55万台目标信心提升。微软Q1 Azure增速40%，AI年化收入超370亿美元，全年capex指引1900亿美元。Uber Q1订单额537.2亿美元同比增25%。存储行业长期供应协议落地，供需紧缺超预期。

MD上调2030年CPU市场规模预期至超1200亿美元，年复合增速35%。
小米26Q1经调整净利润59亿超预期，全年汽车交付55万台目标置信度提升。
微软26Q1 Azure增速40%，AI年化收入超370亿美元，全年capex指引1900亿美元。

Alpha 派行业财报 AI 半导体算力

3 国金证券 | 再谈算力盛宴---掘金AI算力电话会议第36期

2026-05-11T23:14

国金证券AI算力电话会议指出，PCB行业半导体化，头部公司产能领先，板块Q1净利增50.8%，预计Q2环增30%+；存储供不应求涨价持续，Q3价环涨10%-20%，长协最长5年；CPO进度提前至Q3放量；AIDC储能订单验证，Fluence在手订单56亿美元。

PCB板块Q1净利增50.8%，预计Q2环增30%+
存储供不应求涨价，Q3价环涨10%-20%，长协最长5年
CPO进度提前至Q3放量

Alpha 派行业 AI 算力半导体路演

3 @hwchase17: RT @LangChain_OSS: Swap models & view their capabilities! Try out in Deep Agents CLI: https://t.co/ZxQz7b3h3r

2026-05-11T22:11

LangChain 发布了 Deep Agents CLI 工具，支持用户切换模型并查看模型能力。该工具通过提供的链接可以试用。

LangChain 发布 Deep Agents CLI 工具
该工具支持切换模型并查看模型能力

Harrison Chase ↗ X AI 算力

3 Building web search-enabled agents with Strands and Exa

2026-05-11T21:58

AWS 与 Exa 合作，将 Exa 的 AI 原生搜索和检索层集成到 Strands Agents SDK 中，使智能体能够直接获取结构化内容，无需后处理。该集成提供 exa_search 和 exa_get_contents 两个工具，支持新闻、论文、代码库等多种类别搜索，并可在模型驱动的工作流中实时调用网络知识。

Exa 集成 Strands Agents SDK，提供 AI 原生搜索和检索层
集成提供 exa_search 和 exa_get_contents 两个工具
Strands Agents SDK 采用模型驱动架构，模型决定工具调用时机

AWS ML Blog AI 算力云计算

3 Introducing NVIDIA Fleet Intelligence for Real-Time GPU Fleet Visibility and Optimization

2026-05-11T19:45

NVIDIA 发布全新产品 Fleet Intelligence，旨在实现大规模 GPU 集群的实时可见性和优化，解决异构硬件、软件栈更新、功耗限制和多租户工作负载等挑战。

NVIDIA 推出 Fleet Intelligence 产品
该产品提供实时 GPU 集群可见性和优化功能
产品针对大规模 GPU 集群管理中的多项挑战

NVIDIA Technical Blog AI 算力行业动态

3 @nvidia: Don’t miss our CEO Jensen Huang and @Dell Technologies Chairman & CEO Michael Dell at the Unleash the Future Keynote at #DellTechWorld t...

2026-05-11T17:49

英伟达CEO黄仁勋与戴尔CEO迈克尔·戴尔将在Dell TechWorld上发表联合主题演讲，探讨合作利用AI加速企业解决方案。

英伟达CEO黄仁勋和戴尔CEO迈克尔·戴尔将出席Dell TechWorld主题演讲
演讲主题为利用AI加速企业解决方案

@nvidia ↗ X 行业 AI 算力

3 @huggingface: RT @sudoingX: update: qwen 3.6 27b dense q4 just one shotted octopus invaders game on a single 3090. hermes agent drove the whole thing, ~4…

2026-05-11T16:23

用户sudoingX发布更新，称Qwen 3.6 27B dense q4模型在单张NVIDIA RTX 3090上一次性完成了Octopus Invaders游戏，由Hermes代理驱动整个过程。

Qwen 3.6 27B dense q4模型在单张3090上运行
模型一次性完成了Octopus Invaders游戏

@huggingface ↗ X AI 算力

3 @hwchase17: RT @masondrxy: DeepSeek V4 Flash is ~90% cheaper than GPT 5.4 Mini and ~70% cheaper than Gemini 3.1 Flash Lite For devs pushing ~500M tok/…

2026-05-11T15:28

据推文，DeepSeek V4 Flash的价格比GPT 5.4 Mini便宜约90%，比Gemini 3.1 Flash Lite便宜约70%，为开发者提供显著成本优势。

DeepSeek V4 Flash 价格比 GPT 5.4 Mini 便宜约90%
DeepSeek V4 Flash 价格比 Gemini 3.1 Flash Lite 便宜约70%

Harrison Chase ↗ X AI 算力行业