Sourcing — Feed

3 Amazon Research Awards recipients announced

2026-05-27T17:21

亚马逊研究奖（ARA）公布2025年秋季获奖者，共68名来自11国49所大学，涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分，并获取亚马逊研究联系人、公开数据集等资源。

亚马逊研究奖公布68名获奖者，来自11国49所大学
获奖提案涵盖AI安全、Agentic AI、自动推理等六类
获奖者可获得AWS推广积分和亚马逊研究支持

Amazon Science AI 研究云计算

3 @hwchase17: A highlight of new deepagents release is delta channels Drastically improves how we store checkpoints for agents

2026-05-27T17:09

Deepagents新版本发布，亮点是delta channels，它大幅改进了代理检查点的存储方式。

Deepagents新版本发布
引入delta channels改进了检查点存储

Harrison Chase ↗ X AI 行业

3 @SemiAnalysis_: Anthropic Growth and Bedrock Mix Drive AWS Margins Higher While Peers Lag Amazon’s Bedrock Mix and Anthropic Deal Terms Combine to Show Grea...

2026-05-27T17:08

据SemiAnalysis报告，Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升，显示出更强的运营杠杆。与同行相比，AWS在Bedrock和Anthropic交易中表现出优势。

Anthropic增长推动AWS利润率提高
Bedrock Mix提升AWS运营杠杆

@SemiAnalysis_ ↗ X 行业公司云计算 AI

3 @hwchase17: RT @LangChain: Deep Agents v0.6 brings Delta channels, reducing checkpoint storage by up to 100x for long-running agents, without sacrifici…

2026-05-27T17:08

LangChain 发布 Deep Agents v0.6 版本，引入 Delta channels，可将长期运行代理的检查点存储减少高达 100 倍，且不影响性能。

Deep Agents v0.6 发布
引入 Delta channels 减少存储

Harrison Chase ↗ X AI

3 What’s New for Game Developers in NVIDIA RTX: DLSS 4.5 for UE5 and Multilingual AI Characters

2026-05-27T17:01

NVIDIA RTX更新：DLSS 4.5以Unreal Engine插件形式发布，NVIDIA ACE扩展多语言AI角色能力，支持游戏开发者实现AI驱动角色、帧生成和光线追踪渲染。

NVIDIA发布DLSS 4.5作为Unreal Engine插件
NVIDIA ACE扩展多语言AI角色能力

NVIDIA Technical Blog 行业 AI 动态

3 @ycombinator: Rentahuman (@RentAHumanX) allows AI agents to communicate with and pay humans to do tasks in the real world. Their mission is to use AI to c...

2026-05-27T17:00

Rentahuman平台允许AI代理与人类沟通并支付其完成现实世界任务，旨在利用AI创造新工作并全球协调工人。

Rentahuman允许AI代理与人类沟通并支付人类完成任务。
其使命是利用AI创造新工作并全球协调工人。

@ycombinator ↗ X 行业动态 AI

3 @sama: AI should dramatically increase quality of life and individual freedoms for people around the world. The OpenAI Foundation is making an ini...

2026-05-27T16:44

OpenAI基金会宣布初始承诺2.5亿美元，用于测量、过渡支持和新方法以促进广泛共享繁荣。

OpenAI基金会承诺2.5亿美元用于促进广泛共享繁荣

@sama ↗ X AI 公司

3 @huggingface: RT @skalskip92: RF-DETR is now available in @huggingface transformers state of the art in both detection and segmentation, outperforming Y…

2026-05-27T16:16

RF-DETR目标检测与分割模型现已集成至Hugging Face Transformers库。该模型在检测和分割任务上达到最优性能，超越YOLO系列。项目由skalskip92在推特宣布，获得关注。

RF-DETR在Hugging Face Transformers库中可用
该模型在检测和分割任务上达到最优性能

@huggingface ↗ X AI 动态

2 @ClementDelangue: RT @skalskip92: RF-DETR is now available in @huggingface transformers state of the art in both detection and segmentation, outperforming Y…

2026-05-27T16:16

Hugging Face Transformers 现已集成 RF-DETR 模型，该模型在目标检测和分割任务上声称达到最先进水平，超越 YOLO。

RF-DETR 现已在 Hugging Face Transformers 中可用。
RF-DETR 在目标检测和分割上声称超越 YOLO。

@ClementDelangue ↗ X AI 动态

4 AI coding startup Cognition raises $1B at $25B pre-money valuation

2026-05-27T16:00

AI编码初创公司Cognition以250亿美元投前估值融资10亿美元，其年化收入达4.92亿美元，8个月内估值翻倍。

Cognition融资10亿美元，投前估值250亿美元
年化收入4.92亿美元
8个月内估值翻倍

TechCrunch AI AI 公司动态

3 @AravSrinivas: RT @perplexity_ai: We're open-sourcing the Unigram tokenizer we rebuilt to reduce CPU utilization by 5-6x. Small rerankers and embedders r…

2026-05-27T15:59

Perplexity AI宣布开源其重建的Unigram分词器，声称可将CPU利用率降低5-6倍，同时提及小模型相关技术。

Perplexity AI开源Unigram分词器
分词器降低CPU利用率5-6倍

Aravind Srinivas ↗ X AI 算力

3 @SEMIconex: Glass core substrates are moving into focus for next-generation advanced packaging. As AI and HPC drive demand for larger and more complex ...

2026-05-27T15:50

SEMI与Global Net Corp.发布玻璃基板市场报告，指出AI和高性能计算推动先进封装需求，预测2028-2040年玻璃基板市场复合年增长率为67.2%。

SEMI和Global Net Corp.发布玻璃基板市场报告
预测2028-2040年CAGR为67.2%

@SEMIconex ↗ X 行业半导体 AI 算力

3 @demi_guo_: RT @pika_labs: Today, we’re sharing the first of what we’re calling Pika Experiments 🧪 - rough ideas we’ve been playing with behind the sce…

2026-05-27T15:13

Pika Labs分享了一项名为Pika Experiments的实验项目，展示其正在探索的AI视频生成技术新方向。该项目是团队在幕后尝试的初步想法。

Pika Labs推出Pika Experiments实验项目
该项目展示AI视频生成技术的新探索

Demi Guo ↗ X AI 动态

3 @ylecun: RT @proteinrosh: Announcing ESMFold2, our new state-of-the-art structure prediction model capable of predicting structure from single seque…

2026-05-27T15:10

ProteinRos宣布推出新一代结构预测模型ESMFold2，该模型能够从单条序列直接预测蛋白质结构，代表了技术上的重要进展。

ESMFold2模型发布
可从单条序列预测蛋白质结构

@ylecun ↗ X AI 行业

3 @rasbt: The MiniMax M2 series was one of the most widely used open-weight LLM series earlier this year. Now, we got a technical report with some int...

2026-05-27T15:07

MiniMax M2技术报告发布，总结了多项技术发现：选择全注意力机制而非混合滑动窗口；线性/稀疏注意力在生产系统中部署困难且前缀缓存支持差；细粒度MoE（128专家top-8）在2B参数规模下推理和代码能力显著提升；训练流程中增加了软件工程agent行为训练。

MiniMax M2采用全注意力机制，放弃混合滑动窗口
稀疏注意力在生产环境中部署困难且前缀缓存支持差
细粒度MoE在2B参数下将MATH从19.6提升至24.1

@rasbt ↗ X AI 算力

3 @huggingface: RT @mervenoyann: RF-DETR just landed to @huggingface transformers 🥵🔥 sota real-time detection & segmentation models by @roboflow 💜 &g...

2026-05-27T14:59

RF-DETR实时目标检测与分割模型已集成至HuggingFace Transformers，该模型由Roboflow开发，具备SOTA性能，可通过HuggingFace平台使用。

RF-DETR模型已集成至HuggingFace Transformers
该模型由Roboflow开发，支持实时检测与分割

@huggingface ↗ X AI 行业动态

3 @ycombinator: Eden (@thefinalcompany) is building autonomous robotic services. Today they are launching Eden I, their industrial semi-humanoid robot you ...

2026-05-27T14:57

Eden公司今日发布工业半人形机器人Eden I，可按小时租赁，提供自主机器人服务。

Eden发布工业半人形机器人Eden I
Eden I可按小时租赁

@ycombinator ↗ X 行业动态 AI

3 ElevenLabs’s new music generation model can switch genres mid-track

2026-05-27T14:14

ElevenLabs发布全新音乐生成模型，支持在歌曲中间切换流派，用户可以重新生成特定部分而不影响歌曲其余部分。

ElevenLabs发布新音乐生成模型
模型允许在歌曲中间切换流派
用户可重新生成部分而不影响其余

TechCrunch AI AI 行业动态

3 How a Coal Plant in Buffalo Became TeraWulf’s 500 MW AI Campus

2026-05-27T14:02

TeraWulf与施耐德电气合作，将纽约州布法罗的一座燃煤电厂改建为500兆瓦的AI数据中心园区。该园区旨在提供高性能计算基础设施，支持人工智能应用。Data Center Knowledge团队实地探访该园区，了解其电力与冷却解决方案。

TeraWulf与施耐德电气合作，将布法罗煤电厂改建为500兆瓦AI数据中心园区
该园区专注于支持AI计算负载的电力与冷却基础设施

Data Center Knowledge 行业 AI 数据中心算力

3 SOND, a sleep tech startup from Bose’s former head of sleep, exits stealth with $7M

2026-05-27T14:00

睡眠科技初创公司SOND由Bose前睡眠产品负责人领导，获得700万美元融资，推出AI驱动的睡眠耳塞。

SOND获得700万美元融资
公司由Bose前睡眠产品负责人领导
产品为AI睡眠耳塞

TechCrunch AI AI 行业动态

3 Stratos and the New AI Campus Math: Building Around the Grid

2026-05-27T13:51

犹他州提议建设9吉瓦的Stratos AI园区，反映了AI基础设施向专用能源系统、加速许可和直接控制电力的演变趋势。

犹他州提出9吉瓦Stratos AI园区提案
园区围绕专用能源系统建设
注重加速许可和直接电力控制

Data Center Knowledge 行业动态 AI 数据中心算力

3 @ylecun: RT @alexrives: Today we're announcing ESMFold2, an open scientific engine to power prediction, design, and discovery across protein biology…

2026-05-27T13:38

Alex Rives宣布推出ESMFold2，一个用于蛋白质生物学的开放科学引擎，支持预测、设计和发现。

ESMFold2发布
ESMFold2是开放科学引擎
用于蛋白质生物学预测、设计和发现

@ylecun ↗ X AI 行业动态

3 Broadcom and FuriosaAI Bet on Ethernet AI Fabrics

2026-05-27T13:00

Broadcom与FuriosaAI合作开发机架级推理平台，旨在推动AI基础设施转向以太网结构、chiplet和节能token生成。

Broadcom与FuriosaAI合作构建机架级推理平台
该平台聚焦以太网结构、chiplet和节能token生成

Data Center Knowledge 行业动态 AI 半导体

3 @c_valenzuelab: RT @herokominato: AI動画で有名なRunwayのCEOが来日するので、登壇イベントを今週行います！参加登録をお忘れなく！ @runwayml と@c_valenzuelab チームいつもサポートをありがとう！ https://t.co/KnMn8UgU0z

2026-05-27T12:58

AI视频公司Runway的CEO将访问日本，并于本周举办登坛活动。活动信息通过社交媒体发布，提醒用户报名参与。

Runway CEO本周访问日本并举办登坛活动。
活动参与需提前报名注册。

Cristóbal Valenzuela ↗ X 行业动态 AI 活动

3 The Codex feature that works while you sleep

2026-05-27T12:03

本期节目介绍了Codex中的/goal命令，它将AI从逐轮助手转变为自主代理，可执行多步骤复杂任务。通过三个实例展示了其功能：五小时内消除数千个Sentry错误、四小时内将3900封邮件清理至68封、整理数百个Linear任务。同时讲解了如何编写有效目标提示及其适用场景。

/goal命令使AI成为可自主执行多步骤任务的智能代理
利用/goal在五小时内消除了数千个Sentry错误
利用/goal在四小时内将3900封邮件清理至68封

Lenny's Newsletter AI 行业动态

3 Texas May Have Accidentally Built the Perfect Grid for AI

2026-05-27T12:00

德克萨斯州修建的CREZ输电走廊原本用于运输风电，如今这些输电通道正越来越多地吸引超大规模AI基础设施的部署。

德州CREZ输电走廊原本用于风电输送。
同一输电通道正吸引超大规模AI基础设施部署。

Data Center Knowledge 行业 AI 数据中心

3 Cisco and OpenAI redefine enterprise engineering with Codex

2026-05-27T11:00

思科与OpenAI合作，利用Codex重新定义企业工程，帮助思科扩展AI原生开发、加速AI防御工作并自动化缺陷修复。

思科与OpenAI合作使用Codex推进企业工程转型

OpenAI News AI 行业公司

4 兴证海外TMT | 从华为Fellow演讲看韬定律的实际应用

2026-05-27T10:02

华为Fellow透露，公司将于今年秋季量产采用3D堆叠技术的麒麟手机芯片，该技术领先台积电同类方案3年，且散热问题已通过设计解决。此外，华为计划在2026-2027年将XPU功耗效率分别提升40%-80%和80%-120%，7nm与5nm封装可实现等效3nm性能，成本与2D工艺相当。

华为Fellow称秋季将量产3D堆叠麒麟芯片
华为3D堆叠技术领先台积电3年
华为26-27年XPU功耗效率提升40%-120%

Alpha 派行业半导体 AI 动态算力

3 @jukan05: Things I’ve looked into recently: I’m increasingly convinced that semiconductor equipment could become seriously scarce going forward. Base...

2026-05-27T09:32

推特用户@jukan05表示，半导体设备可能严重稀缺，tera-fab项目比预期更认真；英特尔需扩大产能并承接台积电客户，三星已获多个客户，台积电可能在Q3上调资本开支。SK海力士在HBM4上表现优于三星，HBM价格重谈不顺利，超大规模客户不愿重新谈判。

tera-fab项目比预期更认真，半导体设备可能严重稀缺
英特尔需扩大产能并吸收台积电客户，三星已获多个客户
台积电可能在Q3上调资本开支，HBM价格重谈不顺利

Jukan ↗ X 行业半导体 AI 动态

3 Nebius Scales AI Infrastructure Across Ark's Surrey Campus

2026-05-27T09:30

Nebius在萨里郡Ark的Longcross园区扩建AI基础设施，填充LP01机房以满足高密度GPU就绪容量的增长需求。

Nebius在Ark的Surrey园区扩建AI基础设施，填充LP01机房

Data Centre Magazine AI 算力数据中心行业动态

3 @GoogleDeepMind: RT @mseyed: Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini 🚀 Today, we’re sharing the @GoogleDeepMind white paper for…

2026-05-27T09:04

GoogleDeepMind发布Gemini Embedding 2原生多模态嵌入模型白皮书。该模型能够处理文本、图像等多种模态数据，提升检索与生成任务性能。

GoogleDeepMind发布Gemini Embedding 2多模态嵌入模型
该模型原生支持多种数据模态

@GoogleDeepMind ↗ X AI 行业研究

3 开源通信 | “脱颖而出”（八十八）韬（τ）定律：光、液冷、国产AI算力迎“基本面+估值”的戴维斯双击

2026-05-27T09:04

华为提出τ定律，可在成熟制程通过压缩时延、逻辑折叠实现性能突破，无需依赖EUV。该技术利好光互联、液冷及国产AI算力，光模块需求上调，CPO产业加速；液冷进入放量元年，未来算力中心将标配；国产AI算力绕过先进制程封锁，昇腾950/990基于成熟制程，2027年国产算力需求大幅增长。

华为提出τ定律，可在成熟制程实现性能突破，无需EUV
光互联成趋势，光模块需求上调，CPO产业加速
液冷进入放量元年，未来新建算力中心将标配液冷

Alpha 派 AI 半导体算力动态

3 Exclusive: Demis Hassabis on AGI, curing diseases with AI

2026-05-27T09:00

The Rundown独家采访Google DeepMind CEO Demis Hassabis。Hassabis表示通用人工智能（AGI）有望在2030年左右实现，并讨论了AI在药物发现和疾病治愈方面的应用前景。

Hassabis认为AGI有望在2030年实现。
Hassabis讨论了AI在药物发现中的作用。

The Rundown AI AI 行业动态

3 西部郑宏达｜CPU：X86和ARM

2026-05-27T08:06

PC和服务器CPU市场中x86份额占主导但ARM逐年提升。3纳米产能紧缺导致代工价格上涨10%-15%，CPU从25Q4开始涨价，26Q2高端服务器CPU供需缺口放大。AI Agent和机柜方案推动CPU需求增长，国产CPU有望在开放市场获增量。

PC CPU年出货2.5-3亿颗，x86占近90%
3纳米产能紧缺致代工价涨10%-15%，25Q4起CPU涨价
26Q2高端服务器CPU供需缺口放大

Alpha 派行业半导体 AI 数据中心算力

3 @jukan05: [Exclusive] NVIDIA's "Rubin CPX" Launch in Doubt… No Memory or Substrate Orders The launch of NVIDIA's inference GPU "Rubin CPX" has become...

2026-05-27T07:32

据独家消息，NVIDIA的推理GPU“Rubin CPX”发布存疑，公司未订购相关内存和基板，行业视该项目已取消。此前NVIDIA计划今年下半年发布，采用128GB GDDR7内存，但无进展。

NVIDIA未订购Rubin CPX所需内存和基板
行业视Rubin CPX项目已取消
NVIDIA计划使用的GDDR7内存无进展

Jukan ↗ X 行业 AI 半导体

3 Building self-improving tax agents with Codex

2026-05-27T07:00

OpenAI联合Thrive和Crete，利用Codex构建自我改进的税务代理系统，实现自动税务申报，提升准确性并加速工作流程。

OpenAI与Thrive、Crete合作开发基于Codex的税务代理
该代理可自动完成税务申报并自我改进

OpenAI News AI 行业

3 @lqiao: We just hit a major milestone — @FireworksAI_HQ passed $800M annualized run rate and reached 4x revenue growth, apart from Cursor, in Q1. ...

2026-05-27T05:15

Fireworks AI创始人宣布公司年化运行率突破8亿美元，第一季度收入同比增长4倍（不含Cursor业务），并正在招聘人才。

Fireworks AI年化运行率突破8亿美元
第一季度收入同比增长4倍（排除Cursor）

Lin Qiao ↗ X AI 行业动态

3 @jukan05: - China's largest passive component maker, Fenghua Advanced Technology, has suspended order intake across all 0402/0603-size chip resistors ...

2026-05-27T04:54

中国最大被动元件厂商风华高科因订单激增，暂停接受0402/0603尺寸片式电阻和MLCC订单，产能利用率已达90%。供应链将此举归因于预防性采购和短缺担忧，行业预期可能开启涨价周期。银价上涨推升成本，高端MLCC短缺加剧，Murata、三星电机等厂商产能利用率超90%。

风华高科暂停接受0402/0603尺寸片式电阻和MLCC订单
订单激增导致未交付订单远超产能，利用率达90%
银价上涨推升片式电阻成本，高端MLCC短缺预计加剧

Jukan ↗ X 行业 AI 半导体消费

3 [AINews] New AI Infra decacorns: Fireworks, Baseten (with OpenRouter on the way)

2026-05-27T03:33

AI基础设施领域出现新独角兽，Fireworks和Baseten成为独角兽，OpenRouter也在接近独角兽地位。

Fireworks和Baseten成为AI基础设施独角兽
OpenRouter正在成为独角兽的路上

Latent Space AI 行业动态

3 @jukan05: Copper crunch hits components cost amid AI demand surge Tight upstream copper concentrate supply has kept prices high despite rising exchan...

2026-05-27T03:26

上游铜精矿供应紧张导致铜价持续走高，尽管交易所库存增加。2026年4-5月，LME铜现货均价约12,891美元/吨，5月13日盘中升至14,097美元/吨。上游供应商将材料成本完全与市场挂钩，并削减低利润产品，以保护毛利率。PCB和被动元件制造商面临成本压力，供应商已实施两位数提价，并可能在2026年下半年再次提价。

2026年4-5月LME铜现货均价约12,891美元/吨，5月13日盘中升至14,097美元/吨
上游供应商将材料成本与市场波动挂钩，增加加工费调整并削减低利润产品
被动元件和PCB制造商面临成本压力，供应商已实施两位数提价

Jukan ↗ X 行业 AI 消费美股港股

3 @SemiAnalysis_: The next-gen Cerebras CS4 is staying on 5nm. Why? Because going to 3nm doesn't magically fix the fact that SRAM scaling has completely flatt...

2026-05-27T03:00

Cerebras下一代晶圆级芯片CS4仍采用5nm制程，原因是SRAM缩放已基本停滞，即使采用3nm也无法解决，揭示了AI芯片设计中SRAM扩展的瓶颈。

Cerebras CS4 下一代芯片仍采用 5nm 制程
SRAM 缩放已完全停滞，3nm 无法解决该问题

@SemiAnalysis_ ↗ X 行业 AI 半导体

3 @ClementDelangue: RT @AdinaYakup: MiniCPM5-1B is an impressive release in the 1B class! @OpenBMB https://t.co/1JwnRUYeEW ✨ 1B - Apache 2.0 ✨ Hybrid reason…

2026-05-27T00:29

开放团队发布MiniCPM5-1B模型，采用Apache 2.0许可证，支持混合推理能力。该模型参数规模为1B，适用于轻量级部署。

MiniCPM5-1B模型发布
采用Apache 2.0开源许可证
支持混合推理能力

@ClementDelangue ↗ X AI 行业动态

3 @ClementDelangue: RT @PrismML: Today we’re releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-quality…

2026-05-27T00:26

PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 图像生成模型，该系列模型旨在高质量运行。

PrismML 发布 1-bit 图像生成模型
PrismML 发布 Ternary Bonsai Image 4B 模型

@ClementDelangue ↗ X AI 行业

3 Warp’s big bet on building open source with GPT-5.5

2026-05-27T00:00

Warp利用GPT-5.5及OpenAI模型，在本地、云端和开源开发工作流中协调编程代理，推动AI辅助开发。

Warp使用GPT-5.5协调编程代理

OpenAI News AI 行业动态

3 Election information and safeguards in 2026

2026-05-27T00:00

OpenAI宣布在2026年全球选举前，将帮助人们获取信息、支持网络防御者并提高AI透明度，以应对选举中的虚假信息和网络安全挑战。

OpenAI在2026年全球选举前提供信息获取帮助
OpenAI支持网络防御者并提高AI透明度

OpenAI News AI 宏观

3 The pressure

2026-05-26T23:48

curl项目面临AI辅助安全报告激增，报告数量是2024年的4-5倍，质量显著提高，团队工作压力空前，但漏洞严重性多为低或中等。

安全报告数量是2024年的4-5倍
报告质量前所未有地高
curl漏洞严重性多为低或中等

Simon Willison AI 行业动态

4 @jukan05: SK Hynix Effectively Rebuffs US Big Tech's Offers of Tens of Billions of Dollars in Investment Support US big tech companies—Google parent ...

2026-05-26T23:45

SK海力士拒绝了Alphabet、微软、Meta等美国科技巨头数十亿美元的投资支持，原因是担心接受投资会带来独家供应义务，影响其超供应商地位。目前SK海力士在HBM市场与三星形成双寡头，今年产能已售罄。

SK海力士拒绝Alphabet、微软、Meta数十亿美元投资支持
拒绝原因是担忧独家供应义务影响超供应商地位
SK海力士HBM今年产能已售罄，与三星形成双寡头

Jukan ↗ X 行业公司半导体 AI 美股

3 @jukan05: Exclusive: TSMC’s 3nm prices said to rise 15% in the second half; another 10% hike possible next year. C.C. Wei expected to “make things cle...

2026-05-26T23:37

独家消息称台积电3nm制程报价下半年上涨15%，明年可能再涨10%，CEO魏哲家预计将在股东会上说明具体情况。

台积电3nm价格下半年上涨15%
台积电3nm明年可能再涨10%
CEO将在股东会说明价格调整

Jukan ↗ X 行业半导体 AI 动态

3 @SemiAnalysis_: PDOOM ALERT 🚨 : ~48% of e2e LLM latency is prefill, ~52% is decode. Prefill itself breaks into 2 ops: 🟠 Prefill extend (cache write) — inge...

2026-05-26T23:00

Semianalysis发布LLM推理延迟分析：端到端延迟中prefill占48%，decode占52%；prefill又分为prefill extend（缓写入）和cache read（缓存读取）。

LLM端到端延迟中prefill占48%
LLM端到端延迟中decode占52%
Prefill分为prefill extend和cache read

@SemiAnalysis_ ↗ X AI 算力

3 DuckDuckGo installs are up 30% as users reject being ‘force-fed’ Google’s AI Search

2026-05-26T22:32

Google在I/O 2026上改革搜索，用AI代理替换蓝色链接，引发用户不满，导致隐私搜索引擎DuckDuckGo安装量激增30%。

Google在I/O 2026上用AI代理替换蓝色链接
DuckDuckGo安装量因用户反对而增长30%

TechCrunch AI 行业动态 AI