华为SkyBridge芯片设计技术通过利用顶层金属层低电阻,折叠并连接关键数据路径,实现创新堆叠方式,不同于传统芯片堆叠。
华为提出Tau(τ)缩放定律,作为指导半导体行业未来发展的新原则,有望对芯片设计和制造产生深远影响。
英伟达、AMD、英特尔等AI芯片大厂对嵌入式基板技术兴趣增长,该技术可改善信号完整性和功率稳定性。日本Ibiden、韩国三星电机、台湾欣兴、景硕和南电等供应商正加大嵌入式基板开发投资,但大规模采用仍处早期阶段。
华为宣布找到新路径,有望在不使用尖端设备的情况下实现先进半导体突破,缩短与台积电的差距;同时,今年秋季发布的Kirin手机芯片性能将显著提升。
长江存储完成IPO辅导备案,长鑫存储将于5月27日上市审核;京东方与康宁签署框架协议。AMD将服务器CPU长期市场空间指引翻倍至1200亿美元,英伟达预计2026年CPU收入达200亿美元。TI年内四次涨价,海外FPGA涨价且交货周期超40周。大摩预测GB300用MLCC价值量涨182%,今年高容MLCC供需缺口10%-20%;玻璃基板预计2026年量产,2030年市场规模约200亿美元;AI服务器PCB相关市场规模今年预计300亿、明年600亿,CCL价格有望突破上一轮高点。
Cerebras公司宣称其单晶圆方案相当于整个NVL72机架,通过绕开缺陷并保持在芯片上,规避了传统GPU集群面临的网络功耗瓶颈。
英伟达上调GPU出货及营收指引,谷歌发布第八代TPU,月处理token3200万亿(同比增700%),Gemini月活9亿,三季度或加单1.6T光模块;台积电CPO技术下半年量产,明年CPO出货量预计30万台;国内互联网厂商上调资本开支,国产算力需求提升,光芯片未来四年紧缺,液冷今年进入订单交付阶段。
AI算力需求持续高景气,CPU受推理及Agentic AI拉动需求激增,供需偏紧导致涨价持续。AI服务器MLCC用量是普通产品数倍,2025年占行业产能超10%,龙头厂商稼动率近满负荷并已开启双位数涨价,国产厂商订单外溢受益。
被动组件分销商Nichidenbo指出,AI服务器需求导致高规格MLCC、大尺寸电解电容等交期从1.5-2个月延长至3-4个月,部分达6个月以上。日韩供应商已停止接受新订单,保守产能扩张加剧供应紧张。预计2026年MLCC需求同比增长11%,电容器需求进一步增长30%。
OpenAI宣布与巴西媒体集团Grupo Folha和Grupo UOL达成战略内容合作,将可信的巴西新闻引入ChatGPT,并确保内容的归属和透明度,扩大新闻访问范围。
datasette-agent 0.1a4 发布,利用 Datasette 1.0a30 的新 JavaScript 插件钩子 makeJumpSections(),在 Jump 菜单中新增“Start a new agent chat”界面。用户可通过 GitHub 账号登录 agent.datasette.io 试用。
LongCat 发布开源 talking-avatar 模型,采用 MIT 许可证,据称可能达到最先进水平(SOTA)。
HuggingFace转发推文称,llama.cpp增加MTP支持后,Qwen3.6-27B密集生成模型在本地运行速度足够作为日常使用。推文获122点赞、12转发、11回复、9051次浏览。
Hugging Face 创始人分享数据:30万 AI 开发者已填写硬件配置文件,并公布了结果。
llama.cpp 新增 MTP 支持,使本地模型运行速度显著提升。在 A10G 上,Qwen3.6-27B 密集生成速度从 25 tok/s 提升至 45 tok/s,增幅达 78%。
YC S26延长申请截止日期至明天,附带OpenAI提供的200万美元offer,但该offer作为实验项目,不确定是否会再次提供。
GStack 项目在 GitHub 上获得超过 10 万颗星,数万人使用该工具提升代理编码能力。
推文介绍Nvidia Tensor Cores通过systolic arrays大幅提升芯片吞吐量,并附有解释链接。
Hugging Face 宣布 30 万 AI 构建者填写了硬件资料,并分享调查结果。该公司表示期待未来几个月本地 AI 的发展。
Garry Tan发布推文称,使用Thinking Machines平台在几小时内微调了Qwen3.5-397B模型,并称赞其快速可用。
Perplexity公司开源了其内部用于保障开发者安全的工具Bumblebee。
推特讨论HBF技术主要适用于读取密集型高容量数据,并指出随着模型规模增长,HBF可能有用。同时提到英伟达当前策略是扩大scale-up域规模至144/576/1152,将权重存储在大域中,并通过STX将KV缓存卸载到SSD。
据推特爆料,英伟达在GIDS方案中考虑使用高可靠性、高速度的NAND(如200M IOPS),而非HBF。HBF因写入寿命短不适合KV缓存等重写任务,可能仅用于存储权重。若采用,架构或为8 HBM堆栈加4 HBF堆栈。
重定时器(retimer)作为AI芯片时代隐藏核心组件,用于恢复芯片间因高速传输而衰减的信号。随着PCIe 5.0速率达32 GT/s,信号完整传输距离极短,retimer比redriver能完全恢复信号。PCIe代际升级使速度更快,信号传输距离缩短,驱动retimer需求指数增长。
Jukan05辟谣TrendForce关于NVIDIA使用HBF的报道,称其是假新闻,实际NVIDIA为GIDS考虑高可靠性高速NAND。
有消息称英伟达计划在其下一代Vera Rubin AI GPU中实现GPU-Direct Storage与HBF技术,旨在提升数据访问效率。
Hugging Face发布名为LeRobotHF的人形机器人,成本约2500美元,提供完整开源硬件和软件堆栈。
研究人员发布SEGA工作,提出频谱能量引导注意力方法用于扩散模型分辨率外推。
美国艺术与科学院(American Academy of Arts and Sciences)的《Daedalus》期刊出版了由James Manyika编辑的AI与科学特刊。
SemiAnalysis指出,现场天然气已不再是边缘选择,而是悄然成为美国下一代AI训练集群的默认规划假设。
隔夜美股纳指上涨,费城半导体指数涨2%领涨。美联储理事沃勒称不排除进一步加息,市场预期年底前加息概率100%。AI半导体板块内部分化,模拟芯片、CPU等创新高,但Nvidia等未跟随。Dell涨17%受AI服务器需求推动,AMD涨4%,Nokia涨9%。800V电源管理芯片走强,Apple涨1.3%受WWDC预期提振。
Replit Agent负责构建应用,Squidler模拟真实用户测试,Replit Agent修复问题,形成完整的AI QA循环。
RWKV-7 G1g模型发布,声称是世界最好的纯RNN大语言模型,在一般LLM中具有竞争力。
GBrain最新版本支持合成回答功能,可针对特定问题生成答案,并进行了GBrain搜索与思考的AB测试,产品持续迭代。
在 LLMs-from-scratch 仓库中新增了 DeepSeek Sparse Attention (DSA) 的从头实现,包含动机、概述和 GPT 风格模型参考实现,作为独立示例代码。
法拉利车队与IBM合作,利用AI技术重新定义F1粉丝体验,旨在创造超级粉丝。
网友Gavin Baker在推文中讨论称,Anthropic在2026年第一季度实现息税前利润(EBIT)转正,这一点在AI投资回报率辩论中未得到充分重视。此外还提及对SpaceX、Nvidia的讨论以及特朗普访华的影响。
SemiAnalysis指出,在现代agentic编码中,42%的时间花费在CPU上进行工具使用,例如编辑文件、运行命令等。
据分析,现代代理编码中42%的时间用于CPU进行工具使用。传统云计算按CPU核心收费,而代理经济按token收费,为增加token收入,需增加CPU算力。
公用事业公司正围绕大型AI训练园区规划,但分布式推理工作负载可能改变未来电力需求的地点和方式,现有电网未完全准备好应对AI带来的电力需求增长。
据TechCrunch报道,马斯克旗下的xAI已全面转向天然气,SpaceX专注于轨道数据中心,此前承诺的太阳能经济愿景被淡化。
英伟达CEO突访台北Meet-a-Claw活动,开发者现场实操自主智能体,并宣布NVIDIA GTC周正式启动。
分析师预测HBM晶圆产能将从2025年底的390k wpm增至2026年底的500k及2027年底的960k,认为行业预期2027年底达1M wpm过于激进。
黄仁勋称Vera Rubin架构将成为迄今最成功的一代,希望超微电脑加强合规并持续增长;指出AI将影响所有行业,内存价格上涨成为客户挑战,希望供应商快速扩产。
根据预测,台积电CoWoS产能到2027年底将达到每月21万片(WPM),反映了先进封装技术的持续扩展。
英伟达CEO黄仁勋抵达台北,为即将在COMPUTEX 2026上举办的NVIDIA GTC大会预热。
日本Nittobo因AI服务器需求导致高端低热膨胀玻璃纤维短缺,但决定不涨价,专注扩产保市场份额。公司将加速在日本福岛和台湾的产线扩张,以满足T-glass厚布和薄布的超预期需求。
据 Twitter 用户 @jukan05 称,Agentic AI CPU 服务器所需内存容量是通用服务器的 4 倍。该观点获得 643 次点赞,反映业内对 AI 服务器高内存需求的关注。
行业趋势显示AI模型公司正转向智能体产品。OpenAI的Greg表示模型不再是产品,需结合智能体;AI21关闭模型团队,全面转向智能体;DeepSeek首次建立‘Harness团队’。这表明模型质量不再是护城河,产品竞争转向模型、智能体、工作流、UI、记忆和经济的综合考量。
一家全球大型电商公司采用Runway AI工具,实现75%视觉媒体由AI生成,大幅降低成本:原80万美元项目现不到1万美元,每个产品拍摄节省3万美元,年度生产预算从500-600万美元转向AI。