SemiAnalysis发布Intel Xeon芯片生命周期,涉及爱尔兰、亚利桑那、以色列、新墨西哥、哥斯达黎加、成都等多地制造与测试,强调供应链不依赖台湾。
Cerebras下一代晶圆级芯片CS4仍采用5nm制程,原因是SRAM缩放已基本停滞,即使采用3nm也无法解决,揭示了AI芯片设计中SRAM扩展的瓶颈。
Cerebras公司宣称其单晶圆方案相当于整个NVL72机架,通过绕开缺陷并保持在芯片上,规避了传统GPU集群面临的网络功耗瓶颈。
摩根士丹利发布NVL72 BoM分析,指出内存价值不含HBM;Nvidia对内存加价;PCB因无缆设计面积和材料升级;BoM价格为OEM渠道价格,超大规模云和Neocloud成本更低。
ADI首席技术官Mishek Musa在访谈中介绍公司将大型模型蒸馏到边缘设备,并设立机器人社区物理排行榜,涉及多模态触觉传感器、数据中心自动化维护、开源机器人基准及系统级产品策略。
AMD MI355在GLM5架构下单节点FP8推理比NVIDIA B200便宜40%,该信息于GLM5初始发布14周后披露,支持SGLang v0.12的CUDA和ROCm环境。
《Stop Stealing our Chips Act》可能成为法律,该法案奖励举报出口管制违规行为,奖金为违规罚款金额的10-30%,资金来自出口合规问责基金。
AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。
SemiAnalysis指出,随着伊朗战争持续,半导体供应链中一种非常隐蔽的原料——石脑油(Naphtha)可能成为AI芯片的潜在制约因素。该推文引发关注,但尚未提供具体数据或细节。
AMD ROCm软件栈在DeepSeekv4发布后14天内性能提升超75倍,通过融合mHC操作和RoPE Hadamard变换降低CPU开销并提高HBM利用率。此外,使用TileLang和Triton编写注意力索引器和KVCache压缩器以加快开发速度。未来目标:再提升5倍以匹敌单节点B200,再提升1.5倍以匹敌PD分离式B200。
美光(Micron)今年早些时候宣布收购PSMC位于台湾苗栗的P5铜锣厂,该过程现已正式开始。该收购最初看似传统的逻辑/存储晶圆厂收购,但细节值得关注。
2025年底,Chipbook团队关注高端AI加速器封装测试重要性提升,于12月23日指出两家关键测试耗材公司:台湾Winway和韩国ISC。
NVIDIA开源了cuDNN中的超过20个MoE内核和NSA稀疏注意力内核,结束了其12年的闭源状态。此举旨在推动开放内核创新。
SemiAnalysis指出常见误解:TPU v8i并非训练芯片,而是推理芯片。v8i配备8组HBM3E 12-Hi显存,共288GB,带宽8.6 TB/s,而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM,v8t为128MB。FP4算力上,v8i为10.1 PFLOPs,v8t为12.6 PFLOPs。
半导体分析机构SemiAnalysis指出,硅晶圆平均售价正在回升。外延片供应紧张,先进逻辑(7nm及以下)晶圆需求预计在2028年达到近100万片/月,占300mm当量总需求的10%。GlobalWafers、SUMCO、信越化学和Siltronics等主要晶圆制造商有望受益于AI基础设施周期。
SemiAnalysis数据显示,台积电2026年第一季度运营利润率盈亏平衡利用率降至25%,远低于其他代工厂;同期UMC为48%,SMIC为63%。台积电ASP在2018年至1Q26年间增长2.5倍,压过了先进制程折旧的拖累。
在DeepSeekv4 Pro 1.6T模型上,GB300 NVL72搭配SGLang disaggregation和DeepSeek MegaMoe kernels,性能比B200提升6.5倍。该成果由Radix Ark、LMSYS Org、NVIDIA AI、CoreWeave等团队协作实现。
三星工会集会已导致内存产线下降18.4%,代工产线下降58.1%。工会威胁从5月21日起罢工18天,要求三星支付约45万亿韩元奖金。代工线因自动化程度低,产出受更大影响。