清除 当前 18 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 13 小时前 微信公众号 · DeepTech深科技 · 4 天 13 小时前 微信公众号 · Founder Park · 4 天 13 小时前 微信公众号 · FundaAI · 4 天 13 小时前 微信公众号 · 九章智驾 · 4 天 13 小时前 微信公众号 · 晚点LatePost · 4 天 13 小时前 微信公众号 · 琢磨事 · 4 天 13 小时前 微信公众号 · 甲子光年 · 4 天 13 小时前

SemiAnalysis发布Intel Xeon芯片生命周期,涉及爱尔兰、亚利桑那、以色列、新墨西哥、哥斯达黎加、成都等多地制造与测试,强调供应链不依赖台湾。

  • Xeon计算片在爱尔兰和亚利桑那制造
  • EMIB先进封装在新墨西哥州
  • 最终组装在哥斯达黎加,测试在成都

Cerebras下一代晶圆级芯片CS4仍采用5nm制程,原因是SRAM缩放已基本停滞,即使采用3nm也无法解决,揭示了AI芯片设计中SRAM扩展的瓶颈。

  • Cerebras CS4 下一代芯片仍采用 5nm 制程
  • SRAM 缩放已完全停滞,3nm 无法解决该问题

Cerebras公司宣称其单晶圆方案相当于整个NVL72机架,通过绕开缺陷并保持在芯片上,规避了传统GPU集群面临的网络功耗瓶颈。

  • Cerebras单晶圆方案相当于NVL72机架
  • 该方案通过绕开缺陷实现片内互联,绕过网络功耗瓶颈

摩根士丹利发布NVL72 BoM分析,指出内存价值不含HBM;Nvidia对内存加价;PCB因无缆设计面积和材料升级;BoM价格为OEM渠道价格,超大规模云和Neocloud成本更低。

  • NVL72 BoM中内存成本不含HBM,HBM计入GPU项
  • Nvidia对采购内存加价,供应商收入低于BoM显示
  • PCB内容因无缆设计导致面积和材料升级

ADI首席技术官Mishek Musa在访谈中介绍公司将大型模型蒸馏到边缘设备,并设立机器人社区物理排行榜,涉及多模态触觉传感器、数据中心自动化维护、开源机器人基准及系统级产品策略。

  • ADI正在将推理缩小到边缘设备
  • ADI为机器人社区建立物理排行榜
  • ADI采用多模态触觉传感器

AMD MI355在GLM5架构下单节点FP8推理比NVIDIA B200便宜40%,该信息于GLM5初始发布14周后披露,支持SGLang v0.12的CUDA和ROCm环境。

  • AMD MI355比NVIDIA B200便宜40%
  • 适用于GLM5架构的单节点FP8推理
  • 支持SGLang v0.12的CUDA和ROCm

《Stop Stealing our Chips Act》可能成为法律,该法案奖励举报出口管制违规行为,奖金为违规罚款金额的10-30%,资金来自出口合规问责基金。

  • 法案可能成为法律
  • 奖励举报出口管制违规者
  • 奖金为罚款的10-30%

AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。

  • AMD向vLLM/SGLang维护者提供MI355X集群持续访问
  • 此前仅有NVIDIA提供类似开发集群访问

SemiAnalysis指出,随着伊朗战争持续,半导体供应链中一种非常隐蔽的原料——石脑油(Naphtha)可能成为AI芯片的潜在制约因素。该推文引发关注,但尚未提供具体数据或细节。

  • 伊朗战争持续,可能影响半导体供应链中的石脑油供应
  • 石脑油是AI芯片制造中的一种原料
  • SemiAnalysis认为石脑油可能成为AI芯片的潜在约束

AMD ROCm软件栈在DeepSeekv4发布后14天内性能提升超75倍,通过融合mHC操作和RoPE Hadamard变换降低CPU开销并提高HBM利用率。此外,使用TileLang和Triton编写注意力索引器和KVCache压缩器以加快开发速度。未来目标:再提升5倍以匹敌单节点B200,再提升1.5倍以匹敌PD分离式B200。

  • AMD ROCm软件栈14天内性能提升超75倍
  • 改进包括融合mHC操作和RoPE Hadamard变换
  • 目标:再提5倍追平单节点B200,再提1.5倍追平PD分离式B200

美光(Micron)今年早些时候宣布收购PSMC位于台湾苗栗的P5铜锣厂,该过程现已正式开始。该收购最初看似传统的逻辑/存储晶圆厂收购,但细节值得关注。

  • 美光宣布收购PSMC的P5铜锣厂
  • 收购过程已正式开始

2025年底,Chipbook团队关注高端AI加速器封装测试重要性提升,于12月23日指出两家关键测试耗材公司:台湾Winway和韩国ISC。

  • Chipbook团队在2025年底关注测试受益于AI封装。
  • 12月23日指出Winway和ISC为关键测试耗材公司。

NVIDIA开源了cuDNN中的超过20个MoE内核和NSA稀疏注意力内核,结束了其12年的闭源状态。此举旨在推动开放内核创新。

  • cuDNN部分代码开源,包括MoE和NSA稀疏注意力内核
  • 开源的内核数量超过20个
  • NVIDIA称开源内核有助于驱动创新

SemiAnalysis指出常见误解:TPU v8i并非训练芯片,而是推理芯片。v8i配备8组HBM3E 12-Hi显存,共288GB,带宽8.6 TB/s,而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM,v8t为128MB。FP4算力上,v8i为10.1 PFLOPs,v8t为12.6 PFLOPs。

  • TPU v8i配备8组HBM3E 12-Hi,共288GB显存,带宽8.6 TB/s
  • TPU v8t配备6组HBM3E,共216GB显存,带宽6.5 TB/s
  • TPU v8i的FP4算力为10.1 PFLOPs,v8t为12.6 PFLOPs

半导体分析机构SemiAnalysis指出,硅晶圆平均售价正在回升。外延片供应紧张,先进逻辑(7nm及以下)晶圆需求预计在2028年达到近100万片/月,占300mm当量总需求的10%。GlobalWafers、SUMCO、信越化学和Siltronics等主要晶圆制造商有望受益于AI基础设施周期。

  • 外延片供需平衡收紧速度快于预期
  • 7nm及以下逻辑晶圆需求预计2028年达近100万片/月
  • 先进逻辑晶圆需求将占300mm当量总需求的10%

SemiAnalysis数据显示,台积电2026年第一季度运营利润率盈亏平衡利用率降至25%,远低于其他代工厂;同期UMC为48%,SMIC为63%。台积电ASP在2018年至1Q26年间增长2.5倍,压过了先进制程折旧的拖累。

  • 台积电2026年一季度运营利润率盈亏平衡利用率仅25%
  • UMC和SMIC的盈亏平衡利用率分别为48%和63%
  • 台积电2018年至1Q26年每片晶圆均价增长2.5倍

在DeepSeekv4 Pro 1.6T模型上,GB300 NVL72搭配SGLang disaggregation和DeepSeek MegaMoe kernels,性能比B200提升6.5倍。该成果由Radix Ark、LMSYS Org、NVIDIA AI、CoreWeave等团队协作实现。

  • GB300 NVL72在DeepSeekv4 Pro 1.6T上性能比B200提升6.5倍
  • 高性能配置使用DeepSeek MegaMoe内核完全融合GEMM和EP操作
  • Radix Ark、LMSYS Org、NVIDIA AI和CoreWeave等团队参与优化

三星工会集会已导致内存产线下降18.4%,代工产线下降58.1%。工会威胁从5月21日起罢工18天,要求三星支付约45万亿韩元奖金。代工线因自动化程度低,产出受更大影响。

  • 三星工会集会致内存产线下降18.4%,代工产线下降58.1%
  • 工会威胁自5月21日起罢工18天,要求45万亿韩元奖金