SemiAnalysis研究指出,在ERCOT地区,AI运营商的数据中心互连请求与电网实际核准能力之间存在巨大差距,反映了电力危机中供需不匹配。
SemiAnalysis发布Intel Xeon芯片生命周期,涉及爱尔兰、亚利桑那、以色列、新墨西哥、哥斯达黎加、成都等多地制造与测试,强调供应链不依赖台湾。
SemiAnalysis发推称,在Cerebras上运行深度编码模型需24个系统(2400万美元资本支出)仅支持256并发用户,而同等资金下标准GB300机架能提供更多内存带宽。
SemiAnalysis发布深度报告,预计到2030年800VDC供电技术将推动约39GW的新增数据中心容量,并分析了该技术的渗透率、市场机会及挑战。
据SemiAnalysis报告,Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升,显示出更强的运营杠杆。与同行相比,AWS在Bedrock和Anthropic交易中表现出优势。
Cerebras下一代晶圆级芯片CS4仍采用5nm制程,原因是SRAM缩放已基本停滞,即使采用3nm也无法解决,揭示了AI芯片设计中SRAM扩展的瓶颈。
据SemiAnalysis观点,Meta将70%的新毕业软件工程师重新分配至强化学习任务,体现公司对RL方向的资源倾斜。
@SemiAnalysis发布报告称,数据中心正从传统供电架构向800V直流电(800VDC)转型,该技术可提升能效并降低成本。报告第一部分探讨了四阶段过渡、电源机架经济性、固态变压器(SST)及每兆瓦设备含量变化,并分析了供应商影响。
Cerebras公司宣称其单晶圆方案相当于整个NVL72机架,通过绕开缺陷并保持在芯片上,规避了传统GPU集群面临的网络功耗瓶颈。
SemiAnalysis指出,现场天然气已不再是边缘选择,而是悄然成为美国下一代AI训练集群的默认规划假设。
摩根士丹利发布NVL72 BoM分析,指出内存价值不含HBM;Nvidia对内存加价;PCB因无缆设计面积和材料升级;BoM价格为OEM渠道价格,超大规模云和Neocloud成本更低。
Google为开源生产Kubernetes分布式推理工具llm-d添加了夜间CI。TPU在llm-d的CI和代码质量上正在追赶NVIDIA。AMD尚未将其GPU或NIC加入该CI。
SpaceX正式提交S1文件(IPO注册声明),启动上市流程。SemiAnalysis的研究报告被引用。
ADI首席技术官Mishek Musa在访谈中介绍公司将大型模型蒸馏到边缘设备,并设立机器人社区物理排行榜,涉及多模态触觉传感器、数据中心自动化维护、开源机器人基准及系统级产品策略。
AMD MI355在GLM5架构下单节点FP8推理比NVIDIA B200便宜40%,该信息于GLM5初始发布14周后披露,支持SGLang v0.12的CUDA和ROCm环境。
《Stop Stealing our Chips Act》可能成为法律,该法案奖励举报出口管制违规行为,奖金为违规罚款金额的10-30%,资金来自出口合规问责基金。
来源:twitter
发布时间:2026-05-17T17:15:04+00:00
This week, the company has been trying out all types of different AI tools including Devin, Mistral, Grok, Perplexity, Cerebras Public API, etc in addition to the typical Claude & ChatGPT/Codex tools. Most of them we will probably churn from very rapidly as it has negative value add, but one tool that has been shocking better than Claude is @AravSrinivas '
黄仁勋在斯坦福大学演讲中表示,他希望始终维持低模型浮点利用率(MFU),通过过度配置算力、网络和内存等资源来实现更高智能,并暗示xAI可能遵循此策略。
AMD首次向英伟达开源项目AIPerf贡献代码,该仓库专注于LLM工作负载基准测试。此贡献被视为开源社区的重要进展,有望推动厂商无关的高质量代码发展。
DeepSeek发布V4版本,引入MegaMoE技术,这是一个1400行的融合CUDA内核,用于计算整个MoE前向传播。
Cerebras IPO首日涨幅达90%,此外推文还提及特朗普访华期间无人机警察追逐福克斯新闻记者的事件。
谷歌在Google Cloud Next大会上发布新型推理专用TPU,采用名为Broadfly的新型网络拓扑。利用高基数设计,单pod最多可扩展到1152个TPU,相比Ironwood,pod大小提升4.5倍,网络直径减小,任意两个芯片间最多7跳。
AMD为vLLM和SGLang开源维护者提供价值360万美元的MI355X互联开发集群的持续访问权限,此前只有NVIDIA提供此类访问。
SGL Project和Radixark团队优化了DeepSeek V4在B200和B300上的推理性能,并在GB300上实现了4倍交互吞吐量提升。
数据中心开发商越来越多地在县级非建制土地上规划项目,这并非偶然。在城市范围外,他们可以绕过市议会批准、分区投票和土地使用审查,从而重塑大型AI基础设施的布局地图。
SemiAnalysis发布推文称,Anthropic在一个周三增加了200MW电力容量。该信息暗示Anthropic正在扩张算力基础设施,但未披露具体项目细节。
微软多个长期暂停的自建园区出现复苏迹象:北卡罗来纳州康诺弗园区于2026年第一季度破土动工;弗吉尼亚州蔡斯市园区同期出现施工活动;德克萨斯州卡斯特罗维尔园区在停滞一年多后也开始有早期动工迹象。
美光(Micron)今年早些时候宣布收购PSMC位于台湾苗栗的P5铜锣厂,该过程现已正式开始。该收购最初看似传统的逻辑/存储晶圆厂收购,但细节值得关注。
2025年底,Chipbook团队关注高端AI加速器封装测试重要性提升,于12月23日指出两家关键测试耗材公司:台湾Winway和韩国ISC。
AMD MI355x在SGLang上运行DeepSeekv4 Pro,自发布以来每GPU吞吐量提升超过10倍。
据推特消息,GB300 ultra NVL72在vllm推理引擎上比GB200 NVL72快2.7倍。虽然理论性能提升仅1.5倍,但通过全栈优化实现了更高实际性能。该临时样机由英伟达、Inferact和CoreWeave提供用于开源项目。
ABB电气化部门订单在2025年出现季节性模式逆转,Q4环比增长17%,2026年Q1订单创纪录超60亿美元,归因于数据中心需求,预示数据中心工业链积极前景。
原文指出在AI时代,IT机架变得更复杂,需要GPU/ASIC、液冷、高速连接等多系统协同,ODM从单纯的制造角色演变为设计、集成和量产合作伙伴,以支持多种平台和数据中心建设。
半导体分析机构SemiAnalysis指出,硅晶圆平均售价正在回升。外延片供应紧张,先进逻辑(7nm及以下)晶圆需求预计在2028年达到近100万片/月,占300mm当量总需求的10%。GlobalWafers、SUMCO、信越化学和Siltronics等主要晶圆制造商有望受益于AI基础设施周期。
SemiAnalysis数据显示,台积电2026年第一季度运营利润率盈亏平衡利用率降至25%,远低于其他代工厂;同期UMC为48%,SMIC为63%。台积电ASP在2018年至1Q26年间增长2.5倍,压过了先进制程折旧的拖累。
三星工会集会已导致内存产线下降18.4%,代工产线下降58.1%。工会威胁从5月21日起罢工18天,要求三星支付约45万亿韩元奖金。代工线因自动化程度低,产出受更大影响。
DeepSeek v4 Pro发布不到一周,vllm_project和inferact团队通过vLLM 0.20.0版本中的MegaMoE内核,在GB200平台上实现了显著性能改进。