北美科技巨头在Q1财报季密集上调2026年资本开支指引,合计规模超6500亿美元,创纪录的AI云服务订单验证企业级AI需求爆发。
川环科技于5月2日披露进展,公司成功填补3-4寸大管径液冷软管国产空白,其独家研发的膨胀接头计划于5至6月向H客户实现大批量交付。该进展表明公司产品线正由单一软管向高价值总成方案升级,相关技术突破已获得关键客户验证,标志着其在AI液冷零部件领域的产业化进程取得实质性进展。
5月1日,DeepSeek在GitHub开源多模态模型并同步发布技术报告。该模型引入视觉原语框架以补齐单模态短板,官方宣称其性能超越GPT-5.4。此外,云天励飞AI芯片平台已宣布完成与该模型的适配工作。此次发布标志着该公司技术路线向全模态方向拓展。
本文汇总近期AI与半导体产业链动态:DeepSeekV4确认与华为昇腾等国产芯片深度适配;北美科技巨头合计上调2026年资本开支指引超6500亿美元;闪迪新商业模式锁定超三分之一2027财年产能;日月光投控将全年先进封装营收目标上修至35亿美元以上。
4月24日DeepSeekV4正式发布,确认与华为昇腾等国产芯片实现“Day 0”级别深度协同。该适配标志着国产算力进入长上下文、低时延的规模化工程验证阶段,模型未来降价预期与下半年昇腾950超节点量产直接挂钩,推动国产算力自主生态闭环加速。
NVIDIA AI转发用户测试:在DGX Spark(128GB显存)上以q8量化运行nemotron 3 omni模型,通过Hermes Agent实现56 tok/s的推理速度。
NVIDIA发布开源安全沙盒OpenShell,旨在为企业AI代理提供安全控制,限制代理的访问、共享和发送权限,保护企业数据安全。
卡特彼勒在2025年Q1财报中披露,其数据中心发电业务同比增长41%,并将2030年大型发动机产能和发电业务营收目标从此前2倍上调至3倍(相对于2024年)。这一目标大幅上修反映了AI驱动的电力基建需求超预期。
三星SDI于2026年一季度成功签订数据中心高功率BBU电池供应合同。该订单反映全球AI算力基建对备用电源的需求正转入订单落地阶段。原文同时列举了蔚蓝锂芯、亿纬锂能、长虹能源及麦格米特在数据中心BBU电池及供电方案领域的业务布局。
4月28日,建滔积层板发布涨价函,将涨价范围扩大至主流FR-4覆铜板产品。受AI服务器需求增长及上游原材料成本上升影响,覆铜板行业景气度由高端材料向全系列产品传导。产业链相关企业订单饱满且产能利用率维持高位,部分上游铜箔等材料供应趋紧。
NVIDIA Research发布新论文,提出在NeMo-RL结合vLLM中使用推测解码加速强化学习后训练,实现8B模型吞吐量提升1.8倍,235B模型端到端加速2.5倍。
原文指出在AI时代,IT机架变得更复杂,需要GPU/ASIC、液冷、高速连接等多系统协同,ODM从单纯的制造角色演变为设计、集成和量产合作伙伴,以支持多种平台和数据中心建设。
开放计算项目(OCP)成员正推动在数据中心采用直流供电方案,以应对人工智能算力增长带来的电力需求。相关低压直流项目旨在提升服务器能效,优化数据中心电力架构,满足AI基础设施对高效供电的技术要求。
芯片设计公司AMD与加密货币矿企Riot在得克萨斯州签署额外25兆瓦数据中心租赁协议。此次签约是对双方于今年1月达成的初始租赁合同的进一步扩展,标志着双方在数据中心基础设施领域的合作持续深化。
华为官方预测,2026年其AI芯片销售收入将实现约60%的同比增长,预计总销售额将达到120亿美元。该数据为企业对外发布的财务指引,反映了其在人工智能算力硬件领域的业务规划与市场拓展预期。
海湾地区企业Taranis与EEC宣布达成合作,计划在沙特阿拉伯共同开发容量为50兆瓦的数据中心基础设施。该项目配套基金目标投资规模达20亿美元,旨在推进当地数据中心网络的建设与运营,属于中东地区算力基础设施领域的产业合作动态。
Y Combinator 播客介绍两篇递归AI模型论文:HRM和TRM。7百万参数模型在ARC Prize等任务上超越千倍参数模型,通过推理时递归扩展计算深度,以较少参数实现SOTA。
亚马逊、谷歌、Meta与微软等超大规模云厂商近期财报显示,人工智能需求增速已超过现有基础设施建设能力。各企业均指出,未来业务增长将高度依赖电力供应、芯片获取以及前所未有的资本开支投入,反映出AI算力扩张正面临基础设施瓶颈。
据行业媒体报道,Google与Anthropic已达成一项合作协议,将资本投入与5吉瓦的算力采购承诺直接绑定。该交易标志着人工智能基础设施的融资与资源分配模式发生实质性转变,算力预购规模正式迈入吉瓦级,反映出头部企业在底层算力布局上的深度协同。
近期AI行业进入快速发展期,智能体技术跨越拐点推动Token价值提升与生成成本下降。Anthropic年度经常性收入由90亿美元增至超440亿美元,推理基础设施毛利率从38%升至超70%。同时Blackwell等新一代芯片算力较前代显著提升,推理服务商利润率同步扩大,AI产业链价值正向模型实验室集中。
半导体分析机构SemiAnalysis指出,硅晶圆平均售价正在回升。外延片供应紧张,先进逻辑(7nm及以下)晶圆需求预计在2028年达到近100万片/月,占300mm当量总需求的10%。GlobalWafers、SUMCO、信越化学和Siltronics等主要晶圆制造商有望受益于AI基础设施周期。
Anthropic CEO Dario指出预测计算需求极其困难,因为每1美元收入可能需要4-5美元的前期计算投资。投资不足则无法满足需求,过度则导致设备闲置,平衡难度大。
英伟达AI宣布,SGLang在Blackwell硬件上对DeepSeek-V4推理达到180 tok/s/GPU,支持约1M上下文,该优化来自lmsysorg利用模型混合稀疏注意力的Blackwell特定优化。
震裕科技与国星宇航成立合资公司,并在4月24日成立上海子公司,切入算力卫星总成代工领域,该业务基于国星宇航的“星算”计划。
高通在2026年Q2财报中首次明确,将于今年下半年向一家超大规模云计算企业交付定制芯片,标志着其数据中心AI芯片战略从预期走向兑现。
据行业数据,AI数据中心建设对高端机床的需求已从预期转为现实,一季度及四月订单呈现数倍增长,传统淡季维持高景气。液冷核心部件加工领域需求强劲,驱动设备商业绩提升。
DeepSeekV4发布后,通过软硬件深度协同,实现了对华为昇腾、寒武纪、海光信息等主流国产芯片的Day-0原生适配,标志着国产AI产业链从硬件替代向“模型-芯片-云”自主生态质变。
北美四大云厂商在Q1财报季集体上修2026年资本开支指引至近7000亿美元,谷歌和Meta上修幅度超预期,AI相关云业务收入和积压订单爆发式增长,确认AI从训练投入向推理回报期转变,将上游硬件供应链订单能见度延伸至2027年。
4月30日市场消息显示,英伟达下一代Vera Rubin架构GPU将明确采用钻石铜复合散热方案。该方案表明AI芯片散热技术正从系统级液冷向芯片封装材料级创新延伸,金刚石散热材料进入产业化落地阶段,相关产业链技术路线进一步明确。
4月30日资讯汇总显示,DeepSeekV4已实现对华为昇腾等主流国产芯片原生适配;北美四大云厂商集体上修2026年资本开支指引至近7000亿美元;中国锂电池5月排产环比增速上修至15%;广深津等地接连发布楼市优化政策。
4月30日,智谱披露GLM-5系列模型底层工程进展。该进展聚焦解决服务侧扩展瓶颈,通过提升系统吞吐效率与优化推理成本,增强复杂Agent任务的长时运行稳定性。此次技术重心向工程效率转移,旨在改善产品单位经济模型并推动企业级应用落地。
AWS在定制AI芯片Trainium和Inferentia上取得进展,团队正在全球最大云基础设施中扩展部署这些处理器。
NVIDIA技术博客介绍了Agentic AI在地下工程中的应用,能够自动化24/7模拟循环,解决手动工作流瓶颈,提升效率。文章指出,地下行业面临数据复杂性增长与人力带宽不足的挑战,Agentic AI可加速数字演进。
随着人工智能算力需求持续增长,数据中心开发商正加速调整能源获取与建设策略。表后数据中心建设、分阶段通电以及核电布局等方案,已从边缘试点逐步转变为行业核心战略,以应对快速扩张的电力需求。
微软宣布开源Azure集成硬件安全模块(HSM)的设计,该模块集成于每台新Azure服务器,达到FIPS 140-3 Level 3标准,旨在提升云计算的安全性和透明度。相关计划在OCP EMEA峰会上公布。
2026年3月,三个LLM代理生成超60万行代码,运行850次实验,借助GPU加速赢得Kaggle playground竞赛第一名。
NVIDIA发布技术博客,介绍其FLARE平台如何在不进行大量重构的情况下实现联邦学习,以应对数据移动性限制和数据主权规则。
DeepSeek发布第四代旗舰模型V4-Pro和V4-Flash。V4-Pro总参数1.6T、活跃参数49B,V4-Flash总参数284B、活跃参数13B,均支持百万token上下文推理,并部署于NVIDIA Blackwell和GPU加速端点。
NVIDIA 在其 BioNeMo 框架中引入上下文并行技术,允许跨多个 GPU 训练大型生物分子模型,突破单 GPU 内存限制。该技术通过分布式计算实现更大蛋白质复合物的零样本折叠,提升生物分子建模能力。
NVIDIA 发布 cuTile.jl,将 tile 编程模型引入 Julia,并利用 AI 代理自动将 cuTile Python 代码翻译为 cuTile.jl,简化 GPU 内核开发。
NVIDIA发布技术方案,通过TensorRT for RTX运行时加速Unreal Engine 5中的神经网络推理,提升超分辨率、去噪和神经渲染等图形任务的效率。
德科立一季度营收与利润实现同环比双增,数通业务量利齐升,电信业务毛利存在波动。公司泰国工厂将于6月量产并主要服务美东市场,下半年集中释放产能;无锡二期预计年底交付。公司预计今年海外收入占比超40%,明年超50%。1.6T光模块备料充足,预计下半年贡献收入,未来两年数据类业务占比将超50%,2026至2027年暂无OCS收入规划。
ProPetro(PROPWR)与卡特彼勒签署合作协议,规划建设最高2.1GW的新增产能。该项目旨在满足数据中心及高耗能行业不断增长的电力需求。该资讯披露了明确的产能规模与合作对象,属于产业订单与基础设施建设的客观事实。
Ghostty终端模拟器的库libghostty现在可用于fuzz测试TUI程序,已发现btop等多个软件的bug。Ghostty强调速度优势,因为快速内核支持高效测试。
微软Azure业务持续增长,其积压订单规模已达6270亿美元。相关数据显示,当前AI算力需求增速已显著超出电力供应、冷却系统及数据中心建设的实际产能。该情况表明AI基础设施扩张正面临电力与物理空间瓶颈,行业产能缺口问题日益凸显。
随着人工智能工作负载规模持续扩大,数据中心散热技术正从设计考量转变为实际部署挑战。面对功率密度快速攀升,运营商必须对现有散热方案进行适应性调整,以应对AI算力增长带来的能耗压力。
在DeepSeekv4 Pro 1.6T模型上,GB300 NVL72搭配SGLang disaggregation和DeepSeek MegaMoe kernels,性能比B200提升6.5倍。该成果由Radix Ark、LMSYS Org、NVIDIA AI、CoreWeave等团队协作实现。
截至4月29日,市场对北美四大云厂商2026年资本开支预期上调至6500-7650亿美元。核心驱动力从训练转向推理需求,上游光模块、服务器及数据中心配套设备等硬件环节业绩确定性增强。
英特尔财报显示数据中心业务强劲复苏,市场获悉供给极度紧缺致残次芯片遭抢购,下游BIOS厂商确认受益于CPU出货量增长,表明AI工作负载转向推理与智能体引发CPU价值重估。
芯原股份在一季报中披露,截至4月29日新签订单达82.4亿元,其中过去9天内新增约37亿元云侧AI ASIC量产订单,AI算力订单占比从85%提升至91%以上,确认公司切入核心客户AI ASIC大规模量产阶段。