截至4月29日,市场对北美四大云厂商2026年资本开支预期上调至6500-7650亿美元,主因推理算力需求爆发。中国船舶一季度归母净利润同比增长251.64%,高价船订单进入密集交付期。芯原股份9天内新签37亿元云侧AI ASIC量产订单。东方电气拟投资7.39亿元提升自主燃机产能。
杰普特2026年Q1营收同比增长93%,光通信器件业务收入暴增超2000%,3月单月交付破亿;新业务硅光检测设备商业化进展超预期。
英特尔CEO Lip-Bu Tan在Q1财报电话会上指出CPU计算需求上升,受AI推理负载和疫情后CPU更新周期推动。Noam Brown称推理计算是战略资源,Sam Altman表示OpenAI需成为AI推理公司。
芯原股份披露2026年一季度经营数据,当季实现营收8.36亿元,同比增长114.47%,其中量产业务收入同比大增近220%。截至4月底,公司累计新签订单达82.4亿元,AI算力相关订单占比超九成。一季度末在手订单为51.33亿元,超90%预计一年内转化。公司表示量产业务毛利率稳步提升,规模效应持续显现。
DeepSeek v4 Pro发布不到一周,vllm_project和inferact团队通过vLLM 0.20.0版本中的MegaMoE内核,在GB200平台上实现了显著性能改进。
DeepSeek v4 发布,展示长上下文效率技术 CSA、HCA、mHC 等,成本仅为 pro 版本的 8%,并推出最佳开源基础模型。
Ferveret公司CEO指出,采用无风扇与无水冷却技术可在固定电力供应条件下释放更多计算能力。不过该技术目前仍处于试点部署阶段,尚未实现大规模商业化应用,属于数据中心散热领域的产业技术动态。
DeepSeek V4第二轮API降价,缓存命中层价格降至每百万token仅0.025元,缓存命中率超95%。V4将KV缓存压缩至V3.2的10%,并工程化实现基于SSD的大规模KV缓存迁移,推动NAND需求增长。
4月24日,DeepSeek发布V4模型,实现百万级上下文窗口,Agent能力比肩顶级闭源模型,并计划在昇腾950芯片批量上市后下调Pro版价格。
工业富联发布2026年一季报,归母净利润同比翻倍,AI GPU机柜出货量同比增长3.8倍。公司角色向提供液冷及交换机等系统解决方案升级。供应链方面,强瑞技术已小批量交付下一代Rubin服务器液冷核心部件,凯格精机与英维克亦在相关产线及散热领域布局。
本资讯探究交换机芯片产业,指出IB交换芯片由英伟达Mellanox和中科曙光主导,以太交换芯片海外博通占主导,国内盛科、云合智网推进中。单颗51.2T芯片盛科预计27年下半年出样。国产芯片价格为海外7-8折,博通TH5因供应紧张炒至10万以上。CXL交换芯片是未来方向,国内楠菲微、芯微布局。客户导入新供应商适配周期超半年,二供初期份额约10%-20%。
随着AI工作负载扩展,电力成为关键限制因素。文章指出,电力限制主要由基础设施交付时间和系统复杂性驱动,而非单纯的发电能力。这反映了AI算力需求与电力基础设施之间的瓶颈。
东山精密披露2025年年报及2026年一季报数据,2025年营收401.25亿元,净利润13.86亿元;2026年一季度营收131亿元,净利润11.1亿元。公司AI业务利润占比已超50%,核心布局涵盖光模块、光芯片及AIPCB,目前800G产品订单超千万支,并已锁定2至3年上游物料供应。
微软宣布Azure Local扩展至支持单主权环境部署数千台服务器,允许组织在主权边界内运行更大规模本地工作负载,支持联网、间歇联网或完全断连环境,并保持本地策略管控。
莱迪思半导体官方披露,Tauro Technologies推出的DA322 Holoscan适配器已采用其CertusPro NX FPGA芯片。该方案能够为基于英伟达Orin与Thor平台的可扩展边缘AI应用提供单路同步10 GbE数据流,展示了相关半导体器件在边缘AI硬件集成中的具体技术路径与应用场景。
智子芯元(深圳)科技有限公司完成数千万元天使轮融资,由同创伟业、钧山资本领投,英诺天使与松禾资本超额跟投。公司成立半年连续获融资,其技术路径为运筹学与大模型结合,旨在用AI接管AI计算底层加速,解决国产芯片适配效率问题。
AI服务器需求导致电子布供给紧张,从预期走向验证。普通布产能因织布机瓶颈被挤占而全面告急,供需失衡持续,瓶颈在于织布机和高端纱线的刚性约束。
英特尔在4月24日法说会上披露,受AI推理需求旺盛影响,其部分服务器CPU已售罄。同时公司指出,在AI算力架构中,CPU与GPU的配置比例正从1:8向1:4及更高比例演进,反映出CPU在智能体与多任务调度等场景中的需求提升。
4月24日DeepSeek V4正式发布,该版本与华为昇腾芯片实现Day 0级别深度协同优化。官方同步公布昇腾950单卡吞吐性能达4700TPS等具体指标,标志着国产大模型与底层硬件的适配取得实质性进展。
科士达在4月27日业绩交流会披露,一季度储能业务收入同比翻倍至超4亿元,毛利率恢复至25%。海外储能业务成为增长核心,弥补了国内光伏疲软及数据中心船期延误影响。公司工商业储能渠道放量在即,数据中心业务正推进北美新订单及国内云厂商合作。
4月24日DeepSeek V4发布并适配华为昇腾芯片,公布昇腾950单卡吞吐指标。立讯精密与谷歌商谈光模块合同,目标获取23%份额。英特尔披露AI推理需求致部分服务器CPU售罄。亨通光电透露3月光纤光缆收入同比增180%,预期后续增速延续。
关于立讯精密进入谷歌光模块供应链的传闻已获实质性确认。最新信息显示,立讯精密正与谷歌就800G、1.6T及3.2T光模块产品开展合同商谈,目标获取合计23%的供应份额。该事项涉及光模块产业链多家企业,属于明确的产业合作进展。
DeepSeek-V4发布,采用Fine-Grained EP机制降低对卡间互联带宽的要求,使得国产GPU(如摩尔线程、沐曦)能够满足算力需求,打破海外算力生态依赖。
DeepSeek V4发布Pro和Flash模型,Pro参数量1.6T,支持百万token长上下文,推理效率大幅提升:百万token下推理flops仅V3.2的27%,KV cache仅10%。定价延续低价,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7。算法优化提升并发,算力需求仍旺盛,国产算力适配积极。
澜起科技MRDIMM方案由1 MRCD+10 MDB组成,随下一代CPU平台放量,使单内存插槽价值量从10美元级别跃升至100美元以上,提升近十倍。
高盛预测,随着GB300等新一代平台采用PCB背板替代铜缆,AI服务器PCB单机价值量将从不足1000美元跃升至8000美元以上,高端机型可达1.5万美元。预计2025-2027年市场规模复合增长超140%,高端PCB产能供给缺口将持续到2028年。
OpenAI于4月23日发布GPT-5.5,主打面向复杂工作的Agentic工作流,但初步评测显示能力提升有限。API定价翻倍,验证头部模型定价能力,模型在GB200/300上训练运行,拉动算力需求。
日本三井于4月对载体铜箔全线提价12%,以应对1.6T光模块和高阶存储需求爆发。三井市占率90%且扩产克制,为国内厂商提供国产替代窗口,下游深南电路等客户加速导入国产供应商。
4月24日DeepSeek V4模型正式发布,首次实现与华为昇腾、寒武纪等国产算力芯片的Day 0深度适配。该进展推动国产AI产业进入模型与算力双向适配阶段。此外,昇腾950超节点预计于下半年放量,有望带动相关产业链需求。
4月24日DeepSeek-V4正式发布,首次实现与华为昇腾、寒武纪等国产算力平台首日深度适配。英特尔一季度数据中心与AI业务营收同比增22%,确认5月启动第三轮服务器CPU涨价10%至15%。此外,光模块头部厂商一季度财报显示,受AI算力需求拉动,预付账款出现数倍至数十倍环比激增。
4月24日,DeepSeek-V4正式发布。该版本首次实现与华为昇腾、寒武纪等国产算力平台的首日深度适配,标志着合作模式从后期移植升级为贯穿模型设计与底层优化的前期协同。此举验证了国产大模型与算力芯片技术栈的协同可行性,推动AI算力生态建设。
4月26日,立讯精密子公司立讯技术CTO到访四方达,双方就CVD金刚石散热片的联合开发达成初步共识。该事项涉及金刚石散热材料在下游系统集成商的技术验证与合作意向,相关技术主要面向下一代AI算力硬件的散热应用。
DeepSeek发布V4系列,包括Pro版和Flash版。Pro版综合实力国内领先,Flash版性价比高;百万长上下文成本低,推动企业级应用;通过Triton适配国产芯片,优化算子迁移,降低算力需求。
华创计算机梳理大模型行业动态,指出DeepSeek V4上下文窗口达100万token,采用MoE架构,训练主力使用英伟达B200,推理支持华为910C且下半年产能将释放。Anthropic推理迁移至谷歌TPU并绑定亚马逊训练。DeepSeek获腾讯与阿里投资,走自研路线。
谷歌在NEXT26大会上发布TPU 8i和TPU 8t推理训练芯片,效率大幅提升;推出Gemini Enterprise Agent Platform,助力企业部署AI Agent;同时宣布一方模型API Tokens消耗达160亿/分钟。
DeepSeek发布V4系列模型,并与华为昇腾协同,旨在提升高性能模型性价比。该发布标志着AI模型领域的新进展,涉及算力合作。
北电数智发布星火·AI云2.0,CTO谢东在酒仙桥论坛上指出AI产业存在算力、模型、数据等单点突破但系统断层的问题,强调数据是企业AI应用的首要瓶颈,并提出通过系统重构将算力、数据与模型整合为工业化生产力系统。
OpenAI的GPT-5.5将于明天在Microsoft Foundry平台正式可用,该模型在长上下文推理、代理执行、计算机使用准确性及token效率上有所提升,旨在支持高风险的商业工作流。微软Foundry提供企业级安全、合规和治理能力,帮助客户快速评估和部署模型。
SemiAnalysis创始人Dylan Patel在播客中讨论token供需,指出前端模型需求极度旺盛,支付意愿近乎无限;其公司AI支出从数万美元增至700万美元;供给受限于内存、逻辑和芯片设备。
Google DeepMind 发布 Decoupled DiLoCo,一种用于弹性分布式 AI 训练的新方法,旨在提升训练效率和稳定性。
莱迪思半导体宣布与德州仪器达成合作,双方将基于英伟达Holoscan平台共同推出Lattice Holoscan Sensor Bridge解决方案。该方案旨在通过同步低延迟传感器数据实现传感器融合,以支持实时边缘AI应用。
SemiAnalysis发布关于GPU集群总拥有成本的分析,指出Blackwell等现代GPU单价高昂且能耗大,部分初创企业超80%初始资金用于采购GPU。文章强调仅比较GPU每小时单价易产生误导,实际成本受宕机时间、调试、网络存储配置及CPU算力等隐性因素影响显著,集群质量差异直接影响资金使用效率。
华为研究人员测试了自研的4位精度训练格式HiFloat4,与开放计算项目的MXFP4格式相比,在HiFloat4在昇腾NPU上训练多种模型时,相对于BF16基线的损失误差更低(约1.0%对1.5%)。测试模型包括OpenPangu-1B、Llama3-8B和Qwen3-MoE-30B。
ISSCC 2026国际固态电路会议聚焦半导体集成与电路技术,重点展示HBM4、LPDDR6、GDDR7、共封装光学及先进处理器等前沿进展。三星在会上发表HBM4技术论文,披露其性能较上一代显著提升。英伟达、博通、台积电、联发科等企业的先进芯片与接口技术亦在大会亮相。
莱迪思半导体在社交平台发文指出,AI计算正从边缘向云端分布式发展,系统设计重心已超越峰值算力。公司强调其FPGA产品可作为协处理器,协助CPU和GPU卸载系统任务,以支持可扩展的AI平台架构。
Founders Fund前合伙人Scott Nolan创立General Matter,致力于重建美国铀浓缩能力。美国曾是世界铀浓缩领导者,但已完全停止,目前约四分之一的浓缩铀依赖俄罗斯进口,2028年进口禁令将生效。先进反应堆缺乏可靠国内燃料源,铀浓缩被视为核未来的瓶颈。
METR和Epoch机构发布MirrorCode基准测试,用于评估AI自主重实现软件的能力。测试包含20多个目标程序,涵盖Unix工具、加密等领域。结果显示,Claude Opus 4.5成功重实现了约1.6万行Go代码的生物信息学工具,完成该任务所需时间远少于人类工程师。
受AI大模型需求激增及资本开支扩大影响,算力供应链出现紧缺。H100一年期租赁合约价格自2025年10月至2026年3月上涨约40%,按需GPU算力已全面售罄,DRAM、光纤及数据中心托管等上下游环节价格同步攀升。