清除 当前 781 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 22 小时前 微信公众号 · 42章经 · 4 天 17 小时前 微信公众号 · DeepTech深科技 · 4 天 17 小时前 微信公众号 · Founder Park · 4 天 17 小时前 微信公众号 · FundaAI · 4 天 17 小时前 微信公众号 · 九章智驾 · 4 天 17 小时前 微信公众号 · 晚点LatePost · 4 天 17 小时前 微信公众号 · 琢磨事 · 4 天 17 小时前 微信公众号 · 甲子光年 · 4 天 17 小时前

北美科技巨头在Q1财报季密集上调2026年资本开支指引,合计规模超6500亿美元,创纪录的AI云服务订单验证企业级AI需求爆发。

  • 北美科技巨头Q1财报季上调2026年资本开支指引
  • 合计规模超6500亿美元
  • AI云服务积压订单创纪录

川环科技于5月2日披露进展,公司成功填补3-4寸大管径液冷软管国产空白,其独家研发的膨胀接头计划于5至6月向H客户实现大批量交付。该进展表明公司产品线正由单一软管向高价值总成方案升级,相关技术突破已获得关键客户验证,标志着其在AI液冷零部件领域的产业化进程取得实质性进展。

  • 川环科技实现3-4寸大管径液冷软管国产突破。
  • 公司独家研发的膨胀接头将于5-6月向H客户大批量交付。
  • 公司产品线正从单一软管向高价值总成方案升级。

5月1日,DeepSeek在GitHub开源多模态模型并同步发布技术报告。该模型引入视觉原语框架以补齐单模态短板,官方宣称其性能超越GPT-5.4。此外,云天励飞AI芯片平台已宣布完成与该模型的适配工作。此次发布标志着该公司技术路线向全模态方向拓展。

  • 5月1日DeepSeek在GitHub开源多模态模型并发布技术报告
  • 该模型采用视觉原语框架,官方宣称性能超越GPT-5.4
  • 云天励飞AI芯片平台已完成与DeepSeek模型的适配

本文汇总近期AI与半导体产业链动态:DeepSeekV4确认与华为昇腾等国产芯片深度适配;北美科技巨头合计上调2026年资本开支指引超6500亿美元;闪迪新商业模式锁定超三分之一2027财年产能;日月光投控将全年先进封装营收目标上修至35亿美元以上。

  • DeepSeekV4确认与华为昇腾等国产芯片实现深度适配。
  • 北美科技巨头合计上调2026年资本开支指引超6500亿美元。
  • 日月光投控将全年先进封装业务营收目标上修至35亿美元以上。

4月24日DeepSeekV4正式发布,确认与华为昇腾等国产芯片实现“Day 0”级别深度协同。该适配标志着国产算力进入长上下文、低时延的规模化工程验证阶段,模型未来降价预期与下半年昇腾950超节点量产直接挂钩,推动国产算力自主生态闭环加速。

  • 4月24日DeepSeekV4发布,实现与华为昇腾等国产芯片“Day 0”深度协同。
  • 模型未来降价预期与下半年昇腾950超节点量产直接挂钩。
  • 国产算力适配进入长上下文、低时延、高吞吐的规模化工程验证阶段。

NVIDIA AI转发用户测试:在DGX Spark(128GB显存)上以q8量化运行nemotron 3 omni模型,通过Hermes Agent实现56 tok/s的推理速度。

  • 在DGX Spark上运行nemotron 3 omni模型,q8量化
  • 通过Hermes Agent达到56 tok/s推理速度

NVIDIA发布开源安全沙盒OpenShell,旨在为企业AI代理提供安全控制,限制代理的访问、共享和发送权限,保护企业数据安全。

  • NVIDIA发布开源安全沙盒OpenShell,用于企业AI代理安全控制。

卡特彼勒在2025年Q1财报中披露,其数据中心发电业务同比增长41%,并将2030年大型发动机产能和发电业务营收目标从此前2倍上调至3倍(相对于2024年)。这一目标大幅上修反映了AI驱动的电力基建需求超预期。

  • 卡特彼勒数据中心发电业务2025年Q1同比增长41%
  • 公司上调2030年大型发动机产能和营收目标至2024年3倍

三星SDI于2026年一季度成功签订数据中心高功率BBU电池供应合同。该订单反映全球AI算力基建对备用电源的需求正转入订单落地阶段。原文同时列举了蔚蓝锂芯、亿纬锂能、长虹能源及麦格米特在数据中心BBU电池及供电方案领域的业务布局。

  • 三星SDI于2026年一季度签订数据中心高功率BBU电池供应合同。
  • 麦格米特为英伟达推荐供应商,提供含BBU Shelf的供电方案。

4月28日,建滔积层板发布涨价函,将涨价范围扩大至主流FR-4覆铜板产品。受AI服务器需求增长及上游原材料成本上升影响,覆铜板行业景气度由高端材料向全系列产品传导。产业链相关企业订单饱满且产能利用率维持高位,部分上游铜箔等材料供应趋紧。

  • 4月28日建滔积层板发布涨价函,将涨价范围扩大至主流FR-4产品。
  • AI服务器需求与原材料成本上升推动覆铜板行业景气度传导。
  • 沪电股份与胜宏科技AI服务器PCB订单饱满,产能利用率较高。

NVIDIA Research发布新论文,提出在NeMo-RL结合vLLM中使用推测解码加速强化学习后训练,实现8B模型吞吐量提升1.8倍,235B模型端到端加速2.5倍。

  • NVIDIA Research提出推测解码加速RL后训练
  • NeMo-RL+vLLM实现1.8倍吞吐量提升(8B模型)
  • 235B模型端到端加速达2.5倍

原文指出在AI时代,IT机架变得更复杂,需要GPU/ASIC、液冷、高速连接等多系统协同,ODM从单纯的制造角色演变为设计、集成和量产合作伙伴,以支持多种平台和数据中心建设。

  • AI时代IT机架复杂化,需多系统协同
  • ODM从制造转向设计、集成和量产合作伙伴

开放计算项目(OCP)成员正推动在数据中心采用直流供电方案,以应对人工智能算力增长带来的电力需求。相关低压直流项目旨在提升服务器能效,优化数据中心电力架构,满足AI基础设施对高效供电的技术要求。

  • OCP成员推动数据中心采用直流供电以应对AI电力需求
  • 低压直流项目旨在提升服务器运行能效

芯片设计公司AMD与加密货币矿企Riot在得克萨斯州签署额外25兆瓦数据中心租赁协议。此次签约是对双方于今年1月达成的初始租赁合同的进一步扩展,标志着双方在数据中心基础设施领域的合作持续深化。

  • AMD与Riot在得克萨斯州签署额外25兆瓦数据中心租赁协议。
  • 该协议系对双方今年1月已签署初始租赁合同的进一步扩展。

华为官方预测,2026年其AI芯片销售收入将实现约60%的同比增长,预计总销售额将达到120亿美元。该数据为企业对外发布的财务指引,反映了其在人工智能算力硬件领域的业务规划与市场拓展预期。

  • 华为预测2026年AI芯片销售收入将增长60%。
  • 华为预计2026年AI芯片销售额将达120亿美元。

海湾地区企业Taranis与EEC宣布达成合作,计划在沙特阿拉伯共同开发容量为50兆瓦的数据中心基础设施。该项目配套基金目标投资规模达20亿美元,旨在推进当地数据中心网络的建设与运营,属于中东地区算力基础设施领域的产业合作动态。

  • Taranis与EEC合作在沙特开发50MW数据中心
  • 项目配套基金目标投资规模为20亿美元
  • 合作旨在建设与运营数据中心基础设施

Y Combinator 播客介绍两篇递归AI模型论文:HRM和TRM。7百万参数模型在ARC Prize等任务上超越千倍参数模型,通过推理时递归扩展计算深度,以较少参数实现SOTA。

  • 7百万参数递归模型在ARC Prize上超越千倍参数模型
  • HRM和TRM论文以较少参数实现SOTA
  • 递归推理在推理时扩展计算深度突破推理瓶颈

亚马逊、谷歌、Meta与微软等超大规模云厂商近期财报显示,人工智能需求增速已超过现有基础设施建设能力。各企业均指出,未来业务增长将高度依赖电力供应、芯片获取以及前所未有的资本开支投入,反映出AI算力扩张正面临基础设施瓶颈。

  • 亚马逊、谷歌、Meta与微软财报显示AI需求增速超基础设施
  • 超大规模云厂商增长将高度依赖电力供应与芯片获取
  • 相关企业正进行前所未有的资本开支以应对AI扩张

据行业媒体报道,Google与Anthropic已达成一项合作协议,将资本投入与5吉瓦的算力采购承诺直接绑定。该交易标志着人工智能基础设施的融资与资源分配模式发生实质性转变,算力预购规模正式迈入吉瓦级,反映出头部企业在底层算力布局上的深度协同。

  • Google与Anthropic达成涉及5吉瓦算力承诺的合作
  • 该交易将资本投入与大规模算力采购直接绑定
  • AI基础设施的融资与资源分配模式发生转变

近期AI行业进入快速发展期,智能体技术跨越拐点推动Token价值提升与生成成本下降。Anthropic年度经常性收入由90亿美元增至超440亿美元,推理基础设施毛利率从38%升至超70%。同时Blackwell等新一代芯片算力较前代显著提升,推理服务商利润率同步扩大,AI产业链价值正向模型实验室集中。

  • Anthropic年度经常性收入从90亿美元增至超440亿美元。
  • Anthropic推理基础设施毛利率从38%提升至超70%。
  • Blackwell芯片生成Token速度较Hopper提升30倍。

半导体分析机构SemiAnalysis指出,硅晶圆平均售价正在回升。外延片供应紧张,先进逻辑(7nm及以下)晶圆需求预计在2028年达到近100万片/月,占300mm当量总需求的10%。GlobalWafers、SUMCO、信越化学和Siltronics等主要晶圆制造商有望受益于AI基础设施周期。

  • 外延片供需平衡收紧速度快于预期
  • 7nm及以下逻辑晶圆需求预计2028年达近100万片/月
  • 先进逻辑晶圆需求将占300mm当量总需求的10%

Anthropic CEO Dario指出预测计算需求极其困难,因为每1美元收入可能需要4-5美元的前期计算投资。投资不足则无法满足需求,过度则导致设备闲置,平衡难度大。

  • Anthropic CEO认为计算需求预测难度极大
  • 每1美元收入需4-5美元前期计算投资
  • 投资不足或过度均会带来风险

英伟达AI宣布,SGLang在Blackwell硬件上对DeepSeek-V4推理达到180 tok/s/GPU,支持约1M上下文,该优化来自lmsysorg利用模型混合稀疏注意力的Blackwell特定优化。

  • SGLang在Blackwell上对DeepSeek-V4推理速度达180 tok/s/GPU
  • 支持约1M上下文长度
  • 优化来自lmsysorg的Blackwell特定混合稀疏注意力利用

震裕科技与国星宇航成立合资公司,并在4月24日成立上海子公司,切入算力卫星总成代工领域,该业务基于国星宇航的“星算”计划。

  • 震裕科技与国星宇航成立合资公司
  • 震裕科技成立上海子公司切入算力卫星总成代工
  • 合资公司业务基于国星宇航‘星算’计划

高通在2026年Q2财报中首次明确,将于今年下半年向一家超大规模云计算企业交付定制芯片,标志着其数据中心AI芯片战略从预期走向兑现。

  • 高通将于2026年下半年向一家超大规模云计算企业交付定制芯片。

据行业数据,AI数据中心建设对高端机床的需求已从预期转为现实,一季度及四月订单呈现数倍增长,传统淡季维持高景气。液冷核心部件加工领域需求强劲,驱动设备商业绩提升。

  • AI数据中心建设对高端机床需求从预期转为现实
  • 一季度及四月订单呈现数倍增长
  • 行业在传统淡季维持极高景气度

DeepSeekV4发布后,通过软硬件深度协同,实现了对华为昇腾、寒武纪、海光信息等主流国产芯片的Day-0原生适配,标志着国产AI产业链从硬件替代向“模型-芯片-云”自主生态质变。

  • DeepSeekV4实现对华为昇腾、寒武纪、海光信息等国产芯片的Day-0原生适配
  • 标志国产AI产业链从硬件替代向自主生态质变

北美四大云厂商在Q1财报季集体上修2026年资本开支指引至近7000亿美元,谷歌和Meta上修幅度超预期,AI相关云业务收入和积压订单爆发式增长,确认AI从训练投入向推理回报期转变,将上游硬件供应链订单能见度延伸至2027年。

  • 北美四大云厂商上修2026年资本开支指引至近7000亿美元
  • 谷歌和Meta的资本开支上修幅度超预期
  • AI相关云业务收入和积压订单爆发式增长

4月30日市场消息显示,英伟达下一代Vera Rubin架构GPU将明确采用钻石铜复合散热方案。该方案表明AI芯片散热技术正从系统级液冷向芯片封装材料级创新延伸,金刚石散热材料进入产业化落地阶段,相关产业链技术路线进一步明确。

  • 英伟达下一代Vera Rubin架构GPU将采用钻石铜复合散热方案。
  • AI芯片散热技术正从系统级液冷向芯片封装材料级创新延伸。
  • 金刚石散热材料在AI芯片领域进入产业化落地阶段。

4月30日资讯汇总显示,DeepSeekV4已实现对华为昇腾等主流国产芯片原生适配;北美四大云厂商集体上修2026年资本开支指引至近7000亿美元;中国锂电池5月排产环比增速上修至15%;广深津等地接连发布楼市优化政策。

  • DeepSeekV4已实现对华为昇腾、寒武纪、海光信息等国产芯片原生适配。
  • 北美四大云厂商集体上修2026年资本开支指引至近7000亿美元。
  • 中国锂电池5月排产环比增速上修至15%,创历史新高。

4月30日,智谱披露GLM-5系列模型底层工程进展。该进展聚焦解决服务侧扩展瓶颈,通过提升系统吞吐效率与优化推理成本,增强复杂Agent任务的长时运行稳定性。此次技术重心向工程效率转移,旨在改善产品单位经济模型并推动企业级应用落地。

  • 4月30日智谱披露GLM-5底层工程进展。
  • 工程优化旨在提升系统吞吐效率并降低推理成本。
  • 技术升级聚焦解决复杂Agent任务运行稳定性瓶颈。

AWS在定制AI芯片Trainium和Inferentia上取得进展,团队正在全球最大云基础设施中扩展部署这些处理器。

  • AWS正在推进Trainium和Inferentia定制AI芯片
  • 这些芯片部署在全球最大云基础设施上

NVIDIA技术博客介绍了Agentic AI在地下工程中的应用,能够自动化24/7模拟循环,解决手动工作流瓶颈,提升效率。文章指出,地下行业面临数据复杂性增长与人力带宽不足的挑战,Agentic AI可加速数字演进。

  • Agentic AI可自动化地下工程的模拟循环
  • 该技术旨在解决手动数据开销瓶颈
  • 地下行业面临机器速度与人力带宽的差距

随着人工智能算力需求持续增长,数据中心开发商正加速调整能源获取与建设策略。表后数据中心建设、分阶段通电以及核电布局等方案,已从边缘试点逐步转变为行业核心战略,以应对快速扩张的电力需求。

  • 数据中心开发商正为应对AI需求调整能源与建设策略。
  • 表后数据中心建设模式正从边缘案例转向核心战略。
  • 分阶段通电与核电布局成为开发商重点采用的方案。

微软宣布开源Azure集成硬件安全模块(HSM)的设计,该模块集成于每台新Azure服务器,达到FIPS 140-3 Level 3标准,旨在提升云计算的安全性和透明度。相关计划在OCP EMEA峰会上公布。

  • 微软开源Azure集成HSM设计
  • Azure集成HSM达到FIPS 140-3 Level 3
  • HSM集成于每台新Azure服务器

2026年3月,三个LLM代理生成超60万行代码,运行850次实验,借助GPU加速赢得Kaggle playground竞赛第一名。

  • 三个LLM代理生成超60万行代码
  • 运行850次实验后赢得Kaggle竞赛第一名
  • 结合GPU加速压缩迭代循环

NVIDIA发布技术博客,介绍其FLARE平台如何在不进行大量重构的情况下实现联邦学习,以应对数据移动性限制和数据主权规则。

  • NVIDIA FLARE可减少联邦学习的重构开销
  • 联邦学习面临数据移动性、法规和数据主权约束

DeepSeek发布第四代旗舰模型V4-Pro和V4-Flash。V4-Pro总参数1.6T、活跃参数49B,V4-Flash总参数284B、活跃参数13B,均支持百万token上下文推理,并部署于NVIDIA Blackwell和GPU加速端点。

  • DeepSeek发布V4-Pro与V4-Flash模型
  • V4-Pro总参数1.6T,活跃参数49B
  • V4-Flash总参数284B,活跃参数13B

NVIDIA 在其 BioNeMo 框架中引入上下文并行技术,允许跨多个 GPU 训练大型生物分子模型,突破单 GPU 内存限制。该技术通过分布式计算实现更大蛋白质复合物的零样本折叠,提升生物分子建模能力。

  • NVIDIA 在 BioNeMo 中推出上下文并行技术
  • 该技术克服单 GPU 内存限制,支持更大生物分子建模
  • 可实现大型蛋白质复合物的零样本折叠

NVIDIA 发布 cuTile.jl,将 tile 编程模型引入 Julia,并利用 AI 代理自动将 cuTile Python 代码翻译为 cuTile.jl,简化 GPU 内核开发。

  • NVIDIA 推出 cuTile.jl,支持在 Julia 中编写 GPU 内核
  • AI 代理可自动翻译 cuTile Python 代码到 cuTile.jl

NVIDIA发布技术方案,通过TensorRT for RTX运行时加速Unreal Engine 5中的神经网络推理,提升超分辨率、去噪和神经渲染等图形任务的效率。

  • NVIDIA发布加速UE5中神经网络推理的技术方案
  • 该方案使用TensorRT for RTX运行时

德科立一季度营收与利润实现同环比双增,数通业务量利齐升,电信业务毛利存在波动。公司泰国工厂将于6月量产并主要服务美东市场,下半年集中释放产能;无锡二期预计年底交付。公司预计今年海外收入占比超40%,明年超50%。1.6T光模块备料充足,预计下半年贡献收入,未来两年数据类业务占比将超50%,2026至2027年暂无OCS收入规划。

  • 德科立一季度营收利润同环比均增长,数通业务量利齐升。
  • 泰国工厂6月量产服务美东市场,无锡二期预计年底交付。
  • 预计今年海外收入占比超40%,1.6T模块下半年贡献收入。

ProPetro(PROPWR)与卡特彼勒签署合作协议,规划建设最高2.1GW的新增产能。该项目旨在满足数据中心及高耗能行业不断增长的电力需求。该资讯披露了明确的产能规模与合作对象,属于产业订单与基础设施建设的客观事实。

  • ProPetro与卡特彼勒签署协议,规划最高2.1GW新增产能。
  • 新增产能将定向用于满足数据中心及高耗能行业的电力需求。

Ghostty终端模拟器的库libghostty现在可用于fuzz测试TUI程序,已发现btop等多个软件的bug。Ghostty强调速度优势,因为快速内核支持高效测试。

  • libghostty可用于fuzz测试TUI程序
  • 已发现btop等多个软件中的bug

微软Azure业务持续增长,其积压订单规模已达6270亿美元。相关数据显示,当前AI算力需求增速已显著超出电力供应、冷却系统及数据中心建设的实际产能。该情况表明AI基础设施扩张正面临电力与物理空间瓶颈,行业产能缺口问题日益凸显。

  • 微软Azure业务积压订单规模达6270亿美元。
  • AI算力需求增速已超出电力与冷却系统产能。
  • AI需求增速超过数据中心实际建设产能。

随着人工智能工作负载规模持续扩大,数据中心散热技术正从设计考量转变为实际部署挑战。面对功率密度快速攀升,运营商必须对现有散热方案进行适应性调整,以应对AI算力增长带来的能耗压力。

  • AI工作负载规模扩大导致数据中心功率密度快速攀升。
  • 散热技术正从设计考量转变为实际部署挑战。
  • 运营商需调整散热方案以适应AI算力增长需求。

在DeepSeekv4 Pro 1.6T模型上,GB300 NVL72搭配SGLang disaggregation和DeepSeek MegaMoe kernels,性能比B200提升6.5倍。该成果由Radix Ark、LMSYS Org、NVIDIA AI、CoreWeave等团队协作实现。

  • GB300 NVL72在DeepSeekv4 Pro 1.6T上性能比B200提升6.5倍
  • 高性能配置使用DeepSeek MegaMoe内核完全融合GEMM和EP操作
  • Radix Ark、LMSYS Org、NVIDIA AI和CoreWeave等团队参与优化

截至4月29日,市场对北美四大云厂商2026年资本开支预期上调至6500-7650亿美元。核心驱动力从训练转向推理需求,上游光模块、服务器及数据中心配套设备等硬件环节业绩确定性增强。

  • 北美四大云厂商2026年资本开支预期上调至6500-7650亿美元
  • 资本开支核心驱动力从训练转向推理需求
  • 上游硬件环节业绩确定性增强

英特尔财报显示数据中心业务强劲复苏,市场获悉供给极度紧缺致残次芯片遭抢购,下游BIOS厂商确认受益于CPU出货量增长,表明AI工作负载转向推理与智能体引发CPU价值重估。

  • 英特尔财报显示数据中心业务强劲复苏
  • 英特尔残次芯片现遭抢购
  • 下游BIOS厂商确认受益于CPU出货量增长

芯原股份在一季报中披露,截至4月29日新签订单达82.4亿元,其中过去9天内新增约37亿元云侧AI ASIC量产订单,AI算力订单占比从85%提升至91%以上,确认公司切入核心客户AI ASIC大规模量产阶段。

  • 芯原股份9天内新增约37亿元订单
  • 新增订单几乎全部为云侧AI ASIC量产订单
  • AI算力订单占比从85%提升至91%以上