清除 当前 80 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 19 小时前 微信公众号 · 42章经 · 4 天 13 小时前 微信公众号 · DeepTech深科技 · 4 天 13 小时前 微信公众号 · Founder Park · 4 天 13 小时前 微信公众号 · FundaAI · 4 天 13 小时前 微信公众号 · 九章智驾 · 4 天 13 小时前 微信公众号 · 晚点LatePost · 4 天 13 小时前 微信公众号 · 琢磨事 · 4 天 13 小时前 微信公众号 · 甲子光年 · 4 天 13 小时前

Unison Energy CEO 表示,电网互联延迟推动数据中心开发商采用基于天然气的微电网作为主要电源(而非备用),这一变化正在重塑 AI 基础设施建设方式。

  • 电网互联延迟推动数据中心开发商采用燃气微电网作为主电源
  • 燃气微电网正在重塑 AI 基础设施建设方式

根据一份报告,AI Neocloud驱动的工作负载正在改变数据中心流量模式,数据移动转向存储与AI计算之间的持续高带宽传输。

  • Neocloud推动数据中心流量转向高带宽传输
  • 工作负载改变数据移动模式:存储与AI计算间持续传输

德州数据中心开发商因面临2029年并网等待和3500万美元升级费用,选择自建电力以启动一个20万平方英尺的AI园区。

  • 德州数据中心面临2029年电网等待
  • 自建电力以启动20万平方英尺AI园区
  • 升级费用达3500万美元

英伟达与康宁深化合作,共同推进光纤和光子学技术在AI数据中心基础设施中的应用,以支持超大规模部署和光网络发展。

  • 英伟达与康宁宣布合作,聚焦光纤和光子学技术
  • 合作旨在推动AI数据中心物理基础设施和光网络发展

AI数据中心导致不可预测的电力波动,迫使电力公司改变建模方式,从仅关注功耗转向分析设施在扰动中的行为,以保障电网稳定。

  • AI数据中心造成不可预测的电力波动
  • 电力公司需建模设施的扰动行为而非仅功耗

Nvidia与IREN计划合作部署高达5GW的AI基础设施,位于德克萨斯州Sweetwater的园区被定位为Nvidia DSX AI工厂架构的旗舰站点。

  • Nvidia与IREN合作开发高达5GW的AI基础设施
  • Sweetwater园区成为Nvidia DSX AI工厂旗舰站点

数据中心运营商DataVita举办OpenClaw挑战赛,获胜者将获得永久AI数据中心岗位和3.5万英镑起薪。

  • DataVita发起OpenClaw挑战赛
  • 获胜者获永久AI数据中心职位及3.5万英镑起薪

Core Scientific在俄克拉荷马州Muskogee建设数据中心,同时在德克萨斯州推出1.5 GW新计划,合计将提供约3 GW的AI和高密度托管容量。

  • Core Scientific在俄克拉荷马州Muskogee建设数据中心。
  • 公司在德克萨斯州启动1.5 GW新计划。
  • 公司预计提供约3 GW的AI和高密度托管容量。

Core Scientific在俄克拉荷马州马斯科吉建设数据中心,并计划在德克萨斯州佩科斯新增1.5吉瓦容量,总计约3吉瓦毛容量用于人工智能和高密度托管。

  • Core Scientific在马斯科吉建设数据中心
  • 公司计划在德州佩科斯新增1.5吉瓦容量
  • 总毛容量约3吉瓦,用于AI和高密度托管

OpenAI推出了新的MRC网络协议,旨在解决大规模AI集群中的网络拥塞和故障挑战。当前超大规模云商正将GPU集群扩展到数十万张,该协议旨在提升通信效率和可靠性。

  • OpenAI发布MRC网络协议。
  • MRC旨在解决大规模AI集群的拥塞和故障。
  • 超大规模云商正扩展到数十万GPU。

OpenAI推出新的Multipath Reliable Connection(MRC)网络协议,旨在减少大型AI集群中的拥塞和故障相关减速,支持超大规模扩展至数十万GPU,以应对日益增长的算力需求。

  • OpenAI发布MRC协议以减少AI集群拥塞
  • 该协议针对大规模GPU集群的可靠性优化
  • 支持扩展至数十万GPU的超大规模部署

HPE推出自主网络功能,可实时处理网络问题,标志着自驱动网络进入生产阶段。企业采用取决于信任和风险承受能力。

  • HPE推出可实时处理问题的自主网络功能

AMD因EPYC和Instinct产品需求强劲,数据中心业务增长57%,推动收入达103亿美元,推理工作负载扩大AI基础设施支出。

  • AMD数据中心收入增长57%至103亿美元
  • EPYC和Instinct产品需求强劲
  • 推理工作负载推动AI基础设施支出增加

Astera Labs发布新型高基数交换机,旨在解决有状态、启停式AI工作负载带来的协调开销问题,暴露传统GPU集群的局限性。

  • Astera Labs推出新型高基数交换机
  • 目标解决AI工作负载的协调开销
  • 暴露传统GPU集群的局限性

Meta押注太空太阳能,凸显AI数据中心电力需求与电网扩张之间的差距。新的能源合作伙伴关系表明,近期数据中心电力需求增长快于电网基础设施的扩展速度。

  • Meta投资太空太阳能项目
  • AI数据中心电力需求与电网扩张存在差距
  • 新的能源合作伙伴关系凸显矛盾

IBM押注企业AI下一阶段由连接模型与基础设施的软件层定义,推出'Operating Model'推动企业AI控制层。

  • IBM押注企业AI下一阶段由连接模型与基础设施的软件层定义
  • IBM推出'Operating Model'推动企业AI控制层

AI数据中心热潮正在重塑美国电力供应链。电力设备需求增长推动供应增长,超大规模数据中心建设加速,但基础设施挑战持续存在。

  • 数据中心电力设备需求增长推动供应增长
  • 超大规模数据中心建设加速
  • 基础设施挑战持续存在

北卡罗来纳州提议AI基础设施法案,将电力、水和电网扩建成本转嫁给大型数据中心,挑战现有激励模式,重塑选址策略。

  • 北卡罗来纳州拟立法将基础设施成本转嫁给大型数据中心
  • 法案涉及电力、水和电网扩建费用
  • 旨在挑战长期激励模式并影响选址策略

亚马逊、谷歌、Meta与微软等超大规模云厂商近期财报显示,人工智能需求增速已超过现有基础设施建设能力。各企业均指出,未来业务增长将高度依赖电力供应、芯片获取以及前所未有的资本开支投入,反映出AI算力扩张正面临基础设施瓶颈。

  • 亚马逊、谷歌、Meta与微软财报显示AI需求增速超基础设施
  • 超大规模云厂商增长将高度依赖电力供应与芯片获取
  • 相关企业正进行前所未有的资本开支以应对AI扩张

据行业媒体报道,Google与Anthropic已达成一项合作协议,将资本投入与5吉瓦的算力采购承诺直接绑定。该交易标志着人工智能基础设施的融资与资源分配模式发生实质性转变,算力预购规模正式迈入吉瓦级,反映出头部企业在底层算力布局上的深度协同。

  • Google与Anthropic达成涉及5吉瓦算力承诺的合作
  • 该交易将资本投入与大规模算力采购直接绑定
  • AI基础设施的融资与资源分配模式发生转变

随着人工智能算力需求持续增长,数据中心开发商正加速调整能源获取与建设策略。表后数据中心建设、分阶段通电以及核电布局等方案,已从边缘试点逐步转变为行业核心战略,以应对快速扩张的电力需求。

  • 数据中心开发商正为应对AI需求调整能源与建设策略。
  • 表后数据中心建设模式正从边缘案例转向核心战略。
  • 分阶段通电与核电布局成为开发商重点采用的方案。

微软Azure业务持续增长,其积压订单规模已达6270亿美元。相关数据显示,当前AI算力需求增速已显著超出电力供应、冷却系统及数据中心建设的实际产能。该情况表明AI基础设施扩张正面临电力与物理空间瓶颈,行业产能缺口问题日益凸显。

  • 微软Azure业务积压订单规模达6270亿美元。
  • AI算力需求增速已超出电力与冷却系统产能。
  • AI需求增速超过数据中心实际建设产能。

随着人工智能工作负载规模持续扩大,数据中心散热技术正从设计考量转变为实际部署挑战。面对功率密度快速攀升,运营商必须对现有散热方案进行适应性调整,以应对AI算力增长带来的能耗压力。

  • AI工作负载规模扩大导致数据中心功率密度快速攀升。
  • 散热技术正从设计考量转变为实际部署挑战。
  • 运营商需调整散热方案以适应AI算力增长需求。

I Squared Capital已完成对巴西数字基础设施运营商Elea Data Centers的收购。据该公司创始人公开表示,此次交易将直接推动Elea在巴西本土的数据中心网络建设,加速其区域业务扩张步伐,进一步满足当地数字基础设施需求。

  • I Squared Capital已完成对Elea Data Centers的收购。
  • 该交易将加速Elea在巴西的数据中心业务扩张。
  • Elea为巴西本土数字基础设施运营商。

Ferveret公司CEO指出,采用无风扇与无水冷却技术可在固定电力供应条件下释放更多计算能力。不过该技术目前仍处于试点部署阶段,尚未实现大规模商业化应用,属于数据中心散热领域的产业技术动态。

  • Ferveret称无风扇无水冷却技术可在固定功耗下提升算力
  • 该冷却技术目前仍处于试点部署阶段

甲骨文在新墨西哥州的AI数据中心项目“Project Jupiter”放弃使用燃气轮机,转而采用Bloom Energy的燃料电池进行现场发电,以提供电力。

  • 甲骨文Project Jupiter数据中心改用Bloom燃料电池
  • 该项目位于新墨西哥州,用于AI计算
  • 从燃气轮机改为现场燃料电池发电

缅因州否决了数据中心暂停令,但来自环保和社区的压力持续,行业前景仍面临不确定性。

  • 缅因州否决数据中心暂停令
  • 对数据中心行业的压力持续存在

随着AI工作负载扩展,电力成为关键限制因素。文章指出,电力限制主要由基础设施交付时间和系统复杂性驱动,而非单纯的发电能力。这反映了AI算力需求与电力基础设施之间的瓶颈。

  • AI工作负载扩展,电力成为关键限制因素
  • 电力限制由基础设施时间表和系统复杂性驱动

来源:data_center_knowledge
发布时间:
Operators are racing to retrofit aging facilities for AI workloads, but many legacy data centers are running into hard limits around power distribution, cooling, and rack density.

Cast AI报告显示,企业Kubernetes集群中GPU、CPU和内存利用率低,大量算力被锁定。报告数据揭示了当前AI需求激增背景下算力使用效率的现状。

  • Cast AI报告发现企业K8s集群GPU利用率低
  • 报告指出大量算力资源被锁定未使用