清除 当前 2575 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 22 小时前 微信公众号 · 42章经 · 4 天 17 小时前 微信公众号 · DeepTech深科技 · 4 天 17 小时前 微信公众号 · Founder Park · 4 天 17 小时前 微信公众号 · FundaAI · 4 天 17 小时前 微信公众号 · 九章智驾 · 4 天 17 小时前 微信公众号 · 晚点LatePost · 4 天 17 小时前 微信公众号 · 琢磨事 · 4 天 17 小时前 微信公众号 · 甲子光年 · 4 天 17 小时前

华为SkyBridge芯片设计技术通过利用顶层金属层低电阻,折叠并连接关键数据路径,实现创新堆叠方式,不同于传统芯片堆叠。

  • 华为SkyBridge技术利用顶层金属层低电阻
  • 该技术折叠连接关键数据路径

华为提出Tau(τ)缩放定律,作为指导半导体行业未来发展的新原则,有望对芯片设计和制造产生深远影响。

  • 华为提出Tau缩放定律
  • 该定律用于指导半导体行业发展

英伟达、AMD、英特尔等AI芯片大厂对嵌入式基板技术兴趣增长,该技术可改善信号完整性和功率稳定性。日本Ibiden、韩国三星电机、台湾欣兴、景硕和南电等供应商正加大嵌入式基板开发投资,但大规模采用仍处早期阶段。

  • 英伟达、AMD、英特尔对嵌入式基板兴趣增长
  • 嵌入式基板可缩短信号路径,改善PDN阻抗匹配
  • 多家供应商加大嵌入式基板投资开发

华为宣布找到新路径,有望在不使用尖端设备的情况下实现先进半导体突破,缩短与台积电的差距;同时,今年秋季发布的Kirin手机芯片性能将显著提升。

  • 华为称已找到新路径,可能在不使用尖端设备的情况下实现先进半导体突破
  • 今年秋季发布的Kirin智能手机芯片性能将显著提升

长江存储完成IPO辅导备案,长鑫存储将于5月27日上市审核;京东方与康宁签署框架协议。AMD将服务器CPU长期市场空间指引翻倍至1200亿美元,英伟达预计2026年CPU收入达200亿美元。TI年内四次涨价,海外FPGA涨价且交货周期超40周。大摩预测GB300用MLCC价值量涨182%,今年高容MLCC供需缺口10%-20%;玻璃基板预计2026年量产,2030年市场规模约200亿美元;AI服务器PCB相关市场规模今年预计300亿、明年600亿,CCL价格有望突破上一轮高点。

  • 长存完成IPO辅导备案,长鑫5月27日上市审核
  • AMD将服务器CPU市场指引翻倍至1200亿美元
  • TI年内四次涨价,海外FPGA交货周期升至40周以上

Cerebras公司宣称其单晶圆方案相当于整个NVL72机架,通过绕开缺陷并保持在芯片上,规避了传统GPU集群面临的网络功耗瓶颈。

  • Cerebras单晶圆方案相当于NVL72机架
  • 该方案通过绕开缺陷实现片内互联,绕过网络功耗瓶颈

英伟达上调GPU出货及营收指引,谷歌发布第八代TPU,月处理token3200万亿(同比增700%),Gemini月活9亿,三季度或加单1.6T光模块;台积电CPO技术下半年量产,明年CPO出货量预计30万台;国内互联网厂商上调资本开支,国产算力需求提升,光芯片未来四年紧缺,液冷今年进入订单交付阶段。

  • 英伟达上调GPU出货及营收指引
  • 谷歌发布第八代TPU,月处理token3200万亿
  • 台积电CPO相关技术下半年量产

AI算力需求持续高景气,CPU受推理及Agentic AI拉动需求激增,供需偏紧导致涨价持续。AI服务器MLCC用量是普通产品数倍,2025年占行业产能超10%,龙头厂商稼动率近满负荷并已开启双位数涨价,国产厂商订单外溢受益。

  • CPU供需偏紧,涨价持续
  • AI服务器MLCC龙头厂商已双位数涨价
  • 国产MLCC厂商订单外溢受益

被动组件分销商Nichidenbo指出,AI服务器需求导致高规格MLCC、大尺寸电解电容等交期从1.5-2个月延长至3-4个月,部分达6个月以上。日韩供应商已停止接受新订单,保守产能扩张加剧供应紧张。预计2026年MLCC需求同比增长11%,电容器需求进一步增长30%。

  • AI服务器需求使高规格MLCC、大尺寸电解电容交期从1.5-2个月延至3-4个月
  • 日韩被动元件供应商已停止接受部分MLCC和电解电容的新订单
  • 预计2026年MLCC需求同比增长11%,电容器需求进一步增长30%

OpenAI宣布与巴西媒体集团Grupo Folha和Grupo UOL达成战略内容合作,将可信的巴西新闻引入ChatGPT,并确保内容的归属和透明度,扩大新闻访问范围。

  • OpenAI与Grupo Folha和Grupo UOL达成合作
  • 合作将巴西新闻引入ChatGPT
  • 合作强调内容归属与透明度
2026-05-24T23:19

datasette-agent 0.1a4 发布,利用 Datasette 1.0a30 的新 JavaScript 插件钩子 makeJumpSections(),在 Jump 菜单中新增“Start a new agent chat”界面。用户可通过 GitHub 账号登录 agent.datasette.io 试用。

  • datasette-agent 0.1a4 利用 Datasette 1.0a30 的 makeJumpSections() 钩子
  • 新版本在 Jump 菜单中提供“Start a new agent chat”界面
  • 用户可通过 GitHub 账号登录 agent.datasette.io 试用

LongCat 发布开源 talking-avatar 模型,采用 MIT 许可证,据称可能达到最先进水平(SOTA)。

  • LongCat 发布开源 talking-avatar 模型
  • 模型采用 MIT 许可证
  • 模型声称可能是 SOTA

HuggingFace转发推文称,llama.cpp增加MTP支持后,Qwen3.6-27B密集生成模型在本地运行速度足够作为日常使用。推文获122点赞、12转发、11回复、9051次浏览。

  • llama.cpp新增MTP支持
  • Qwen3.6-27B模型本地生成速度提升
  • 模型可日常使用

Hugging Face 创始人分享数据:30万 AI 开发者已填写硬件配置文件,并公布了结果。

  • 30万 AI 开发者填写了硬件配置文件。
  • Hugging Face 分享了硬件配置结果。

llama.cpp 新增 MTP 支持,使本地模型运行速度显著提升。在 A10G 上,Qwen3.6-27B 密集生成速度从 25 tok/s 提升至 45 tok/s,增幅达 78%。

  • llama.cpp 增加 MTP 支持
  • Qwen3.6-27B 在 A10G 上速度提升 78%

YC S26延长申请截止日期至明天,附带OpenAI提供的200万美元offer,但该offer作为实验项目,不确定是否会再次提供。

  • YC S26延长截止日期明天结束
  • 提供200万美元OpenAI offer
  • 该offer是实验性质

GStack 项目在 GitHub 上获得超过 10 万颗星,数万人使用该工具提升代理编码能力。

  • GStack 在 GitHub 上星标数突破 10 万
  • 数万人使用 GStack 增强代理编码

推文介绍Nvidia Tensor Cores通过systolic arrays大幅提升芯片吞吐量,并附有解释链接。

  • Tensor Cores通过systolic arrays提高Nvidia芯片吞吐量

Hugging Face 宣布 30 万 AI 构建者填写了硬件资料,并分享调查结果。该公司表示期待未来几个月本地 AI 的发展。

  • 30 万 AI 构建者在 Hugging Face 填写硬件资料

Garry Tan发布推文称,使用Thinking Machines平台在几小时内微调了Qwen3.5-397B模型,并称赞其快速可用。

  • Garry Tan在几小时内微调了Qwen3.5-397B模型

Perplexity公司开源了其内部用于保障开发者安全的工具Bumblebee。

  • Perplexity开源内部安全工具Bumblebee

推特讨论HBF技术主要适用于读取密集型高容量数据,并指出随着模型规模增长,HBF可能有用。同时提到英伟达当前策略是扩大scale-up域规模至144/576/1152,将权重存储在大域中,并通过STX将KV缓存卸载到SSD。

  • HBF主要针对窄范围工作负载,如读取密集型高容量数据
  • 英伟达策略是扩大scale-up域至144/576/1152并存储权重
  • 英伟达通过STX将KV缓存卸载到SSD

据推特爆料,英伟达在GIDS方案中考虑使用高可靠性、高速度的NAND(如200M IOPS),而非HBF。HBF因写入寿命短不适合KV缓存等重写任务,可能仅用于存储权重。若采用,架构或为8 HBM堆栈加4 HBF堆栈。

  • 英伟达考虑采用高可靠性高速度NAND用于GIDS
  • 英伟达不考虑在GIDS中使用HBF

重定时器(retimer)作为AI芯片时代隐藏核心组件,用于恢复芯片间因高速传输而衰减的信号。随着PCIe 5.0速率达32 GT/s,信号完整传输距离极短,retimer比redriver能完全恢复信号。PCIe代际升级使速度更快,信号传输距离缩短,驱动retimer需求指数增长。

  • retimer用于恢复高速芯片间传输的衰减信号
  • PCIe 5.0速率32 GT/s下信号完整传输距离极短
  • retimer比redriver能完全恢复信号

Jukan05辟谣TrendForce关于NVIDIA使用HBF的报道,称其是假新闻,实际NVIDIA为GIDS考虑高可靠性高速NAND。

  • NVIDIA未考虑使用HBF。
  • NVIDIA为GIDS考虑高可靠性高速NAND。

有消息称英伟达计划在其下一代Vera Rubin AI GPU中实现GPU-Direct Storage与HBF技术,旨在提升数据访问效率。

  • 英伟达计划在Vera Rubin GPU上实现GPU-Direct Storage
  • 该技术结合HBF(可能指高带宽存储)

Hugging Face发布名为LeRobotHF的人形机器人,成本约2500美元,提供完整开源硬件和软件堆栈。

  • Hugging Face发布人形机器人LeRobotHF
  • 成本约2500美元
  • 提供完整开源堆栈

研究人员发布SEGA工作,提出频谱能量引导注意力方法用于扩散模型分辨率外推。

  • 研究人员发布SEGA工作,关注扩散模型分辨率外推。

美国艺术与科学院(American Academy of Arts and Sciences)的《Daedalus》期刊出版了由James Manyika编辑的AI与科学特刊。

  • 《Daedalus》期刊出版AI与科学特刊,由James Manyika编辑。

SemiAnalysis指出,现场天然气已不再是边缘选择,而是悄然成为美国下一代AI训练集群的默认规划假设。

  • 现场天然气成为美国下一代AI训练集群的默认规划假设
  • 该转变是悄然发生的,此前被视为边缘选项

隔夜美股纳指上涨,费城半导体指数涨2%领涨。美联储理事沃勒称不排除进一步加息,市场预期年底前加息概率100%。AI半导体板块内部分化,模拟芯片、CPU等创新高,但Nvidia等未跟随。Dell涨17%受AI服务器需求推动,AMD涨4%,Nokia涨9%。800V电源管理芯片走强,Apple涨1.3%受WWDC预期提振。

  • 纳斯达克100指数上涨40个基点,费城半导体指数涨2%
  • 美联储理事沃勒表示若通胀不减弱,不排除进一步加息
  • Dell股价涨17%,因AI服务器需求强劲

Replit Agent负责构建应用,Squidler模拟真实用户测试,Replit Agent修复问题,形成完整的AI QA循环。

  • Replit Agent构建应用
  • Squidler模拟真实用户测试
  • Replit Agent修复问题形成完整QA循环

RWKV-7 G1g模型发布,声称是世界最好的纯RNN大语言模型,在一般LLM中具有竞争力。

  • RWKV-7 G1g模型正式发布

GBrain最新版本支持合成回答功能,可针对特定问题生成答案,并进行了GBrain搜索与思考的AB测试,产品持续迭代。

  • GBrain最新版本支持合成回答功能。
  • 进行了GBrain搜索与思考的AB测试。

在 LLMs-from-scratch 仓库中新增了 DeepSeek Sparse Attention (DSA) 的从头实现,包含动机、概述和 GPT 风格模型参考实现,作为独立示例代码。

  • 向 LLMs-from-scratch 仓库添加了 DSA 实现
  • 实现包含动机、概述和 GPT 风格模型参考代码

法拉利车队与IBM合作,利用AI技术重新定义F1粉丝体验,旨在创造超级粉丝。

  • 法拉利车队与IBM合作提供AI驱动粉丝体验
  • 该合作聚焦于重塑F1车迷互动方式

网友Gavin Baker在推文中讨论称,Anthropic在2026年第一季度实现息税前利润(EBIT)转正,这一点在AI投资回报率辩论中未得到充分重视。此外还提及对SpaceX、Nvidia的讨论以及特朗普访华的影响。

  • Anthropic在2026年第一季度实现EBIT转正

SemiAnalysis指出,在现代agentic编码中,42%的时间花费在CPU上进行工具使用,例如编辑文件、运行命令等。

  • 现代agentic编码中42%的时间用于CPU工具使用

据分析,现代代理编码中42%的时间用于CPU进行工具使用。传统云计算按CPU核心收费,而代理经济按token收费,为增加token收入,需增加CPU算力。

  • 现代代理编码中42%的时间用于CPU进行工具使用。

公用事业公司正围绕大型AI训练园区规划,但分布式推理工作负载可能改变未来电力需求的地点和方式,现有电网未完全准备好应对AI带来的电力需求增长。

  • 公用事业围绕大型AI训练园区进行电力规划
  • 分布式推理工作负载可能改变电力需求分布
  • 现有电网未准备好应对AI带来的电力需求

据TechCrunch报道,马斯克旗下的xAI已全面转向天然气,SpaceX专注于轨道数据中心,此前承诺的太阳能经济愿景被淡化。

  • xAI已全面转向天然气。
  • SpaceX专注于轨道数据中心。

英伟达CEO突访台北Meet-a-Claw活动,开发者现场实操自主智能体,并宣布NVIDIA GTC周正式启动。

  • 英伟达CEO突访台北Meet-a-Claw活动
  • 开发者现场实操自主智能体
  • 黄仁勋宣布NVIDIA GTC周正式启动

分析师预测HBM晶圆产能将从2025年底的390k wpm增至2026年底的500k及2027年底的960k,认为行业预期2027年底达1M wpm过于激进。

  • HBM晶圆产能2025年底390k wpm
  • 预测2026年底500k wpm,2027年底960k wpm
  • 分析师认为1M wpm目标过于激进

黄仁勋称Vera Rubin架构将成为迄今最成功的一代,希望超微电脑加强合规并持续增长;指出AI将影响所有行业,内存价格上涨成为客户挑战,希望供应商快速扩产。

  • 黄仁勋称Vera Rubin架构将成为迄今最成功的一代
  • 黄仁勋希望超微电脑加强合规并保持快速增长
  • 黄仁勋指出内存价格上涨,希望供应商快速扩产

根据预测,台积电CoWoS产能到2027年底将达到每月21万片(WPM),反映了先进封装技术的持续扩展。

  • CoWoS产能预计2027年底达21万片/月

英伟达CEO黄仁勋抵达台北,为即将在COMPUTEX 2026上举办的NVIDIA GTC大会预热。

  • 英伟达CEO黄仁勋已抵达台北
  • NVIDIA GTC大会将于COMPUTEX 2026期间举行

日本Nittobo因AI服务器需求导致高端低热膨胀玻璃纤维短缺,但决定不涨价,专注扩产保市场份额。公司将加速在日本福岛和台湾的产线扩张,以满足T-glass厚布和薄布的超预期需求。

  • Nittobo因短缺但不涨价,专注扩产保市场份额
  • T-glass需求超预期,加速日本和台湾产线扩张

据 Twitter 用户 @jukan05 称,Agentic AI CPU 服务器所需内存容量是通用服务器的 4 倍。该观点获得 643 次点赞,反映业内对 AI 服务器高内存需求的关注。

  • Agentic AI CPU 服务器内存需求是通用服务器的 4 倍

行业趋势显示AI模型公司正转向智能体产品。OpenAI的Greg表示模型不再是产品,需结合智能体;AI21关闭模型团队,全面转向智能体;DeepSeek首次建立‘Harness团队’。这表明模型质量不再是护城河,产品竞争转向模型、智能体、工作流、UI、记忆和经济的综合考量。

  • Greg表示模型不再是产品,需结合智能体
  • AI21关闭模型团队,全面转向智能体
  • DeepSeek首次建立Harness团队

一家全球大型电商公司采用Runway AI工具,实现75%视觉媒体由AI生成,大幅降低成本:原80万美元项目现不到1万美元,每个产品拍摄节省3万美元,年度生产预算从500-600万美元转向AI。

  • 一家全球大型电商公司采用Runway后,75%的视觉媒体由AI生成
  • 原成本80万美元的项目现不到1万美元,每产品拍摄节省3万美元
  • 该公司年度生产预算从500-600万美元转向AI