当前 3563 条 / 共 3563 条
筛选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 23 小时前 微信公众号 · 42章经 · 4 天 18 小时前 微信公众号 · DeepTech深科技 · 4 天 18 小时前 微信公众号 · Founder Park · 4 天 18 小时前 微信公众号 · FundaAI · 4 天 18 小时前 微信公众号 · 九章智驾 · 4 天 18 小时前 微信公众号 · 晚点LatePost · 4 天 18 小时前 微信公众号 · 琢磨事 · 4 天 18 小时前 微信公众号 · 甲子光年 · 4 天 18 小时前

SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。

  • 中位数输入令牌为9.6万
  • 数据来源:432k个真实编码代理请求

电商AI自动化工具Amboras上线,能自动运行、优化和A/B测试店铺。早期商户转化率提升超80%。

  • Amboras推出AI电商全自动运营工具
  • 早期商户使用后转化率提升超80%

微软宣布Azure Kubernetes Fleet Manager跨集群网络功能进入公开预览,该功能基于Advanced Container Networking Services,提供透明的东西向多集群网络连接,旨在简化多集群管理,支持故障转移和跨区域工作负载迁移。

  • Azure Kubernetes Fleet Manager跨集群网络功能公开预览。
  • 该功能由Advanced Container Networking Services提供支持。
  • 用于简化多集群网络管理,支持故障转移和跨区域迁移。

在华南上市公司交流会上,优然牧业透露:4月行业存栏短期上行因疫情封场导致活牛运输暂停,病牛淘汰利好行业出清;散奶价回升至2.5-2.9元/斤,下游乳企提前锁货,原奶供需接近平衡,预计三季度奶价企稳回升至3.4-3.5元/斤;成本端玉米上涨空间有限,豆粕或微降,公司已储备低价青贮,2026年预计淘汰率33-35%,财务费用预计降超1亿元,肉牛养殖和饲料业务逐步拓展。

  • 4月行业存栏短期上行因疫情封场导致活牛运输暂停
  • 散奶价回升至2.5-2.9元/斤,预计三季度奶价企稳回升至3.4-3.5元/斤
  • 公司26年预计淘汰率33-35%,财务费用预计降超1亿元

开拓药业核心防脱产品KX8三期临床获积极结果,预计下半年提交上市申请,明年三季度获批。4月化妆品销售额超去年全年,全年预计同比增4-5倍。美白原料KT939预计今年销售额翻3-4倍,8月完成临床,10月提交注册,预计6-7月与头部化妆品企业签约。

  • KX8三期临床获积极结果,预计下半年提交上市申请,明年三季度获批
  • 4月化妆品销售额超去年全年,全年预计同比增4-5倍
  • 美白原料KT939预计今年销售额翻3-4倍,8月完成临床,10月提交注册

谷歌搜索AI更新后,输入单词“disregard”会导致搜索界面失效,这是一个已知的技术问题。

  • 谷歌搜索AI更新后,单词“disregard”会破坏搜索界面
  • 该问题涉及谷歌搜索的AI功能

llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。

  • llama.cpp 新增 WebGPU 后端支持
  • 该工作基于 ggml 库实现
  • 旨在实现完整的 WebGPU 支持

微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。

  • 微软Foundry与Hugging Face合作推出平台
  • 平台包含三个开源图像模型
  • 该平台为开发者提供最大AI创新目录

Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。

  • Allen AI发布ArtifactLinker系统
  • ArtifactLinker预测模型评估基准

NVIDIA 发布 AI-Q agent skill 开源深度研究工具,可将研究管道打包成便携技能,集成到 agent harness 中,委托本地或托管 AI-Q 服务器执行任务并返回带引用的详细报告。

  • NVIDIA 发布开源深度研究工具 AI-Q agent skill
  • 该工具可将研究管道打包成便携技能,集成到 agent harness
  • 代理可委托 AI-Q 服务器执行任务并返回带引用报告

a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。

  • Google每月处理超过3.2 quadrillion tokens
  • 同比去年增长7倍

SEMI能源协作获得2026年可再生能源市场亚洲杰出倡议奖,该协作由制造商、供应商和可持续发展领导者组成,旨在推动可再生能源采购、政策改革和清洁能源接入。

  • SEMI能源协作获得2026年REM亚洲杰出倡议奖
  • SEMI EC由制造商、供应商和可持续发展领导者组成
  • SEMI EC致力于促进可再生能源采购和政策改革

知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。

  • MiniMax采用Perplexity搜索基础设施
  • MiniMax是一家领先的开源模型和智能体公司

谷歌演示了原型Android XR眼镜,该眼镜将Gemini AI集成到用户视野中,提供翻译、导航等信息叠加功能。

  • 谷歌演示了原型Android XR眼镜
  • 眼镜集成Gemini AI,提供翻译和导航
  • 信息直接叠加到用户视野中

Google DeepMind宣布Project Genie与Google Maps街景集成,用户可将美国真实地点转化为互动虚拟世界。该功能目前仅支持美国地区。

  • Project Genie与Google Maps街景集成
  • 支持将美国真实地点转化为互动世界

Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。

  • Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face
  • 可通过SQL查询超过21.9亿网页,无需下载

llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。

  • llama.cpp/ggml 推出新 WebGPU 后端
  • 该项目开始全面支持 WebGPU

Microsoft Azure 宣布 Azure NetApp Files 在 EDA 工作负载中取得性能突破,通过新独立基准测试证实其可提供可预测的高性能共享存储,支持大规模并发,并已获得领先半导体公司采用,推动芯片设计上云。

  • Azure NetApp Files 实现低延迟、高吞吐的 EDA 存储性能突破
  • 新独立基准测试验证了其大规模并发下的可预测性能
  • 领先半导体公司正在采用 Azure NetApp Files 进行芯片设计

长鑫存储已于去年1月启动DDR5内存量产,相关芯片已被第三方机构TechInsights拆解验证。目前该公司产能主要用于满足国内市场需求,尚未对全球DRAM供需造成冲击,预计至少需两年时间才能形成实质性市场竞争。

  • 长鑫存储已于去年1月启动DDR5内存量产
  • TechInsights已对长鑫DDR5芯片完成拆解验证
  • 长鑫存储当前产能主要满足国内需求,预计两年内难以冲击全球市场

Google DeepMind宣布推出Gemini Omni模型,并展示了一周内用户创作的杰出作品。

  • Google DeepMind推出Gemini Omni模型
  • 展示用户一周内创作的杰出作品

在Data Centre LIVE会议第二天,演讲者讨论了AI增长与能源需求、可持续性目标及未来基础设施之间的紧张关系。

  • Data Centre LIVE第二天聚焦AI增长与能源需求的矛盾。
  • 演讲者探讨了可持续性目标与基础设施未来的挑战。
  • 会议涉及AI、能源和基础设施的交叉议题。

CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。

  • CommonCrawl推荐使用Hugging Face Buckets处理大型训练数据集

机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。

  • Reachy Mini在烹饪直播中故障
  • 推文获得51次点赞和25930次查看

德州超越弗吉尼亚,在全球数据中心排名中领先。达拉斯、西得克萨斯和奥斯汀-圣安东尼奥在Cushman全球排名中上升,原因是AI基础设施对电力和土地的需求。

  • 德州超越弗吉尼亚成为全球数据中心排名领先
  • 达拉斯、西得克萨斯、奥斯汀-圣安东尼奥在Cushman排名中上升

公司交流中透露,3月以来完全成本上涨10%-20%,4月起约6成订单提价以转嫁成本,5月订单增速回落至个位数。越南三期年产能爬坡至1-2千万平米,终止墨西哥建厂计划,暂无美国建厂计划。预计26年运动草增长10%-20%,行业未来3年增速个位数,公司增速或高于行业。

  • 完全成本3月以来涨10%-20%,4月起6成订单提价
  • 5月订单增速回落至个位数
  • 越南三期年产能1-2千万平,终止墨西哥建厂

AI推理工作负载正推动数据中心从郊区回迁至城市区域。Mathpix在布鲁克林部署GPU,表明生产型AI需求驱动城市托管基础设施增长。

  • AI推理工作负载推动数据中心回迁至城市区域
  • Mathpix在布鲁克林部署GPU基础设施
  • 生产型AI需求驱动城市托管基础设施增长

HSCALE在意大利米兰获得250MW电力容量,承诺超过20亿欧元用于两个园区的超大规模数据中心建设,计划于2028年前交付。

  • HSCALE在米兰两个园区获得250MW电力容量
  • 承诺超过20亿欧元用于超大规模数据中心建设

在Data Centre LIVE会议上,Centrica研究与创新总监Ben Krikler博士探讨了AI数据中心的能源挑战,包括AI对电网的影响是威胁还是机遇,以及如何通过智能解决方案应对。

  • Centrica总监在Data Centre LIVE会议讨论AI数据中心能源挑战
  • 探讨AI是电网最大威胁还是智能解决方案

长沙银行一季度对公贷款净增420亿元,增速超10%,净息差较去年末企稳;到期定存留存率75%-80%,对公房地产贷款零不良,零售不良短期暂无拐点;预计全年息差波动控制在10BP内,营收力争实现一季度双五目标,信贷增速约9%,将重点发力县域市场与零售转型。

  • 一季度对公贷款净增420亿,增速超10%
  • 净息差较去年末企稳
  • 对公房地产贷款零不良

美国制裁长江存储后,外国设备公司被禁提供支持服务。曾在这些公司工作的中国员工集体加入长江存储,确保了其生产不受影响。

  • 美国制裁导致外国设备公司无法为YMTC提供支持服务
  • 外国设备公司中的中国员工集体跳槽至YMTC,避免生产中断

微软本周取消了内部Claude Code许可证,原因是基于token的计费导致成本难以承受。

  • 微软取消了内部Claude Code许可证
  • 取消原因是token计费成本过高

2025年乔治梅森大学研究发现,靠近数据中心的房屋价值更高,但该趋势的普遍性仍存疑。

  • 2025年乔治梅森大学研究发现靠近数据中心的房屋价值更高。

摩根士丹利分析称,英伟达下一代Rubin机架售价约780万美元,价值提升主要来自PCB、MLCC和ABF基板,带动中国PCB概念股上涨。

  • 摩根士丹利分析英伟达Rubin机架ASP约780万美元。
  • 价值提升主要来自PCB、MLCC和ABF基板。
  • 中国PCB概念股丁泰高科涨停,胜宏科技涨13.3%。

在Data Centre LIVE: London会议上,Bastille公司专家Ivan O'Sullivan警告AI基础设施运营商,无线威胁已成为数据中心行业不可忽视的盲点。

  • Bastille专家警告AI基础设施运营商关注无线威胁
  • 无线威胁被认为是数据中心行业的盲点

央行货币信贷报告显示3-4月居民长期贷款未显著增加,非银存款大增1万亿元,宏观流动性有收紧可能,美债、国债利率抬升需警惕。

  • 3-4月居民长期贷款未显著增加
  • 非银存款大增1万亿元
  • 宏观流动性有收紧可能

东方公用事业报告指出,算电协同为早期政策支持的产业。一季度实际弃风弃光率超10%,2025年数据中心用电量近2000亿度,其中AIDC占25%-30%。预计2030年智算用电量中性达5000-6000亿度。

  • 一季度实际弃风弃光率超10%
  • 2025年数据中心用电量近2000亿度,AIDC占25%-30%
  • 预计2030年智算用电量中性达5000-6000亿度

Google CEO Sundar Pichai在I/O 2026接受独家专访,表示Omni模型将赋能创作者,但YouTube保持创作者优先,维持人与人连接。他预测当前AI在三年后会显得过时。同期,OpenAI发布Codex升级,加州推出保护受AI影响工人的措施。

  • Sundar Pichai在I/O 2026专访中阐述Google AI方向,强调赋能创作者
  • Pichai表示YouTube将保持创作者优先,维持人与人连接
  • OpenAI发布最新Codex升级,加州推出工人保护措施

珠免1-4月销售双位数增长,Q1利润总额2.66亿元,毛利率近50%,计划2-3年化债、推进剩余49%股权注入并拓展门店品类;中免海南日销近期降速,预计5月底6月初推出消费券,机场店SKU恢复近九成,线上业务及DFS收购后运营符合预期。

  • 珠免1-4月销售双位数增长,Q1利润总额2.66亿元
  • 珠免计划2-3年化债、推进剩余49%股权注入
  • 中免海南日销降速,预计5月底6月初推出消费券

Runway 发布 Aleph 2.0,新版本支持无限控制、多镜头拍摄、1080p 输出、最长 30 秒视频生成。

  • Aleph 2.0 支持无限控制和多镜头拍摄
  • 输出分辨率为 1080p,最长 30 秒

加州高铁项目成本预计升至2310亿美元,平均每位加州工人需承担超过12000美元。

  • 加州高铁项目成本已高达2310亿美元
  • 平均每位加州工人将支付超过12000美元

AI基础设施初创公司Turbopuffer实现1亿美元年收入并盈利,Exa以22亿美元估值完成2.5亿美元C轮融资,Modal以47亿美元估值完成3.55亿美元C轮融资。此外,AI Twitter摘要报道了RAEv2等模型及基准更新。

  • Turbopuffer实现1

AI半导体内存墙问题催生新方案:GPU与HBM解耦,通过光学互连远距离安装更多HBM。国内大型内存厂商研究人员于5月22日透露正与客户讨论该方案,以突破HBM带宽和容量扩展瓶颈,同时HBM堆叠超过16层面临物理极限。

  • 国内外内存和封装行业提出GPU-HBM通过光学互连解耦方案。
  • 国内大型内存厂商5月22日表示正与客户讨论光学互连方案。
  • HBM堆叠超过16层面临工艺难度和物理极限。

美国联邦贸易委员会(FTC)对Cox Media Group、MindSift和1010 Digital Works三家公司提起诉讼,指控其宣称的“主动监听”AI营销服务实际上并未监听消费者对话,而是转售从其他数据经纪商获取的邮件列表。三家公司同意支付近100万美元和解。

  • FTC要求三家公司支付近100万美元和解虚假宣传指控
  • Cox Media Group等宣称的“主动监听”服务实际未使用语音数据
  • 该服务实质是高价转售从其他数据经纪商获取的邮件列表

推文指出LLM训练依赖快速矩阵乘法,但许多周围操作仍受内存限制。CODA方法对这些内核进行重新参数化优化。

  • LLM训练中许多周围操作是内存受限的内核
  • CODA重新参数化这些内存受限的内核

作者指出AI从廉价聊天工具转向高成本AI代理,上下文窗口更大,推理成本高一个数量级。AI能力持续提升,高端用例继续使用前沿模型,低端任务转向低成本模型。成本分层扩大,企业需管理AI成本。

  • AI从廉价聊天工具转向具有大上下文窗口和更高推理成本的AI代理
  • 高端用例继续使用前沿模型,低端任务转向低成本模型
  • AI推理成本分层扩大,企业需管理成本

Y Combinator宣布延长夏季批次申请截止日期,以便更多团队利用与OpenAI的新合作协议。

  • YC延长夏季批次截止日期
  • 此举为了让更多团队利用与OpenAI的新合作

Runway ML 发布 Aleph 2.0,支持通过提示词对最长30秒的视频进行修改和编辑,直接回应 Google Omni 的竞争。

  • Runway ML 推出 Aleph 2.0 视频编辑工具
  • 支持基于提示词编辑最长30秒的视频

Nvidia的Vera CPU性能超越最新x86 CPU,同时Intel正在开发18A CPU以与MacBook Neo竞争。

  • Nvidia Vera CPU性能超越最新x86 CPU
  • Intel开发18A CPU与MacBook Neo竞争

YC(Y Combinator)宣布延长夏季批次申请截止日期,以使更多团队能利用YC与OpenAI的新合作协议。该协议为YC创业公司提供OpenAI服务优惠。

  • YC延长夏季批次截止日期
  • YC与OpenAI达成新合作协议

Lattice Semiconductor 宣传其 CertusPro NX FPGA 被 Canova Tech 用于评估平台,旨在简化工业和汽车工程师构建连接系统,减少线缆并提升互操作性。

  • Lattice CertusPro NX FPGA 用于 Canova Tech 的评估平台
  • 该平台面向工业和汽车工程师,简化连接系统构建