SemiAnalysis分析了43.2万个真实编码代理请求,发现中位数输入令牌数为9.6万,超过《了不起的盖茨比》全文,表明代理工作负载正在改变推理经济学。
电商AI自动化工具Amboras上线,能自动运行、优化和A/B测试店铺。早期商户转化率提升超80%。
微软宣布Azure Kubernetes Fleet Manager跨集群网络功能进入公开预览,该功能基于Advanced Container Networking Services,提供透明的东西向多集群网络连接,旨在简化多集群管理,支持故障转移和跨区域工作负载迁移。
在华南上市公司交流会上,优然牧业透露:4月行业存栏短期上行因疫情封场导致活牛运输暂停,病牛淘汰利好行业出清;散奶价回升至2.5-2.9元/斤,下游乳企提前锁货,原奶供需接近平衡,预计三季度奶价企稳回升至3.4-3.5元/斤;成本端玉米上涨空间有限,豆粕或微降,公司已储备低价青贮,2026年预计淘汰率33-35%,财务费用预计降超1亿元,肉牛养殖和饲料业务逐步拓展。
开拓药业核心防脱产品KX8三期临床获积极结果,预计下半年提交上市申请,明年三季度获批。4月化妆品销售额超去年全年,全年预计同比增4-5倍。美白原料KT939预计今年销售额翻3-4倍,8月完成临床,10月提交注册,预计6-7月与头部化妆品企业签约。
谷歌搜索AI更新后,输入单词“disregard”会导致搜索界面失效,这是一个已知的技术问题。
llama.cpp 项目宣布新增 WebGPU 后端支持,该项目是 ggml 库的一部分,旨在提升在浏览器中的推理性能。
微软Foundry与Hugging Face合作,在单一平台上推出三个开源图像模型,为开发者提供最大的AI创新目录。
Allen AI发布ArtifactLinker新系统,用于预测模型应该评估哪些基准,旨在解决当前模型只在部分基准上评估的问题。
NVIDIA 发布 AI-Q agent skill 开源深度研究工具,可将研究管道打包成便携技能,集成到 agent harness 中,委托本地或托管 AI-Q 服务器执行任务并返回带引用的详细报告。
a16z引用数据称,Google每月处理的token数量超过3.2 quadrillion,较一年前增长7倍。
SEMI能源协作获得2026年可再生能源市场亚洲杰出倡议奖,该协作由制造商、供应商和可持续发展领导者组成,旨在推动可再生能源采购、政策改革和清洁能源接入。
知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。
谷歌演示了原型Android XR眼镜,该眼镜将Gemini AI集成到用户视野中,提供翻译、导航等信息叠加功能。
Google DeepMind宣布Project Genie与Google Maps街景集成,用户可将美国真实地点转化为互动虚拟世界。该功能目前仅支持美国地区。
Common Crawl 2026年4月爬取数据和URL索引已上传至Hugging Face,用户可通过SQL直接查询超过21.9亿网页,无需下载,大幅降低数据处理门槛。
llama.cpp/ggml 宣布推出全新 WebGPU 后端,支持浏览器端运行大模型,提升推理性能。该项目已开始全面集成 WebGPU 支持。
Microsoft Azure 宣布 Azure NetApp Files 在 EDA 工作负载中取得性能突破,通过新独立基准测试证实其可提供可预测的高性能共享存储,支持大规模并发,并已获得领先半导体公司采用,推动芯片设计上云。
长鑫存储已于去年1月启动DDR5内存量产,相关芯片已被第三方机构TechInsights拆解验证。目前该公司产能主要用于满足国内市场需求,尚未对全球DRAM供需造成冲击,预计至少需两年时间才能形成实质性市场竞争。
Google DeepMind宣布推出Gemini Omni模型,并展示了一周内用户创作的杰出作品。
在Data Centre LIVE会议第二天,演讲者讨论了AI增长与能源需求、可持续性目标及未来基础设施之间的紧张关系。
CommonCrawl推荐使用Hugging Face Buckets用于大型不断演变的训练数据集,Hugging Face CEO转发该信息。
机器人Reachy Mini在@lalopenguin的烹饪直播中突然故障,引发观众关注。推文附带视频链接,浏览量超过2.5万次。
德州超越弗吉尼亚,在全球数据中心排名中领先。达拉斯、西得克萨斯和奥斯汀-圣安东尼奥在Cushman全球排名中上升,原因是AI基础设施对电力和土地的需求。
公司交流中透露,3月以来完全成本上涨10%-20%,4月起约6成订单提价以转嫁成本,5月订单增速回落至个位数。越南三期年产能爬坡至1-2千万平米,终止墨西哥建厂计划,暂无美国建厂计划。预计26年运动草增长10%-20%,行业未来3年增速个位数,公司增速或高于行业。
AI推理工作负载正推动数据中心从郊区回迁至城市区域。Mathpix在布鲁克林部署GPU,表明生产型AI需求驱动城市托管基础设施增长。
HSCALE在意大利米兰获得250MW电力容量,承诺超过20亿欧元用于两个园区的超大规模数据中心建设,计划于2028年前交付。
在Data Centre LIVE会议上,Centrica研究与创新总监Ben Krikler博士探讨了AI数据中心的能源挑战,包括AI对电网的影响是威胁还是机遇,以及如何通过智能解决方案应对。
长沙银行一季度对公贷款净增420亿元,增速超10%,净息差较去年末企稳;到期定存留存率75%-80%,对公房地产贷款零不良,零售不良短期暂无拐点;预计全年息差波动控制在10BP内,营收力争实现一季度双五目标,信贷增速约9%,将重点发力县域市场与零售转型。
美国制裁长江存储后,外国设备公司被禁提供支持服务。曾在这些公司工作的中国员工集体加入长江存储,确保了其生产不受影响。
微软本周取消了内部Claude Code许可证,原因是基于token的计费导致成本难以承受。
2025年乔治梅森大学研究发现,靠近数据中心的房屋价值更高,但该趋势的普遍性仍存疑。
摩根士丹利分析称,英伟达下一代Rubin机架售价约780万美元,价值提升主要来自PCB、MLCC和ABF基板,带动中国PCB概念股上涨。
在Data Centre LIVE: London会议上,Bastille公司专家Ivan O'Sullivan警告AI基础设施运营商,无线威胁已成为数据中心行业不可忽视的盲点。
央行货币信贷报告显示3-4月居民长期贷款未显著增加,非银存款大增1万亿元,宏观流动性有收紧可能,美债、国债利率抬升需警惕。
东方公用事业报告指出,算电协同为早期政策支持的产业。一季度实际弃风弃光率超10%,2025年数据中心用电量近2000亿度,其中AIDC占25%-30%。预计2030年智算用电量中性达5000-6000亿度。
Google CEO Sundar Pichai在I/O 2026接受独家专访,表示Omni模型将赋能创作者,但YouTube保持创作者优先,维持人与人连接。他预测当前AI在三年后会显得过时。同期,OpenAI发布Codex升级,加州推出保护受AI影响工人的措施。
珠免1-4月销售双位数增长,Q1利润总额2.66亿元,毛利率近50%,计划2-3年化债、推进剩余49%股权注入并拓展门店品类;中免海南日销近期降速,预计5月底6月初推出消费券,机场店SKU恢复近九成,线上业务及DFS收购后运营符合预期。
Runway 发布 Aleph 2.0,新版本支持无限控制、多镜头拍摄、1080p 输出、最长 30 秒视频生成。
加州高铁项目成本预计升至2310亿美元,平均每位加州工人需承担超过12000美元。
AI基础设施初创公司Turbopuffer实现1亿美元年收入并盈利,Exa以22亿美元估值完成2.5亿美元C轮融资,Modal以47亿美元估值完成3.55亿美元C轮融资。此外,AI Twitter摘要报道了RAEv2等模型及基准更新。
AI半导体内存墙问题催生新方案:GPU与HBM解耦,通过光学互连远距离安装更多HBM。国内大型内存厂商研究人员于5月22日透露正与客户讨论该方案,以突破HBM带宽和容量扩展瓶颈,同时HBM堆叠超过16层面临物理极限。
美国联邦贸易委员会(FTC)对Cox Media Group、MindSift和1010 Digital Works三家公司提起诉讼,指控其宣称的“主动监听”AI营销服务实际上并未监听消费者对话,而是转售从其他数据经纪商获取的邮件列表。三家公司同意支付近100万美元和解。
推文指出LLM训练依赖快速矩阵乘法,但许多周围操作仍受内存限制。CODA方法对这些内核进行重新参数化优化。
作者指出AI从廉价聊天工具转向高成本AI代理,上下文窗口更大,推理成本高一个数量级。AI能力持续提升,高端用例继续使用前沿模型,低端任务转向低成本模型。成本分层扩大,企业需管理AI成本。
Y Combinator宣布延长夏季批次申请截止日期,以便更多团队利用与OpenAI的新合作协议。
Runway ML 发布 Aleph 2.0,支持通过提示词对最长30秒的视频进行修改和编辑,直接回应 Google Omni 的竞争。
Nvidia的Vera CPU性能超越最新x86 CPU,同时Intel正在开发18A CPU以与MacBook Neo竞争。
YC(Y Combinator)宣布延长夏季批次申请截止日期,以使更多团队能利用YC与OpenAI的新合作协议。该协议为YC创业公司提供OpenAI服务优惠。
Lattice Semiconductor 宣传其 CertusPro NX FPGA 被 Canova Tech 用于评估平台,旨在简化工业和汽车工程师构建连接系统,减少线缆并提升互操作性。