清除 当前 2572 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 20 小时前 微信公众号 · 42章经 · 4 天 15 小时前 微信公众号 · DeepTech深科技 · 4 天 15 小时前 微信公众号 · Founder Park · 4 天 15 小时前 微信公众号 · FundaAI · 4 天 15 小时前 微信公众号 · 九章智驾 · 4 天 15 小时前 微信公众号 · 晚点LatePost · 4 天 15 小时前 微信公众号 · 琢磨事 · 4 天 15 小时前 微信公众号 · 甲子光年 · 4 天 15 小时前

亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。

  • 亚马逊研究奖公布68名获奖者,来自11国49所大学
  • 获奖提案涵盖AI安全、Agentic AI、自动推理等六类
  • 获奖者可获得AWS推广积分和亚马逊研究支持

Deepagents新版本发布,亮点是delta channels,它大幅改进了代理检查点的存储方式。

  • Deepagents新版本发布
  • 引入delta channels改进了检查点存储

据SemiAnalysis报告,Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升,显示出更强的运营杠杆。与同行相比,AWS在Bedrock和Anthropic交易中表现出优势。

  • Anthropic增长推动AWS利润率提高
  • Bedrock Mix提升AWS运营杠杆

LangChain 发布 Deep Agents v0.6 版本,引入 Delta channels,可将长期运行代理的检查点存储减少高达 100 倍,且不影响性能。

  • Deep Agents v0.6 发布
  • 引入 Delta channels 减少存储

NVIDIA RTX更新:DLSS 4.5以Unreal Engine插件形式发布,NVIDIA ACE扩展多语言AI角色能力,支持游戏开发者实现AI驱动角色、帧生成和光线追踪渲染。

  • NVIDIA发布DLSS 4.5作为Unreal Engine插件
  • NVIDIA ACE扩展多语言AI角色能力

Rentahuman平台允许AI代理与人类沟通并支付其完成现实世界任务,旨在利用AI创造新工作并全球协调工人。

  • Rentahuman允许AI代理与人类沟通并支付人类完成任务。
  • 其使命是利用AI创造新工作并全球协调工人。

OpenAI基金会宣布初始承诺2.5亿美元,用于测量、过渡支持和新方法以促进广泛共享繁荣。

  • OpenAI基金会承诺2.5亿美元用于促进广泛共享繁荣

RF-DETR目标检测与分割模型现已集成至Hugging Face Transformers库。该模型在检测和分割任务上达到最优性能,超越YOLO系列。项目由skalskip92在推特宣布,获得关注。

  • RF-DETR在Hugging Face Transformers库中可用
  • 该模型在检测和分割任务上达到最优性能

Hugging Face Transformers 现已集成 RF-DETR 模型,该模型在目标检测和分割任务上声称达到最先进水平,超越 YOLO。

  • RF-DETR 现已在 Hugging Face Transformers 中可用。
  • RF-DETR 在目标检测和分割上声称超越 YOLO。

AI编码初创公司Cognition以250亿美元投前估值融资10亿美元,其年化收入达4.92亿美元,8个月内估值翻倍。

  • Cognition融资10亿美元,投前估值250亿美元
  • 年化收入4.92亿美元
  • 8个月内估值翻倍

Perplexity AI宣布开源其重建的Unigram分词器,声称可将CPU利用率降低5-6倍,同时提及小模型相关技术。

  • Perplexity AI开源Unigram分词器
  • 分词器降低CPU利用率5-6倍

SEMI与Global Net Corp.发布玻璃基板市场报告,指出AI和高性能计算推动先进封装需求,预测2028-2040年玻璃基板市场复合年增长率为67.2%。

  • SEMI和Global Net Corp.发布玻璃基板市场报告
  • 预测2028-2040年CAGR为67.2%

Pika Labs分享了一项名为Pika Experiments的实验项目,展示其正在探索的AI视频生成技术新方向。该项目是团队在幕后尝试的初步想法。

  • Pika Labs推出Pika Experiments实验项目
  • 该项目展示AI视频生成技术的新探索

ProteinRos宣布推出新一代结构预测模型ESMFold2,该模型能够从单条序列直接预测蛋白质结构,代表了技术上的重要进展。

  • ESMFold2模型发布
  • 可从单条序列预测蛋白质结构

MiniMax M2技术报告发布,总结了多项技术发现:选择全注意力机制而非混合滑动窗口;线性/稀疏注意力在生产系统中部署困难且前缀缓存支持差;细粒度MoE(128专家top-8)在2B参数规模下推理和代码能力显著提升;训练流程中增加了软件工程agent行为训练。

  • MiniMax M2采用全注意力机制,放弃混合滑动窗口
  • 稀疏注意力在生产环境中部署困难且前缀缓存支持差
  • 细粒度MoE在2B参数下将MATH从19.6提升至24.1

RF-DETR实时目标检测与分割模型已集成至HuggingFace Transformers,该模型由Roboflow开发,具备SOTA性能,可通过HuggingFace平台使用。

  • RF-DETR模型已集成至HuggingFace Transformers
  • 该模型由Roboflow开发,支持实时检测与分割

Eden公司今日发布工业半人形机器人Eden I,可按小时租赁,提供自主机器人服务。

  • Eden发布工业半人形机器人Eden I
  • Eden I可按小时租赁

ElevenLabs发布全新音乐生成模型,支持在歌曲中间切换流派,用户可以重新生成特定部分而不影响歌曲其余部分。

  • ElevenLabs发布新音乐生成模型
  • 模型允许在歌曲中间切换流派
  • 用户可重新生成部分而不影响其余

TeraWulf与施耐德电气合作,将纽约州布法罗的一座燃煤电厂改建为500兆瓦的AI数据中心园区。该园区旨在提供高性能计算基础设施,支持人工智能应用。Data Center Knowledge团队实地探访该园区,了解其电力与冷却解决方案。

  • TeraWulf与施耐德电气合作,将布法罗煤电厂改建为500兆瓦AI数据中心园区
  • 该园区专注于支持AI计算负载的电力与冷却基础设施

睡眠科技初创公司SOND由Bose前睡眠产品负责人领导,获得700万美元融资,推出AI驱动的睡眠耳塞。

  • SOND获得700万美元融资
  • 公司由Bose前睡眠产品负责人领导
  • 产品为AI睡眠耳塞

犹他州提议建设9吉瓦的Stratos AI园区,反映了AI基础设施向专用能源系统、加速许可和直接控制电力的演变趋势。

  • 犹他州提出9吉瓦Stratos AI园区提案
  • 园区围绕专用能源系统建设
  • 注重加速许可和直接电力控制

Alex Rives宣布推出ESMFold2,一个用于蛋白质生物学的开放科学引擎,支持预测、设计和发现。

  • ESMFold2发布
  • ESMFold2是开放科学引擎
  • 用于蛋白质生物学预测、设计和发现

Broadcom与FuriosaAI合作开发机架级推理平台,旨在推动AI基础设施转向以太网结构、chiplet和节能token生成。

  • Broadcom与FuriosaAI合作构建机架级推理平台
  • 该平台聚焦以太网结构、chiplet和节能token生成

AI视频公司Runway的CEO将访问日本,并于本周举办登坛活动。活动信息通过社交媒体发布,提醒用户报名参与。

  • Runway CEO本周访问日本并举办登坛活动。
  • 活动参与需提前报名注册。

本期节目介绍了Codex中的/goal命令,它将AI从逐轮助手转变为自主代理,可执行多步骤复杂任务。通过三个实例展示了其功能:五小时内消除数千个Sentry错误、四小时内将3900封邮件清理至68封、整理数百个Linear任务。同时讲解了如何编写有效目标提示及其适用场景。

  • /goal命令使AI成为可自主执行多步骤任务的智能代理
  • 利用/goal在五小时内消除了数千个Sentry错误
  • 利用/goal在四小时内将3900封邮件清理至68封

德克萨斯州修建的CREZ输电走廊原本用于运输风电,如今这些输电通道正越来越多地吸引超大规模AI基础设施的部署。

  • 德州CREZ输电走廊原本用于风电输送。
  • 同一输电通道正吸引超大规模AI基础设施部署。

思科与OpenAI合作,利用Codex重新定义企业工程,帮助思科扩展AI原生开发、加速AI防御工作并自动化缺陷修复。

  • 思科与OpenAI合作使用Codex推进企业工程转型

华为Fellow透露,公司将于今年秋季量产采用3D堆叠技术的麒麟手机芯片,该技术领先台积电同类方案3年,且散热问题已通过设计解决。此外,华为计划在2026-2027年将XPU功耗效率分别提升40%-80%和80%-120%,7nm与5nm封装可实现等效3nm性能,成本与2D工艺相当。

  • 华为Fellow称秋季将量产3D堆叠麒麟芯片
  • 华为3D堆叠技术领先台积电3年
  • 华为26-27年XPU功耗效率提升40%-120%

推特用户@jukan05表示,半导体设备可能严重稀缺,tera-fab项目比预期更认真;英特尔需扩大产能并承接台积电客户,三星已获多个客户,台积电可能在Q3上调资本开支。SK海力士在HBM4上表现优于三星,HBM价格重谈不顺利,超大规模客户不愿重新谈判。

  • tera-fab项目比预期更认真,半导体设备可能严重稀缺
  • 英特尔需扩大产能并吸收台积电客户,三星已获多个客户
  • 台积电可能在Q3上调资本开支,HBM价格重谈不顺利

Nebius在萨里郡Ark的Longcross园区扩建AI基础设施,填充LP01机房以满足高密度GPU就绪容量的增长需求。

  • Nebius在Ark的Surrey园区扩建AI基础设施,填充LP01机房

GoogleDeepMind发布Gemini Embedding 2原生多模态嵌入模型白皮书。该模型能够处理文本、图像等多种模态数据,提升检索与生成任务性能。

  • GoogleDeepMind发布Gemini Embedding 2多模态嵌入模型
  • 该模型原生支持多种数据模态

华为提出τ定律,可在成熟制程通过压缩时延、逻辑折叠实现性能突破,无需依赖EUV。该技术利好光互联、液冷及国产AI算力,光模块需求上调,CPO产业加速;液冷进入放量元年,未来算力中心将标配;国产AI算力绕过先进制程封锁,昇腾950/990基于成熟制程,2027年国产算力需求大幅增长。

  • 华为提出τ定律,可在成熟制程实现性能突破,无需EUV
  • 光互联成趋势,光模块需求上调,CPO产业加速
  • 液冷进入放量元年,未来新建算力中心将标配液冷

The Rundown独家采访Google DeepMind CEO Demis Hassabis。Hassabis表示通用人工智能(AGI)有望在2030年左右实现,并讨论了AI在药物发现和疾病治愈方面的应用前景。

  • Hassabis认为AGI有望在2030年实现。
  • Hassabis讨论了AI在药物发现中的作用。

PC和服务器CPU市场中x86份额占主导但ARM逐年提升。3纳米产能紧缺导致代工价格上涨10%-15%,CPU从25Q4开始涨价,26Q2高端服务器CPU供需缺口放大。AI Agent和机柜方案推动CPU需求增长,国产CPU有望在开放市场获增量。

  • PC CPU年出货2.5-3亿颗,x86占近90%
  • 3纳米产能紧缺致代工价涨10%-15%,25Q4起CPU涨价
  • 26Q2高端服务器CPU供需缺口放大

据独家消息,NVIDIA的推理GPU“Rubin CPX”发布存疑,公司未订购相关内存和基板,行业视该项目已取消。此前NVIDIA计划今年下半年发布,采用128GB GDDR7内存,但无进展。

  • NVIDIA未订购Rubin CPX所需内存和基板
  • 行业视Rubin CPX项目已取消
  • NVIDIA计划使用的GDDR7内存无进展

OpenAI联合Thrive和Crete,利用Codex构建自我改进的税务代理系统,实现自动税务申报,提升准确性并加速工作流程。

  • OpenAI与Thrive、Crete合作开发基于Codex的税务代理
  • 该代理可自动完成税务申报并自我改进

Fireworks AI创始人宣布公司年化运行率突破8亿美元,第一季度收入同比增长4倍(不含Cursor业务),并正在招聘人才。

  • Fireworks AI年化运行率突破8亿美元
  • 第一季度收入同比增长4倍(排除Cursor)

中国最大被动元件厂商风华高科因订单激增,暂停接受0402/0603尺寸片式电阻和MLCC订单,产能利用率已达90%。供应链将此举归因于预防性采购和短缺担忧,行业预期可能开启涨价周期。银价上涨推升成本,高端MLCC短缺加剧,Murata、三星电机等厂商产能利用率超90%。

  • 风华高科暂停接受0402/0603尺寸片式电阻和MLCC订单
  • 订单激增导致未交付订单远超产能,利用率达90%
  • 银价上涨推升片式电阻成本,高端MLCC短缺预计加剧

AI基础设施领域出现新独角兽,Fireworks和Baseten成为独角兽,OpenRouter也在接近独角兽地位。

  • Fireworks和Baseten成为AI基础设施独角兽
  • OpenRouter正在成为独角兽的路上

上游铜精矿供应紧张导致铜价持续走高,尽管交易所库存增加。2026年4-5月,LME铜现货均价约12,891美元/吨,5月13日盘中升至14,097美元/吨。上游供应商将材料成本完全与市场挂钩,并削减低利润产品,以保护毛利率。PCB和被动元件制造商面临成本压力,供应商已实施两位数提价,并可能在2026年下半年再次提价。

  • 2026年4-5月LME铜现货均价约12,891美元/吨,5月13日盘中升至14,097美元/吨
  • 上游供应商将材料成本与市场波动挂钩,增加加工费调整并削减低利润产品
  • 被动元件和PCB制造商面临成本压力,供应商已实施两位数提价

Cerebras下一代晶圆级芯片CS4仍采用5nm制程,原因是SRAM缩放已基本停滞,即使采用3nm也无法解决,揭示了AI芯片设计中SRAM扩展的瓶颈。

  • Cerebras CS4 下一代芯片仍采用 5nm 制程
  • SRAM 缩放已完全停滞,3nm 无法解决该问题

开放团队发布MiniCPM5-1B模型,采用Apache 2.0许可证,支持混合推理能力。该模型参数规模为1B,适用于轻量级部署。

  • MiniCPM5-1B模型发布
  • 采用Apache 2.0开源许可证
  • 支持混合推理能力

PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 图像生成模型,该系列模型旨在高质量运行。

  • PrismML 发布 1-bit 图像生成模型
  • PrismML 发布 Ternary Bonsai Image 4B 模型

Warp利用GPT-5.5及OpenAI模型,在本地、云端和开源开发工作流中协调编程代理,推动AI辅助开发。

  • Warp使用GPT-5.5协调编程代理

OpenAI宣布在2026年全球选举前,将帮助人们获取信息、支持网络防御者并提高AI透明度,以应对选举中的虚假信息和网络安全挑战。

  • OpenAI在2026年全球选举前提供信息获取帮助
  • OpenAI支持网络防御者并提高AI透明度
2026-05-26T23:48

curl项目面临AI辅助安全报告激增,报告数量是2024年的4-5倍,质量显著提高,团队工作压力空前,但漏洞严重性多为低或中等。

  • 安全报告数量是2024年的4-5倍
  • 报告质量前所未有地高
  • curl漏洞严重性多为低或中等

SK海力士拒绝了Alphabet、微软、Meta等美国科技巨头数十亿美元的投资支持,原因是担心接受投资会带来独家供应义务,影响其超供应商地位。目前SK海力士在HBM市场与三星形成双寡头,今年产能已售罄。

  • SK海力士拒绝Alphabet、微软、Meta数十亿美元投资支持
  • 拒绝原因是担忧独家供应义务影响超供应商地位
  • SK海力士HBM今年产能已售罄,与三星形成双寡头

独家消息称台积电3nm制程报价下半年上涨15%,明年可能再涨10%,CEO魏哲家预计将在股东会上说明具体情况。

  • 台积电3nm价格下半年上涨15%
  • 台积电3nm明年可能再涨10%
  • CEO将在股东会说明价格调整

Semianalysis发布LLM推理延迟分析:端到端延迟中prefill占48%,decode占52%;prefill又分为prefill extend(缓写入)和cache read(缓存读取)。

  • LLM端到端延迟中prefill占48%
  • LLM端到端延迟中decode占52%
  • Prefill分为prefill extend和cache read

Google在I/O 2026上改革搜索,用AI代理替换蓝色链接,引发用户不满,导致隐私搜索引擎DuckDuckGo安装量激增30%。

  • Google在I/O 2026上用AI代理替换蓝色链接
  • DuckDuckGo安装量因用户反对而增长30%