Amp Neo 正式向所有人开放可用,用户无需再使用后缀。
亚马逊研究奖(ARA)公布2025年秋季获奖者,共68名来自11国49所大学,涵盖AI安全、Agentic AI、自动推理、AWS密码学、网络安全与反滥用技术、可持续性六个领域。获奖者可获得不限用途资金和AWS推广积分,并获取亚马逊研究联系人、公开数据集等资源。
Deepagents新版本发布,亮点是delta channels,它大幅改进了代理检查点的存储方式。
据SemiAnalysis报告,Anthropic的增长和Amazon Bedrock的产品组合推动了AWS利润率上升,显示出更强的运营杠杆。与同行相比,AWS在Bedrock和Anthropic交易中表现出优势。
LangChain 发布 Deep Agents v0.6 版本,引入 Delta channels,可将长期运行代理的检查点存储减少高达 100 倍,且不影响性能。
NVIDIA RTX更新:DLSS 4.5以Unreal Engine插件形式发布,NVIDIA ACE扩展多语言AI角色能力,支持游戏开发者实现AI驱动角色、帧生成和光线追踪渲染。
Rentahuman平台允许AI代理与人类沟通并支付其完成现实世界任务,旨在利用AI创造新工作并全球协调工人。
OpenAI基金会宣布初始承诺2.5亿美元,用于测量、过渡支持和新方法以促进广泛共享繁荣。
Defiance公司提交了中国机器人ETF的申请,该ETF将专注于中国机器人相关公司。
Y Combinator转发了Motion Studio的发布信息。Motion Studio是一款创意执导和制作高端发布视频的产品,使用自有视频技术端到端完成。
RF-DETR目标检测与分割模型现已集成至Hugging Face Transformers库。该模型在检测和分割任务上达到最优性能,超越YOLO系列。项目由skalskip92在推特宣布,获得关注。
Hugging Face Transformers 现已集成 RF-DETR 模型,该模型在目标检测和分割任务上声称达到最先进水平,超越 YOLO。
电力约束、许可审批和电网接入正在重新定义欧洲各国的数据中心市场,推动增长向能快速推进的项目转移。
AI编码初创公司Cognition以250亿美元投前估值融资10亿美元,其年化收入达4.92亿美元,8个月内估值翻倍。
Perplexity AI宣布开源其重建的Unigram分词器,声称可将CPU利用率降低5-6倍,同时提及小模型相关技术。
SEMI与Global Net Corp.发布玻璃基板市场报告,指出AI和高性能计算推动先进封装需求,预测2028-2040年玻璃基板市场复合年增长率为67.2%。
Pika Labs分享了一项名为Pika Experiments的实验项目,展示其正在探索的AI视频生成技术新方向。该项目是团队在幕后尝试的初步想法。
ProteinRos宣布推出新一代结构预测模型ESMFold2,该模型能够从单条序列直接预测蛋白质结构,代表了技术上的重要进展。
据《每日电讯报》报道,法国总统马克龙撕毁65年来的原则,决定动用法国核武器保卫欧洲,无论美国是否参与。波兰、德国等国家对此关注。
MiniMax M2技术报告发布,总结了多项技术发现:选择全注意力机制而非混合滑动窗口;线性/稀疏注意力在生产系统中部署困难且前缀缓存支持差;细粒度MoE(128专家top-8)在2B参数规模下推理和代码能力显著提升;训练流程中增加了软件工程agent行为训练。
塔塔咨询服务(TCS)推出新的主权云平台,聚焦欧洲数据中心,旨在解决数据主权问题,并帮助运营商实现网络、AI系统和关键基础设施的现代化。
RF-DETR实时目标检测与分割模型已集成至HuggingFace Transformers,该模型由Roboflow开发,具备SOTA性能,可通过HuggingFace平台使用。
Eden公司今日发布工业半人形机器人Eden I,可按小时租赁,提供自主机器人服务。
SpaceX IPO文件披露,亏损同比增长700%,收入增速放缓至个位数,市销率达107倍。文件显示公司尚未盈利,但营收仍增长。
ElevenLabs发布全新音乐生成模型,支持在歌曲中间切换流派,用户可以重新生成特定部分而不影响歌曲其余部分。
TeraWulf与施耐德电气合作,将纽约州布法罗的一座燃煤电厂改建为500兆瓦的AI数据中心园区。该园区旨在提供高性能计算基础设施,支持人工智能应用。Data Center Knowledge团队实地探访该园区,了解其电力与冷却解决方案。
睡眠科技初创公司SOND由Bose前睡眠产品负责人领导,获得700万美元融资,推出AI驱动的睡眠耳塞。
犹他州提议建设9吉瓦的Stratos AI园区,反映了AI基础设施向专用能源系统、加速许可和直接控制电力的演变趋势。
Alex Rives宣布推出ESMFold2,一个用于蛋白质生物学的开放科学引擎,支持预测、设计和发现。
Broadcom与FuriosaAI合作开发机架级推理平台,旨在推动AI基础设施转向以太网结构、chiplet和节能token生成。
AI视频公司Runway的CEO将访问日本,并于本周举办登坛活动。活动信息通过社交媒体发布,提醒用户报名参与。
本期节目介绍了Codex中的/goal命令,它将AI从逐轮助手转变为自主代理,可执行多步骤复杂任务。通过三个实例展示了其功能:五小时内消除数千个Sentry错误、四小时内将3900封邮件清理至68封、整理数百个Linear任务。同时讲解了如何编写有效目标提示及其适用场景。
德克萨斯州修建的CREZ输电走廊原本用于运输风电,如今这些输电通道正越来越多地吸引超大规模AI基础设施的部署。
思科与OpenAI合作,利用Codex重新定义企业工程,帮助思科扩展AI原生开发、加速AI防御工作并自动化缺陷修复。
华为Fellow透露,公司将于今年秋季量产采用3D堆叠技术的麒麟手机芯片,该技术领先台积电同类方案3年,且散热问题已通过设计解决。此外,华为计划在2026-2027年将XPU功耗效率分别提升40%-80%和80%-120%,7nm与5nm封装可实现等效3nm性能,成本与2D工艺相当。
CD PROJEKT RED官方宣布,《巫师3:狂猎》第三个扩展包“Songs of the Past”将于2027年在PlayStation平台发布,该消息来自官方推特,获得大量关注。
推特用户@jukan05表示,半导体设备可能严重稀缺,tera-fab项目比预期更认真;英特尔需扩大产能并承接台积电客户,三星已获多个客户,台积电可能在Q3上调资本开支。SK海力士在HBM4上表现优于三星,HBM价格重谈不顺利,超大规模客户不愿重新谈判。
Nebius在萨里郡Ark的Longcross园区扩建AI基础设施,填充LP01机房以满足高密度GPU就绪容量的增长需求。
GoogleDeepMind发布Gemini Embedding 2原生多模态嵌入模型白皮书。该模型能够处理文本、图像等多种模态数据,提升检索与生成任务性能。
华为提出τ定律,可在成熟制程通过压缩时延、逻辑折叠实现性能突破,无需依赖EUV。该技术利好光互联、液冷及国产AI算力,光模块需求上调,CPO产业加速;液冷进入放量元年,未来算力中心将标配;国产AI算力绕过先进制程封锁,昇腾950/990基于成熟制程,2027年国产算力需求大幅增长。
The Rundown独家采访Google DeepMind CEO Demis Hassabis。Hassabis表示通用人工智能(AGI)有望在2030年左右实现,并讨论了AI在药物发现和疾病治愈方面的应用前景。
美国环保署计划简化数据中心建设审批流程,以减少监管障碍,但此举可能引发法律诉讼并加剧环境担忧。
PC和服务器CPU市场中x86份额占主导但ARM逐年提升。3纳米产能紧缺导致代工价格上涨10%-15%,CPU从25Q4开始涨价,26Q2高端服务器CPU供需缺口放大。AI Agent和机柜方案推动CPU需求增长,国产CPU有望在开放市场获增量。
开源截图工具Screendrop发布,支持用户使用R2和Hono Worker自建云存储,项目托管于GitHub。
联电(UMC)在股东会上表示,因新加坡厂扩建导致成本负担增加,计划下半年选择性涨价,并预计2027年与客户进行全面价格重谈。
据独家消息,NVIDIA的推理GPU“Rubin CPX”发布存疑,公司未订购相关内存和基板,行业视该项目已取消。此前NVIDIA计划今年下半年发布,采用128GB GDDR7内存,但无进展。
OpenAI联合Thrive和Crete,利用Codex构建自我改进的税务代理系统,实现自动税务申报,提升准确性并加速工作流程。
根据英国《金融时报》报道,香港超越瑞士成为全球离岸财富中心。这一变化反映了全球财富管理格局的重大转变,香港在吸引国际资本方面取得领先地位。
Fireworks AI创始人宣布公司年化运行率突破8亿美元,第一季度收入同比增长4倍(不含Cursor业务),并正在招聘人才。
中国最大被动元件厂商风华高科因订单激增,暂停接受0402/0603尺寸片式电阻和MLCC订单,产能利用率已达90%。供应链将此举归因于预防性采购和短缺担忧,行业预期可能开启涨价周期。银价上涨推升成本,高端MLCC短缺加剧,Murata、三星电机等厂商产能利用率超90%。