NVIDIA Vera Rubin 平台通过 NVL72 系统处理代理式 AI 推理中的非确定性轨迹,解决大规模推理工作负载的延迟问题。
a16z进行的一次GTM调查发现,自AI工具大规模采用以来,CRM使用率有所上升。AI代理能够监听通话并将结构化笔记写回系统,使得CRM中的数据比以往更加丰富,促使销售人员更多使用CRM。
OpenAI对苹果的ChatGPT集成效果不满,认为未能带来预期的订阅用户和曝光度,因此正在积极考虑对苹果采取法律行动。
一款名为Clawdmeter的开源工具发布,可将Claude Code的使用统计转化为桌面仪表盘,面向AI编程重度用户。
TakeCareOS 发布,这是一个面向护理机构的 AI-first 操作系统,整合排班、CRM、护理笔记、消息、发票、考勤、合规等功能,并通过 AI 代理自动处理协调员的行政工作。
Aleph,一个完全自洽的AI智能体系统,在包括Putnam在内的所有主要定理证明基准测试中表现优异,达到最高水平。
PrimeIntellect宣布与LangChain合作,共同部署自我改进的代理,实现持续学习功能。
LangSmith Fleet 为开发者及 Plus 计划用户推出由 Fireworks AI 支持的免费模型,降低了使用门槛。
Fleet现在内置了由Fireworks AI驱动的模型,并提供免费token。这是一个产品集成动态,涉及AI模型在Fleet平台上的应用。
Datadog 发布 Toto 2.0 时间序列基础模型权重,引发对时间序列模型规模定律的讨论。
Y Combinator采访了RevenueCat、Greptile、Firecrawl等十余家DevTool公司的创始人,讨论AI Agent现状和软件工程未来,话题包括代理作为客户、编码终结、早期错误、AI意外发现等。
Josh Woodward在Twitter上更新称,某产品存在一个bug,将在下一个版本中修复,计划在Google I/O大会之后发布。该帖获得236次点赞、2次转发和9条回复。
Datadog发布Toto 2.0时间序列基础模型系列,权重开源(Apache 2.0),参数规模从4M到2.5B,性能随规模提升,在BOOM、GIFT-Eval、TIME基准上取得领先。该模型首次在时间序列领域展示了缩放定律。
Datadog AI 发布了 Toto 2.0,包含 5 个开放权重的时序预测模型,参数规模从 4M 到 2.5B,声称实现了时间序列建模的规模化。
Anthropic发布论文,阐述对中美AI竞争的看法,认为美国和民主盟友在前沿AI领域保持领先,并讨论如何维持这一优势。
LangChain 宣布推出 LangChain Labs,这是一个新的应用研究组织,专注于持续学习(Continual Learning)。
亚马逊Lex推出Assisted NLU功能,利用大语言模型提升机器人准确率,无需手动配置,包括主要模式、回退模式和意图消歧,包含在标准定价中。
本文介绍如何将Stream的Vision Agents开源框架与Amazon Bedrock和Amazon Nova 2 Sonic结合,构建实时语音代理。该方案支持低延迟音频流、函数调用、自动重连和多语言,解决生产级语音应用的工程挑战。
AWS宣布Amazon Quick Sight支持跨账户Athena访问,允许用户在中心化Quick部署中查询多个业务单元账户的Athena数据,无需管理多个订阅或承担所有查询成本,提升了数据统一分析与洞察能力。
Amazon Bedrock AgentCore Browser 新增支持 Chrome 企业策略和自定义根 CA 证书,允许组织对 AI 浏览器代理进行细粒度控制,包括 URL 过滤、下载限制和密码管理器配置,并可连接内部服务。
Auxos 是一款新工具,允许营销、产品和研究团队在真实客户之前大规模模拟决策,快速测试信息、广告、定价和品牌定位假设。该产品由 Y Combinator 支持并正式发布。
谷歌在Google Cloud Next大会上发布新型推理专用TPU,采用名为Broadfly的新型网络拓扑。利用高基数设计,单pod最多可扩展到1152个TPU,相比Ironwood,pod大小提升4.5倍,网络直径减小,任意两个芯片间最多7跳。
Uptime Institute最新研究显示,数据中心宕机事件持续下降,但AI设施可能逆转这一趋势,带来更多宕机风险。
AI公司Poetiq在Twitter宣布,其Meta-System从零构建了编码工具,在LiveCodeBench Pro基准测试上达到最先进水平(SOTA),未使用微调或特殊技术。
Andrew Ng宣布与AMD合作推出新课程《Transformers in Practice》,由Sharon Zhou授课。课程提供Transformer模型实际应用知识,包括文本生成机制、注意力层、推理优化等技术,并配有交互式可视化。
Nvidia Nemotron 获得 Deep Agents 0.6 版本的原生支持,该消息由 William Markito 在 Twitter 上发布。这标志着 AI 开发框架与 Nvidia AI 工具进一步集成。
Gigacatalyst推出AI工具,允许软件公司通过对话快速构建缺失功能,6周内帮助客户解锁100万美元管道并发布800个新功能。
FireworksAI 宣布成为 LangChain 的 Deep Agents Inference 合作伙伴,该消息在旧金山举行的 Interrupt 2026 会议上公布。
台达电子成为英伟达及大多数原始设计制造商/原始设备制造商在超级系统领域的首个合格合作伙伴。
据推特消息,英伟达H100芯片在中国已开始正式销售,但未提供具体细节和官方确认,需后续验证。
Khosla Ventures 向 Ian Crosby 的新公司 Synthetic 投资 1000 万美元,Synthetic 致力于开发全自主 AI 记账服务。Crosby 此前创立的 Bench 已倒闭。
Anthropic宣布与盖茨基金会合作,承诺提供2亿美元资助、Claude credits和技术支持,用于全球健康、生命科学、教育、农业和经济流动等领域的项目。
初创公司PLAN0发布产品,可将建筑图纸转化为成本估算和分析,声称已承载200亿美元项目,致力于成为建筑行业的数据平台。
英伟达RTX 5090和RTX Pro 6000已获中国批准进口并开始销售。
播客讨论科技新闻:Anthropic从Elon购买算力并承诺向Google投入2000亿美元;Cerebras进行IPO;Ramp最新估值400亿美元;Hubspot下跌而Monday上涨。同时提及风险投资策略和创始人心态。
思科宣布裁员近4000人,以节省资金加大对人工智能领域的投资。同时,公司报告了创纪录的季度收入。
Wirestock 获得 2300 万美元融资,平台拥有超过 70 万创作者,向 AI 实验室供应照片、视频和 3D 内容。
亚马逊科学发布Promptimus,一种自动优化已完善提示的方法,具有模型无关、性能驱动、聚焦利用、全自动等优势,通过AI代理识别失败点并精准改进,无需人工工程。
OpenAI发布Codex功能,用户可通过ChatGPT移动应用在任何地方实时监控、引导和批准编码任务。
LangChain 在 Interrupt 大会上发布了底层数据库 SmithDB 和自动化排障引擎 LangSmith Engine,解决 Agent 运行海量 trace 导致的数据库瓶颈。
HuggingFace本周达到100万个数据集的里程碑,所有开源模型基于此,下一步目标为更多开放数据集。
美国参议员桑德斯和AOC提出法案,暂停所有AI数据中心建设。全美已有300多项地方法案,导致2026年计划建设的数据中心中一半面临延迟或取消。这些数据中心每个都会为当地经济带来数十亿美元投资。
Equinix扩展了Fabric Geo Zones,旨在解决数据主权问题。公司将其定位为分布式AI和混合多云基础设施的关键层,提供网络级主权控制。
百度创始人李彦宏在Create 2026大会上提出新指标DAA(日活智能体数),强调AI竞赛应从模型转向智能体的执行力。他认为智能体是AI应用的最主流形态,并回顾了百度在智能体领域的布局,包括秒哒和伐谋等产品。
密集GPU集群正在重塑数据中心设计,扩大AI工厂与传统企业设施之间的差距。
江森自控完成对合金企业的收购,以扩展热管理技术,满足AI驱动的数据中心冷却需求。
金融科技公司Ramp最新AI指数显示,Anthropic在企业付费用户中的采用率首次超过OpenAI,自2025年以来增长4倍,反映企业AI市场格局变化。
德州电力可靠性委员会(ERCOT)警告,AI驱动的负荷预测可能高估了数据中心需求,从而影响德州电网规划调整。
AIDC板块景气度上行,金盘科技2025年海外订单31.6亿元,2026年一季度海外订单22亿元。美国变压器价格持续上涨,加急费达30%-50%。
TELUS将在加拿大不列颠哥伦比亚省建设一个由三个站点组成的AI数据中心集群,旨在支持加拿大在境内保留AI基础设施和数据的主权需求。