清除 当前 2582 条 / 共 3571 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 2 小时前 微信公众号 · 42章经 · 4 天 20 小时前 微信公众号 · DeepTech深科技 · 4 天 20 小时前 微信公众号 · Founder Park · 4 天 20 小时前 微信公众号 · FundaAI · 4 天 20 小时前 微信公众号 · 九章智驾 · 4 天 20 小时前 微信公众号 · 晚点LatePost · 4 天 20 小时前 微信公众号 · 琢磨事 · 4 天 20 小时前 微信公众号 · 甲子光年 · 4 天 20 小时前

Deep Agents宣布与Nebius AI的Token Factory集成,使用户能够在生产级AI基础设施上运行代理工作负载。该消息由LangChain转发,获得一定关注。

  • Deep Agents集成Nebius AI Token Factory
  • 支持在生产级AI基础设施上运行代理工作负载

Perplexity AI 宣布其产品 Perplexity Computer 帮助 Rho 公司每周会议时间减少 90%。该产品可自动检查 Slack、Notion、Jira、Figma 和 Google Docs 等工具。

  • Rho 使用 Perplexity Computer 将每周会议时间减少 90%
  • Perplexity Computer 可检查 Slack、Notion、Jira、Figma 和 Google Docs

Andrej Karpathy是OpenAI联合创始人,已加入Anthropic的预训练团队。预训练是训练Claude模型核心知识的关键阶段,也是构建前沿模型中最昂贵和计算密集的环节之一。

  • Andrej Karpathy加入Anthropic预训练团队
  • 他曾是OpenAI联合创始人

Radar完成1.7亿美元B轮融资,估值达10亿美元。其天花板安装的硬件可高精度读取RFID标签,帮助零售商实时了解库存,已在1400多家门店部署,客户包括American Eagle Outfitters和Gap Inc.等。

  • Radar获1.7亿美元B轮融资,估值10亿美元
  • 其RFID读取硬件精度99%,部署超1400家门店
  • 合作零售商包括American Eagle和Gap

弗吉尼亚州修订数据中心发电机许可指南,反映对超大规模备用发电机在AI负载增长下使用频率增加的担忧,社区审查加强。

  • 弗吉尼亚州收紧数据中心发电机许可
  • AI负载增长导致备用发电机使用更频繁
  • 社区对数据中心发电机的审查加强

AWS 博客介绍通过自定义 MCP 服务器扩展 Kiro CLI 的对话记忆,集成 Amazon Bedrock AgentCore Memory 托管服务,实现持久上下文存储与语义检索,支持短期工作记忆和长期智能记忆。

  • Amazon Bedrock AgentCore Memory 是托管服务,提供持久记忆和语义搜索
  • Kiro CLI 可自定义 MCP 服务器集成该记忆功能

亚马逊宣布SageMaker Feature Store新增支持Apache Iceberg表格式、流式摄取、批量摄取以及通过Lake Formation进行细粒度访问控制,解决元数据膨胀和访问控制难题。

  • 支持Apache Iceberg表格式和流式摄取
  • 支持Lake Formation细粒度访问控制
  • 新功能在SageMaker Python SDK v3.8.0中可用

AWS 介绍了在 Amazon Bedrock 上实现程序化工具调用(PTC)的三种方式:自托管 Docker 沙箱、托管解决方案和基于 Anthropic SDK 的代理。PTC 通过模型生成代码并在沙箱中执行,减少多工具工作流中的延迟和 token 消耗。

  • AWS 发布 Amazon Bedrock 上程序化工具调用的三种实现方式
  • 程序化工具调用通过模型生成代码在沙箱执行,仅返回最终结果
  • 三种方式包括自托管 Docker 沙箱、托管解决方案和代理 SDK

AI研究员Andrej Karpathy宣布加入Anthropic,将专注于前沿大语言模型的研发工作。他保持对教育的热情,计划未来继续从事相关教育项目。

  • AI研究员Andrej Karpathy加入Anthropic
  • Karpathy将从事LLM前沿研发工作

Y Combinator宣布Andustry(@andustry_hq)是一款AI原生经纪商,帮助制造商寻找工业品供应商。该平台声称可帮助客户节省30%成本,将采购时间缩短一半。

  • Andustry是AI原生经纪商,帮助制造商找工业品供应商
  • 可节省30%成本,缩短一半采购时间

Modal 宣布现支持 Claude AI 的托管代理,通过 Modal Sandboxes 提供运行环境。

  • Modal 支持 Claude AI 的托管代理
  • 使用 Modal Sandboxes 作为运行环境

Hugging Face 与 tomaarsen 联合发布 Ettin Reranker 家族,包含六种新的 CrossEncoder 重排序模型,参数规模从 17M 到 1B,声称在同规模下达到最先进性能。

  • 发布 Ettin Reranker 家族,含六种新模型
  • CrossEncoder 重排序器参数 17M 至 1B
  • 宣称达到同规模最先进水平

General Instinct公司发布技术方案,将前沿AI模型部署到边缘硬件(如Jetson、移动NPU、ARM CPU),实现离线低延迟运行,帮助机器人和物理AI团队。该消息由Y Combinator发布祝贺。

  • General Instinct将前沿AI模型部署到受限边缘硬件
  • 产品支持Jetson、移动NPU和ARM CPU
  • 公司获得Y Combinator祝贺并发布

黑石集团承诺投资50亿美元,与谷歌合作成立一家新的美国数据中心公司,专注于围绕谷歌云TPU(AI定制芯片)建设AI云基础设施。

  • 黑石承诺投资50亿美元
  • 新公司围绕谷歌云TPU建设
  • 新公司服务于AI云计算

Dell通过NativeEdge、AI Factory和PowerEdge系统推进边缘编排,旨在分布式数据中心环境中实现实时AI扩展。

  • Dell推进边缘编排技术,使用NativeEdge、AI Factory和PowerEdge系统
  • 目标是在分布式数据中心环境中实现实时AI扩展

LeadbayAI 宣布获得 430 万美元融资,其客户包括 Corgi、Deel、L'Oréal 等公司,旨在通过 AI 革新销售流程。

  • LeadbayAI 获得 430 万美元融资
  • 客户包括 Corgi、Deel、L'Oréal

俄克拉荷马州通过新立法,旨在防止人工智能和超大规模数据中心的电力成本转嫁给居民用户。该法律针对数据中心电力费用分摊问题,为居民提供保护。

  • 俄克拉荷马州新立法禁止将AI数据中心电力成本转嫁给居民用户

华创研究所2026年中期策略会提及南方传媒:2025年营收86.35亿元,归母净利润10.43亿元同比增近29%;2026年Q1营收19.69亿元,归母净利3亿元;核心教材教辅业务增2.43%,粤版国标教材审定数全国第二,粤教祥云覆盖1.94万所学校;AI业务2025年体量约2亿元,预计2026年增20%以上;发力书影融合新赛道。

  • 2025年南方传媒营收86.35亿元,归母净利润10.43亿元,同比增近29%
  • 粤版国标教材审定数全国第二,粤教祥云覆盖1.94万所学校
  • AI业务2025年体量约2亿元,预计2026年增长20%以上

OpenAI宣布推进AI内容来源技术,包括Content Credentials、SynthID和验证工具,以帮助用户识别和信任AI生成的媒体内容。

  • OpenAI推出内容来源技术进展
  • 包括Content Credentials、SynthID和验证工具
  • 旨在帮助识别和信任AI生成媒体

马斯克对OpenAI、Sam Altman、Greg Brockman和微软提起的超过1000亿美元的诉讼被陪审团驳回,理由是起诉时间过晚。马斯克称判决为“日历技术性”问题并计划上诉。

  • 马斯克对OpenAI和微软的诉讼被驳回
  • 陪审团认为案件起诉时间过晚

GSR分析文章指出,Nvidia在中国收入占比从约26%降至约5%,但其战略意图并非收入,而是将中国视为观察AI基础设施演进的实验室。中国本土AI芯片生态(华为、DeepSeek、阿里巴巴)已进入架构实验和系统优化阶段。然而,GSR认为Nvidia中国团队未能有效执行战略,与客户沟通不足。

  • Nvidia在中国收入占比从约26%降至约5%
  • 中国本土AI芯片生态已进入架构实验和系统优化阶段
  • GSR指出Nvidia中国团队未能与客户有效沟通

暗光纤提供商Big Fiber获得2.5亿美元融资,将用于扩建暗光纤路由和容量。此次融资的背景是超大规模云服务商在电力丰富地区建设分布式AI园区,推动了对暗光纤的需求。

  • Big Fiber获得2.5亿美元融资
  • 融资用于增加暗光纤路由和容量
  • 超大规模云商在电力丰富地区建设分布式AI园区

陶氏推出面向液冷数据中心的新型冷却液管理服务,旨在满足AI工作负载对热可靠性的增长需求。该服务提供全面的冷却液支持,确保数据中心高效运行。

  • 陶氏推出了面向液冷数据中心的新型冷却液管理服务。
  • 该服务旨在满足AI工作负载对热可靠性的增长需求。

Digital Realty在巴塞罗那启用首个数据中心BCN1,旨在满足AI算力需求并受益于地中海海底电缆增长。

  • Digital Realty在巴塞罗那推出首个数据中心BCN1
  • 该数据中心服务于AI需求和海底电缆增长

三星电子和SK海力士为应对内存短缺,加速工厂建设竞赛。三星加快平泽园区P5 Fab 1建设,计划将工期缩短过半,原定2028年下半年完工;P6工厂将于7月开工。双方争夺施工材料,竞争加剧。

  • 三星加快平泽园区P5 Fab 1建设,工期计划缩短过半
  • 三星P6工厂(P5 Fab 2)定于7月开工
  • 三星与SK海力士因施工材料短缺竞争加剧

GBrain发布v0.36.1版本,新增Hindsight功能,可追踪预测并帮助改进预测。该功能灵感来自周末黑客马拉松团队的创意,并首次加入了完整评估。

  • GBrain v0.36.1版本发布
  • 新增Hindsight功能,追踪预测以改进预测
  • 功能灵感来自黑客马拉松团队创意,包含首次完整评估

Anthropic正在构建下一代Claude模型,其负责人Alex Albert分享了5个关键要点,包括模型和硬件协同设计等方向。

  • Anthropic正在开发下一代Claude模型
  • Alex Albert分享了5个模型构建要点

llama.cpp 新增 MTP(多令牌预测)支持,本地模型推理速度显著提升,足以作为日常驱动。Qwen3.6-27B 密集生成在 A10 GPU 上得到展示,推动本地 AI 部署实用性。

  • llama.cpp 新增 MTP 支持,加速本地模型推理。
  • 本地模型速度提升至可作为日常驱动。
  • Qwen3.6-27B 在 A10 上展示密集生成性能。

玻璃纤维严重短缺,AI服务器升级至224G PAM4推动高性能低介电Low-Dk和低热膨胀Low-CTE材料需求激增。台燿科技高端M7/M8材料供不应求,计划2026年三季度出货下一代M9材料。日本企业主导高端Low-CTE玻璃纤维市场,台湾厂商富乔纤维进入AI服务器供应链,宝特扩展高强度玻璃纤维,Grandsys受益于通用产品涨价并开发新材料。

  • 玻璃纤维严重短缺,AI服务器升级至224G PAM4推动高端材料需求
  • 台燿科技高端M7/M8材料供不应求,计划2026年Q3出货M9
  • 台湾玻璃纤维厂富乔、宝特、Grandsys受益于短缺

Lucius是一家企业级AI员工公司,创始人赵赫称其产品为Context Layer,通过有SLA的合同保证交付。公司服务三十余家企业客户,最快案例客户仅看10分钟Demo即购买。团队12人,CTO来自谷歌YouTube机器学习组。

  • Lucius为企业提供有SLA的AI员工服务
  • 客户最快看10分钟Demo即购买
  • 团队12人,CTO来自谷歌YouTube

据台湾媒体,英伟达CEO黄仁勋可能重返台湾,并在Computex展会上发布一款与联发科合作开发的边缘设备芯片。

  • 黄仁勋可能再次前往台湾
  • 计划在Computex发布与联发科合作的边缘芯片

英伟达官方宣布,SpaceX及埃隆·马斯克将试用其新一代Vera CPU。该CPU为英伟达最新产品,标志着其在CPU领域的重要布局。

  • 英伟达推出Vera CPU
  • SpaceX和马斯克将试用该CPU

Perplexity Computer 新增 Artifacts 页面,侧边栏提供快捷方式,用户可查看和固定应用、文档等。

  • Perplexity Computer 推出 Artifacts 页面
  • 侧边栏新增 Artifacts 快捷方式
  • 用户可查看和固定应用、文档

戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。

  • 戴尔CEO称提供模型选择避免基础设施混乱
  • 演讲提及Kimi K2.6和DeepSeek V模型

huggingface的hf-mem工具更新,新增将混合专家模型(MoE)内存估计分解为基础权重、路由专家和KV缓存三个部分的功能。

  • hf-mem工具新增将MoE内存估计分解为三个部分的功能

llama.cpp 新增 MTP 支持,使本地模型运行速度足够日常使用。Qwen3.6-27B 模型在 A10 GPU 上实现快速文本生成。

  • llama.cpp 增加 MTP 支持,提升本地模型推理速度。
  • Qwen3.6-27B 模型在 A10 上实现快速生成。

NVIDIA首次交付自研CPU Vera给AnthropicAI、OpenAI、SpaceX和OracleCloud等合作伙伴,面向智能体AI时代。这是NVIDIA首款定制CPU,标志着其进入CPU领域。

  • NVIDIA交付首批自研Vera CPU给AnthropicAI、OpenAI、SpaceX和OracleCloud
  • Vera是NVIDIA首款定制CPU,面向智能体AI时代

阿里未来资本开支超原计划3800亿元,数据中心规模较2022年增10倍,自研AI推理芯片已量产,60%算力服务外部客户;腾讯一季度经营性资本开支同比增84%,下半年国产算力资本开支将大幅提升。国家建设全国一体化算力网,今年六网基建投资超7万亿元,要求自立自强,利好国产芯片、服务器、IDC等全产业链。

  • 阿里未来资本开支将超原计划3800亿元,数据中心规模增10倍
  • 腾讯一季度经营性资本开支同比增84%
  • 国家建设全国一体化算力网,六网基建投资超7万亿元

SandboxAQ 将其药物发现模型集成到 Anthropic 的 Claude 平台,旨在降低 AI 药物发现的计算门槛,使无需深厚计算背景的研究人员也能使用。

  • SandboxAQ 将药物发现模型集成到 Claude 平台
  • 该集成降低了计算门槛,无需计算博士学位

Y Combinator将于5月30日在旧金山举办语音代理黑客马拉松,获奖者将获得保证的YC面试机会及其他特别奖项。

  • YC将于5月30日在旧金山举办语音代理黑客马拉松
  • 获奖者可获得保证的YC面试机会

Mentra Live开源智能眼镜正式发布,面向实际工作场景部署,已出货数千台。

  • Mentra Live开源智能眼镜发布
  • 面向实际工作场景部署
  • 已出货数千台

据推特消息,文学期刊正在发表并奖励AI创作的故事,包括知名杂志Granta。这反映了AI在文学领域的渗透趋势。

  • 文学期刊正在发表并奖励AI写的故事,包括Granta杂志

GBrain v0.36版本发布,包含全新README和重构的skillpack系统,允许用户自行修改技能包,同时保持与官方更新兼容。

  • GBrain v0.36版本发布
  • 全新README和重构skillpack系统

Anthropic收购了纽约初创公司Stainless,该公司成立于2022年,专注于自动化生成和维护软件开发工具包(SDK),其客户包括OpenAI、Google和Cloudflare。

  • Anthropic收购了纽约初创公司Stainless
  • Stainless为OpenAI、Google、Cloudflare提供SDK工具

Nous Research发布Hermes Agent v0.14.0,新增Grok订阅、Codex运行时和Windows测试版支持。

  • Nous Research发布Hermes Agent v0.14.0
  • 新增Grok订阅、Codex运行时和Windows测试版

VentureBeat报道LangSmith Engine可自动化代理修复循环,检测失败、诊断原因并起草PR,涉及多模态功能。

  • LangSmith Engine实现代理修复循环自动化
  • 可检测失败、诊断原因并起草PR

本文介绍如何使用Amazon Nova 2 Lite进行内容审核,基于MLCommons AILuminate标准,支持自定义审核政策。文章展示了该模型在三个公共数据集上与其他基础模型的基准测试结果,强调通过提示调整审核策略无需训练数据。

  • Amazon Nova 2 Lite可用于内容审核。
  • 使用MLCommons AILuminate v1.1作为审核政策。
  • 对Amazon Nova 2 Lite与多个基础模型进行了基准测试。

llama.cpp 新增对 Qwen3.6 系列的多 Token 预测(MTP)支持,被视为本地 AI 生态的重要里程碑,带来性能提升。

  • llama.cpp 添加 MTP 支持 Qwen3.6 系列
  • 该更新被认为是本地 AI 生态的里程碑

生物学家利用DeepMind的Co-Scientist系统快速发现新因子,成功逆转人类细胞衰老,实现细胞年轻化。

  • 生物学家使用Co-Scientist系统发现新因子
  • 新因子成功使人类细胞年轻化

Hugging Face与戴尔在戴尔科技世界大会上宣布合作,旨在通过开源模型推动企业级本地AI部署,作为应对GPU短缺的解决方案。

  • Hugging Face与戴尔达成合作
  • 合作在戴尔科技世界大会主题演讲中宣布
  • 合作聚焦企业级本地AI部署