清除 当前 2581 条 / 共 3575 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 8 小时前 微信公众号 · 42章经 · 5 天 3 小时前 微信公众号 · DeepTech深科技 · 5 天 3 小时前 微信公众号 · Founder Park · 5 天 3 小时前 微信公众号 · FundaAI · 5 天 3 小时前 微信公众号 · 九章智驾 · 5 天 3 小时前 微信公众号 · 晚点LatePost · 5 天 3 小时前 微信公众号 · 琢磨事 · 5 天 3 小时前 微信公众号 · 甲子光年 · 5 天 3 小时前

Anthropic与SpaceX签署计算合作协议,Anthropic将租赁SpaceX的Colossus 1超级集群,该集群功率超300MW,配备超22万张Nvidia GPU。此举解决了Anthropic的算力问题,并可能削弱OpenAI的竞争优势。

  • Anthropic与SpaceX签署租赁Colossus 1的协议
  • Colossus 1是300MW的孟菲斯超级集群,含超22万张Nvidia GPU

Anthropic在年度开发者活动上宣布与xAI达成协议,接管Colossus 1数据中心,预计年交易额约50亿美元。同时发布Claude Managed Agents三项新功能,Anthropic CEO预测2026年将出现一人十亿美元公司。

  • Anthropic与xAI达成每年约50亿美元的交易,接管Colossus 1。
  • Anthropic发布Claude Managed Agents三个新功能。
  • Dario Amodei预测2026年出现一人十亿美元公司。

五位AI供应链核心人士在米尔肯全球会议上讨论了芯片短缺、轨道数据中心等话题,并质疑现有AI技术架构的合理性。

  • 五位AI供应链人士讨论芯片短缺和数据中心架构问题
  • 提到轨道数据中心的可能性
  • 质疑支撑AI技术的整体架构是否正确

SemiAnalysis发布推文称,Anthropic在一个周三增加了200MW电力容量。该信息暗示Anthropic正在扩张算力基础设施,但未披露具体项目细节。

  • Anthropic在一周内增加了200MW电力容量

一位用户在推文上发布了一项新的子二次注意力技术,声称可使长上下文大语言模型成本降低10倍且不牺牲性能,并附有链接。该技术可能影响AI模型的效率。

  • 新子二次注意力技术可降低长上下文LLM成本10倍
  • 技术不牺牲性能

Anthropic举办'Code with Claude'活动,发布多项产品更新:Claude Code routines实现自动化工作流调度;Outcomes组件实现基于规则的代理评级;多智能体编排支持专业AI团队协作;Dreams记忆系统改善长期行为;以及提升使用限制。

  • Anthropic推出Claude Code routines自动化工作流
  • Anthropic发布基于结果的代理评级系统Outcomes
  • Anthropic引入多智能体编排和梦境记忆系统

微软多个长期暂停的自建园区出现复苏迹象:北卡罗来纳州康诺弗园区于2026年第一季度破土动工;弗吉尼亚州蔡斯市园区同期出现施工活动;德克萨斯州卡斯特罗维尔园区在停滞一年多后也开始有早期动工迹象。

  • 微软多个长期暂停的自建园区恢复施工。
  • 康诺弗园区2026年Q1破土动工。
  • 蔡斯市园区同期出现施工活动。

Claude Code工程负责人透露当前招聘侧重两类人才:有产品意识的创意构建者和系统深度专家。

  • Claude Code工程负责人招聘创意构建者和系统专家

结构化输出基准数据集已在 Hugging Face 平台上发布,用户可访问获取。

  • 结构化输出基准数据集在 Hugging Face 上发布

AI从训练向推理演进,CPU/GPU配比变化,未来70%-80%算力将消耗在CPU上。AMD预测2030年AI CPU市场规模超1200亿美元,服务器CPU已涨价10%-20%。英特尔AI营收占比达60%,同比增长40%。国内海光等CPU厂商及配套公司将受益。

  • AMD预测2030年AI CPU市场规模超1200亿美元
  • 服务器CPU今年3月已涨价10%-20%
  • 英特尔AI营收占比达60%,同比增40%
2026-05-07T00:00

OpenAI宣布开始在ChatGPT中测试广告投放,以支持免费访问服务。广告将带有清晰标识,确保答案独立性,并加强隐私保护与用户控制。

  • OpenAI开始测试在ChatGPT中投放广告
  • 广告支持免费访问,并明确标识和隐私保护

ChatGPT推出可选安全功能“Trusted Contact”,当检测到用户有严重自残担忧时,会通知其信任的联系人。

  • ChatGPT引入可选安全功能Trusted Contact
  • 该功能在检测到严重自残担忧时通知信任联系人

豆包推出三档付费增值服务,海外Anthropic 2026年5月ARR达440亿美元,OpenAI预计2030年AI广告营收1020亿美元。年初至今算力租赁价涨40%,相关上市公司一季度净利增近5倍,回本周期缩至2年,净利率超20%。超节点可提升算力效率,交换芯片配比提升5-6倍,国产化进度更快。

  • 豆包推出三档付费增值服务
  • 年初至今算力租赁价涨40%
  • 相关上市公司一季度净利增近5倍

莱迪思半导体(Lattice Semiconductor)签署最终协议收购AMI,将低功耗FPGA与平台固件和基础设施可管理性技术相结合,重点服务于云和AI领域。

  • 莱迪思半导体签署协议收购AMI
  • 整合低功耗FPGA与平台固件和基础设施可管理性
  • 目标市场为云和AI领域

腾讯混元Hy3预览版发布两周后,在OpenRouter周排行榜上排名第一,处理3.66T tokens,周环比增长298%。

  • 腾讯混元Hy3预览版发布两周
  • 在OpenRouter周榜排名第一
  • 处理3.66T tokens,周环比增长298%

a16z发布推文指出,大量通过vibecoded(AI辅助编程)生成的应用程序正在涌入App Store,表明AI驱动开发趋势明显。

  • 大量vibecoded应用正在涌入App Store

NVIDIA与ServiceNow合作,在ServiceNow Knowledge 2026上发布Project Arc,这是一个基于开放模型和NVIDIA OpenShell的长期运行桌面代理,专为企业工作流程设计,具备治理、审计和安全执行能力。

  • NVIDIA与ServiceNow合作交付自主AI代理
  • ServiceNow在Knowledge 2026上发布Project Arc

Snap宣布与Perplexity价值4亿美元的交易已友好结束,该交易于去年11月公布,原计划将Perplexity的AI搜索引擎整合到Snapchat中。

  • Snap宣布与Perplexity的4亿美元交易友好结束
  • 交易原计划将Perplexity AI搜索整合进Snapchat

Clay公司使用LangSmith管理每月3亿次agent运行,平均每次10-30步,展示了AI agent在生产环境中的大规模应用。

  • Clay使用LangSmith管理每月3亿次agent运行
  • 平均每个agent运行10-30步
2026-05-06T21:32

xAI的真正业务可能更多是构建数据中心而非训练AI模型,表明其战略重心转向基础设施。

  • xAI的业务重心转向建设数据中心

NeuralBench 发布,一个统一的开源框架,用于基准测试神经人工智能模型,其1.0版本包含36个EEG任务和94个数据集。

  • NeuralBench是一个统一的开源框架,用于基准测试NeuroAI模型
  • v1.0版本包含36个EEG任务和94个数据集

Yann LeCun转发消息:宣布发布NeuralBench,用于在开放环境中对神经AI模型和数据集进行基准测试,并提供了代码和白皮书。

  • 发布NeuralBench基准测试工具
  • 支持神经AI模型和数据集开放测试
  • 提供代码和白皮书

Anthropic CEO Dario Amodei表示,今年早些时候公司使用量和收入增长了80倍,因此将继续尽可能多地获取算力。

  • Dario称今年早些时候使用量和收入增长80倍
  • 公司将继续尽可能多地获取算力

SEMI与TechInsights联合发布2026年Q1半导体制造监测报告,显著上调2026年电子、IC销售和半导体资本支出展望。AI芯片在半导体组合中份额持续增长,得益于超大规模资本支出和AI基础设施投资周期。晶圆厂利用率改善,但增长由高价值器件和工艺复杂度驱动,而非晶圆产能扩张,先进封装和测试成为有效产出瓶颈。

  • SEMI与TechInsights发布Q1 2026半导体制造监测报告
  • 2026年电子、IC销售和半导体资本支出展望显著上调
  • AI芯片份额持续增长,先进封装制约有效产出

ZyphraAI发布推理MoE模型ZAYA1-8B,训练于AMD平台,活跃参数小于1B,优化智能密度。

  • ZyphraAI发布ZAYA1-8B推理MoE模型
  • 模型在AMD上训练,活跃参数小于1B

Anthropic正在构建其托管代理平台,新增“记忆”和“结果评估”功能。

  • Anthropic正在构建托管代理平台
  • 平台新增记忆功能(Dreaming)
  • 平台新增结果评估功能(Outcomes)

Exa的MCP服务在ChatGPT中正式上线,可访问人员、公司等独特数据源。

  • Exa MCP在ChatGPT中正式可用
  • Exa MCP提供人员、公司等数据源访问

NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。

  • NVIDIA与Unsloth合作使LLM训练速度提升约25%
  • 双方发布训练优化指南

UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。

  • UnslothAI与NVIDIA合作,实现LLM训练提速约25%
  • 通过3种优化方法实现加速

根据OpenAI联合创始人Greg Brockman的公开讲述,揭示了埃隆·马斯克离开OpenAI的谈判内幕,这是关于AI领域重要人物变动的罕见公开细节。

  • Greg Brockman公开了马斯克离开OpenAI的谈判内幕

英伟达宣布与SpaceX和AnthropicAI达成新的计算合作伙伴关系,将提供超过22万块英伟达GPU,部署在Colossus 1超级计算机上。

  • 英伟达与SpaceX和AnthropicAI建立计算合作伙伴关系
  • 合作由Colossus 1中的22万+英伟达GPU提供算力

Arden公司推出审计自动化代理,可收集证据、测试控制、撰写审计工作底稿,将数周工作缩短为数小时。

  • Arden开发自动化审计代理
  • 代理可收集证据、测试控制并撰写底稿
  • 将审计工作从数周缩短至数小时

OpenAI公布ChatGPT Futures Class of 2026荣誉名单,表彰26名在四年大学中全程使用ChatGPT的学生,其AI应用包括测绘150万个未知太空物体、通过墙壁探测灾害幸存者等。

  • OpenAI发布ChatGPT Futures Class of 2026名单,共26人
  • 学生用AI测绘150万个未知太空物体
  • AI可透过墙壁检测灾害幸存者

HuggingFace首席执行官Clement Delangue将参加Datadog举办的DASH2026大会,并与Datadog CEO Olivier Pomel进行一场炉边谈话。

  • HuggingFace CEO参加DASH2026炉边谈话
  • 与Datadog CEO对谈

据提案,SpaceX计划在德克萨斯州建设名为“Terafab”的芯片工厂,投资高达1190亿美元。该设施将是多阶段、下一代、垂直整合的半导体制造和先进计算制造设施。

  • SpaceX计划在德克萨斯州建设名为Terafab的芯片工厂
  • 投资高达1190亿美元
  • 设施为多阶段、下一代、垂直整合的半导体和先进计算制造设施

2025年底,Chipbook团队关注高端AI加速器封装测试重要性提升,于12月23日指出两家关键测试耗材公司:台湾Winway和韩国ISC。

  • Chipbook团队在2025年底关注测试受益于AI封装。
  • 12月23日指出Winway和ISC为关键测试耗材公司。

Hugging Face CEO转推宣布Qwopus3.6-35B-A3B-v1模型上线,通过Hugging Face Space提供,但具体细节未公布。

  • Qwopus3.6-35B-A3B-v1模型已上线
  • 模型通过Hugging Face Space提供

NVIDIA宣布Adobe正在其NemoClaw平台上构建Adobe CX Enterprise Coworker。Adobe CX业务总裁Anil Chakravarthy表示,品牌可在NVIDIA OpenShell运行时中部署Adobe客户体验智能,实现企业代理的治理、可观测和可审计。

  • Adobe在NVIDIA NemoClaw上构建Adobe CX Enterprise Coworker
  • Adobe CX业务总裁解释如何在NVIDIA OpenShell中部署客户体验智能

Harvey与@hwchase17合作开发长周期法律智能体基准测试,旨在推动行业特定基准的建立。

  • Harvey与@hwchase17合作开发法律AI基准测试

Anthropic宣布与SpaceX达成合作伙伴关系,将大幅增加其计算能力。该合作将支持其AI模型的训练和推理需求。

  • Anthropic与SpaceX达成合作
  • 计算能力将大幅增加

LangChain 推出 Harness Profiles,提供模型特定的配置文件,用于调整提示、工具和中间件,支持 OpenAI 和 Anthropic 等模型。

  • LangChain 推出 Harness Profiles 功能
  • 该功能可针对不同模型调整提示、工具和中间件
  • 支持 OpenAI 和 Anthropic 等模型

Hugging Face推出开源机器人应用商店Reachy Mini App Store,包含200多个应用,类似机器人的应用商店。

  • Hugging Face发布开源机器人应用商店Reachy Mini App Store
  • 该商店包含200多个应用

Hugging Face推出面向消费者的机器人应用商店,旨在为机器人提供应用程序分发平台,推动机器人技术普及。

  • Hugging Face发布消费级机器人应用商店
  • 该商店为机器人提供应用程序分发

NVIDIA AI宣布推出TokenSpeed推理引擎,专为高速智能体工作负载设计。该引擎具备高级KV缓存管理、安全高效调度器、可插拔分层内核系统,支持多芯片,并在NVIDIA Blackwell上实现最快的MLA注意力内核。

  • TokenSpeed是NVIDIA发布的全新推理引擎
  • TokenSpeed在NVIDIA Blackwell上拥有最快的MLA注意力内核
  • 该引擎支持多芯片,采用可插拔分层内核系统

谷歌发布并部署了新的开源网络协议MRC,专为大型AI训练集群设计,旨在提高多路径可靠连接性能,已在谷歌最大训练集群上生产部署。

  • 谷歌发布开源网络协议MRC
  • MRC用于大型AI训练集群
  • 已在谷歌最大训练集群部署

Hugging Face 宣布推出机器人应用商店,旨在推动AI机器人技术的民主化,目前已上线300多个应用。

  • Hugging Face 推出机器人应用商店
  • 已有300多个应用上线

谷歌更新AI搜索功能,将Reddit等网络论坛的内容纳入作为“专家建议”,以帮助用户回答更小众的查询,但该设计可能带来混乱。

  • 谷歌AI搜索新增从Reddit等论坛获取的专家建议
  • 该功能旨在帮助用户回答更小众的查询
  • 设计选择可能产生混乱

人工智能机器人初创公司 Genesis AI 完成 1.05 亿美元种子轮融资,并发布首个基础模型 GENE-26.5 及机器人手执行复杂任务的演示。

  • Genesis AI 完成 1.05 亿美元种子轮融资
  • 发布首个模型 GENE-26.5
  • 演示机器人手执行复杂任务

Hugging Face CEO Clement Delangue宣布推出机器人应用商店,已上线300多个应用,部署了10000台机器人,并展示非编程人员快速构建应用的案例。

  • 推出机器人应用商店,已有300多个应用
  • 已部署10000台机器人在实际环境中

Serno是一款新工具,可针对单个模型无法回答的问题,即时构建多智能体团队,利用最佳AI模型协同工作。

  • Serno可即时构建多智能体团队
  • Serno用于回答单个模型无法解决的问题