清除 当前 2581 条 / 共 3575 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 8 小时前 微信公众号 · 42章经 · 5 天 3 小时前 微信公众号 · DeepTech深科技 · 5 天 3 小时前 微信公众号 · Founder Park · 5 天 3 小时前 微信公众号 · FundaAI · 5 天 3 小时前 微信公众号 · 九章智驾 · 5 天 3 小时前 微信公众号 · 晚点LatePost · 5 天 3 小时前 微信公众号 · 琢磨事 · 5 天 3 小时前 微信公众号 · 甲子光年 · 5 天 3 小时前

高通CEO公开表示,公司正在与OpenAI、Meta及其他公司合作开发下一代产品,此前外界曾认为OpenAI仅与联发科合作。

  • 高通CEO称公司与OpenAI合作开发下一代产品
  • 高通CEO称公司与Meta合作开发下一代产品
  • 高通CEO表示合作涉及多个公司
2026-05-08T12:30

OpenAI 介绍了安全运行 Codex 的方案,包括沙箱、审批、网络策略和代理原生遥测,以支持安全合规的编码代理采用。

  • OpenAI 发布 Codex 安全运行方案
  • 安全措施包括沙箱、审批、网络策略和遥测

Charmaine Klee 在推特上表示,Claude managed agents 已在 Val Town 上可用,其编辑-浏览器-部署模型为构建代理提供了良好的开发体验。

  • Claude managed agents 已在 Val Town 上可用
  • Val Town 的编辑-浏览器-部署模型可简化代理构建

浮动数据中心作为AI基础设施的非传统实验正在兴起,Panthalassa的项目吸引了数百万投资,表明这一创新方向获得关注。

  • 浮动数据中心成为AI基础设施实验的新方向
  • Panthalassa项目获得数百万投资

英伟达与康宁深化合作,共同推进光纤和光子学技术在AI数据中心基础设施中的应用,以支持超大规模部署和光网络发展。

  • 英伟达与康宁宣布合作,聚焦光纤和光子学技术
  • 合作旨在推动AI数据中心物理基础设施和光网络发展

Anthropic与SpaceXAI达成合作,使Anthropic能够使用全球最大的超级计算机之一。这标志着AI基础设施在全球范围内进一步扩展。

  • Anthropic与SpaceXAI建立合作伙伴关系
  • Anthropic将获得世界最大超级计算机之一的访问权限
  • 合作旨在支持AI基础设施的全球扩展

Fluence Energy盘前上涨18.66%,因公司将获得2个直接超大规模云服务商合同。市场认为此类合同对小市值公司是重大利好,可能引发估值重估。

  • Fluence Energy盘前上涨18.66%
  • 公司将获得2个直接超大规模云服务商合同
  • 公司当前市值较小

AI数据中心导致不可预测的电力波动,迫使电力公司改变建模方式,从仅关注功耗转向分析设施在扰动中的行为,以保障电网稳定。

  • AI数据中心造成不可预测的电力波动
  • 电力公司需建模设施的扰动行为而非仅功耗

OpenAI发布了三个新的API语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。其中Realtime-2具备GPT-5级别的推理能力,支持同时使用多个工具并能边思考边说话。在Big Bench Audio基准测试中,Realtime-2得分96.6%,较前代提升15个百分点,显著缩小了推理差距。

  • OpenAI推出GPT-Realtime-2等三个语音模型
  • Realtime-2具备GPT-5级推理,支持多工具和边说话边思考
  • Realtime-2在Big Bench Audio上得分96.6%,提升15个百分点

4月Product Hunt榜单盘点显示,AI Agent产品竞争从“命名红利”转向“能干活”,产品需切入真实高频工作流。Brila以1287票获月最高票,为本地商家生成网站;其他产品如ProdShort、Figma for Agents、Claude Code Routines、Fathom 3.0等也各有具体场景。

  • Brila以1287票成为4月Product Hunt最高票产品
  • Brila通过分析Google Maps评论为商家生成网站
  • 4月PH上新AI产品约500+,环比减少16%

Frost & Sullivan的白皮书指出,液冷和热管理正成为AI数据中心性能和可持续性的核心。

  • Frost & Sullivan白皮书指出液冷和热管理对AI数据中心至关重要

OpenAI发布了GPT-Realtime-2等三个实时语音模型,在Big Bench Audio上性能提升15.2%,新增前导语、并行工具调用、更强恢复行为、128K上下文、可控语气和推理级别调整等功能。

  • OpenAI发布GPT-Realtime-2、-Translate和-Whisper三个实时语音模型
  • 新模型在Big Bench Audio基准上提升15.2%
  • 新增前导语、并行工具调用、128K上下文等功能

施耐德电气与NVIDIA合作,利用数字孪生技术模拟和验证吉瓦级数据中心,以支持AI工作负载的扩展。该技术可在实际部署前优化设计,提升效率与可靠性。

  • 施耐德电气与NVIDIA合作,使用数字孪生技术模拟吉瓦级数据中心
  • 技术用于在部署前验证数据中心性能和可靠性

流水的估值,铁打的商业化能力:寻找具身智能公司从 Demo 到 IPO 的“价值锚”

Original 苏清涛 苏清涛 九章具身-价值锚

在具身智能这个依然处于“寒武纪大爆发”前夜的赛道里,资本市场从不缺能画出完美 DCF(现金流折现)模型的分析师。他们用精密的 Excel 表格,推演着一家家初创公司在 2030 年的现金流,仿佛未来已经像瑞士钟表一样精准运转。

但毫不客气地说,这些模型在具身智能这种离大规模商业落地还有很长时间的产业,往往只是“伪精确”的自我安慰。

事实上,许多定量分析、财务预测与估值推演,本质上是写给那些认知能力不行的人看的,或者是写给那些很享受“上当受骗的感觉”的外行看的。 他们需要一个确定的数字来抚慰对不确定性的恐惧,哪怕这个数字是虚构的、瞎编的。

在这个充满噪音的阶段,**定量分析

  • 流水的估值,铁打的商业化能力:寻找具身智能公司从 Demo 到 IPO 的“价值锚”
微信公众号 · 九章智驾 微信公众号 九章智驾 AI 半导体 投资研究

GStack v1.28 发布,GStack Browser 新增下载功能,支持在无头 Linux 容器中通过 Xvfb 运行带有反机器人检测的 headed 模式;添加 llms.txt 文件便于各类 AI 代理使用所有技能。

  • GStack v1.28 发布,GStack Browser 新增下载功能
  • 支持在无头 Linux 容器中用 Xvfb 运行 headed 模式及反机器人检测
  • 添加 llms.txt 文件以简化 AI 代理的技能调用

GBrain v0.29和v0.29.1版本发布,新增显著性功能,可识别情感强烈、对人类重要、不寻常或有趣的内容。

  • GBrain v0.29版本发布,新增显著性功能
  • v0.29.1版本同步发布

vLLM项目维护者正在优化DeepSeekv4的首日性能,并在周末合并了初始模型支持PR,强调速度是关键优势。

  • vLLM维护者优化DeepSeekv4性能
  • 周末合并初始模型支持PR
  • 强调速度是核心优势

OpenAI发布GPT-5.5-Cyber模型有限预览,面向防御者用于保护关键基础设施。

  • GPT-5.5-Cyber模型进入有限预览
  • 该模型面向防御者
  • 用于保护关键基础设施

Sam Altman表示希望帮助公司提升自身安全,并认为应尽快开始相关工作。

  • Sam Altman表示希望帮助公司提升安全性
  • 认为应尽快开始相关工作

YC在旧金山举办AI销售主题闭门会,邀请销售领导者参与。LinkedIn技术运营副总裁和ClickUp销售策略AI负责人与HyperboundAI联合创始人讨论AI应用,8家YC初创公司进行闪电演示。

  • YC邀请旧金山销售领袖参加AI销售主题会议
  • LinkedIn和ClickUp高管与HyperboundAI讨论AI应用
  • 8家YC初创公司展示AI销售产品

Rork 推出 AI Cloud,支持 150 多种模型,可一键启动几乎所有 AI 应用,包括 Higgsfield。

  • Rork 发布 AI Cloud 服务
  • 支持 150+ 模型一键启动 AI 应用

Hugging Face 为 Reachy Mini 推出具身机器人应用商店,NVIDIA Robotics 转发称其为向更易获取的物理 AI 迈出重要一步。

  • Hugging Face 为 Reachy Mini 推出具身机器人应用商店
  • NVIDIA Robotics 转发并称其有助于更易获取物理 AI

人形板块回调48个交易日,跌幅25%,换手率回升至3.4%。特斯拉Optimus V3将于7-8月发布,供应链将提前获订单;国内厂商已传完成PPAP,宇树等国产本体厂推进IPO。

  • 人形板块回调48个交易日,跌幅25%,换手率回升至3.4%
  • 特斯拉Optimus V3将于7-8月发布,供应链将提前获订单
  • 国内厂商已传完成PPAP,宇树等国产本体厂推进IPO

Nvidia与IREN计划合作部署高达5GW的AI基础设施,位于德克萨斯州Sweetwater的园区被定位为Nvidia DSX AI工厂架构的旗舰站点。

  • Nvidia与IREN合作开发高达5GW的AI基础设施
  • Sweetwater园区成为Nvidia DSX AI工厂旗舰站点

OpenAI的Codex现在可以驱动Chrome浏览器后台标签页,实现自动化操作。该功能提升了AI与浏览器的集成能力。

  • Codex支持驱动Chrome后台标签页

台积电先进封装收入占比将提升至12%,CoWoS产能紧缺,日月光已提价20%-40%。先进封装扩产需1.5年,供需缺口至少维持3-4个季度,净利率可达30%。

  • 台积电先进封装收入占比将提升至12%
  • CoWoS产能紧缺,日月光已提价20%-40%
  • 先进封装扩产需1.5年,供需缺口至少维持3-4个季度

OpenAI在其API中推出了新的语音智能功能,可应用于客户服务、教育和创作者平台。

  • OpenAI在API中推出新的语音智能功能。

Cognition 在推特宣布推出 SWE-1.6 Fast 版本,由 Cerebras 提供支持,宣称速度达到每秒 1000 tokens。

  • Cognition 推出 SWE-1.6 Fast 版本
  • SWE-1.6 Fast 由 Cerebras 驱动
  • 宣称速度 1000 tokens/s

Perplexity 确认基于 NVIDIA 平台运行,并使用 CUTLASS Python 栈优化模型,展示了双方在 AI 算力上的合作。

  • Perplexity 运行在 NVIDIA 平台上。
  • Perplexity 使用 CUTLASS Python 栈优化模型。

人工智能健身教练应用Imperfect正式上线,可根据用户健康数据实现个性化训练、恢复和营养计划调整。

  • Imperfect是一款基于AI的健身教练应用
  • 该应用根据用户健康数据每日调整训练、恢复和营养

AI Heroes 使用 gbrain 与其自有生产记忆栈进行对比测试,在 150 个实际问题上 gbrain 获胜。

  • AI Heroes 在 150 个实际问题上测试 gbrain 并胜出

BitboardHQ 宣布推出一个数据分析工作空间,支持连接 Claude、Cursor 等 AI 代理工具。

  • BitboardHQ 发布数据分析工作空间。
  • 支持连接 Claude 和 Cursor 等 AI 代理。

NVIDIA发布技术博客,介绍GB200 NVL72系统通过NVLink扩展一致性实现整机架性能,带来机架级局部性硬约束,并对Slurm调度器进行优化以提升集群效率。

  • GB200 NVL72通过NVLink在整机架范围扩展一致性
  • 机架级局部性成为硬约束,跨域性能大幅下降

NVIDIA 发布 Model Optimizer 工具,用于模型量化,可降低 VRAM 使用并提升在 GeForce RTX GPU 等消费级设备上的推理性能。

  • NVIDIA Model Optimizer 支持模型量化以减少 VRAM 占用
  • 量化方法可提升推理性能,适用于 GeForce RTX GPU 等设备

NVIDIA官方推特表示Perplexity运行在NVIDIA上,并介绍了团队使用CUTLASS Python堆栈优化推理模型的细节。

  • Perplexity使用NVIDIA CUTLASS优化推理模型

Anthropic将开源对齐工具Petri捐赠给Meridian Labs,并发布重大更新,提升测试的适应性、真实性和深度。

  • Anthropic捐赠Petri工具给Meridian Labs
  • 发布重大更新提升Petri测试适应性
  • 更新增强了测试的真实性和深度

AI初创公司Pit由欧洲滑板车巨头Voi的联合创始人创立,a16z领投其1600万美元种子轮融资,成为斯德哥尔摩新星。

  • Voi联合创始人创立AI初创公司Pit
  • a16z领投Pit的1600万美元种子轮

Claude管理代理快速入门在Val Town平台上线,用户可以分叉并添加API密钥后运行。

  • Claude Managed Agents Quickstart 在 Val Town 上线

Vellum公司宣布完成2500万美元融资,用于构建全球首个个人智能(Personal Intelligence)系统,名为Vellum,强调AI属于用户。该消息在Twitter上传播,获得了较高关注。

  • Vellum完成2500万美元融资
  • 融资用于构建个人智能AI系统

OpenAI为ChatGPT推出信任联系人安全措施,在对话涉及自残风险时可触发联系预设联系人。

  • OpenAI推出信任联系人安全措施
  • 该措施用于可能自残的对话场景

OpenAI宣布Codex现在可以直接在Chrome浏览器中工作,支持macOS和Windows系统,并改进了与Chrome中应用和网站的配合。

  • Codex可直接在Chrome上工作
  • 支持macOS和Windows系统

Antirez宣布推出DS4,这是一个专为DeepSeek v4 Flash设计的推理引擎。项目进展顺利。

  • DS4是DeepSeek v4 Flash的专用推理引擎
  • 该引擎已正式发布

据曝光细节,xAI与Anthropic就Colossus数据中心达成协议:Anthropic获得Colossus 1,而xAI保留使用更大的Colossus数据中心。该交易涉及两大AI公司的基础设施分配,影响算力资源格局。

  • Anthropic获得Colossus 1数据中心
  • xAI保留使用更大的Colossus数据中心

Whisper模型新增实时流式转录功能,推出gpt-realtime-whisper模型,支持流式处理。

  • Whisper模型现支持实时流式转录
  • 推出新的gpt-realtime-whisper模型

开发者将 hello-realtime 演示更新为使用新的 gpt-realtime-2 模型,该模型支持推理功能。

  • 新模型 gpt-realtime-2 发布
  • gpt-realtime-2 支持推理功能
  • 个人演示 demo 已更新至新模型

OpenAI宣布Codex现在可以直接在Chrome浏览器上运行,支持macOS和Windows系统,能够并行处理多个标签页,无需接管浏览器。用户需安装Chrome插件。

  • Codex现在直接集成在Chrome浏览器中
  • 支持macOS和Windows系统
  • 可并行处理多个标签页,在后台运行

OpenAI宣布推出新的实时翻译模型,即日起可通过API使用。

  • OpenAI发布新实时翻译模型
  • 该模型即日起可通过API调用

Chronicle Labs 推出了一个面向企业 AI agent 的 staging 环境,允许团队在沙盒中重放生产事件进行回测,类似于交易算法在实盘前的回测。

  • Chronicle Labs 为企业 AI agent 推出 staging 环境
  • 该环境允许在沙盒中重放生产事件进行回测

Perplexity 推出 Personal Computer,将 AI 代理带入 Mac,现已对所有人开放。

  • Perplexity 的 Personal Computer 现已对所有 Mac 用户开放。
2026-05-07T19:57

llm-gemini 0.31版本发布,其中gemini-3.1-flash-lite模型从预览版转为正式版。

  • llm-gemini更新至0.31版本
  • gemini-3.1-flash-lite不再为预览版