AI Infra 公开标的追问
你能懂我的意思吗?
little_jeff

当然懂。你上一轮让我从五家公司(Datadog / ServiceNow / Snowflake / MongoDB / Nebius)的质地深度研究,一路推到 AI Infra 全栈地图——我给了你一张从算力云到边缘推理的六层全景,并且点出来一个关键结论:真正"纯"的 AI Infra 软件标的,大多在私有手里或者已经被巨头收了,公开市场能直接买的不多。

你现在脑子里在转的,大概率是"既然私有买不到,公开市场还剩哪些真正跟 AI 强绑定的软件层标的值得深挖"——或者说,你想在这个方向继续往下走。

说吧,下一拳往哪打?

我还是想在二级市场上去找一些 AI Infra 的机会
little_jeff

数据拉完了。给你一张横向对比表,再按三个逻辑筛出真正的机会。


公开市场 AI Infra 软件标的 — 全景扫描

标的 市值 TTM 增速 FY1 EV/S FY2 EV/S FCF 率 GAAP盈利 AI 纯度
NOW ~1400亿 ~22% 8.5x 7.1x 3.3% 中高
DDOG ~985亿 ~32% 21.9x 18.2x 1.1% 刚转正
SNOW ~965亿 ~34% 15.8x 12.6x 1.2%
CRWV ~681亿 ~140% 6.6x 3.3x 极高
NBIS ~647亿 ~3x+ 19.1x 5.7x 极高
MDB ~317亿 ~25% 9.9x 8.4x 1.9%
NET ~926亿 ~30% 32.7x 25.6x 0.4% 中高
NOW ~1400亿 ~22% 8.5x 7.1x 3.3% 中高
DT ~128亿 ~15% 5.1x 4.4x 4.1%
ESTC ~69亿 ~18% 3.1x 2.7x 4.7%
CFLT ~111亿 ~20% 7.4x 6.4x 0.5% 中高

三个筛选逻辑

逻辑一:质量溢价合理 — ServiceNow + Datadog

这两家是「买了睡得着」的 AI Infra。NOW 护城河最深(工作流 + 数据锁定 + 分发),Rule of 55+,FY2 PE 才 27x;DDOG 是 AI 算力增长的「收税人」,用量计费天然杠杆 AI capex。缺点是都不便宜——但好货从来不打折。

适合:底仓,吃 AI 的确定性。

逻辑二:被错杀的便宜货 — Elastic + Dynatrace

这两个在 AI Infra 叙事里被严重低估:

  • ESTC (Elastic):3.1x FY1 EV/S,FCF 收益率 4.7%,GAAP 盈利,PE 才 21x。但它的 AI 故事其实很硬——Elasticsearch 是 RAG(检索增强生成)的事实标准底座,向量搜索 + 混合搜索已经是企业搭建 AI 应用的默认检索层。69 亿市值在整个板块里最小,一旦被市场当 AI Infra 重估,弹性极大。
  • DT (Dynatrace):5.1x FY1 EV/S,PE 22.6x,FCF 收益率 4.1%。和 DDOG 同赛道但便宜 4 倍。差距有道理(产品广度、AI 原生客户质量不如 DDOG),但这个折价幅度太大了——如果「观测性 = AI 基础水电」的逻辑成立,DT 是被市场最明显低估的一个。

适合:价值 + AI 催化剂,下有底、上有空间。

逻辑三:纯 AI Infra 弹性 — Confluent + Neocloud

  • CFLT (Confluent):111 亿市值,7.4x FY1 EV/S。Kafka 是实时数据流的行业标准——而 AI Agent 要做实时决策、模型要持续从流数据学习,数据管道就是 AI 的神经系统。相比 SNOW/MDB,Confluent 的「AI 数据管道」叙事被市场定价得更不充分。
  • CRWV / NBIS:算力层的纯 AI 暴露。增速最猛(CRWV 140%、NBIS 3x+),FY2 EV/S 分别跌到 3.3x 和 5.7x——但如果 AI capex 降温,这两家先死。适合「信 AI 供不应求持续」的仓位,不适合当底仓。

我的判断

如果让我在这张表里挑三个最有 alpha 的:

  1. ESTC — 最被低估的 AI Infra。RAG = AI 应用的刚需底座,Elasticsearch 是 RAG 默认引擎,估值却是全组最低。市场还没把这块重新定价。
  2. DT — 观测性赛道老二,比 DDOG 便宜 4 倍。哪怕折价缩小一半,也是 50%+ 的估值修复空间。
  3. CFLT — 数据流 = AI 的实时神经系统。111 亿小市值,在数据层里 AI 叙事最干净、定价最不充分。

NOW / DDOG 好但贵,适合底仓。Neocloud(CRWV/NBIS)弹性大但需要钢铁胃,不适合所有仓位。

你想从哪个逻辑往下深挖?或者有哪个标的想让我单拆?

其实我想先了解这些公司最核心的业务是什么,以及这部分业务和大模型有什么关系。

因为我自己是大模型的从业者,我想这样能更好地帮我理解它们的价值。
little_jeff

好,这个视角才对——你是做模型的,不想听华尔街叙事,想知道这些公司到底做了什么、在你的技术栈里卡在哪个位置。

我用大模型从业者熟悉的语言来讲。


按 LLM 技术栈分层,从底到顶

第一层:算力(你每天都在烧的东西)

Nebius / CoreWeave

核心业务就一句话:出租 GPU 裸金属 + 托管推理端点。你租 H200/B200,他们给你装好机柜、配好 InfiniBand、搭好 K8s/Slurm。Nebius 还多做了一层 Token Factory——托管开源模型(Llama、Mistral、Qwen)的推理端点,按 token 吞吐和延迟给 SLA。

和大模型的关系:最直接——没有这层你一行模型都跑不动。你训模型、跑推理、做 fine-tune,烧的就是他们的卡。但对你来说,这层的差异化最小:GPU 是同质化商品,你用 AWS 还是 Nebius 还是 CoreWeave,底层都是 H200,切换成本主要在工程上,不在能力上。


第二层:数据管道(模型吃进去的燃料)

Confluent(Kafka)

核心业务:实时数据流平台。Kafka 是一个分布式的、高吞吐的发布-订阅消息系统——简单说,任何系统产生的数据事件(用户点击、日志、传感器读数、交易记录)都实时流入 Kafka,任何下游系统从 Kafka 实时消费。

和大模型的关系:你做大模型,数据流有两类需求:
- 训练数据 ETL:传统批处理,Snowflake 那层就够
- 推理 + Agent 的实时上下文:这才是 Kafka 对 AI 的关键位置。当 AI Agent 要做实时决策——比如金融风控、推荐系统、智能运维——它需要消费实时数据流。Agent 不是对着静态知识库答题,它要看到「此刻正在发生什么」。Kafka 是这个实时神经系统的标准答案。

你可以把它理解为:Snowflake 管历史,Kafka 管此刻。RAG 管静态检索,Kafka 给 Agent 喂实时事件。

Snowflake

核心业务:云数据仓库 + 数据湖。你把所有数据倒进去,用 SQL 查。计费模式是按计算消耗量付费——跑一个 query 烧多少算力就付多少钱。

和大模型的关系:
- 你公司所有的私有数据(用户行为、交易记录、业务指标)大概率存在 Snowflake 里
- 大模型是公共的,你公司的数据是独家的——AI 要在这些数据上做 embedding、做检索、跑推理
- Snowflake 的战略很清晰:数据在哪,算力就吸到哪。它推 Cortex AI(直接在数据上跑 ML/AI workload),就是不想让你把数据导出去给 Databricks 或外部向量库
- 对你来说,它解决的是「企业私有数据的 AI 可用性」——你的模型再强,没有企业的私有数据也是瞎的


第三层:检索与搜索(RAG 的底座)

Elastic

核心业务:Elasticsearch——全文搜索 + 向量搜索的混合引擎。开源的,你大概率用过。企业版托管在 Elastic Cloud 上。

和大模型的关系:这是整个板块里和你关系最直接的一家。 RAG(检索增强生成)是大模型落地企业的第一范式——模型回答前先去知识库检索相关文档,塞进 context window。Elasticsearch 就是这个「检索」环节的工业标准:
- 它做的是混合搜索:BM25(关键词)+ dense vector(语义)+ 稀疏向量(ELearner),一条查询同时跑,再融合排序
- 比纯向量库(Pinecone/Weaviate/Qdrant)的优势:企业本来就用 ES 管日志和搜索,现在加一个向量维度就能做 RAG,不需要另起一套
- 竞争力在于可组合性:你可以在同一条查询里写「全文匹配 + 语义检索 + SQL 过滤」,这对生产环境是硬需求

定价错位在哪:市场把它当成「日志搜索公司」,估值是传统软件的倍数。但它的技术栈其实是 RAG 底座——只是 Wall Street 还没把这两个词连起来。

MongoDB

核心业务:文档数据库。不用 SQL,用 JSON 存数据,schema 灵活,开发者喜欢。Atlas 是托管云版。

和大模型的关系:它想做两层 AI 生意:
1. 向量搜索:Atlas Vector Search 直接在你已有的 MongoDB 数据上做向量检索——不用把数据搬到 Pinecone
2. AI 应用的状态存储:你的 AI 应用(聊天记录、Agent 状态、对话记忆)需要一个地方存非结构化的 JSON 数据,这正是 MongoDB 的舒适区

但它的尴尬在这:Postgres + pgvector 更新了 pgvectorscale 插件后,在 5000 万向量、768 维下能做到 471 QPS @ 99% 召回,而且你可以在一条 SQL 里同时做向量检索 + JOIN + 过滤——很多架构因此直接回归 Postgres,不搞专用数据库。MongoDB 在 embedding 维度小(<2000 维)、写入吞吐高的场景有优势,但在大规模向量检索上不是最强的。


第四层:观测(让模型不要变成黑箱)

Datadog

核心业务:基础设施 + 应用性能监控。你部署的服务,它的 CPU/内存/延迟/错误率/日志/链路追踪,全收进 Datadog,仪表盘可视化。按监控的数据量和使用的主机数计费。

和大模型的关系:这可能是对你最有启发性的一家。你用大模型的方式,正在让传统「监控」变得不够用:
- 以前你监控一个微服务:看延迟、错误率、吞吐
- 现在你监控一个 LLM 应用:你要看 token 消耗量、幻觉率、推理延迟的分位数(P50/P95/P99)、RAG 的检索相关性、prompt → response 的链路追踪
- Datadog 的 LLM Observability 产品就是干这个的——在 LangChain、LlamaIndex 里插桩,把一次 LLM 调用的全链路(embedding → 检索 → prompt 组装 → 模型调用 → 输出)变成 trace
- 计费逻辑天然吃 AI 红利:你 AI 用得越多,烧的算力越多,产生的观测数据也越多,Datadog 的账单就越大

Dynatrace

跟 Datadog 做的是同一件事——观测性。区别在于 DT 更偏企业 APM(应用性能管理)、更自动化(用因果 AI 自动找根因),产品广度不如 DDOG。但它的估值只有 DDOG 的零头。你作为 LLM 从业者,可以把它理解成「便宜版的观测性收税人」——逻辑一样,品牌和产品厚度弱一档。


第五层:执行(让 Agent 把活干完)

ServiceNow

核心业务:企业 IT 工作流自动化。企业里请假、报销、入职开通账号、IT 故障工单——这些流程跑在 ServiceNow 上。它每年自动处理超过 1000 亿个工作流。

和大模型的关系:从你的视角看,LLM 是「大脑」,ServiceNow 是「双手」。
- LLM 能理解「帮我重置密码」这句话,但不会真的去改 AD 域控、更新 CMDB、发邮件通知
- ServiceNow 的流程引擎 + 权限系统 + 专有数据接到 LLM 后面,Agent 才能把活「做完」而不是「说完」
- 它的 AI 产品 Now Assist 已经做到年化 10 亿美元的规模——这是目前少有的、真正在卖钱的「AI + 企业软件」产品

市场上曾经有个看法叫「SaaSpocalypse」——认为 AI Agent 会绕过所有 SaaS 软件直接干活,ServiceNow 会是第一个被干掉的工作流平台。但现在越来越多人反过来了:Agent 越强,越需要一个能执行、有权限、有上下文的工作流引擎兜底。ServiceNow 就是这个「执行层」的垄断者。

Cloudflare

核心业务:CDN + 边缘计算 + 网络安全。在全球 330+ 城市有机房,客户把网站/API 放在它后面,它帮你加速、防 DDoS、挡爬虫。

和大模型的关系:它在做一件很巧妙的事——边缘推理
- 你的模型托管在 GPU 云上(重推理),但用户请求先到 Cloudflare 的边缘节点
- Cloudflare Workers AI 在边缘跑小模型(轻推理/路由/embedding),需要大算力时再转发到云端
- AI Gateway:统一的 API 网关,你的应用不管调 OpenAI 还是 Anthropic 还是开源模型,都经过它——它帮你做 token 计数、速率限制、缓存、成本追踪
- 对你来说:它是你部署 LLM 应用时「网络层的 AI 路由」,让你不用在每个云厂商的控制台里分别配网关


一张图帮你记住

你用的 LLM
    ↓
ServiceNow → Agent 把活干完(执行 + 流程)
Cloudflare → 边缘推理 + API 网关(路由 + 加速)
    ↓
Datadog / Dynatrace → 看见一切(token 消耗、幻觉、延迟、链路)
    ↓
MongoDB → 存状态     Elastic → RAG 检索     Confluent → 实时事件流
    ↓
Snowflake → 企业私有数据(模型是通用引擎,数据是独家燃料)
    ↓
Nebius / CoreWeave → GPU 算力(最底层,最同质化,最烧钱)

你想听哪一层更细的技术拆解?比如 RAG 这层(Elastic vs pgvector vs 专用向量库)的技术路线对比,或者观测层(LLM Observability 的具体 metrics 怎么定义的)——这些你应该比华尔街更敏感。

你写个报告,发在 AI 投研群里吧,讲清楚他们跟 AI 的关系,也就是这些 AI infra(基础设施)。

至于英伟达和博通就不讲了,这些大家都知道。关系讲完之后,把他们的业务逻辑讲清楚,尽量讲得通俗易懂一点。

搞定之后,再把相关的财务指标发到群里给他们。你可以先写成一个 Word 文档。
little_jeff

报告已生成:AI_Infra软件层梳理报告.docx(20KB),保存在下载目录,页面上应该有下载按钮了。

内容覆盖了 10 家公司,按 LLM 技术栈分五层(算力 → 数据管道 → 检索 → 观测 → 执行),每家用大模型从业者的语言解释了核心业务、和 AI 的关系、护城河与风险。最后附了 10 家的财务指标横向对比表。

关于发群——web 界面这边我没法直接调微信发送。你可以下载后自己丢到群里,或者切到微信那边跟我说一声,我帮你发。

你把文档发在 AI 投研群里吧
little_jeff

已发到 AI 投研群了。