AI Infra 公开标的追问

你能懂我的意思吗？

当然懂。你上一轮让我从五家公司（Datadog / ServiceNow / Snowflake / MongoDB / Nebius）的质地深度研究，一路推到 AI Infra 全栈地图——我给了你一张从算力云到边缘推理的六层全景，并且点出来一个关键结论：真正"纯"的 AI Infra 软件标的，大多在私有手里或者已经被巨头收了，公开市场能直接买的不多。

你现在脑子里在转的，大概率是"既然私有买不到，公开市场还剩哪些真正跟 AI 强绑定的软件层标的值得深挖"——或者说，你想在这个方向继续往下走。

说吧，下一拳往哪打？

我还是想在二级市场上去找一些 AI Infra 的机会

数据拉完了。给你一张横向对比表，再按三个逻辑筛出真正的机会。

公开市场 AI Infra 软件标的 — 全景扫描

标的	市值	TTM 增速	FY1 EV/S	FY2 EV/S	FCF 率	GAAP盈利	AI 纯度
NOW	~1400亿	~22%	8.5x	7.1x	3.3%	高	中高
DDOG	~985亿	~32%	21.9x	18.2x	1.1%	刚转正	高
SNOW	~965亿	~34%	15.8x	12.6x	1.2%	否	高
CRWV	~681亿	~140%	6.6x	3.3x	负	否	极高
NBIS	~647亿	~3x+	19.1x	5.7x	负	否	极高
MDB	~317亿	~25%	9.9x	8.4x	1.9%	否	中
NET	~926亿	~30%	32.7x	25.6x	0.4%	否	中高
NOW	~1400亿	~22%	8.5x	7.1x	3.3%	高	中高
DT	~128亿	~15%	5.1x	4.4x	4.1%	是	中
ESTC	~69亿	~18%	3.1x	2.7x	4.7%	是	中
CFLT	~111亿	~20%	7.4x	6.4x	0.5%	否	中高

三个筛选逻辑

逻辑一：质量溢价合理 — ServiceNow + Datadog

这两家是「买了睡得着」的 AI Infra。NOW 护城河最深（工作流 + 数据锁定 + 分发），Rule of 55+，FY2 PE 才 27x；DDOG 是 AI 算力增长的「收税人」，用量计费天然杠杆 AI capex。缺点是都不便宜——但好货从来不打折。

适合：底仓，吃 AI 的确定性。

逻辑二：被错杀的便宜货 — Elastic + Dynatrace

这两个在 AI Infra 叙事里被严重低估：

ESTC (Elastic)：3.1x FY1 EV/S，FCF 收益率 4.7%，GAAP 盈利，PE 才 21x。但它的 AI 故事其实很硬——Elasticsearch 是 RAG（检索增强生成）的事实标准底座，向量搜索 + 混合搜索已经是企业搭建 AI 应用的默认检索层。69 亿市值在整个板块里最小，一旦被市场当 AI Infra 重估，弹性极大。
DT (Dynatrace)：5.1x FY1 EV/S，PE 22.6x，FCF 收益率 4.1%。和 DDOG 同赛道但便宜 4 倍。差距有道理（产品广度、AI 原生客户质量不如 DDOG），但这个折价幅度太大了——如果「观测性 = AI 基础水电」的逻辑成立，DT 是被市场最明显低估的一个。

适合：价值 + AI 催化剂，下有底、上有空间。

逻辑三：纯 AI Infra 弹性 — Confluent + Neocloud

CFLT (Confluent)：111 亿市值，7.4x FY1 EV/S。Kafka 是实时数据流的行业标准——而 AI Agent 要做实时决策、模型要持续从流数据学习，数据管道就是 AI 的神经系统。相比 SNOW/MDB，Confluent 的「AI 数据管道」叙事被市场定价得更不充分。
CRWV / NBIS：算力层的纯 AI 暴露。增速最猛（CRWV 140%、NBIS 3x+），FY2 EV/S 分别跌到 3.3x 和 5.7x——但如果 AI capex 降温，这两家先死。适合「信 AI 供不应求持续」的仓位，不适合当底仓。

我的判断

如果让我在这张表里挑三个最有 alpha 的：

ESTC — 最被低估的 AI Infra。RAG = AI 应用的刚需底座，Elasticsearch 是 RAG 默认引擎，估值却是全组最低。市场还没把这块重新定价。
DT — 观测性赛道老二，比 DDOG 便宜 4 倍。哪怕折价缩小一半，也是 50%+ 的估值修复空间。
CFLT — 数据流 = AI 的实时神经系统。111 亿小市值，在数据层里 AI 叙事最干净、定价最不充分。

NOW / DDOG 好但贵，适合底仓。Neocloud（CRWV/NBIS）弹性大但需要钢铁胃，不适合所有仓位。

你想从哪个逻辑往下深挖？或者有哪个标的想让我单拆？

其实我想先了解这些公司最核心的业务是什么，以及这部分业务和大模型有什么关系。

因为我自己是大模型的从业者，我想这样能更好地帮我理解它们的价值。

好，这个视角才对——你是做模型的，不想听华尔街叙事，想知道这些公司到底做了什么、在你的技术栈里卡在哪个位置。

我用大模型从业者熟悉的语言来讲。

按 LLM 技术栈分层，从底到顶

第一层：算力（你每天都在烧的东西）

Nebius / CoreWeave

核心业务就一句话：出租 GPU 裸金属 + 托管推理端点。你租 H200/B200，他们给你装好机柜、配好 InfiniBand、搭好 K8s/Slurm。Nebius 还多做了一层 Token Factory——托管开源模型（Llama、Mistral、Qwen）的推理端点，按 token 吞吐和延迟给 SLA。

和大模型的关系：最直接——没有这层你一行模型都跑不动。你训模型、跑推理、做 fine-tune，烧的就是他们的卡。但对你来说，这层的差异化最小：GPU 是同质化商品，你用 AWS 还是 Nebius 还是 CoreWeave，底层都是 H200，切换成本主要在工程上，不在能力上。

第二层：数据管道（模型吃进去的燃料）

Confluent（Kafka）

核心业务：实时数据流平台。Kafka 是一个分布式的、高吞吐的发布-订阅消息系统——简单说，任何系统产生的数据事件（用户点击、日志、传感器读数、交易记录）都实时流入 Kafka，任何下游系统从 Kafka 实时消费。

和大模型的关系：你做大模型，数据流有两类需求：
- 训练数据 ETL：传统批处理，Snowflake 那层就够
- 推理 + Agent 的实时上下文：这才是 Kafka 对 AI 的关键位置。当 AI Agent 要做实时决策——比如金融风控、推荐系统、智能运维——它需要消费实时数据流。Agent 不是对着静态知识库答题，它要看到「此刻正在发生什么」。Kafka 是这个实时神经系统的标准答案。

你可以把它理解为：Snowflake 管历史，Kafka 管此刻。RAG 管静态检索，Kafka 给 Agent 喂实时事件。

Snowflake

核心业务：云数据仓库 + 数据湖。你把所有数据倒进去，用 SQL 查。计费模式是按计算消耗量付费——跑一个 query 烧多少算力就付多少钱。

和大模型的关系：
- 你公司所有的私有数据（用户行为、交易记录、业务指标）大概率存在 Snowflake 里
- 大模型是公共的，你公司的数据是独家的——AI 要在这些数据上做 embedding、做检索、跑推理
- Snowflake 的战略很清晰：数据在哪，算力就吸到哪。它推 Cortex AI（直接在数据上跑 ML/AI workload），就是不想让你把数据导出去给 Databricks 或外部向量库
- 对你来说，它解决的是「企业私有数据的 AI 可用性」——你的模型再强，没有企业的私有数据也是瞎的

第三层：检索与搜索（RAG 的底座）

Elastic

核心业务：Elasticsearch——全文搜索 + 向量搜索的混合引擎。开源的，你大概率用过。企业版托管在 Elastic Cloud 上。

和大模型的关系：这是整个板块里和你关系最直接的一家。 RAG（检索增强生成）是大模型落地企业的第一范式——模型回答前先去知识库检索相关文档，塞进 context window。Elasticsearch 就是这个「检索」环节的工业标准：
- 它做的是混合搜索：BM25（关键词）+ dense vector（语义）+ 稀疏向量（ELearner），一条查询同时跑，再融合排序
- 比纯向量库（Pinecone/Weaviate/Qdrant）的优势：企业本来就用 ES 管日志和搜索，现在加一个向量维度就能做 RAG，不需要另起一套
- 竞争力在于可组合性：你可以在同一条查询里写「全文匹配 + 语义检索 + SQL 过滤」，这对生产环境是硬需求

定价错位在哪：市场把它当成「日志搜索公司」，估值是传统软件的倍数。但它的技术栈其实是 RAG 底座——只是 Wall Street 还没把这两个词连起来。

MongoDB

核心业务：文档数据库。不用 SQL，用 JSON 存数据，schema 灵活，开发者喜欢。Atlas 是托管云版。

和大模型的关系：它想做两层 AI 生意：
1. 向量搜索：Atlas Vector Search 直接在你已有的 MongoDB 数据上做向量检索——不用把数据搬到 Pinecone
2. AI 应用的状态存储：你的 AI 应用（聊天记录、Agent 状态、对话记忆）需要一个地方存非结构化的 JSON 数据，这正是 MongoDB 的舒适区

但它的尴尬在这：Postgres + pgvector 更新了 pgvectorscale 插件后，在 5000 万向量、768 维下能做到 471 QPS @ 99% 召回，而且你可以在一条 SQL 里同时做向量检索 + JOIN + 过滤——很多架构因此直接回归 Postgres，不搞专用数据库。MongoDB 在 embedding 维度小（<2000 维）、写入吞吐高的场景有优势，但在大规模向量检索上不是最强的。

第四层：观测（让模型不要变成黑箱）

Datadog

核心业务：基础设施 + 应用性能监控。你部署的服务，它的 CPU/内存/延迟/错误率/日志/链路追踪，全收进 Datadog，仪表盘可视化。按监控的数据量和使用的主机数计费。

和大模型的关系：这可能是对你最有启发性的一家。你用大模型的方式，正在让传统「监控」变得不够用：
- 以前你监控一个微服务：看延迟、错误率、吞吐
- 现在你监控一个 LLM 应用：你要看 token 消耗量、幻觉率、推理延迟的分位数（P50/P95/P99）、RAG 的检索相关性、prompt → response 的链路追踪
- Datadog 的 LLM Observability 产品就是干这个的——在 LangChain、LlamaIndex 里插桩，把一次 LLM 调用的全链路（embedding → 检索 → prompt 组装 → 模型调用 → 输出）变成 trace
- 计费逻辑天然吃 AI 红利：你 AI 用得越多，烧的算力越多，产生的观测数据也越多，Datadog 的账单就越大

Dynatrace

跟 Datadog 做的是同一件事——观测性。区别在于 DT 更偏企业 APM（应用性能管理）、更自动化（用因果 AI 自动找根因），产品广度不如 DDOG。但它的估值只有 DDOG 的零头。你作为 LLM 从业者，可以把它理解成「便宜版的观测性收税人」——逻辑一样，品牌和产品厚度弱一档。

第五层：执行（让 Agent 把活干完）

ServiceNow

核心业务：企业 IT 工作流自动化。企业里请假、报销、入职开通账号、IT 故障工单——这些流程跑在 ServiceNow 上。它每年自动处理超过 1000 亿个工作流。

和大模型的关系：从你的视角看，LLM 是「大脑」，ServiceNow 是「双手」。
- LLM 能理解「帮我重置密码」这句话，但不会真的去改 AD 域控、更新 CMDB、发邮件通知
- ServiceNow 的流程引擎 + 权限系统 + 专有数据接到 LLM 后面，Agent 才能把活「做完」而不是「说完」
- 它的 AI 产品 Now Assist 已经做到年化 10 亿美元的规模——这是目前少有的、真正在卖钱的「AI + 企业软件」产品

市场上曾经有个看法叫「SaaSpocalypse」——认为 AI Agent 会绕过所有 SaaS 软件直接干活，ServiceNow 会是第一个被干掉的工作流平台。但现在越来越多人反过来了：Agent 越强，越需要一个能执行、有权限、有上下文的工作流引擎兜底。ServiceNow 就是这个「执行层」的垄断者。

Cloudflare

核心业务：CDN + 边缘计算 + 网络安全。在全球 330+ 城市有机房，客户把网站/API 放在它后面，它帮你加速、防 DDoS、挡爬虫。

和大模型的关系：它在做一件很巧妙的事——边缘推理。
- 你的模型托管在 GPU 云上（重推理），但用户请求先到 Cloudflare 的边缘节点
- Cloudflare Workers AI 在边缘跑小模型（轻推理/路由/embedding），需要大算力时再转发到云端
- AI Gateway：统一的 API 网关，你的应用不管调 OpenAI 还是 Anthropic 还是开源模型，都经过它——它帮你做 token 计数、速率限制、缓存、成本追踪
- 对你来说：它是你部署 LLM 应用时「网络层的 AI 路由」，让你不用在每个云厂商的控制台里分别配网关

一张图帮你记住

你用的 LLM
    ↓
ServiceNow → Agent 把活干完（执行 + 流程）
Cloudflare → 边缘推理 + API 网关（路由 + 加速）
    ↓
Datadog / Dynatrace → 看见一切（token 消耗、幻觉、延迟、链路）
    ↓
MongoDB → 存状态     Elastic → RAG 检索     Confluent → 实时事件流
    ↓
Snowflake → 企业私有数据（模型是通用引擎，数据是独家燃料）
    ↓
Nebius / CoreWeave → GPU 算力（最底层，最同质化，最烧钱）

你想听哪一层更细的技术拆解？比如 RAG 这层（Elastic vs pgvector vs 专用向量库）的技术路线对比，或者观测层（LLM Observability 的具体 metrics 怎么定义的）——这些你应该比华尔街更敏感。

你写个报告，发在 AI 投研群里吧，讲清楚他们跟 AI 的关系，也就是这些 AI infra（基础设施）。

至于英伟达和博通就不讲了，这些大家都知道。关系讲完之后，把他们的业务逻辑讲清楚，尽量讲得通俗易懂一点。

搞定之后，再把相关的财务指标发到群里给他们。你可以先写成一个 Word 文档。

报告已生成：AI_Infra软件层梳理报告.docx（20KB），保存在下载目录，页面上应该有下载按钮了。

内容覆盖了 10 家公司，按 LLM 技术栈分五层（算力 → 数据管道 → 检索 → 观测 → 执行），每家用大模型从业者的语言解释了核心业务、和 AI 的关系、护城河与风险。最后附了 10 家的财务指标横向对比表。

关于发群——web 界面这边我没法直接调微信发送。你可以下载后自己丢到群里，或者切到微信那边跟我说一声，我帮你发。

⬇AI_Infra_软件层梳理_20260602.html34.0 K · 点击下载 ⬇AI_Infra软件层梳理报告.docx20.1 K · 点击下载

你把文档发在 AI 投研群里吧

已发到 AI 投研群了。