# AI应用层的机会不在「通用智能体」，而在「工作流深处」

- 来源：meng shao (@shao__meng)
- 发布时间：2026-05-28 08:25
- AIHOT 分数：60
- AIHOT 链接：https://aihot.virxact.com/items/cmpordaq008hsslv4xsb5lt6h
- 原文链接：https://x.com/shao__meng/status/2059793239688016240

## AI 摘要

a16z 合伙人指出，AI应用层仍有巨大机会，但机会不在模型实验室押注的“黄砖路”上。这条路径指用最强模型加简单编排做通用AI工具，与实验室正面竞争胜算极低。真正的机会在“Oz的其他地方”——复杂、垂直、多步骤的工作流。其价值不仅来自模型，更来自确保输出可信、合规、可运营的系统脚手架。应用公司相比实验室的优势在于：能构建专属的数据学习飞轮、跨模型管理与优化成本，并吸收监管复杂度。核心结论：模型层可替换，但深度集成的工作系统不可替代。

## 正文

AI 应用层还没死，但要避开「Yellow Brick Road」！

@joeschmidtiv （a16z） 这篇文章指出：AI 应用层仍有巨大机会，但机会不在模型实验室正在全力押注的「通用智能体」路径上，而在垂直、复杂、系统级的「工作流深处」。

创始人、求职者普遍焦虑：OpenAI、Anthropic 会不会把应用层全部吃掉？

Schmidt 认为这种焦虑「对了一半」：
· 对的部分：实验室确实会吞掉大量横向、通用、低复杂度的应用表面
· 错的部分：「应用层」不是铁板一块，不能一概而论

他用《绿野仙踪》做比喻：
· 黄砖路（Yellow Brick Road） = 实验室正在走的路
· Oz 的其他地方 = 创业公司该去的地方

什么是「黄砖路」？为什么危险？
黄砖路指：拿最强模型 + 现成连接器（Slack、Salesforce、GitHub 等）+ 简单 Agent 编排 → 做一个通用 AI 同事。

问题在于，这正是 Cowork、Codex、Claude Code 在做的事。

如果你做的是同样的连接器、同样的浅层编排、没有子 Agent 和深度配置、也没有分发--你是在跟实验室正面竞争，大概率是死路。

黄砖路上的问题（代码生成、写作、图像等）有一个共同特征：产品质量随模型 raw capability 线性提升，每多投一美元预训练/后训练，产品就更好。这类问题天然适合实验室。

「Oz 其他地方」的机会在哪里？
机会在复杂、垂直、多步骤、多角色的问题上，价值不只来自模型能力，更来自让输出可信、合规、可运营的一整套脚手架。

典型特征：
· 跨系统 Gather context，再经多个人类审批节点
· 涉及 legacy 系统
· 需要确定性结果，不能容忍模糊
· 与真实商业结果绑定（成交、核保、合规审查）

实验室自己也承认搞不定全部--所以才会砸重金做 forward-deployed joint ventures（派驻式联合项目），帮企业定制配置。如果「下一个模型版本就能解决」，他们不会投这笔钱。

为什么实验室最终也「吞不掉」Oz 其他地方？
1. 数据与学习飞轮
· 大量行业知识不在训练集里：未写下的规范、潜规则、从业者脑中的经验
· 两层飞轮：
· 跨客户：同类问题的模式识别
· 单客户：该机构特有的例外与决策逻辑
· 横向工具难以设计合适的 UX 来捕获这些知识；垂直玩家可以围绕工作流定制界面

2. 模型变异性管理
· 实验室只能推自家模型；应用公司可以跨厂商选模型--不同子任务用最合适的（开源微调、竞品 API 等）
· 还替客户做脏活：每次模型升级重跑 eval、针对 edge case 重调 prompt、平滑迁移
· 客户得到的是「全市场最优智能 + 升级连续性」，而非「请自行迁移到我们的新模型」

3. 成本优化
· 全走 Opus 4.7 = 负毛利
· 垂直公司按子任务路由：前沿模型做难题、中端做 bulk、自研/微调小模型做窄任务
· 实验室定的是「$X 能买到的最低智能」；应用公司卖的是「完成该工作流所需的最低 dollar cost」

4. 治理（Governance）
· 成为客户在该垂直领域跑 AI 的控制平面：权限、审计、agent 能做什么、实际做了什么
· 吸收监管复杂度（HIPAA、SEC/FINRA、律师协会规则等）
· 横向玩家无法同时成为「一百个垂直领域」的合规伙伴

核心 trade-off：实验室必须 everywhere for everyone → 无法 great at one thing。

三个自检框架：你在不在「Oz 其他地方」？
测试 | 黄砖路（危险）| Oz 其他地方（机会）
· 工具与步骤测试 | 一步、一个工具、结果可容错（如搜 Google Drive） | 多步、多工具、输出需过 partner/法庭/监管
· 系统 vs 工具测试 | 客户已有工作流上的「智能插件」；实验室出竞品客户可换掉你 | 客户通过你的系统跑工作；你是 orchestration layer
· 对冲基金/P&L 测试 | 客户为 generic capability 付费（Claude seat 可替代）| 客户为 workflow-specific outcome 付费（成交、核保、合规）

最终判断：两条路都会出大赢家
· 黄砖路：实验室赢--拥有模型 + 横向工具的分发
· Oz 其他地方：应用公司赢--若拥有 system of work（工作执行面、数据捕获、治理）

模型层是可替换的（fungible）；工作系统不可替代。

新一代 enterprise software 会建在路上之外--应用公司成为整合并交付各类新模型的层，而客户依赖的是那套系统。

### 引用推文

> Joe Schmidt IV：http://x.com/i/article/2059491657683443712