# Claude Code推智能体视图，OpenAI成立部署公司，AI英雄主义时代终结

- 来源：ginobefun (@hongming731)
- 发布时间：2026-05-12 08:37
- AIHOT 分数：71
- AIHOT 链接：https://aihot.virxact.com/items/cmp1wxh4g0283slbp9ilzrh22
- 原文链接：https://x.com/hongming731/status/2053998040055460208

## AI 摘要

Claude Code发布智能体视图，将多会话管理集成于单一面板，旨在降低开发者并行工作的认知负担，标志着AI辅助编程进入“多线程”阶段。OpenAI宣布成立独立部署子公司，初始投入超四十亿美元，并派驻约150名前线部署工程师进入企业，表明AI竞争焦点已从模型能力转向实际落地能力。同时，行业观点认为，AI的“英雄主义时代”已经过去，当前稀缺的是靠谱、细致、负责任的工程执行力，而非天才洞察。

## 正文

http://x.com/i/article/2053997483949453312

# BestBlogs 早报·05-12：Claude Code 智能体视图、OpenAI 部署公司、AI 英雄主义时代终结

在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-05-12

## 导语

今天是 2026 年 5 月 12 日，欢迎收听 BestBlogs 每日早报。

今天的内容主线，可以用一个词来概括：落地。

Claude Code 上线智能体视图，开发者终于能在一块面板里统管所有并行会话，并发工作的认知成本大幅下降。这不只是一个 UI 改进，而是 AI 辅助编程从"单线程"跳到"多线程"的关键一跳--以往你需要在十几个终端标签和 tmux 格子之间来回横跳，现在一个左箭头就能看到全局。

与此同时，OpenAI 成立了独立部署子公司，初始投入超四十亿美元，并将一百五十名前线部署工程师直接派驻进企业内部。这是一个明确的信号：AI 的瓶颈已经从"模型够不够强"切换到"AI 能不能真正跑进生产"。卖许可证的时代告一段落，服务到现场才是下半场的竞争。

而在今天最值得细听的一篇内容里，亲历了 Anthropic 和 Google DeepMind 前沿训练的研究员姚顺宇，用四小时的对话说清楚了一件事：AI 行业的英雄主义时代已经过去了，这个行业真正稀缺的不是天才，而是靠谱、做事细、对自己的工作负责。

今天我们有三篇精讲，七篇速览，以及五篇扩展阅读。我们开始吧。

## 精讲一：Claude Code 中的智能体视图 | Claude

来源：Claude Blog

背景：并行工作是开发者最痛的认知负担

如果你最近用 Claude Code 跑过多任务，应该对这个场景很熟悉：一个窗口在帮你写测试，另一个窗口在 review PR，第三个在搜索 bug。你需要在多个终端标签之间来回切换，同时还要记住"哪个任务跑到哪里了、哪个在等我回复"。这个认知开销随着并发任务数线性增长，最终会把人逼回单任务模式。

Claude Code 今天发布的智能体视图（Agent View），正是为了解决这个问题。

核心功能：一屏总览，按需介入

智能体视图的核心设计思路是：将所有并行会话集中在一个面板里，让你只在关键决策节点介入。

操作方式很简单：在任意会话中按左箭头，或在终端执行 claude agents，即可打开智能体视图。每一行显示一个会话的状态--是否在等你输入、当前的最后一条响应内容、上次交互时间。你可以快速"Peek"（预览）某个会话的最后一轮，如果需要决策，可以直接在预览界面回复，无需切换进入完整对话。会话收到回复后，自动继续往下跑。

对于长期运行的任务，可以通过 /bg 指令把当前会话发到后台，或者启动时直接用 claude --bg 【task】 跳过前台，作为纯后台任务运行。

早期用户的实际使用模式

根据官方整理的早期用户反馈，有几个典型使用场景：

最常见的是批量下发任务：把多个想法或任务同时分配给多个 Claude 会话，每个会话可以配合不同的 skill，等一批 PR 同时就绪再集中审查。这个模式相当于把原本串行的开发流程改成了并行流水线。

另一个场景是管理长期运行的 Agent：比如 PR 守卫、Dashboard 更新器这类循环作业，在智能体视图里可以直接看到下一次运行时间，不需要再去查日志。

第三个是在多任务中快速切换：当你正在进行一个主任务时，突然想开一个新的快速问题或子任务，按左箭头打开智能体视图，新建会话，得到答案后右箭头回到原来的会话。Peek 功能会在答案就绪时直接显示，不需要你主动去切换。

为什么这个更新很重要

Claude Code 之前的多任务体验，高度依赖用户自己管理 tmux 或多终端标签，认知负担都压在开发者身上。智能体视图的意义在于，它把"多 Agent 协作"的组织成本从用户侧转移到了工具侧。

以研究预览形式，当前开放给 Pro、Max、Team、Enterprise 以及 API 用户，需要运行 claude agents 来手动开启。感兴趣可以访问官方文档了解更多。

这篇内容的完整阅读地址：https://www.bestblogs.dev/article/e8c4364d

## 精讲二：OpenAI 推出 OpenAI 部署公司，助力企业围绕智能构建业务

来源：OpenAI Blog

不是卖许可证，是派人到现场

OpenAI 今天宣布成立一家新的独立子公司：OpenAI Deployment Company（OpenAI 部署公司）。这家公司的使命，是帮助企业真正把 AI 系统用起来、用好--不是卖一个 API 调用权限，而是派人到企业里，贴着业务场景把 AI 推进生产。

核心执行力量是一批被称为 **FDE（Forward Deployed Engineers，前线部署工程师）**的人。通过收购应用 AI 咨询公司 Tomoro，OpenAI 部署公司从第一天起就配备了大约 150 名经验丰富的 FDE 和部署专家。这些人将常驻在客户的内部团队中，识别 AI 能发挥最大价值的场所，重新设计围绕 AI 的组织基础设施和关键工作流，并把阶段性收益固化成可持续的系统。

超四十亿美元的起步资金

OpenAI 部署公司以超过四十亿美元的初始投入正式启动，由 TPG 领投，Advent、Bain Capital 和 Brookfield 作为联合创始合伙人，Goldman Sachs、SoftBank Corp.、McKinsey、Bain & Company、Capgemini 等十九家机构也在其中。

OpenAI 对该子公司拥有多数所有权和控制权，客户无论是直接与 OpenAI 合作，还是通过 OpenAI 部署公司合作，都将获得统一的体验。未来募集的资金将用于扩大运营规模，以及继续收购能够加速 AI 部署的公司。

瓶颈从模型能力转向落地能力

OpenAI 在公告中直接说清楚了这一战略背景：过去几年，超过一百万家企业采用了 OpenAI 的产品和 API。通过这些部署，一个规律越来越清晰--企业 AI 的下一阶段，将由企业把技术真正跑进实际业务的能力来决定，而不是由模型本身有多强来决定。

这不是 OpenAI 的一厢情愿，而是一个在市场上已经反复被验证的现象：AI 系统训练好了、API 也打通了，但一旦到了需要真正改变业务流程的地方，就卡住了。卡在哪里？卡在组织惰性、流程设计、安全顾虑、以及缺乏专门了解 AI 局限性的工程人才。

OpenAI 部署公司的逻辑，是把这"最后一公里"的落地能力变成一项可规模化交付的服务，并且配上足够多的人力和资本让它真的做到。

一个标志性的业务模式转变

这一举动背后，是 OpenAI 对当前企业 AI 采用现状的清晰判断：技术已经够用了，但大量企业不知道如何把 AI 系统真正嵌入到关键业务流程中。

一个典型的 OpenAI 部署公司参与模式，从诊断开始：定位 AI 能在哪些业务场景创造最大价值，选出少量优先流程与客户领导层和运营团队共同确定目标，然后 FDE 进驻企业内部，完成系统设计、开发、测试和部署--把 OpenAI 的模型与客户的数据、工具、控制体系和业务流程连接起来，让团队在日常工作中可以稳定使用。

一个行业信号

从 Palantir 的部署工程师模式，到今天腾讯研究院分析的 FDE 岗位暴增，再到 OpenAI 直接成立独立公司--AI 从"研究机构"走向"商业化运营机构"的转型，今天的发布是一个明确的结构性确认。

值得注意的是，OpenAI 部署公司的独立运营，也意味着 OpenAI 正在把这个增长方向从内部项目升格为战略级业务，与 Google Cloud、AWS 等云厂商通过专业服务团队推动企业 AI 采用的路径，形成了直接的正面竞争。AI 落地能力，已经成为这轮竞争的新高地。

完整公告见：https://www.bestblogs.dev/article/f648cbd2

## 精讲三：姚顺宇 4 小时访谈：在 Anthropic 训 Claude、AI 英雄主义时代已过去

来源：张小珺 Jùn|商业访谈录

一个"小疯"的亲历者

今天要介绍的这期节目，是张小珺对姚顺宇长达四小时的深度访谈。姚顺宇毕业于清华和斯坦福，研究背景是理论物理（非厄米系统、量子物理、高能物理），博士毕业后转行进入 AI 领域。过去两年，他先后在 Anthropic 和 Google DeepMind 担任研究科学家，参与了 Claude 3.7、4.5 和 Gemini 3 等关键模型的开发。

按理说，这样的履历应该让人谦虚地说"只是参与了重要的项目"。事实上他确实这么说了--但他说这句话的语气，和表面意思恰好相反，带着一种对 AI 行业"神话个体"叙事的主动警惕。

"AI 不太需要脑子"是什么意思

访谈里，姚顺宇说了一句容易被断章取义的话：

> "AI 这个事，本来也不太需要脑子--真的不太需要脑子。这个行业最重要的特质，就是靠谱，就是做事细，对自己做的事情负责任。"

听起来像在说 AI 研究很简单，其实他在说的是：AI 行业的核心竞争力，已经不再是某种难以复制的天才洞察，而是工程执行力。在预训练规模已经证明有效、主要技术路线基本确立的今天，能把一件事做踏实、不出岔子、持续迭代，反而是真正的稀缺能力。

他做了一个很有意思的比喻：

> "现在大家都是冲浪的人，本质上是那个浪，而不是你那个冲浪的人。"

意思是，模型能力的演进（那个"浪"）才是主要动力，而研究员只是借着这个浪在推进工作。在这个背景下，对个体天赋的过度崇拜，很可能是一种认知偏差。

AI 英雄主义时代已经过去

这句话是访谈里的核心判断。

2020 年前后，AI 领域确实经历了一段个人英雄主义色彩浓厚的时期--一篇论文、一个算法、一个团队，可以显著推动整个领域的进步。但在今天，前沿模型的训练是一个需要数百人协作、跨越漫长时间线、依赖海量算力的工程行动。个人的贡献被稀释进了集体的系统中。

姚顺宇说：

> "AI 个人英雄主义时代已经过去了，所以也没有什么英雄，有时候甚至觉得旧时代英雄有点蠢。"

这句话的语气很直，但背后的逻辑是认真的：如果我们继续用英雄主义的叙事框架来理解 AI 行业，就会把注意力放错地方--崇拜某个人，而不是理解整个系统是如何工作的。

在 Anthropic 训练 Claude 的第一手观察

访谈的技术部分，姚顺宇谈到了预训练的现状（他的判断是"Pre-train 没有到头"）、Coding 爆发的背后驱动力、"硬蒸"和"聪明的蒸"的本质区别，以及字节豆包在技术路线上的判断。

由于涉及企业机密，他在许多地方选择点到为止，但光是这些点到为止的判断，已经比大多数媒体报道包含更多信息密度。

录制于 2026 年 3 月，节目发出时 AI 领域又已发生了许多变化--他特别说明，请大家体谅内容的滞后性。这大概也是这个行业的宿命：任何"最新判断"，很快就会成为"历史记录"。

完整访谈：https://www.bestblogs.dev/podcast/a4391a3

## 速览

今天还有七篇值得关注的内容，我来快速过一遍。

Anthropic 推出 Claude Managed Agents，助力规模化部署

Anthropic 官方宣布推出 Claude Managed Agents，面向需要大规模构建和部署 AI Agent 的用户。核心功能包括顾问策略（Prompt Caching 和 System Prompts）、代码执行环境，以及网络搜索能力。Anthropic 负责运营这项服务，所有新功能将在原生 Claude API 上线的同一天同步推出。这是 Anthropic 在企业级 Agent 基础设施层面迈出的重要一步，配合今天 Claude Code 智能体视图的发布，当前的方向非常清晰：把并发 Agent 的部署和管理，变成一种标准化、可托管的能力。

阅读地址：https://www.bestblogs.dev/status/2053868595394879553

Andrej Karpathy 谈人机交互的未来：从文本到交互式神经视频

Karpathy 分享了一个实用技巧：让 LLM 以 HTML 格式输出，然后在浏览器里打开--视觉效果比纯文本 Markdown 丰富得多。他借此延伸出一个更大的判断：音频是人类的优选输入方式，而视觉（图像、动画、视频）是人类的优选输出方式。他描绘了一条从纯文本到 Markdown 到 HTML，再到扩散模型直接生成的交互式神经视频的演进路径。更丰富的输入模态（比如直接用手指向屏幕内容描述上下文）也是他认为需要补全的一环。不算深度技术文章，但这种把实用技巧和长期判断连接起来的思维方式，值得学习。

阅读地址：https://www.bestblogs.dev/status/2053872850101285137

我们刚过了人类最后一个劳动节？AI 新职业的八个变化

腾讯研究院基于 7 家 AI 原生公司 2026 年劳动节当天的 1570 个在招岗位做了一次数据分析，得出了八个结构性结论。最值得关注的几条：岗位总量在 8 个月内翻了一倍多（从 718 涨到 1570）；AI 公司的人力重心从研发转向了产品和商业化，但工程师绝对数量没有下降；部署类岗位（尤其是 FDE，前线部署工程师）从零星几个暴涨到了上百个；推广者（销售、客户成功、合作伙伴）增速全类别最快，增长到了原来的四倍多。这份数据很适合拿来和今天 OpenAI 部署公司的新闻一起看，两个信号相互印证：AI 行业的下半场，商业化落地能力才是核心战场。

阅读地址：https://www.bestblogs.dev/article/9042fa70

Pinterest 如何构建生产级 MCP 生态系统

ByteByteGo 这篇文章，详细拆解了 Pinterest 内部是如何把 MCP（Model Context Protocol）做到生产级的。他们面对的问题是：五个 AI 接入面（内部聊天应用、IDE 插件、聊天机器人、CLI Agent、自主 Agent）加上十个内部工具，如果没有统一协议，就需要五十个定制集成，每多加一个面或工具都是乘法。MCP 把这个 N×M 的问题变成了 N+M 的问题。但真正的工程量不在协议本身，而在协议周边：中央注册表、双层认证系统、统一部署流水线，以及从第一天起就内嵌的可观测性。对于正在或打算在公司内推广 MCP 的人，这篇文章是一份很好的实践参考。

阅读地址：https://www.bestblogs.dev/article/dcf387de

SocialReasoning-Bench 揭示当前 AI 智能体的局限性

微软研究院推出了一个新的基准测试--SocialReasoning-Bench，专门评估 AI Agent 在社交情境中的表现。测试设计了两个场景：日历协调和市场谈判。结论很刺激：前沿模型在这两类场景中，始终无法为用户争取到最大利益，大量价值被遗留在谈判桌上。即便通过 Prompt 明确指示"代表用户争取最大利益"，表现依然远低于一个称职的代理应该达到的水平。这意味着，在需要社交推理和利益博弈的场景中，AI Agent 现在其实并不可靠--这既是当前的局限，也是一个清晰的研究机会。

阅读地址：https://www.bestblogs.dev/article/d1e95073

再也无需手写项目更新：Notion 的 AI 赋能工程会议

来自 Notion 工程总监 Ryan Nystrom 的分享，演示了 AI 如何彻底重塑工程站会。核心是一个叫"Hot Potato"的自定义 Notion AI Agent，每天早上 9 点自动运行，对过去 24 小时的 Slack 对话、GitHub PR、Notion 任务库和 Honeycomb 指标（通过 MCP 接入）做一次"Map-Reduce"--开会的时候，AI 已经准备好了一份有内容的会议前置文档，团队直接跳过状态播报环节，进入实质讨论。还有一个叫 Boxy 的内部工具，通过在 Notion 评论里 @ AI Agent，带着 bug 描述或特性需求，Agent 会自动开一个 VM 写代码、跑测试、开 PR。这是工程管理流程里 AI 落地最完整的案例之一。

阅读地址：https://www.bestblogs.dev/video/121c5d7

Netflix 借助 Apache Druid 的区间感知缓存，84% 的查询结果来自缓存

Netflix 面临的问题很典型：实时分析系统每天处理万亿级数据行，而 Dashboard 上的查询通常是"过去 3 小时的错误率"这类滚动窗口查询。时间窗口每隔几分钟稍微一移，传统缓存系统就认为这是一个全新请求，完全重算。Netflix 引入了区间感知缓存策略：把查询拆解成稳定子区间和最新动态段，稳定部分命中缓存，最新的动态部分实时计算后合并。结果是 84% 的查询命中了缓存，查询负载下降了 33%，P90 查询时间提升了 66%。对做数据分析系统的工程师来说，这是一篇值得精读的系统设计案例。

阅读地址：https://www.bestblogs.dev/article/8ba3a393

## 扩展阅读

今天还有五篇值得一读的好文，根据你的兴趣选择。

深度拆解：AI Agent Harness 的构造（宝玉的分享）

AI Agent 在 Demo 上跑得不错，放进生产就开始掉链子--问题不在模型，在模型外围的基础设施。这篇文章系统拆解了 AI Agent Harness 的十二个核心组件，涵盖编排循环、工具调用、记忆管理、上下文管理，并对比了 Anthropic、OpenAI、LangChain 等主流框架的实现差异。如果你正在搭建或优化自己的 Agent 系统，这是一份很好的组件清单和设计参考。

阅读地址：https://www.bestblogs.dev/article/40a5fbba

在 Anthropic 的读心术之外，大模型黑盒迎来了真正的法医（腾讯科技）

Anthropic 用 SAE（Sparse Autoencoder）路线做模型可解释性--通过激活分析读懂模型在"想什么"。而 Goodfire 的 Tom McGrath（Anthropic 和 DeepMind 可解释性团队前成员）走了一条不同的路：直接拆模型权重本身。他们的 VPD（对抗参数分解）方法，把一个 67M 的小语言模型拆成了数万个可以单独命名和修改的最小计算单元。这篇文章深入对比了这两条路线，并指出这是 AI 从炼金术走向科学的一颗信号弹。和今日精讲三在主题上也有共鸣：当我们更清楚地理解模型是如何工作的，"AI 英雄主义"的叙事会更进一步被解构。

阅读地址：https://www.bestblogs.dev/article/17cd71a0

PayPal 借助 Cursor 将路线图吞吐量提升 40%（Cursor Blog）

PayPal 有 8000 名开发者，代码库跨越数十年。他们用 Cursor 完成了一次标志性的规模验证：原本需要 8 到 12 个月的 3000 个应用 Java 升级，两个月搞定。路线图吞吐量提升了 40%，部署节奏从每周变成了每日。这篇文章没有停在数字上，而是详细讲了 PayPal 如何从高影响力团队开始切入，逐步推广 Cursor 使用的过程。对于在大型企业内推广 AI 编程工具的人，这是一个可以直接借鉴的路径。

阅读地址：https://www.bestblogs.dev/article/839fd633

黄金时代论：Marc Andreessen 谈 AI 与劳动力的未来（a16z）

Marc Andreessen 在播客访谈中阐述了他的"黄金时代论"：AI 不只是工具，而是一种普适的超能力，将劳动力从专业化角色转变为无所不包的"建设者"（Builder）。他认为，以前创建软件需要程序员、产品经理、设计师三类角色，AI Agent 现在让一个人可以同时做到三件事，进入"超级生产者"时代。这个判断和今天精讲三里姚顺宇的"集体主义胜利"论形成了有趣的张力--Andreessen 看到的是个体能力的放大，姚顺宇看到的是英雄主义的式微，两者其实都是真实的，只是站的维度不同。

阅读地址：https://www.bestblogs.dev/video/21d8b07

裁员潮将持续，直到我们学会发掘 AI 的商业价值（宝玉的分享）

这篇文章来自一位正处于裁员名单边缘的工程师，在 5 月 20 日公布结果前写下的思考--所以特别有真实感。他的核心论点是：当前的裁员潮，不是因为 AI 直接取代了员工，而是因为企业还没学会把海量 AI 投入转化成商业成果。AI 带来的是"投入"（更多代码、更多功能、更多方案），但"成果"（收入增长、用户增长、实际业务价值）没有同步提升。为了抵消高昂的 AI 支出和膨胀的组织内耗，裁员成了短期平衡手段。和今日腾讯研究院的那篇数据文章放在一起读，构成了同一个问题的两面：岗位在增加，但价值转化的压力也在增加。

阅读地址：https://www.bestblogs.dev/article/a77fcd78

## 今日阅读路径

如果今天时间有限，我建议按以下顺序读三篇：

第一篇：Claude Code 中的智能体视图

如果你用 Claude Code，这是今天最值得立刻打开的一篇。跟着文章走一遍，开启 claude agents 体验一下智能体视图，20 分钟能建立起直接的使用感知。

第二篇：姚顺宇 4 小时访谈

这篇耗时最长，但信息密度极高。建议选一个整块的时间，把从 1：53：47 开始的"在 Anthropic 训练 Claude"部分认真听完--这是你能从一个亲历者口中听到的、关于前沿模型训练最真实的描述之一。

第三篇：我们刚过了人类最后一个劳动节

1570 个岗位的数据，比任何关于 AI 就业的预测文章都更有说服力。和今天 OpenAI 部署公司的新闻放在一起看，能帮助你快速建立对 AI 行业真实结构变化的感知。

今天的早报就到这里。感谢收听 BestBlogs 每日早报 EP55，我们明天见。

BestBlogs Pro 早鸟内测开放：你可以自定义订阅源、配置兴趣标签，每天获得一份属于自己的头条早报。欢迎抢先体验，并把反馈发回给我们：https://bestblogs.dev