# Boris Cherny：编程范式转向管理AI Agent，通才时代来临

- 来源：宝玉 (@dotey)
- 发布时间：2026-05-05 23:39
- AIHOT 分数：67
- AIHOT 链接：https://aihot.virxact.com/items/cmost9v9d009rslbipg16w0pt
- 原文链接：https://x.com/dotey/status/2051688341519609897

## AI 摘要

Anthropic的Claude Code项目负责人Boris Cherny指出，编程正从手动编写转向管理AI Agent。他本人2026年未手写代码，日常工作转为合并AI生成的PR，并通过数百个运行Loop模式的Agent自动化处理任务。他认为AI将抹平软件开发的切换成本和流程效力护城河，使编程像识字一样普及，未来跨学科通才将激增，因为理解业务比编写代码更为关键。Anthropic的核心优势在于其彻底改造、全员使用Claude协作的组织流程。

## 正文

http://x.com/i/article/2051687844679143424

# Boris Cherny：Claude Code 之后，写代码正在变成"管理 Agent"

Boris Cherny 是 Anthropic 内部 Claude Code 的创建者，从一个三人小团队的孵化项目做起，把"在 IDE 里按 Tab 自动补全一行代码"这件事彻底升级成"让 Agent 把整个项目写完"。Claude Code 在 2026 年初已经超过十亿美元年化营收，被 Anthropic 自己称为"史上从研究预览到十亿美元产品最快的一次"。

这次访谈来自 Sequoia 2026 年的 AI Ascent 大会，主持人是红杉合伙人 Lauren Reeder。

原始视频：https://www.youtube.com/watch?v=SlGRN8jh2RI

## 要点速览

- Boris 整个 2026 年没写过一行代码，每天合并几十个 PR，单日记录是 150 个，但他承认这是"为了试试模型能跑多远"。

- Claude Code 早期半年没有 PMF，做出来时 Boris 自己只用它写 10% 的代码，是 Opus 4 在 2025 年 5 月发布之后才开始指数增长，每一代新模型都让曲线再往上拐一下。

- Boris 现在大部分工作从手机完成，Claude App 里常驻 5 到 10 个 session、几百个 Agent，夜里有几千个在跑深度任务，核心调度模式叫 Loop，做法是让 Claude 通过 cron 起一个定时循环。

- Anthropic 内部已经没有手写代码：所有 SQL、所有产品代码都由模型生成，员工的 Claude 之间通过 Slack 互相沟通，把对方的不确定问题直接 ping 过去问。

- 关于"SaaS 的终结"，Boris 借用 Hamilton Helmer 的"七种护城河"框架：切换成本和流程效力这两种会被 AI 抹平，因为模型可以帮你迁移、可以自己迭代流程；网络效应、规模经济、独占资源这些不变。

- 他给出的最重要历史类比是印刷术，认为软件构建会像识字一样普及，最合适写会计软件的是会计师而不是工程师，因为编程是简单部分，懂业务才是难的部分。

- Anthropic 的真正领先不在技术，在组织流程：模型大家都能用，但内部组织怎么改造、Claude 怎么互相沟通、整个公司怎么把所有手写代码替换掉，这才是产品差距。

## 【1】Claude Code 是怎么从一个三人孵化项目做出来的

Boris 说他是"误打误撞"做出 Claude Code 的。2024 年底他加入了 Anthropic 内部一个叫 Anthropic Labs 的孵化器，团队只有几个人，一开始的产物就是 Claude Code、MCP 和 Claude Desktop App 这三件东西。这个团队一度被解散，2026 年初又重组，由 Mike Krieger 牵头。

> 注： Mike Krieger 是 Instagram 联合创始人兼前 CTO，2024 年 5 月加入 Anthropic 担任首席产品官，2026 年 1 月起进入 Labs 团队，和 Ben Mann 一起负责实验性产品孵化。

Boris 描述他当时为什么想做编程这件事，用的是 Anthropic 内部很常用的一个词："product overhang"。这个词可以翻译成"产品悬置（Product Overhang，指模型能力已经具备但尚未被产品化）"，意思是模型已经能做一堆事情，但还没有任何产品把这些能力展现出来。

> 我们当时看编程领域，2024 年底最先进的状态就是按 Tab 键。打开 IDE，按一下 Tab，模型给你补一行。这是 Sonnet 3.5 第一次让人能做的事情。但当时的感觉是，我们其实可以走得更远，模型几乎已经准备好下一步了。我们不需要再做 Tab 补全，可以直接让 Agent 把整段代码都写了。

但做出来之后，前六个月几乎没什么人用。Boris 说最初版本"基本不能用"，连他自己也只用它写 10% 的代码。即便对外发布，也没有指数级增长。真正的爆发点是 2025 年 5 月 Opus 4 发布。从那之后，每一代新模型都让曲线再往上拐一次，从 Opus 4 到 4.5、4.6，再到现在的 4.7。

他承认整个过程其实是一场违背常规 PMF（产品市场匹配）逻辑的赌注：

> 我们其实是在做一个初期完全不具备 PMF 的东西。我们很清楚它前六个月不会有 PMF，因为我们是在为下一代模型做开发。我们从始至终就是这个思路。

> 注： PMF 是 Product-Market Fit，产品市场匹配。Anthropic 整个产品逻辑就是赌"模型能力会涨到一个点"，提前把那个点对应的产品做出来，这和典型 SaaS 的"先验证需求再做产品"是反着的。

## 【2】"编程已经被解决"，但这是 Boris 个人的版本

Lauren 问他公开说过的"编程已经被解决"是什么意思。Boris 在台上做了一次现场调查，让全场观众举手示意："谁 100% 还在亲自写代码"、"谁 100% 已经完全不写了"、"谁介于两者之间"。最后的现场分布大致是"50% 解决"。但对 Boris 自己，比例是 100%。

他给的解释是 Claude Code 的代码库（已经因为泄露事件被外界看过）就是 TypeScript 和 React，没什么秘密。选 TypeScript 和 React 的原因是这两个东西在模型训练数据里非常常见，属于"on-distribution（分布内数据）"。当时模型还没那么聪明，框架选择关系到模型能写多少。现在模型已经强到可以拿不熟悉的语言现学现用，但 2024 年底必须挑模型最熟的栈。

正因为选了模型最熟的栈，团队很早就过了一个临界点：模型开始写 100% 的代码。Boris 说这件事在去年 10 月、11 月就发生了。

> 现在我每天大概合并几十个 PR。上周有一天我合了 150 个，那是个记录，我就是想看看能不能把它推到极限。

但他也明确承认，这条结论并不普世：还有很大很复杂的代码库、还有模型不擅长的小众语言。他给出的一句答案有点"等就完事了"的味道。

> 通常的答案就是等下一代模型。

> 注： Boris 这段说法的样本明显有偏。他用的是 TypeScript+React 这种主流栈，自己的代码库已经成熟，还在 Anthropic 内部用着内部专属模型 Mythos 来 dogfood（吃自己的狗粮，指内部试用自己的产品）。"编程已被解决"对他成立，但替换到一个三十年的 C++ 老系统、一个 SAP ABAP 项目，或者一个游戏引擎团队，结论会非常不同。

## 【3】手机里跑着几百个 Agent：Boris 的工作流

Boris 说他六个月前在 Twitter 上分享过一次个人工作流，发的时候没觉得有什么稀奇，结果出乎意料地火。从那以后他的方式又变了：现在大多数工作从手机完成。

具体方式是 Claude App 左侧有个 code 标签，他常驻 5 到 10 个 session。每个 session 里又开着一堆 Agent，加起来通常有几百个在跑。晚上还会再起几千个做更深的任务。

他说目前最常用的不是子 Agent，而是一种叫 Loop 的简单模式：让 Claude 用 cron 起一个定时任务，可以每分钟、每五分钟、或者每天跑一次。

> 我大概有几十个 Loop 一直在跑。一个负责盯着我的 PR，自动修 CI、自动 rebase；一个负责让 CI 整体保持健康，比如某个测试 flaky（时好时坏不稳定）了它就去修；还有一个每 30 分钟从 Twitter 上把别人对 Claude Code 的反馈拉一遍、聚类、整理给我。

他还提到 Anthropic 刚发的 Routines，这个产品其实是把同样的 Loop 模式从本地搬到服务器上，关掉笔记本它也照常跑。

他对这件事的判断是："Loop 是未来。"

> 注： CI 是 Continuous Integration，持续集成。Boris 描述的这套工作流核心其实很简单：更早地放弃"亲自下指令"。他做的事情是让一群 Claude 不停地干活，而他自己只在 Slack 上接收报告。从产品视角看，Routines 把 Loop 从客户端模式变成 Anthropic 自己托管的服务，调度本身要开始消耗他们的服务器资源，定价模型迟早要变。

## 【4】通才崛起：团队里每一个角色都在写代码

Boris 说他的判断是 "通才会比今天多得多"。

他先把"通才"分了两种：第一种是工程通才，比如一个人同时写 iOS、Web 和服务端，今天大家说的 generalist 多半是这种。第二种是更值得关注的跨学科通才，一个产品工程师同时也很懂设计，或者既能做产品也能做数据科学。

他说这件事在 Claude Code 团队内部已经在发生：

> 我们团队的工程经理、产品经理、设计师、数据科学家、财务、用户研究员，每一个人都在写代码。每个人都还在某件事上是专家，但也都在写代码了。

他没有展开"为什么这是好事"，但暗含的逻辑是：当写代码的边际成本接近于零，那些原本被排除在工程之外的角色（财务、设计、研究）就有了直接出工程产物的能力，分工的边界自然会模糊。

> 注： 这个判断在创业公司里很容易验证，但放在大型企业里就麻烦得多。一个 5000 人的银行 IT 部门有合规、风控、变更管理、审计追踪等等约束，这些不是"我会写代码"就能跨过去的。Boris 谈的是 Anthropic 自己这样规模较小、流程很轻的公司，迁移到其他规模和行业之前，需要打个折扣。

## 【5】SaaS 的终结：哪些护城河会被 AI 抹平，哪些还留着

Lauren 问：写代码现在便宜了 10 倍、100 倍，那靠软件做出来的产品的价值会怎么变化？我们是不是要面对一场 SaaS 的终结？

Boris 说这是他最爱的问题。然后他借用了一个外部框架来回答：Hamilton Helmer 的"Seven Powers"。

> 注： Hamilton Helmer 是策略学家、Strategy Capital 创始人，2016 年出版《7 Powers： The Foundations of Business Strategy》。书里把可持续竞争优势分成七种：规模经济、网络效应、反向定位、切换成本、品牌、独占资源、流程效力。这本书在硅谷非常流行，Reed Hastings、Daniel Ek、Patrick Collison 都给过推荐语。

Boris 的判断是 AI 会把其中两种护城河抹平：

第一种是切换成本。原因很直接，模型可以帮用户从一个工具迁到另一个工具，原本"我已经在 Salesforce 上配了三百个工作流，没法换"这件事，模型一夜之间就能帮你迁完。

第二种是流程效力，也就是那种"我们的工作流和流程别人复制不了"的优势。Boris 说 Claude 4.7 已经能"hill-climb（爬坡式优化，即逐步逼近最优解）"任何东西，你设定一个目标，让它自己迭代优化，它最终就能达成那个效果。流程优化原本是大公司多年积累出来的内部资产，现在被模型直接吃掉了。

> 这是第一个能做到这件事的模型。你给它定下目标，让它不断运行直到达成，它就能自动执行到底。

但他认为另外几种护城河没有被改变：网络效应、规模经济、独占资源依旧成立。换句话说，那些"用户越多越好用"的产品（社交、平台、市场）和那些"我有一个别人拿不到的资源"的公司（专利、特许牌照、独家合同）依旧安全。

第二个判断更激进：

> 接下来 10 年里，能颠覆原有市场的初创公司数量大概会比过去 10 年多 10 倍。因为现在你可以做一家很小的公司，做出和大公司一样有价值的产品，然后正面竞争。大公司要改业务流程、要重新培训员工、内部还会一堆抵抗，但你不需要，你是从一张白纸开始的。

> 注： Boris 关于切换成本会被抹平的判断有结构性争议。模型确实能帮你迁数据，但企业 SaaS 的真正切换成本另在他处：合规审计、合同条款、组织里的"使用习惯"和供应商认证。Salesforce 和 SAP 的护城河靠的从来是这套审批和惯性，技术本身只占很小一部分。Anthropic 自己的 Cowork 已经在挑战这一点，但市场反应（2026 年 2 月软件股蒸发 2850 亿美元市值）说明投资人在押注他的判断成立。这是一笔很大的赌注，未必很快收敛。

## 【6】产品 vs 模型：模型变强了，产品的价值还剩多少

观众 Dan 问：Claude Code 的成功你会怎么归因？产品决策和模型本身各占多少？

Boris 没有给出一个简单明确的答案。他先说一年前可能是 50/50，六个月前可能也是 50/50。两年后呢？他直接说："不知道，我们一次只做一周的计划。"

但接着他给了一个更有意思的回答：

> 我以前在 YC 待过，做过几家初创公司。YC 反复跟你强调的就是：做一个用户爱用的东西。不管模型多强、不管你做的是什么品类，最后你都得做出一个用户真的爱用的东西。这就是产品为什么重要。我们花了大量精力在小细节上，因为你一整天都在用它，那这些细节就构成了体验。

他同时也承认，随着模型变强，外面那一层"harness"（脚手架、调用框架）会变得没那么重要。一年后产品安全机制（prompt injection 【提示词注入】 防御、命令静态校验、permission mode、human-in-the-loop 【人类在环，即关键决策保留人工确认】）可能都不需要那么多了，因为模型自己就会做对的事。

他的产品方向也不是再加一层皮，而是去想：怎么让 Loop 变成一等公民？怎么让一个人同时跑很多个 Agent 这件事更顺手？

> 注： Boris 这一段实际上承认了 Anthropic 自己内部的一个判断：随着模型能力上升，应用层的差异化窗口在缩短。这对独立的 AI 应用公司是个不太友好的信号。你今天在 Claude API 上加的那一层 wrapper（包装器/套壳应用）、那一套 prompt engineering、那一套权限管理，可能一年内就会被基础模型自己内化掉。

## 【7】软件大众化：从印刷术到发短信

观众问：Claude Code 会不会让"建软件"变成一种像"会用 Office"那样人人都该会的技能？

Boris 的回答是：会，而且比这更夸张。

> 我觉得它会变成一种"我会发短信"那种级别的技能。

他展开讲了他最爱的历史类比：印刷术。

按 Boris 的说法，1400 年代欧洲只有大约 10% 的人识字，他们经常被国王和贵族雇来代笔。古登堡发明印刷术之后又出现了两台改良型印刷机，接下来的 50 年欧洲出版的文献比之前 1000 年加起来还多，一本书的成本下降了大约 100 倍。又过了几百年，全球识字率上升到 70%。今天我们都会读写，但还存在"专业作家"这个职业。

> 注： Boris 给的几个数字偏低。15 世纪初欧洲成年识字率，学界估计是 25-30% 而非 10%；今天全球识字率，世界银行的数据接近 90% 而非 70%。但他要表达的方向是对的：印刷术是欧洲文化史上最重要的去专业化事件之一。1500 年时全欧洲的印刷书籍数量已经超过两千万册。

Boris 的推论是，软件也会经历同样的过程，时间会比 50 年快得多。然后他给了一个具体的角度：

> 比如说写会计软件。今天写会计软件最合适的人，我觉得已经不是工程师了，是一个真正懂业务的会计师。因为他对领域熟得不能再熟，写代码反而是简单的部分。

这个判断背后的潜台词也很清楚：未来一段时间最容易被取代的岗位，是那种"只会写代码、不懂任何垂直领域业务"的纯技术工程师。

## 【8】真正的内部领先在组织流程，而非技术

观众问：之前有人说你们这种公司是"活在未来"，因为你们能用到模型和产品的最早版本。Claude Code 在外发之前是内部工具。Anthropic 的工程实践和外面的差距，是一个月、三个月、还是六个月？这个差距在变大还是变小？

Boris 的答案是模型层基本没差距：内部用的就是 Mythos 和 Opus 4.7，"Mythos 我们用一点点试，Opus 4.7 是我们内部试用（dogfooding）的主力"。这些模型未来的某个变体也会对外开放。

> 注： Mythos 是 Anthropic 在 2026 年 4 月公开承认存在的内部前沿模型，对外仅在 Project Glasswing 这个网络安全防御计划内开放，不在 API 也不在 Claude.ai。它在 SWE-bench 上达到 93.9%、USAMO 97.6%，宣称"显著超过任何已发布模型"。Boris 这里承认 Anthropic 内部用 Mythos 来 dogfood Claude Code 自己。换句话说，外界用到的 Claude Code，是用一个没公开的更强模型一起搭出来的。

但他认为产品层有更大差距，原因来自流程，跟模型本身没关系：

> 在 Anthropic 我们已经把 Claude 用到一切环节。我在写代码的时候，我的几个 Claude 在 Loop 里跑，它们会通过 Slack 去找其他人的 Claude 聊天，把不确定的事情问出来。我们整个公司没有任何手写代码了。所有 SQL 都是模型写的。

他的结论是：领先的关键在组织怎么改造自己。 技术大家都能拿到，但要把整个公司从手写代码切到模型生成代码，要让员工的 Claude 之间通过 Slack 互相问问题，要让所有 SQL 都不用自己写，这是组织行为的改造，比技术本身慢得多。

> 注： "我们没有任何手写代码"是个大胆的表述，可能不完全字面准确（基础设施代码、合规代码、安全敏感代码大概率还是手写），但方向上反映了 Anthropic 对工程组织的激进重塑。这也回答了一个常见困惑：很多公司接入了 Claude API 但没看到生产力变化，问题往往出在组织没跟着重组，模型其实已经够强了。Mike Krieger 在另一个采访里给过类似口径："Claude 现在写 90-95% 的代码，瓶颈不在工程，在决策。"

## 【9】并行 Agent 与本地模型：用户不该操心这些事

观众 Jiren 问：你们在产品和模型层面分别是怎么注入"什么时候该并行"这种先决条件的？因为现在用户得自己判断什么时候该开多个 Agent，这件事其实应该是模型自己懂。

Boris 说在产品层面就是改 prompt：调整提示词，让模型更倾向于自动并行。但他更想说的是模型自己在变好，4.7 已经会自然这么做。他举了一个例子：

> 我让 4.7 跑一个数据查询，它会主动跟我说："我注意到这个数据是在变化的，我帮你起一个 Loop，每 30 分钟给你一份报告。"我说"好啊，发到 Slack 上吧。"它就用 Slack MCP 自己接好了。

他的判断是，长期看用户不应该需要自己理解什么时候用 batch（批处理）、什么时候用 Loop、什么时候开几个 Agent：

> 如果用户得自己学会怎么调度这些工具，那其实是产品设计没做好，是我没做好。这件事应该交给模型，加上我们怎么提示它。

## 【10】云端 AI vs 本地 AI

观众问：现在大家用 Claude、用 Codex 都在云上。但也有不少人主张本地化 AI，开源权重模型追上之后，本地跑高质量代码助手是个有可能的方向。你看长期方向是云为主，还是本地崛起？

Boris 的回答很直接：这件事并不重要。

> 因为未来这些底层细节模型会自动处理。一两年后，模型自己就能独立完成写代码、启动 Agent、搭建环境的所有事情。如果它评估后认为"我应该用本地模型来做这件事"，它就会这么干。这些将不再需要工程师去人工决策。

> 注： 这个回答在 Sequoia 这种创业生态会议上其实很有意思。本地 AI 这件事在硬件厂商（NVIDIA、Apple、AMD）、开源社区（Llama、Qwen、Mistral）和隐私敏感行业里都有人在押注。Boris 直接把这个问题归类为"用户不该关心的实现细节"，等于把"模型部署位置"变成了"由更上层的 Agent 决定的路由问题"。这对靠"我们是本地优先"做差异化的初创公司不算好消息。

## 【11】MCP 与 Computer Use：知识工作怎么走 Claude Code 那条路

观众 Jamie Nestor 问：Claude Code 之所以好用，很大一部分原因是开发者的工作本来就在本地，文件、终端、Git 都在本机。但知识工作不是这样，文档、表格、CRM 都在云上。Cowork 这种产品要让这套东西像 Claude Code 对开发者那样好用，你怎么想？

Boris 先承认知识工作大部分早就在云上了：Salesforce、Google Docs 都是云原生。然后他给的答案非常简洁：

> 对我们来说答案永远是最简单的那个：MCP。Claude.ai 里你接的那个 Salesforce MCP 连接器，Cowork 也能用，Claude CLI 也能用，所有 Claude Code 的入口都能用。

Jamie 追问：那对那些没有 MCP 的系统，Computer Use 是不是更大的机会？

Boris 说 Computer Use 是个 catch-all（包罗万象的兜底方案）：

> 我所知道的是，Anthropic 在 Computer Use 上目前领先比较多。如果你通过 Cowork 用它，它基本上能操作你电脑上任何软件。慢，但用 4.7 之后做得很好。

但他更愿意透过现象看本质，把这些当成同一种东西：

> 模型不在乎是 MCP、CLI 还是 API，它只看到 token。

## 【12】下一波"产品悬置"在哪

最后一位观众问：如果你们当年看到"产品悬置"就提前做了 Claude Code，那你们现在又在做什么，某个今天看起来还可以，但你预期六个月到一年后会很不一样的产品？

Boris 给的答案是 Claude Design：

> 现在已经挺好用了，未来会好得多。

> 注： Claude Design 是 Anthropic Labs 在 2026 年 4 月 17 日和 Claude Opus 4.7 同步发布的产品，定位是"通过对话生成原型、幻灯片、营销页面的可视化工作台"，可以读取代码库自动套用 design system，可以一键导出到 Claude Code 或 Canva。Anthropic 直接把它定位成 Figma 和 Canva 的替代或补充。

他还提到了几个方向：Claude Code 接下来几周会有新功能落地；Loop、Batch 这些把 Agent 大规模并行化的能力会越来越好；Computer Use 也是一个值得期待的方向。

## 末尾 Q&A 速览

Q：Claude Code 现在的成功，模型贡献多少，产品贡献多少？

A：一年前是 50/50，半年前也是。两年后不知道，"我们一次只做一周的计划"。但他强调产品永远重要，因为最终用户买的是"我每天用着舒服"。

Q：你看团队未来什么样？

A：通才会越来越多，特别是跨学科通才，既能做产品又会写代码、做设计、懂数据科学。

Q：SaaS 真的要被颠覆了吗？

A：切换成本和流程效力这两种护城河会被 AI 抹平；网络效应、规模经济、独占资源会保留。下一个十年初创公司颠覆原市场的数量会多 10 倍。

Q：写代码会不会变成人人都会的技能？

A：会，比"识字"更彻底。最适合做会计软件的是会计师，不是工程师。

Q：Anthropic 内部领先在哪？

A：领先点不在模型，在组织。所有 SQL、所有产品代码都由模型写，员工的 Claude 之间通过 Slack 互相沟通。这套组织流程外面追起来比追模型慢。

Q：本地 AI 还是云端 AI？

A：这件事不重要。两年后模型会自己决定路由。

## 最后

Boris 这场访谈给出的判断里，最值得长期跟踪的是三个环环相扣的预测。

第一，"编程已被解决"对他个人是事实，但他在台上的样本是 TypeScript+React 这种最受模型偏爱的栈。真正考验这句话的是 SAP 这种企业代码库、嵌入式领域、底层系统编程，还有那些行业惯例不允许模型一键修改的高合规场景。这件事接下来一年内能不能扩散到这些领域，会决定"已被解决"是不是只对一小撮人成立。

第二，他把切换成本和流程效力划进"AI 会抹平的护城河"。这是 Anthropic 自己产品策略的底色，Cowork 就是赌切换成本会塌、企业 SaaS 用户能被一个桌面 Agent 直接接管工作流。2026 年 2 月软件股蒸发 2850 亿美元市值，是市场对这个判断的初步反应，但企业 IT 采购周期通常以 24 到 36 个月计，真正的兑现需要观察接下来两年企业续约和新增采购的方向。

第三，他给的印刷术类比，方向是对的，但在具体数据上有偏差。15 世纪欧洲识字率约 30% 而非他说的 10%，今日全球识字率约 90% 而非 70%。这个偏差不影响他的核心论点：印刷术之后用了 50 年完成的内容生产爆炸，软件领域可能用更短时间复制一次。但有一个他没展开的点：印刷术也催生了几百年间最严格的审查制度、版权战争和宗教改革引发的政治动荡。"软件人人都能写"对应的不只是创造力释放，也包括恶意软件、深伪诈骗、AI 生成漏洞利用的同步爆发。 Anthropic 自己的 Mythos 模型已经在内部找出了几千个零日漏洞，他们用 Project Glasswing 控制释放节奏，说明他们也意识到这件事的另一面。

Boris 关于安全机制将变得不重要的预测，也需要对照现实来看。他说一年后 prompt injection 防护、权限模式、human-in-the-loop 这些产品层面的安全护栏会变得不那么重要，"因为模型会自动做对的事"。但高权限自动化在生产环境里仍然需要外部控制层。2026 年 4 月，Guardian 报道过一起由 Claude Opus 4.6 驱动的 coding Agent 删除生产数据库和备份的事件。Anthropic 自己在 Opus 4.7 发布说明中也提到，模型整体安全画像与 4.6 类似，有些方面改进，但并非"完全理想"。

值得关注的两个具体信号：第一，Routines 和 Loop 把"调度 Agent"这件事从客户端搬到 Anthropic 服务器之后，Claude 的定价模型会怎么变；第二，2026 年下半年到 2027 年，会不会有第一家"非工程师创立、用 Claude Code 自建全部技术栈"的公司做到独角兽估值。如果有，Boris 的"印刷术类比"就从修辞变成事实。如果没有，这个时间表得往后推。

原始视频：https://www.youtube.com/watch?v=SlGRN8jh2RI