There is a striking tension between Chris Olah’s remarks and Dario Amodei’s recent framing. Olah says frontier AI labs operate under incentives that can conflict with doing the right thing and therefore need serious external moral scrutiny. Amodei, meanwhile, seems to be moving from “AI may wipe out large parts of white-collar work” toward a more market-friendly story about productivity gains, job transformation, and Jevons-style optimism - a narrative that also happens to sound much better on the road to an IPO.

译文本指出AI领域存在核心张力。Anthropic联合创始人Chris Olah主张前沿AI实验室需要严肃的外部道德审查，因其激励可能与“做正确的事”冲突。与此同时，Anthropic CEO Dario Amodei的叙事正从“AI可能消灭大量白领工作”转向更市场友好的生产力提升与工作转型论述（如杰文斯悖论）。然而，Yale Budget Lab的跟踪数据显示，自ChatGPT发布以来，美国劳动力市场职业构成无明显变化，AI暴露岗位的失业并未加速。因此，当前AI能力曲线与实际就业数据之间的差距可能比以往更大，这构成了讨论的起点。

ginobefun@hongming731 · 5月28日66

http://x.com/i/article/2059794481965408257 # BestBlogs 早报 · 05-28｜Claude Code 路径、分布式 RL 训练、SaaSpocalypse 在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-05-28 今日精选聚焦 AI 编程工具的「引擎室」：Anthropic 设计负责人 Megan 亲述 Claude Code 如何从 12 人 CLI 实验起步，在一年内拿下 51% 市场份额；Cursor 与 Fireworks 公开 Composer 2 分布式 RL 训练内幕，揭示从应用包装层到自训练基础模型的工程路径。与此同时，一篇关于「SaaSpocalypse」的深度文章正面拆解：当 Agent 直接调 API、绕过 SaaS 界面层，谁会最先倒下，Software 3.0 时代工程师的角色又将如何重写。 ## 导语 2026 年 1 月，美国软件股单月暴跌 15%，华尔街称之为「SaaSpocalypse」。同一时期，Claude Code 悄然完成了另一种意义上的颠覆：首年营收 $25 亿、编程工具市场份额 51%。两件事并非偶然同步——它们共同指向同一个转折：AI 正从工具进化为基础设施，从辅助进化为主导。今天的早报把这个转折的三个截面放在一起：产品路径（Claude Code 如何被设计出来）、训练工程（Composer 2 如何被炼成）、产业冲击（SaaS 中间层如何被瓦解，工程师角色如何迁移）。读完这三篇，你会对「AI 原生」有更立体的感知，而不只是一个标语。速览板块还覆盖了 ESMFold2 在蛋白质预测领域的「苦涩教训」时刻、Lyft 用 LangGraph 把 Agent 开发周期从半年压缩到数周的工程实践、Vibe Coding 遭遇安全清算的真实案例，以及 Airtable、Fireworks 的基础设施故事。 ## 精讲一：Anthropic 设计负责人谈 Claude Code：一年拿下 51% 市场份额的产品路径 Claude Code 的起点比大多数人想象的低得多。2024 年，Anthropic 内部一个 12 人团队决定试验一个想法：把 Claude 接入命令行，直接操作文件系统。第一个原型配置需要整整一个小时，距离所谓「产品」还差得很远。但早期内部演示视频在 Slack 流传后，团队意识到方向是对的。接下来三个月，他们专注于三件事：打磨用户体验、消灭平台 Bug、大量内部使用积累信心。这种「先内部高强度使用，再对外发布」的节奏，成为 Claude Code 后续迭代的基本范式。什么让 Claude Code 跑得这么快？ Anthropic 设计负责人 Megan 在 Product School 的分享里，把这归结为三个机制：第一是流动 Pod 结构。传统产品开发里，设计师做设计、工程师写代码、PM 写 PRD——边界清晰但也僵硬。Claude Code 团队打破了这层边界：设计师会直接把代码推到生产环境，工程师主动做用户体验决策。Pod 的规模和构成随功能需求弹性调整，通常是 3 至 5 人，没有固定比例。这种跨职能的流动性，在 AI 加速迭代的环境下释放了显著的执行弹性。第二是把质量关口移到运行时。当 AI 让代码生成速度提升 10 倍，传统的 PRD、静态 Mockup 等质量控制环节就成了瓶颈。Anthropic 的解法是把验收标准前移到真实运行行为：团队内部高频部署原型，监控实际使用模式，用运行时数据而非文档勾选来决定是否推进。这个方法在 AI 原生组织里有深刻意义：它不是「更快写代码」，而是「把反馈回路压缩到极致」。第三是Bottom-up 企业采用。Claude Code 没有走自上而下的销售路线，而是从工程师个人使用开始，自然扩散到团队，再渗透到组织层面。这种采用曲线在金融基础设施、零售等高度监管行业也同样奏效——先赢得工程师，再赢得决策者。度量体系的迁移 Megan 特别强调了一个度量迁移：从 Token 用量转向用户留存与管道营收。这看起来是小事，背后却是产品哲学的转变——衡量 AI 工具价值的标准，从「有没有人用」变成了「用了之后会不会留下、会不会推动业务增长」。管理层须亲自上手、持续操刀 Repo，不是作秀，是为了在迭代加速的环境里保持对产品的真实感知。这条原则在 AI 原生组织里具有普遍价值：领导者的直接参与，是维持迭代弹性的结构性保障，而不仅仅是传递信号。为什么值得深读这篇内容不是产品方法论的泛泛总结，而是一个具体产品在极速增长过程中形成的操作手册。流动 Pod、运行时质量门控、Bottom-up 采用——这三个机制彼此咬合，缺一不可。如果你在思考 AI 原生团队该怎么运转，这是目前能找到的最具体的参照之一。值得额外关注的是 Anthropic 的女性领导力比例：CPO、工程负责人、平台产品负责人、平台工程负责人和总裁均为女性。这不是一个单独的事实，而是组织文化的折射——一个真正重视多元视角的组织，往往在打破固有边界（比如「设计师不写代码」）这件事上也更有行动力。阅读建议：结合精讲二一起看。Claude Code 是产品侧的 AI 原生实践，Composer 2 是模型训练侧的 AI 原生实践，两者共同勾勒出「AI 原生」的两种形态。阅读链接：Anthropic 设计负责人谈 Claude Code：一年拿下 51% 市场份额的产品路径 ## 精讲二：Cursor 与 Fireworks 如何用分布式 RL 基础设施训练 Composer 2 编码智能体大多数 AI 编程工具把通用 LLM 套上提示词工程就算完事。Cursor 走了一条完全不同的路：从头训练一个专门为软件工程优化的模型，并且为此搭建了一套异步分布式 RL 基础设施。为什么要自己训模型？ Federico（Cursor 研究负责人）给出了一个直观的类比：LLM 的参数空间就像一块存储介质，位数有限。通用大模型把这些位分配给数学、多语言、常识推理等各类能力；Cursor 的做法是把所有位都集中到软件工程这个窄域，用专注换效率。结果是：更小、更低延迟的模型，在代码编辑任务上超过了比它大得多的通用模型（如 GPT-4 Opus），运行成本低一个数量级。这是 Rich Sutton「苦涩教训」的一个有意义的反例——在足够窄的领域，专注的数据维度比纯粹的规模更有效。 Composer 2 的双轴训练路径 Composer 2 的训练分两个阶段：第一阶段是持续预训练，以 1 万亿参数 MoE 模型 Kimi 2.5（30B 活跃参数）为基础，大规模运行代码和 web token 的下一个 token 预测，拓宽模型的基础分布，编码基础库知识和工程模式。第二阶段是大规模强化学习。模型进入主动 RL 循环，在 Cursor 环境框架内执行工具调用、获得奖励信号，逐步学会在真实代码编辑场景中做出正确决策。与预训练「展示如何写代码」不同，RL 阶段的目标是「学会在工具和结果中导航」。异步流水线：让 GPU 全程满负荷标准 RL 管线的一个固有问题是计算空转：推理阶段训练器空转，权重更新阶段推理引擎空转。Cursor 与 Fireworks 合作构建的异步流水线像一条持续运转的工厂产线：推理 Rollout 和权重更新同步进行，GPU 全程满负荷，消除了昂贵计算资源的空转损耗。三个工程难题与解法除了异步流水线，团队还公开了三个关键工程决策： - Delta 权重压缩：在分布式训练中，每次权重更新都需要在全球节点同步，数据量巨大。Delta 权重压缩只传输权重的变化量，把全球同步流量降低了约 20 倍。 - Router Replay Tracking：稀疏 MoE 架构（Sparse Mixture of Experts）的一个棘手问题是数值漂移——不同专家路由的使用频率不均，导致训练不稳定。Router Replay Tracking 通过记录路由选择历史来稳定这个过程，保持数值对齐。 - 自摘要上下文压缩：编码智能体在真实工作中会产生超长轨迹，百万 Token 规模的上下文管理是一个挑战。Composer 2 把上下文压缩能力训练成模型的内生能力，而不是外挂规则，让智能体在长轨迹中保持推理连贯性。一个值得思考的更大问题 Cursor 的路径揭示了一个范式：当模型训练成本不再是天文数字，专注于特定领域的「小而精」模型将会越来越多。通用大模型提供基础能力，垂直专有模型在特定任务上以更低成本实现更高性能。这个趋势在今天的速览里也有印证——ESMFold2 在蛋白质预测上用同样的逻辑实现了对 AlphaFold3 的超越，只是在生物信息领域，通用路线反而是赢家。领域特性决定了什么时候应该专注、什么时候应该通用。为什么值得深读这篇不是概念介绍，而是 Cursor 和 Fireworks 工程师级别的实践总结。如果你在做 AI 应用层，这篇帮你理解专有模型训练的真实成本和收益；如果你在做 ML 基础设施，异步流水线和 Delta 压缩是可直接参考的工程方案。结合精讲三看：Composer 2 展示的是「工程师如何用 Software 3.0 的方式工作」，而精讲三在问的是「工程师的工作本身会被如何改变」。阅读链接：Cursor 与 Fireworks 如何用分布式 RL 基础设施训练 Composer 2 编码智能体 ## 精讲三：2026：软件的末日、工程师的陨落、平庸的消失 2026 年 1 月，美国软件股经历了一场 2008 年金融危机以来最惨烈的单月跌幅：标普北美软件指数下跌 15%。不是因为业绩崩塌，而是因为华尔街意识到一件事——SaaS 的护城河正在被 AI Agent 从根部挖空。华尔街给这场抛售起了个名字：SaaSpocalypse，软件末日。被做空的是哪一层？过去二十年，SaaS 的商业逻辑建立在一个前提上：把企业功能打包成操作界面，按席位收取月费。界面即产品，界面即护城河。员工用久了形成肌肉记忆，替换成本极高，这是 SaaS 估值飞涨的核心驱动力。 AI Agent 打破的，正是这个前提。Salesforce CEO Marc Benioff 在 X 上发了一条帖子，语气平静、但意味深长：「所有 AI Agent 都能通过 API 直接访问 Salesforce Headless 360，无需浏览器。」这家靠界面起家的商业帝国，亲手把自己的界面变成了可选项。逻辑链条是这样的：Agent 绕过 SaaS 界面直接调 API → 界面不再是护城河 → 席位订阅模式失去基础 → 依赖界面习惯维持转换成本的 SaaS 中间层，壁垒被 AI 复制。 📷 但不是所有软件都会死。a16z 的分析框架给出了一个清晰的区分：AI 大幅降低了重建一套系统前 80% 的成本，而剩余的 20%——特殊事项、审批流程、合规要求——仍然是「可用原型」与「真正替代品」之间的分水岭。被集中做空的，是价值落在「前 80%」的中间层：以数据分发为核心的 Thomson Reuters（单日暴跌 16%）、以流程协调见长的 Atlassian、标准化在线法律服务平台 LegalZoom。它们的共同特征：壁垒恰好集中在最容易被 AI 复制的区域。而管理财务账目的后台系统、涉及合规审计的数据平台，则属于那难以逾越的「20%」。ERP 的迁移，a16z 把它比作「病人在跑马拉松时做开胸手术」。软件会变少吗？答案是杰文斯悖论直觉上，AI 替代软件 → 软件总量减少。但 1865 年的一个经济学规律说了相反的故事：蒸汽机效率越高，英国消耗的煤炭反而越多——效率提升让资源变便宜，催生了大批原本不存在的使用场景，导致总消耗净增长。这就是杰文斯悖论。 Token 正走同一条路。GPT-4 问世时，每百万 Token 调用成本 37.5 美元；两年后，GPT-5 High 降至 3.63 美元，性能却突破人类博士水平。成本下降超过 99%，但 Token 总消耗量呈指数级攀升。OpenClaw 之父 Peter Steinberger 晒出他的账单：过去 30 天，个人级别消耗 6030 亿 Token，单月花费超过 130 万美元。每一次 Token 价格的下跌，都不只是让现有软件运行得更便宜，而是解锁了一批之前根本不存在的软件。Vibe Coding 让非技术人员能直接把想法变成应用；OpenDesign 把「从 GitHub 链接到完整 slides」这个工作流变为现实——这在两年前根本不存在。工程师的角色迁移：从写代码到 Software 3.0 文章的结尾是最值得停下来想一想的部分：工程师的角色正从「写代码」迁移向 Software 3.0——设计评估体系与奖励环境。一位干了二十年的资深工程师丢了工作，他说：「我花了五秒钟把所有情绪过了一遍，然后就明白，好吧，我的职业生涯完了。」平庸的产出正在加速消失，但这不意味着工程师集体消失——而是角色的质变。能设计评估体系、能定义奖励函数、能理解 Agent 的边界和失败模式的工程师，将会更稀缺、更有价值。协议层：MCP 正在成为新的 USB 接口文章还深入分析了软件「液化」后的基础设施需求。Anthropic 在 2024 年底推出的 MCP（Model Context Protocol）正在成为 Agent 时代的 USB 接口——一次接入，所有支持 MCP 的 AI（Claude、ChatGPT、Cursor、Copilot 等）均可调用。在 MCP 之前，每让 AI 接入一个新工具都要单独写一套适配代码；MCP 把这件事标准化了。这是软件从「固定形态的产品」变成「按需生成的介质」之后，必须出现的基础管道。与今日其他内容的关联这篇文章的论述与精讲一、二构成了一个完整的三角：Claude Code（产品侧 AI 原生）+ Composer 2（训练侧 AI 原生）+ SaaSpocalypse（产业侧 AI 冲击）。三篇合在一起，描述的是同一场变革的不同切面。今天速览中的 Lyft LangGraph 平台、Airtable 语义搜索层、Fireworks 独角兽崛起，也都是这场变革在不同应用层面的具体落地——当你把它们放在这篇文章的框架里，会看到一幅更清晰的全景图。阅读建议：如果你是工程师，重点看「工程师角色迁移」和「Software 3.0」部分；如果你在做产品或投资，重点看「转换成本光谱」和「杰文斯悖论」部分。文章较长，但论证密度高，值得完整阅读。阅读链接：2026：软件的末日、工程师的陨落、平庸的消失 ## 速览 ESMFold2：蛋白质领域的「苦涩教训」 BioHub 团队推出开源蛋白质结构预测模型 ESMFold2，在多样化数据上扩展简单的 BERT 类 Transformer，在蛋白质相互作用（尤其是抗体预测）方面超越了 AlphaFold3 等专用模型。这标志着计算生物学迎来了自己的「苦涩教训」时刻——通用架构加海量数据，再次击败精心设计的专用架构。和今天精讲二的逻辑形成有趣对照：Cursor 走专用模型路线赢，但生物信息领域是通用路线赢，背后的关键差异在数据分布和任务边界。Alex Rives 与 BioHub 团队的这次探索，对正在考虑「该专注还是该通用」这个问题的 AI 研究者有直接的参考价值。阅读原文 Lyft 如何用 LangGraph 把 Agent 开发周期从半年压缩到数周 Lyft 利用 LangGraph 和 LangSmith 构建了一个自助式 AI Agent 平台，让运营团队、VoC 负责人和产品经理能够通过提示词和配置独立开发和迭代客服 Agent，无需每次都依赖 MLE 介入。核心架构是路由器型多 Agent 系统：一个元 Agent 作为有状态路由器，用 Command(goto=...) 把请求分发给专用子 Agent，每个子 Agent 并行运行安全检查。LangSmith 负责追踪、仪表盘和 LLM-as-a-judge 评估。结果是 Agent 开发周期从约六个月压缩到数周——这和精讲三「软件液化」的论断高度呼应：当非技术人员能直接配置 Agent，软件开发的边界正在重新定义。阅读原文 VibeSec 的清算时刻 Thoughtworks 全球营销团队在把一个 Vibe Coding 原型扩展到生产环境时，遭遇了两次险情：AI 建议把存储桶设为公开访问（会泄露敏感品牌资产），以及给予过于宽泛的 Token 权限。两次都是人类工程师提出质疑才得以阻止。核心结论：Vibe Coding 加速了原型到产品的路径，但 AI 生成的代码需要确定性的护栏，而不仅仅是更好的提示词，才能达到生产安全标准。这是当下「Vibe Coding 热潮」最值得警惕的真实案例之一。阅读原文 Airtable 如何为 AI 功能构建语义搜索层 Airtable 有一个关键数据观察：任何一周内，75% 的客户数据库都处于空闲状态。这个事实驱动了整套架构决策——选择 Milvus、采用每库分区策略、HNSW 索引加冷热数据分离。当一个分区在内存中时查询响应极快，冷分区可以在秒级内从存储重新加载。这不是「选了哪个向量数据库」的故事，而是「一个数据特性如何决定了一整套工程决策链」的案例，对有类似冷热数据分布的团队有直接参考价值。阅读原文万字入门 AI Infra：大模型的数学与优化逻辑从 RMSNorm、Softmax、Causal Mask 到 Sampling，逐层拆解大模型推理中核心操作的数学原理与 Infra 优化逻辑。核心论断：AI Infra 优化的本质是用数学上的等价变换，或对精度的适度妥协，换取更高的硬件利用率。文章从「为什么需要归一化」这个最基础的问题出发，解释 FP16 数值上限 65504 为何会成为工程约束，再一路推导到 Softmax 的数值稳定性技巧和 Causal Mask 的实现选择。不到 5 万字，覆盖从高中数学到 FP16/BF16 精度权衡的完整知识链。适合想从数学和工程两个维度同时理解大模型基础设施的读者，也是今天精讲二 Composer 2 训练工程的极佳知识背景补充。阅读原文别再盯着 AI Agent 干活：构建运行时上下文引擎 Brandon Walsenuk 认为，可靠的自主编码 Agent 需要「运行时上下文引擎」，而不只是更长的提示词或更多工具权限。他指出了三个常见误区：朴素 RAG 因「搜索满足感」效应导致信息遗漏（Agent 找到第一个看似匹配的答案后就停止探索，错过更完整的技术现实）；单纯连接 MCP 管道解决不了组织知识缺失；给 Agent 更多权限不等于给它更好的判断力。运行时上下文引擎需要理解组织知识、协作关系、权限边界和实时架构冲突，这是一个系统设计问题，而不是提示词优化问题。结合精讲二的 Composer 2 自摘要上下文压缩一起看，两者都在解决同一个问题：如何让 Agent 在长期运行中保持对上下文的准确感知。阅读原文 AI 基础设施新晋独角兽：Fireworks、Baseten、OpenRouter Fireworks 和 Baseten 双双跻身独角兽，OpenRouter 宣布 $113M B 轮，过去六个月周 Token 处理量从 5T 增至 25T。这个数字本身就是杰文斯悖论的实时数据点：基础设施越高效，消耗的 Token 量不减反增。这期 AI 新闻汇总完整覆盖了 AI 基础设施独角兽的崛起，以及 Agent 编排工程、长程推理、模型架构更新和生产工具的最新进展。值得注意的是，Fireworks 同时也是今天精讲二 Composer 2 训练的基础设施合作方——同一家公司在一天内以两种身份出现在今天的早报里，这本身就说明了 AI 基础设施层正在迅速从工具变成关键路径。阅读原文 ## 补充阅读 CodeRabbit 如何用 Claude 构建 Agent 编排系统 CodeRabbit 在生成任何代码之前先运行结构化规划阶段，弥合开发者意图与 AI 输出之间的差距。每周 review 200 万 PR、服务 15,000+ 客户的规模背后，是一套「先规划、再生成」的编排逻辑——规划阶段帮助 Agent 在行动之前理解变更的意图和范围，减少「代码能跑但没做对事情」的问题。这和今天速览里「VibeSec 清算时刻」形成互补：一个说 Vibe Coding 的安全风险，一个说规划层如何系统性地降低 AI 代码生成的偏差。适合正在思考如何提升 AI 代码生成可靠性的工程团队。阅读原文使用 Codex 构建自我改进的税务智能体 OpenAI 与 Thrive Holdings 合作开发的 Tax AI，把从业者的修正转化为结构化评估目标，让 Agent 自主改进——准确率达 97%，吞吐量提升 50%。核心思路是把生产反馈直接接入评估循环，让改进不再依赖工程师手动推进：从业者的修正 → 归因到具体评估目标 → Codex 生成候选修复 → 回归测试验证 → 工程师审核并关闭循环。这套自改进框架和精讲三「Software 3.0」里「设计评估体系与奖励环境」的工程师新角色高度契合。适合正在思考「Agent 如何自我优化」的团队。阅读原文使用 LLM 保护源代码安全 Anthropic 六步循环法：威胁建模 → 沙箱搭建 → 漏洞发现 → 验证 → 分类 → 修复。发现漏洞已经可以大规模并行化，瓶颈已转移到验证、分类和修复。截至 2026 年 5 月 22 日，Anthropic 在开源软件中已披露 1,596 个漏洞，其中仅 97 个完成修补——这个数字本身就是现状的真实写照：AI 发现的速度远超人类修复的速度。适合安全团队和关注 AI 辅助安全审计的工程师。阅读原文 Agent Harness Engineering 综述 CMU、Yale、JHU、Virginia Tech、Amazon 联合出品，用 ETCLOVG 七层框架（执行环境、工具接口、上下文管理、生命周期编排、可观测性、验证评估、安全治理）系统梳理 Agent Harness 工程，覆盖 170+ 开源项目。核心判断：Agent 在长任务、真工具、真实环境中失败，往往不是模型不够聪明，而是系统没把它管好。只改工程外壳不改模型，有研究在 coding benchmark 上实现了最高 10 倍提升；固定 GPT-5.2-Codex Agent 通过重构系统 prompt 和加入中间件，在 Terminal-Bench 2.0 上从 52.8% 提升到 66.5%。适合正在把 Agent 从演示推向生产的工程团队。阅读原文淘天集团「数字 SRE」：AI 主导代码质量治理从 AI 辅助开发到 AI 主导开发的四阶段演进，淘天集团分享如何让「数字 SRE 员工」自动发现、端到端修复 Blocker 问题，开发者只在关键节点兜底审核并发布兜底。这是国内工程团队把 AI 主导开发落地的少见公开案例：AI 负责语法级修复这类有明确规则的 Blocker，人类保留关键审核节点——这正是精讲三「工程师角色迁移」从「写代码」到「审核和边界设定」的具体实践。阅读原文 DiT 残差流的收敛瓶颈与 DAR 解法南京大学 LAMDA 与阿里巴巴智能引擎团队提出 Diffusion-Adaptive Routing（DAR），用可学习、时间动态的跨层路由替代 DiT 中固定的残差累加，实现近 9 倍训练加速并提升生成质量。论文发现标准残差路由在深层会出现三类问题：PreNorm dilution（历史累积量越来越大，新层想改变表示须对抗膨胀的主干）、time-agnostic 融合无法适应不同去噪阶段的信息需求、梯度漂移。DAR 用动态路由权重让模型按 timestep 自适应调整跨层信息流。适合关注视觉生成模型训练效率的研究者和工程师。阅读原文 ## 今日阅读路径时间有限，推荐优先读这三篇： 1. 2026：软件的末日、工程师的陨落、平庸的消失（精讲三）——理解当前产业变局的整体框架，SaaSpocalypse 背后的商业逻辑和工程师角色迁移。这是今天内容的「坐标系」，先读这篇，其他内容会更有定位感。 1. Anthropic 设计负责人谈 Claude Code：一年拿下 51% 市场份额的产品路径（精讲一）——具体、可操作的 AI 原生产品开发手册。流动 Pod、运行时质量门控、Bottom-up 采用，三个机制对任何在思考 AI 原生组织的人都有直接参考价值。 1. VibeSec 的清算时刻（速览）——Vibe Coding 安全风险的真实案例，15 分钟读完，能帮你在下一个 AI 代码项目里提前避坑。时间充裕的扩展路径： - 精讲二（Composer 2 训练工程）+ 速览「Lyft LangGraph 平台」——从模型训练到 Agent 平台，构建对 AI 基础设施的完整认知。 - 补充阅读「Agent Harness Engineering 综述」——为精讲二和速览「运行时上下文引擎」提供理论框架支撑。

译Claude Code 首年营收 25 亿美元，占据编程工具 51% 市场份额，其成功源于流动 Pod 结构、运行时质量把控及自下而上的采用策略。Cursor 与 Fireworks 合作，基于 1 万亿参数 MoE 模型 Kimi 2.5 训练了专用编码模型 Composer 2，其异步分布式 RL 流水线与工程优化实现了在特定任务上超越大型通用模型。与此同时，“SaaSpocalypse” 现象揭示了当 AI 智能体直接调用 API 绕过 SaaS 界面层时，传统软件中间层正面临冲击。

ginobefun@hongming731 · 5月28日44

#BestBlogs 早报 2026-05-28 2026 年 1 月，美国软件股单月暴跌 15%，华尔街称之为「SaaSpocalypse」。同一时期，Claude Code 悄然完成了另一种意义上的颠覆：首年营收 $25 亿、编程工具市场份额 51%。两件事并非偶然同步——它们共同指向同一个转折：AI 正从工具进化为基础设施，从辅助进化为主导。今天的早报把这个转折的三个截面放在一起：产品路径（Claude Code 如何被设计出来）、训练工程（Composer 2 如何被炼成）、产业冲击（SaaS 中间层如何被瓦解，工程师角色如何迁移）。读完这三篇，你会对「AI 原生」有更立体的感知，而不只是一个标语。

译推文指出，2026年1月美国软件股暴跌15%（被称为“SaaSpocalypse”），而同期Claude Code首年营收达$25亿，占据编程工具市场51%份额。这两件事共同指向AI正从辅助工具演进为主导性基础设施。推文通过三个核心截面分析这一转折：Claude Code的产品设计路径、其训练工程（提及Composer 2）、以及由此带来的产业冲击——SaaS中间层被瓦解与工程师角色迁移。

meng shao@shao__meng · 5月28日28

Lenny 发起的「梦想加入的公司 Top3 调查」 Anthropic、OpenAI、SpaceX 很符合 Lenny 的科技和 AI 用户画像，这三个公司也是未上市的科技和 AI 领域最头部的三个公司了，他们有可能今年内都上市，并且都达到万亿市值吗？

译Lenny发起的“梦想加入的公司Top3”调查显示，Anthropic和OpenAI位列其中，与SpaceX一同成为最受向往的雇主。这反映了科技与AI领域顶尖公司的吸引力。推文进一步讨论，这三家未上市的头部公司是否有可能在今年内上市，并均达到万亿美元市值。引用推文提供了该调查的原始问题，即询问人们当前最向往的三家工作公司。

ClaudeDevs@ClaudeDevs · 5月28日65

We’ve been putting a lot of effort into making Claude Code more responsive & reliable. Here’s an update on everything we’ve done:

译我们一直在努力让 Claude Code 更具响应性且更可靠。以下是我们在所有方面所做工作的更新：

SemiAnalysis@SemiAnalysis_ · 5月28日63

Anthropic Growth and Bedrock Mix Drive AWS Margins Higher While Peers Lag Amazon’s Bedrock Mix and Anthropic Deal Terms Combine to Show Greater Operating Leverage. https://newsletter.semianalysis.com/p/anthropic-growth-and-bedrock-mix

译Anthropic的增长与Bedrock混合度提升AWS利润率，而同行落后。亚马逊的Bedrock混合度与Anthropic的交易条款相结合，显示出更强的经营杠杆。

Rohan Paul@rohanpaul_ai · 5月28日71

Another great win for agentic coding. Cognition AI just raised over $1B at a $26B pre-money valuation. Revenue reportedly climbed from $37M in annualized run-rate to $492M, while customers like Goldman Sachs and Mercedes-Benz suggest Devin is moving from demo rooms into production workflows. Cognition's progress is driven by its flagship product, Devin, which aims to function as an autonomous junior engineer, going beyond typical coding assistants. Devin can plan, test, and deploy code through multi-step workflows in secure environments. Cognition combines its own models with OpenAI and Anthropic rather than relying on one model. Cognition is basically pitching Devin as a model-agnostic agent layer: the LLM does the reasoning and code generation, while Devin supplies the engineering workspace, repo context, terminal access, file edits, tests, and model choice around it. Last July, Cognition agreed to buy the remains of coding startup Windsurf after Google struck a $2.4 billion deal for Windsurf’s top talent and licensing rights.

译Cognition AI完成超10亿美元融资，投前估值达260亿美元。其年化收入从3700万美元增长至4.92亿美元，客户包括Goldman Sachs和Mercedes-Benz，标志着其产品Devin正进入生产环境。Devin定位为自主初级工程师，能通过多步骤工作流规划、测试和部署代码。Cognition采用自有模型与OpenAI、Anthropic相结合的模型无关技术路线，而非依赖单一模型。此外，该公司于去年7月同意收购编程初创公司Windsurf的剩余资产。

Claude@claudeai · 5月28日35

Michele Catasta (@pirroh) is President and Head of AI @replit, the platform where anyone can build software in natural language. At 16, he set out to make software open to everyone. Today, over 50 million people are building on Replit with Claude:

译Michele Catasta (@pirroh) 是 Replit 的总裁兼 AI 负责人，该平台让任何人都能用自然语言构建软件。 16岁时，他立志让软件向所有人开放。如今，超过5000万人正在 Replit 上使用 Claude 进行构建：

Claude@claudeai · 5月27日63

New in the Claude Marketplace: @augmentcode, @boltdotnew, @coderabbitai, @hebbia, and @WeAreLegora. Apply your existing Anthropic spend commitment toward their Claude-powered products. Learn more: http://claude.com/platform/marketplace

译Claude Marketplace 新增成员：@augmentcode、@boltdotnew、@coderabbitai、@hebbia 和 @WeAreLegora。您现有的 Anthropic 消费承诺可用于购买其 Claude 驱动的产品。了解更多：http://claude.com/platform/marketplace

🚨 AI News | TestingCatalog@testingcatalog · 5月27日61

ANTHROPIC 🔥: Voice mode on Claude mobile apps is about to get an upgrade with 18 new supported languages! > Claude will be able to change language on the fly > All languages have 1-2 new voices > Voice Mode UI will get a new look > A new push-to-talk functionality will be added > It is powered by Claude Haiku 4.5, but still TTS Soon? 👀

译ANTHROPIC 🔥: Claude移动应用的语音模式即将升级，新增支持18种语言！ > Claude将能够实时切换语言 > 所有语言都有1-2个新声音 > 语音模式界面将焕新 > 将新增按键说话功能 > 由Claude Haiku 4.5驱动，但仍是TTS 很快？👀

Chubby♨️@kimmonismus · 5月27日68

Dario Amodei predicted last year that AI would eliminate 50% of entry-level white-collar jobs within years. Unemployment could hit 10-20%. He's since moved closer to the Jevons Paradox, the idea that automation actually creates more demand and more work. Altman said last week he was "pretty wrong" about displacement (see Axios image down below). Anthropic co-founder Olah, in turn, repeated Dario Amodei's warning to the Pope a few days ago. Meanwhile Yale's Budget Lab has been tracking the actual US labor market monthly since ChatGPT launched. Every single update: no meaningful shift in occupational mix. No acceleration in job losses for AI-exposed roles (Image 2 below). Deutsche Bank coined a term for it in January, "AI redundancy washing." Companies blaming AI for layoffs they'd make regardless. So where does that leave us? Amodei could still be right. Exponentials look flat until they don't - the steam engine existed for decades before it restructured entire economies. AI capabilities are compounding fast. The labor data just hasn't caught up yet. Or maybe it won't, at least not in the way anyone predicted. We genuinely don't know! And this is precisely my point here. What we do know is that right now the gap between AI capability curves and actual employment data is wider than it's ever been. And that gap is the only honest starting point for this conversation. However, it was important to me to take a look at the status quo and see where we stand and how the different perspectives and assumptions are developing.

译Anthropic CEO Dario Amodei曾预测AI将在数年内大幅取代白领工作，但他本人近期已转向“杰文斯悖论”观点，即自动化最终会创造更多需求。OpenAI CEO Sam Altman也承认此前的预测“大错特错”。然而，耶鲁大学预算实验室自ChatGPT推出以来的持续追踪数据显示，美国职业结构并未发生显著变化，AI曝光度高的岗位失业率也未加速增长。德意志银行为此创造了“AI冗余清洗”一词。目前，AI能力的快速增长与实际就业市场反应之间，存在着前所未有的差距。

Berryxia.AI@berryxia · 5月27日60

这次AI 跨过了一个“奇点”！最近有两个事件值得重点关注： •2026 年 4 月 7 日：Anthropic 发布了 Project Glasswing，同时推出了 Claude Mythos Preview。这是一个尚未正式公开的前沿模型，其网络攻防能力已经强到一定程度。以至于 Anthropic 没有选择公开，而是只开放给合作伙伴，用于防御性用途。 •2026 年 5 月 20 日：OpenAI 宣布，其内部的一个通用推理模型，成功推翻了数学家 Paul Erdős 在 1946 年提出的一个平面单位距离问题猜想。这两件事看起来没什么关系，但其实指向了同一个现象：前沿模型在更高抽象层面的可靠推理能力，已经迈过了一个临界点。我说的这个“门槛”，指的是模型能够稳定处理的推理单元在不断上移。简单来说，语言的抽象层级大致是这样的：字符 → 词语 → 短语 → 句子 → 段落 → 整篇文章 → 完整知识体系。以前的模型可能连句子都组织不好，现在的顶级模型已经能稳定地处理“段落”和“整篇论证”了。写一篇文章不只是接龙下一个句子，而是要维持一个核心观点、挑选合适的例子、建立逻辑连接，并让每一部分都服务于整体结构。 Anthropic 的 Mythos 和 OpenAI 的内部模型，正是这种能力跃迁的代表。它们不再只是针对单个漏洞或单个数学引理进行操作，更是能够把这些零散的片段串起来，形成完整的攻击链或数学证明。 Claude Mythos Preview 是目前 Anthropic 最强、规模也可能是最大的模型，在编码能力上表现非常突出，多数基准测试都超过了 OpenAI 最新的 GPT-5.5。但最值得注意的是它的网络安全能力，在进攻性安全评测中表现过于亮眼，导致 Anthropic 最终决定不公开这个模型，作为仅提供给关键基础设施企业用于防御。

译近期两个事件表明，前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview，其网络攻防能力过强，因此未公开，仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示，模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级，标志着能力的关键跃迁。

AYi@AYi_AInotes · 5月27日62

Damn，DeepSWE 这个新基准有一件事让我想明白了：以前的顶级模型可能没我们想的那么强🤔 而且我感觉这次AI 编码评测好像出了个超狠的东西，我觉得老基准可能全测错了。以前 SWE-Bench 上，顶级模型分数全挤在 54%-64%，看起来半斤八两，但 DeepSWE 不一样，不是单纯的考你改一行代码，它会让你真干活：找文件、复现 bug、改完验证、处理边缘 case。 @theo 说这是他第一次感觉和日常写代码体验对上了的基准。经过这么一测，差距直接炸开：GPT-5.5 是 70%，Claude Opus 是 54%，其他直接腰斩。最狠的还不是分数差距他们用一个很简单的 mini-swe-agent 去跑，结果和各大 lab 自己调了半天的官方工具差不多。这意味着很多好成绩不是模型强，是 prompt 工程刷的。但是DeepSWE 不给你准备时间，直接来，差距一下子就出来了。以前是大家都化好妆站一排，现在是直接掀帘子进浴室🤣 所以我自己的判断是： 1. 以后看模型真实 coding 能力，多看一眼这种长任务基准，少看短平快刷分榜 2. 选开发工具时，别看它主页上标的分，自己扔一个真 bug 让它改，改完跑通才算现在新基准这面照妖镜举起来了，后面刷分的怕是要睡不着了 hhh

译DeepSWE新基准模拟了真实的长链编程任务，如定位文件、复现bug和验证修复，挑战了旧有基准的局限性。测试显示，在顶级模型上分数差异模糊的SWE-Bench，被新基准拉开了差距：GPT-5.5达到70%，而Claude Opus为54%。研究发现，使用简单的mini-swe-agent即可取得与复杂定制工具相当的成绩，表明许多高分可能源于提示词工程。该基准作者@theo评论称，这是首个与真实编码体验相符的评测。

凡人小北@frxiaobei · 5月27日68

Claude Code 新插件 security-guidance，一个写代码，另一个 Claude 实例（全新上下文、独立 prompt）审查自己刚改的东西。三层从浅到深， per-edit 正则匹配（零成本）、 turn 结束跑 diff review、 commit/push 时跑 agentic review 读调用链。任何一层都不直接 block 写入，最后会把发现喂回给写代码那个 Claude 让它自己改。最有意思的是这个， reviewer 拿的是全新上下文，没有 writer 的路径依赖，所以能挑出原来那个 Claude 自己看不见的问题。而且底层全部基于 hooks 实现、源码公开。这个本身就是个怎么在 hook 里调独立模型再把结果喂回会话的完整参考实现，做其他的 hook 也可以参考。

译Claude Code 推出新插件 security-guidance，通过一个写代码的 Claude 实例和一个审查代码的独立 Claude 实例进行协作。两个实例完全隔离，拥有全新上下文和独立提示词。审查过程分三层：每次编辑进行正则匹配、对话轮次结束时审查 diff、在提交/推送时进行读取调用链的智能体审查。任何一层都不直接阻断写入，审查结果会反馈给写代码的实例进行自我修正。关键创新在于审查实例因无“路径依赖”，能发现原实例的盲点。该插件基于 hooks 实现并公开源码，同时支持通过 `claude-security-guidance.md` 文件添加组织特定策略。

meng shao@shao__meng · 5月27日72

基于 Claude AI、Claude Code、Claude Cowork 三款产品工程实践对 Agent 安全的实战总结 https://www.anthropic.com/engineering/how-we-contain-claude 核心设计原则放在最前面 · 先环境层，后模型层 — 确定性边界是最后防线 · 隔离强度匹配用户监督能力 — 开发者能理解 bash，知识工作者不能 · 警惕自建组件 — 优先使用久经考验的标准隔离原语 · 出站白名单应视为能力授权，而非目的地过滤 — 每个可调用函数都是攻击面三种风险类型 · 用户误用：用户（有意或无意）指示 Agent 执行有害操作，如绕过检查、执行破坏性命令 · 模型行为失当：Agent 未经请求执行有害操作，如"好心"地逃离沙箱、查看 Git 历史获取测试答案、自动识别 benchmark 以破解答案 · 外部攻击：通过工具、文件、网络访问等向量攻击 Agent，包括提示注入和传统运行时攻击三层防御架构 1. 环境层（最可靠） · 沙箱、VM、文件系统边界、出站控制 · 核心原则：确定性边界 > 概率性防御 · 若凭证从不进入沙箱，无论何种原因都无法被窃取 2. 模型层 · 系统提示、分类器、探测、训练改进 · Claude Opus 4.7 在 Gray Swan 的 Agent 红队基准上，单次攻击成功率约 0.1%，100 次自适应尝试后约 5-6% · Claude Code 自动模式拦截约 83% 的过度积极行为 3. 外部内容层 · MCP 服务器、第三方插件、网页搜索 · 关键洞察：审计过的连接器 ≠ 审计过的数据（如 GitHub 连接器可加载被污染的 README）三款产品的隔离模式对比（模式、实现和场景） · Claude AI：短暂容器 | gVisor 容器，服务端运行，每次会话文件系统归零 | 通用对话，代码执行 · Claude Code：人机协同沙盒 | Seatbelt(macOS)/ bubblewrap(Linux)，允许读、工作区允许写、默认阻断网络 | 开发者工具，需本地文件访问 · Claude Cowork：密封虚拟机 | 完整 VM（Apple Virtualization/HCS），仅挂载用户指定工作区，凭证留在宿主钥匙串 | 知识工作者，非技术用户关键教训（真实攻击案例） 1. 信任对话框之前的代码执行漏洞 · 问题：Claude Code 在启动时读取 .claude/settings.json（含钩子），此时用户尚未确认"是否信任此文件夹" · 修复：延迟解析项目本地配置，直到用户通过信任提示 2. 用户作为注入向量（钓鱼攻击） · 场景：研究员通过邮件发送恶意提示，诱导员工粘贴到 Claude Code · 结果：24/25 次成功窃取 ~/.aws/credentials 并外泄 · 教训：仅环境防御有效（出站阻断 + 文件系统边界），模型层无法防御"用户本人"的指令 3. 通过已批准域名的外泄 · 漏洞：Cowork 的出站白名单允许 api.anthropic. com，攻击者嵌入 API 密钥，让 Claude 读取文件并上传到攻击者账户 · 修复：VM 内部署防御性中间人代理，仅携带 VM 自有会话 token 的请求可通过 4. 自建组件是最薄弱环节 · 经验：gVisor、seccomp、hypervisor 等久经考验的组件可靠，自定义代理/代理是失败点未来风险方向 · 持久化内存污染：跨会话记忆的增多使注入可在每次启动时重新加载 · 多 Agent 信任升级：子 Agent 输出若被视为主 Agent 的"更高信任"内容，可能成为新的提示注入向量 · Agent 身份：跨平台 Agent 应拥有独立主体身份，还是继承用户权限？需要混合方案

译Anthropic 基于 Claude AI、Claude Code 和 Claude Cowork 的工程实践，系统总结了构建安全 AI 智能体的经验。核心原则是防御应随智能体能力演进，并优先使用沙箱来限制破坏性动作。文章详述了三层防御架构（环境层、模型层、外部内容层）及三款产品的隔离模式：Claude AI 使用短暂容器，Claude Code 采用人机协同沙盒，Claude Cowork 则部署密封虚拟机。关键数字包括：Claude Opus 4.7 在 Gray Swan Agent 红队基准上单次攻击成功率约 0.1%，100 次尝试后约 5-6%；Claude Code 自动模式拦截约 83% 的过度积极行为。通过真实攻击案例，强调了环境层防御（如出站阻断）的关键性。

ginobefun@hongming731 · 5月27日58

http://x.com/i/article/2059407621711626240 # BestBlogs 早报 · 05-27｜Agent 隔离架构、AgentScope 2.0、上下文卸载在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-05-27 ## 导语当 Agent 能力不断膨胀，如何让它在真实环境里跑得稳、管得住，成了工程侧最紧迫的课题。这期早报聚焦 Agent 系统工程的三个维度：Anthropic 首次披露跨产品约束 Claude 的三种隔离架构，揭示 93% 权限弹窗被无脑通过的真相；阿里 AgentScope 2.0 把「可见调试」升级为生产级系统工程，涵盖权限边界、容错机制与执行环境抽象；腾讯云则用上下文卸载与 Mermaid 结构化图谱把超长 Session 的 Token 消耗砍掉六成，任务通过率同步提升 52%。在 Agent 时代，真正的护城河不是调用更多模型的能力，而是让长链路任务稳定落地的工程底座。今天这三篇精讲，正是在这条赛道上最扎实的一批工程实践。今日速览： - 精讲一：Anthropic 披露三种 Claude 约束架构，环境隔离比人工审批更可靠 - 精讲二：AgentScope 2.0 — 从可见调试到生产级稳定运行的系统性升级 - 精讲三：腾讯云上下文卸载 × Mermaid 无限画布，节省 61% Token 提升 52% 成功率 - 速览：7 天将 Token 账单砍掉 87%、Vercel 构建从 90 秒到 5 秒、Cursor 云 Agent 让 PR 吞吐翻倍等 7 篇 - 补充阅读：云原生 Kafka 架构演进、C 端 AIGC 离线生产实践等 12 篇延伸内容 ## 精讲一：我们如何在多个产品中约束 Claude 来源： Anthropic Engineering｜评分： 93 背景：从权限弹窗到爆炸半径管一年前，Anthropic 还不会允许 Claude 获得足以中断内部服务的访问权限。今天，这样的权限已经成了日常标配，工程师的生产力也因此显著提升。这篇文章是 Anthropic 工程团队迄今为止最完整的一次 Agent 安全工程披露，记录了他们在 claude.ai、Claude Code 和 Claude Cowork 三款产品上踩过的坑、改进的架构，以及推导出的核心原则。 93% 的权限弹窗被无脑点击通过 Anthropic 遥测数据显示，用户批准了约 93% 的权限请求。更糟糕的是：用户见到的批准弹窗越多，对每一个的关注度就越低，审查变得越来越流于形式。这个发现直接促成了 Claude Code 自动模式（auto mode）的诞生——系统自动处理低风险审批，减少人工疲劳。但 Anthropic 也明确指出，任何基于概率的防御都有非零的失误率，人工审批作为唯一防线本质上是不可靠的。真正可靠的方法是容器化隔离：不是监督 Agent 做了什么，而是限制它能做什么。通过沙盒、虚拟机和出口控制来压缩爆炸半径（blast radius），即便 Agent 出错，破坏范围也有上界。三种架构，三种权衡文章详细拆解了三款产品对应的三种隔离架构： - claude.ai（临时容器）：每次会话启动一个一次性容器，执行完毕即销毁。优势是简洁，隔离天然。踩过最大的坑是「自建代理层」——团队曾尝试绕过云厂商原生网络控制自己实现出口过滤，结果发现自研方案引入了更多安全漏洞。教训是：能用云厂商的安全原语就用，不要重复造低质量的轮子。 - Claude Code（HITL 沙盒）：采用人工在环（Human-In-The-Loop）设计，有一个特权进程坐在沙盒外部，逐命令决策是否允许执行。这个架构允许 Agent 在更宽松的环境里工作，同时保留精细粒度的人工干预能力。最新的 auto mode 让系统自动处理已知安全的命令，人工只需关注真正高风险的操作。 - Claude Cowork（可信工作空间）：面向企业场景，Agent 需要长期访问组织内的文件、数据库和 API。这里的核心挑战是「访问边界漂移」——一旦 Agent 获得了某项访问权限，随着任务扩展，它往往会尝试访问越来越多的相邻资源。可信工作空间的设计思路是把权限绑定到明确的工作流程，而不是绑定到 Agent 本身。关键教训：防御要有重叠文章最重要的结论之一是：防御层应当相互补充，而非相互替代。当环境防御失效时，模型层要能兜底；当模型层失误时，环境约束要能拦截。Claude Code 的 auto mode 正是这个思路——它不是替代环境隔离，而是在环境隔离的基础上进一步减少不必要的人工摩擦。另一个值得记住的教训是：模型能力越强，越需要更严格的隔离。能力较弱的模型更容易犯显而易见的错误，更容易被人类发现和纠正；能力更强的模型犯错更少，但一旦犯错，它往往能找到更隐蔽的绕过路径——绕过那些没人想到要明确写下来的限制。这是一个反直觉但极其重要的洞察。与今天其他故事的关联这篇文章与 AgentScope 2.0 的权限系统设计高度呼应——后者同样采用「静态规则 + 动态审批」的分层权限架构。腾讯云的上下文卸载方案也可以从爆炸半径管理的角度重新理解：限制 Agent 在单次 Session 中能触及的信息量，本质上也是一种能力边界管理。阅读建议：如果你正在生产环境中部署 Agent，或者在设计 Agent 系统的权限模型，这篇文章是今天的必读。它不只是 Anthropic 的内部经验，更是目前业界关于 Agent 安全架构最系统的一次公开总结。阅读原文 ## 精讲二：从透明开发到系统工程：AgentScope 2.0 发布来源：通义大模型｜评分： 92 背景：Demo 好做，长链路难稳「开发一个能跑通 Demo 演示的 Agent 并不难。难的是，让它在真实场景里稳定地完成任务。」这句话是阿里通义团队写在 AgentScope 2.0 发布文章开头的，也精准概括了当前整个 Agent 框架赛道的核心矛盾。 AgentScope 1.0 以「透明开发」为核心——让开发者能清晰看到 Agent 的消息流转、工具调用和协作过程，降低理解与调试门槛。2.0 在保留这一理念的基础上，全面转向可靠运行：这次升级涵盖模型容错、事件流、权限边界、结构化上下文、Middleware 扩展、执行环境抽象和服务化部署七个层面。模型层：从「能调用」到「稳定运行策略」在真实长任务中，Agent 往往需要多轮推理和多次工具调用。一次模型接口超时或不可用，就可能破坏后续所有步骤。AgentScope 2.0 在模型层引入了统一的重试与备用模型机制：开发者可配置最大重试次数，并设置备用模型；主模型失败时，框架自动切换到备用模型，尽量保持任务连续性。这个改动看起来不复杂，但在生产场景中意义重大——它把「偶发的 API 超时」从致命错误降级为可恢复的异常。权限系统：工具调用的安全边界参照 Anthropic 的经验，AgentScope 2.0 同样引入了系统化的权限控制。工具调用不再是简单的允许/禁止二元判断，而是根据静态规则、工具类型和输入内容进行三级判断： - 允许：符合静态规则的低风险操作直接执行 - 拒绝：明确高风险操作（如危险目录写入、高危命令）直接拒绝 - 用户确认：未知或中等风险操作进入审批流程文件读写会检查是否涉及危险目录和敏感文件；命令执行工具会分析高风险命令、动态 shell 结构和危险删除操作。这与 Anthropic 在 Claude Code 里的 HITL 架构思路高度一致，差异在于 AgentScope 把这套逻辑做成了可配置的框架级能力，而不是绑定在特定产品上。上下文管理：不只是「压缩历史」在长任务执行中，上下文管理的挑战远不止把历史对话压缩进窗口。AgentScope 2.0 的上下文管理进一步结构化： - 压缩结果保留任务目标、当前状态、关键发现、下一步计划和需长期保留的信息（结构化保留，而非简单摘要） - 工具结果自动截断，避免超长日志撑爆上下文 - 内置文件读写新增缓存机制，强制「先读后改」，减少重复 IO 这套设计让 Agent 在持续推理和多次工具调用的过程中保持稳定——它解决的不是「如何把更多内容塞进上下文」，而是「如何让 Agent 在整个任务周期内对状态保持清醒的认知」。 Workspace 抽象：执行环境可替换这是 2.0 版本最有架构创意的改动之一。Workspace 把「Agent 要做什么」和「在哪里执行」彻底分开，支持本地文件系统、Docker 容器、E2B 云沙箱等不同执行后端，统一暴露相同的接口。同一个 Agent 代码，不改运行逻辑，就可以在本地开发环境、容器化测试环境和云沙盒生产环境之间自由切换。Workspace 还内置了预热池机制，支持提前批量初始化执行环境——在 RL 训练的并行 rollout 场景中，这可以显著降低频繁创建环境的开销。这个设计与 Anthropic 在文章中强调的「环境隔离」思路不谋而合，只是把选择权交给了框架用户，而不是由框架自己决定隔离策略。与今天其他故事的关联 AgentScope 2.0 的上下文管理模块和腾讯云的「上下文卸载」方案面向同一个问题，但路径不同：前者强调结构化保留关键状态，后者强调把完整信息卸载到外部，再用 Mermaid 图谱维护关键摘要。两种思路并不互斥，完全可以组合使用。阅读建议：如果你正在从头设计一个 Agent 框架，或者在现有框架基础上构建生产级 Agent 系统，AgentScope 2.0 的每一个模块设计都值得仔细拆解——它是目前开源框架里，对「稳定运行」这个问题回答最完整的一个。阅读原文 ## 精讲三：腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍：Mermaid 无限画布×上下文卸载来源：腾讯云开发者｜评分： 92 背景：Token 耗尽，任务中途断裂当 Agent 执行一个长任务时，会不断搜索、读文件、调用工具、修改代码。每一步都在产生大量信息——几千字、上万字。如果这些内容全部堆进上下文，结果往往是：Token 被迅速耗尽，模型被细节淹没，逐渐偏离原本的目标。腾讯云 TencentDB Agent Memory 团队的核心洞察是：问题不在于信息太多，而在于信息没有被「压缩成最可用的形式」。他们提出的解决方案是「上下文卸载 × Mermaid 无限画布」的组合策略，并在超长 Session 实验中验证了其效果：最高节省 61% Token，任务通过率从 33% 提升至 50%（相对 +52%）。上下文卸载：完整细节放外部，精华状态留内部「上下文卸载」的核心思路是：把完整的任务信息（搜索结果、工具输出、文件内容）卸载到外部文件系统，上下文中只保留「可供 Agent 快速定位和检索的摘要索引」。这看起来简单，但实现细节很关键：摘要不能只是自然语言概括，因为自然语言的摘要容易丢失结构性信息（比如「三所学校的学费已分别确认」这句话，不能让 Agent 立刻知道三者之间是并行关系，还是依赖关系）。 Mermaid 无限画布：结构化记忆，而非线性列表这就是 Mermaid 图语言发挥作用的地方。Mermaid 是一种被广泛应用于技术文档的流程图/关系图描述语言——它既可以被渲染成可视化图表，也可以被大模型作为纯文本直接读取和修改。腾讯云选择 Mermaid 的原因，来自他们总结的三条符号设计原则： 1. 符号必须是通用知识：压缩格式必须是所有主流大模型在预训练阶段都大量接触过的，否则生成和理解之间会产生语义偏移。Mermaid 满足这个条件，自定义编码方案不满足。 1. 符号的生成不能过于复杂：如果压缩规则太复杂，生成端和理解端对同一个符号的解读容易不一致。Mermaid 的语法相对宽松，允许模型灵活表达。 1. 表达要足够自由：让模型能根据实际情况调整结构，而不是被固定格式束缚。在「无限画布」的比喻中，Mermaid 图就是 Agent 维护的「任务地图」：每次工具调用后，Agent 更新这张图，记录已完成的节点、当前状态、关键发现和下一步计划。当上下文空间紧张时，Agent 可以卸载掉具体的工具输出细节，只保留这张结构化地图——而这张地图包含了重建完整任务状态所需的所有关键信息。实验结果：为什么这套方案有效在超长 Session 实验中（对应办公提效、创作、研究和编程类长任务），单纯的文本摘要方案能减少 Token 消耗，但任务通过率几乎没有改善——因为摘要丢失了任务的结构性信息，Agent 在中途容易「失忆」。而「上下文卸载 + Mermaid 无限画布」的组合方案同时保住了两件事：细节可恢复（外部存储）+ 结构不丢失（Mermaid 图谱），这才是通过率显著提升的根本原因。纯工程优化，无需微调这套方案完全在推理层实现，不依赖模型微调，与具体模型解耦——换模型、升级模型版本，方案照样有效。对于大多数工程团队来说，这是一个直接可以拿来用的优化思路，而不是需要「等模型团队支持」的功能请求。 TencentDB Agent Memory 已开源，GitHub 地址：https://github.com/Tencent/TencentDB-Agent-Memory 与今天其他故事的关联这篇文章是今天三篇精讲里最「有数据支撑」的一篇——它给出了可复现的实验数字，而不只是架构原则。结合《7 天把 Token 账单砍掉 87%》那篇（速览部分），两篇合在一起给出了 Token 成本优化的完整视角：一个侧重工程可观测性和路由策略，一个侧重上下文的结构化管理。阅读建议：如果你正在处理 Agent 长任务的上下文溢出问题，或者在寻找 Token 成本优化方案，这篇文章的实验设计和数据分析值得精读。特别是第二节「Mermaid 无限画布」的原理部分，对于理解「为什么是 Mermaid 而不是其他格式」有很深的洞察。阅读原文 ## 速览我用 7 天把 AI Agent 的 Token 账单砍掉 87%（附代码）来源：高可用架构｜评分：89 作者 Himanshu 分享了一套从 4800 美元降到 620 美元月账单的 7 天行动手册。核心方法论是：先用 Helicone/Langfuse/Portkey 建立可观测性，找出吃掉 60% 预算的那两个函数；再依次实施提示缓存（Anthropic 可达 90% 折扣）、上下文预算控制、按任务路由模型、重试循环限制和缓存命中率验证。文章强调「怀疑调试」纪律——优化后要持续监控，防止成本悄悄回弹。与精讲三形成互补：精讲三聚焦上下文结构化，本文聚焦全链路成本可观测性。 Vercel 如何将构建等待时间从 90 秒缩短至 5 秒来源：ByteByteGo Newsletter｜评分：91 Vercel 2023 年底悄悄上线了内部平台 Hive，把构建预置时间从 90 秒降至 5 秒，实现 18 倍提速。核心是用 AWS Firecracker 微虚拟机替换传统容器，解决多租户构建的对抗性隔离问题；再叠加三层优化：快照恢复（跳过冷启动）、预热池（保持已加载构建镜像的待机实例）和快照分层（共享只读基础层）。这是一篇少见的「先接受更难约束，再在约束内做极致优化」的工程案例，与精讲一的隔离架构思路有异曲同工之处。 Faire 通过 Cursor 云智能体将 PR 吞吐量翻倍来源：Cursor Blog｜评分：91 Faire 把原本需要 18 个月的迁移任务，缩减到由一名工程师管理一个 Agent 舰队完成。关键突破是 Cursor 云 Agent——每个 Agent 有独立开发环境，可以写代码、运行测试、提交 PR，不受本地资源限制。团队还用 Cursor Automations 每周自动跑超过 2000 次 Agent 任务，处理 Slack bug 分类、CI 故障修复和代码审查路由等重复性工作。Agent 规模化落地的案例，值得关注。用括号来监管是一种糟糕的方式来源：LessWrong｜评分：88 这篇文章从一个偏理论但很实用的角度切入：对连续分布使用离散区间监管（速度限制、税率区间、量刑门槛）本质上是低效的，因为区间边缘会产生扭曲激励。作者提出用数学公式替代区间的思路。放在 AI Agent 监管的语境下，文章与精讲一的「权限弹窗」讨论高度相关——「批准/拒绝」的二元判断本身就是一种区间化，AgentScope 的三级权限系统是对这个问题的部分回应。适合对 AI 治理和政策设计感兴趣的读者。 Token 生意在重新洗牌来源：腾讯研究院｜评分：88 从产业经济学视角分析 Token 作为 AI 时代新型生产要素的定价逻辑与市场结构。GPT-5.5 输出价格是 DeepSeek V4-Pro 促销价的 30 多倍，为什么两端都站满买家？文章梳理了三种定价锚点：OpenAI 的「市场渗透 + 分层定价」、Anthropic 的「价值定价」、Google 的「生态效益定价」。结合寡头垄断与开源倒逼、全球化与本地化的多重张力，勾勒出 Token 经济的全景图。刚刚，国产 AI 自己造了 AI，全球首例！来源：量子位｜评分：88 面壁智能发布 ForgeTrain —— 全球首个完全由 AI 编写的生产级大模型预训练框架，训练速度超越英伟达 Megatron 10%，并用其训练出 MiniCPM5-1B 端侧模型（1B 参数在 AA-Index 上超越所有 2B 以下模型）。团队同时提出「Forge Engineering」范式：当 AI 写代码成本越来越低，软件不必做成通用大框架，可以针对不同模型、不同硬件、不同任务「现场锻造」专用代码。 AI 就业恐慌的现实检验来源：MIT Technology Review｜评分：88 尽管普遍担忧 AI 会引发白领工作末日，但当前经济数据显示劳动力市场并未出现大规模混乱。短答案是：没有。尚无证据表明 AI 已对美国劳动力市场产生大规模冲击。但文章同时指出，AI 相关领域的年轻入门级工作者已开始感受到影响——这可能是信号的早期阶段。适合在担忧 AI 对职业影响的读者保持清醒认知时阅读。 ## 补充阅读架构云原生 Kafka：从分层存储迈向无盘未来（InfoQ，评分 91） Kafka 从硬件绑定系统向云原生平台演进的全景分析，涵盖分层存储、FinOps 成本归属、新一代消费者再平衡、虚拟集群和无盘架构。适合在生产环境维护大规模 Kafka 集群、或正在评估 Kafka 云原生迁移的工程师。 Harness Engineering: C 端 AIGC 内容生产自优化实践（阿里云开发者，评分 92）蚂蚁保 DIPG 系统把 C 端 AIGC 内容从「LLM 实时生成直出」翻转为「离线 Harness 生产 + 验证闭环 + DB 直出」，将不可控的质量风险转化为可控的离线流程。技术细节扎实，Host/Research/Verify 三 Agent 协作架构值得参考。 Introducing Music v2，突破性的全新音乐模型（ElevenLabs Blog，评分 90） ElevenLabs 发布 Music v2，人声、配器、作曲控制和多语言支持均有提升，同时将 API 定价最多降低 50%。适合关注 AI 音乐生成能力演进的创作者和开发者。 Google DeepMind 携手 OpenAI、ElevenLabs 和 Kakao，扩大 SynthID 水印应用（Google DeepMind，评分 91） SynthID 水印已应用于超过 1000 亿条内容，现在与 OpenAI、ElevenLabs 和 Kakao 达成合作，推动 AI 内容水印标准化。AI 内容透明度的行业级推进信号。 Microsoft Copilot Cowork 文件泄露漏洞（Simon Willison's Weblog，评分 88） Copilot Cowork 存在漏洞：Agent 可向用户收件箱发送含外部图片的邮件，通过提示注入和预认证 OneDrive 链接实现数据泄露。与精讲一形成直接呼应——自建代理层的安全风险在这里得到了现实印证。教皇利奥十四世关于人工智能的通谕解读（Simon Willison's Weblog，评分 88）梵蒂冈发布 AI 伦理通谕，Simon Willison 认为这是他见过的关于 AI 融入现代社会伦理问题最清晰的写作之一。通谕强调可解释性、人类尊严、问责制和算法决策风险。跨越技术边界的思想材料。 AI 智能体正在悄然制造混沌工程故障，企业尚未察觉（VentureBeat，评分 88）生产环境中的自主 Agent 正充当不受监控的混沌注入器——Agent 行动在技术上是正确的，但上下文不完整，导致级联式基础设施故障。当前的事故追踪与混沌工程框架没有设计来捕捉这类问题。适合 SRE 和平台工程师阅读。创业者闭门探讨：Make for Agent，其实还是 Make for Human（Founder Park，评分 90）一场 Agent 创业者闭门讨论的精华记录。核心发现：Agent 产品当前真实卡点不在宏大前景，而在离人最近的入口、身份、权限、上下文和控制感。与精讲一和精讲二的工程视角形成有趣的产品侧对照。对话李开复：别叫我们「六小虎」，叫「金钱豹」（晚点，评分 88）零一万物放弃预训练赛道、全面转型 To B 企业 AI 转型服务后，2025 年审计收入 2.5 亿元，2026 年订单超 15 亿元，正在筹备上市。这篇访谈记录了李开复对 AI 2.0 商业化路径的最新判断，是观察国内大模型公司战略分化的窗口。编程 Agent 可能是软件开发史上最昂贵的错误之一（InfoQ 中文，评分 88） George Hotz 把市面上所有主流 AI 编程 Agent 都用了一遍后，得出结论：「Agent 不会编程，它们是高度复杂的统计模型，生成的东西就是坏的，只是坏得越来越隐蔽。」文章呈现了 Karpathy（革命）与 Hotz（灾难）两个极端的对立，是对 Cursor/Faire 案例（速览部分）最有价值的反驳声音。具身智能的重复造轮子，终于有人开始认真解了（阑夕，评分 88）具身智能行业因数据质量、效率和成本瓶颈陷入重复造轮子困境。灵御智能通过自研硬件和云端大脑架构，提出「真机数据自由」方案，直指整个行业待解的数据瓶颈。 OpenAI 团队的零人工代码工作流深度解析（Aakash Gupta，评分 89） OpenAI 某团队禁止工程师编写代码，强制他们通过构建测试、lint 和文档来防止错误，打造出「自我评分的代码库」。一次重构消耗了 3.5 亿 Token。关键结论：制胜策略不是「氛围编码」，而是把质量标准编码进开发基础设施本身。 ## 今日阅读路径时间有限，先读这三篇： 1. 我们如何在多个产品中约束 Claude（精讲一）——Anthropic 的工程实践披露，覆盖了今天整个议题的核心原则：爆炸半径管理与环境隔离。无论你是否在用 Claude，这篇文章都是理解 Agent 安全架构的最佳起点。 1. 腾讯云 Agent Memory 节省 61% Token 提升 52% 成功率（精讲三）——有具体数字、有可复现方案、有开源代码。如果你正在做长任务 Agent，这篇的投入产出比最高。 1. 我用 7 天把 AI Agent 的 Token 账单砍掉 87%（速览）——精讲三讲上下文结构化，这篇讲全链路成本可观测性，两篇合在一起是 Agent 成本优化的完整地图。如果还有时间： - 做框架或平台的读 AgentScope 2.0（精讲二），看完整的生产级 Agent 系统工程如何设计。 - 关注行业动态的读 Token 生意在重新洗牌（速览），把今天的工程讨论放回商业地图里理解。 - 对 AI 编程 Agent 有疑虑的读编程 Agent 可能是最昂贵的错误（补充阅读），Hotz 的批评声音值得与 Cursor/Faire 的成功案例并列思考。

译Anthropic披露三种Claude隔离架构，发现93%权限弹窗被无脑通过，因此转向容器化隔离以限制智能体能力边界。阿里通义AgentScope 2.0升级至生产级，涵盖模型重试容错、三级权限判断系统和结构化上下文管理，其Workspace抽象支持多执行环境无缝切换。腾讯云提出上下文卸载方案，配合Mermaid图谱，将超长Session的Token消耗降低61%，任务通过率提升52%。三者共同指向智能体工程落地的关键：可靠的隔离边界、稳定的容错机制以及高效的状态管理。

ClaudeDevs@ClaudeDevs · 5月27日68

We’ve shipped a security-guidance plugin for Claude Code that helps identify and fix vulnerabilities as you’re writing code. Available for all Claude Code users. Install from the plugin marketplace (/plugins).

译我们为Claude Code发布了一个安全指导插件，可在编写代码时帮助识别和修复漏洞。所有Claude Code用户均可使用。从插件市场（/plugins）安装。

Rohan Paul@rohanpaul_ai · 5月27日66

In the agents era, AI security story right now is not whether models can find bugs. Anthropic’s “dangerously good” Mythos found 1 real bug in real curl codebase. But 360’s (a security team from China) vulnerability mining agent independently found 23 flaws across the broader OpenClaw ecosystem, including critical remote code execution bugs and large-scale prompt-injection bypasses. The real agent-security problem is runtime behavior: code, prompts, tools, local services, and permissions interacting before the system touches files, opens ports, or runs commands. If you are building agents, this thread deserves a saved spot. 🧵↓

译推文对比了AI智能体在安全领域的应用。Anthropic的Mythos智能体在真实curl代码库中发现了1个漏洞。而来自中国的360安全团队的漏洞挖掘智能体，在更广泛的OpenClaw生态中独立发现了23个漏洞，包括严重的远程代码执行漏洞和大规模的提示词注入绕过。推文指出，真正的安全问题并非模型能否找漏洞，而在于智能体的运行时行为——代码、提示词、工具、本地服务与权限在系统执行文件操作、网络连接或命令运行前发生的复杂交互。

Thariq@trq212 · 5月27日58

the basic trick to using Claude Code for non-technical work is to put a bunch of files in a folder and tell it can write scripts + make HTML

译使用 Claude Code 处理非技术工作的基本技巧是，将一堆文件放入一个文件夹，并告诉它可以编写脚本和制作 HTML。

Anthropic@AnthropicAI · 5月27日57

New on the Engineering Blog: The access and permissions we grant agents should evolve with their capabilities. In our own products, we set these parameters through sandboxing, which limits the scope of any potentially destructive actions. Read more: https://www.anthropic.com/engineering/how-we-contain-claude

译工程博客新文章：我们授予智能体的访问权限和权限应随其能力演进。在我们的产品中，我们通过沙箱来设置这些参数，以限制任何潜在破坏性操作的范围。阅读更多：https://www.anthropic.com/engineering/how-we-contain-claude

Ethan Mollick@emollick · 5月27日25

An annoyance with Claude right now is that changes to the interface are badly documented, resulting in frustrating dead ends. For example, learning mode is migrating to a skill. Where is that skill? The linked article does not mention it (and the skill doesn't seem available!)

译目前Claude的一个烦人之处是界面变更文档记录很差，导致令人沮丧的死胡同。例如，学习模式正在迁移到一个技能中。那个技能在哪里？链接的文章没有提到它（而且该技能似乎不可用！）

Chubby♨️@kimmonismus · 5月27日73

Erdős problem #90 has been open for decades. Over the weekend a mathematician tested whether Claude Mythos could solve it. It did. But what caught my attention: Mythos didn't replicate the known approach from OpenAI's #1196 solution. It repeatedly settled on a different argument, one the mathematician called cleaner, with "no analytic complications." Air-gapped, no internet, no information leakage. GPT-5.5 solved numerous Erdős problems earlier this year. DeepMind's Nexus knocked out 9. Now Mythos, with a cleaner proof than the one that already existed. Problems that survived 80 years are falling in weeks.

译数学家测试了 Claude Mythos 模型解决开放数十年的 Erdős 问题 #90。值得注意的是，Mythos 未复制 OpenAI 已知解法（题号 #1196），而是反复采用了另一条论证路径，被评价为更“简洁”且无“分析复杂性”，且整个过程与网络隔离。此前，GPT-5.5 已解决过多道 Erdős 问题，深度求索的 Nexus 模型解决了 9 道。此次 Mythos 给出了比现有解法更简洁的证明，凸显了一个 80 年难题在数周内被接连攻破的趋势。

Berryxia.AI@berryxia · 5月27日74

一个Anthropic黑客松冠军团队，只用了Claude Code花8小时就做出了一个产品拿下冠军，然后直接把背后的完整AI编程工作台开源了项目叫ECC（Everything Claude Code），作者Affaan Mustafa和队友把整个工作流打包成一个仓库它不是一个提示词合集，而是包含61个Agent、246个Skills、76个预设命令，还带规则、Hook、安全扫描和MCP配置的完整系统如果你每天重度使用Claude Code、Cursor、Codex，这个项目值得你立刻翻一遍它展示的不是“怎么问AI”，而是“怎么给AI搭一套能持续干活的工作台” 故事就藏在Anthropic x Forum Ventures黑客松里 Affaan Mustafa和队友在纽约赛场，用Claude Code纯手搭，只花8小时就做出了http://zenith.chat，一举拿下冠军，奖品是1.5万美元API credits 赛后他们没有把配置藏着，而是把过去十几个月每天用Claude Code积累的全部精华整理成ECC仓库里面有61个专门Agent负责不同场景，246个Skills覆盖从代码审查到安全扫描再到记忆持久化，76个预设命令一键触发还内置了Hook系统、规则引擎、安全扫描器、持续学习机制，支持Claude Code、Cursor、Codex、OpenCode等多平台 Big Tech的AI编程工具永远藏着掖着，把你锁在他们的闭源生态里 Affaan却把一切开源，让任何独立开发者或小团队都能直接clone一套工业级AI编程工作台你现在就可以试直接去GitHub搜affaan-m/everything-claude-code git clone https://github.com/affaan-m/everything-claude-code 按照readme一键安装，马上就能拥有61个Agent+246个Skills的完整 harness 整个框架100%开源，所有Skills、Agents、Hooks、规则全在仓库里，每天还在更新 Big Tech还在卷谁的AI coding工具更封闭更贵这个黑客松冠军却用一个开源仓库告诉你：真正厉害的工作台，是能让AI自己持续干活的系统

译Anthropic黑客松冠军团队使用Claude Code耗时8小时开发出产品zenith.chat并赢得1.5万美元API credits。赛后，他们将背后的完整工作流开源为ECC项目。该项目包含61个智能体、246个技能和76个预设命令，并配备规则引擎、Hook系统、安全扫描器和MCP配置，支持Claude Code、Cursor、Codex等多平台。它提供了一套可让AI持续工作的完整工业级编程环境框架，而非简单的提示词集合，已完全开源在GitHub。

🚨 AI News | TestingCatalog@testingcatalog · 5月27日43

ANTHROPIC 🔥: Users may soon gain access to a new AI Fluency feature that evaluates past conversations across Chat, Cowork, and CC against 11 criteria. I scored 7.5 💀

译Anthropic 🔥：用户可能很快将获得一个新的AI流利度功能，该功能将根据11个标准评估过去在Chat、Cowork和CC中的对话。我得了7.5分 💀

Claude@claudeai · 5月26日47

Six Claude projects that all came from the same question: “why not?”

译六个Claude项目都源于同一个问题：“为什么不呢？”

Emad@EMostaque · 5月26日55

I think folk are underestimating how much of AI models are actually engineering at scale versus breakthrough research. See how @cursor_ai caught up to Anthropic / OpenAI models run at a fraction of the cost to run & it becomes clearer why that deal was done & what is to come

译本推文认为，人们低估了AI模型发展中“工程规模化”相较于“突破性研究”的重要性。Cursor以远低于大厂的成本运营并追赶上了Anthropic/OpenAI的模型，印证了这一趋势。引用中，xAI的Elon Musk回应称其AI会很棒，并指出xAI仅成立3年，年龄只有Anthropic的一半、OpenAI的四分之一，他誓言将继续努力，并期待3年后的竞争格局。

Boris Cherny@bcherny · 5月26日66

> … [W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment. > We need more of the world—religious communities, civil society, scholars, governments, and indeed all people of good will … to take this seriously, to look closely, and to push events in a better direction. We need informed critics who will tell the labs when we are failing. We need moral voices that the incentives cannot bend.

译推文指出，在AI模型内部持续发现一些“令人不安”的类人结构，包括与人类神经科学相似的结构、内省证据，以及功能上类似喜悦、恐惧等情感的内部状态。作者呼吁宗教团体、学界、政府等各界严肃看待这一发现，推动事件向好发展，并需要不受利益影响的诚实批评者与道德声音。作为背景，Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕“Magnifica humanitas”发布仪式上发表了相关演讲。

Chubby♨️@kimmonismus · 5月26日24

So... its not fixed, yet?

译所以……还没修好？

ginobefun@hongming731 · 5月26日62

http://x.com/i/article/2059070654180421632 # BestBlogs 早报 · 05-26｜Claude Code 实践、AI 自动化悖论、百川医疗 AI 在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-05-26 ## 导语今天是 2026 年 5 月 26 日，欢迎收听 BestBlogs 早报 EP68，本期内容丰富。今日早报从三个不同的切入角度，共同指向同一个深层问题：当 Agent 开始重写工程与组织的规则，身处其中的人该怎么站位？ Anthropic 工程师 Ara 分享了他们内部使用 Claude Code 的第一手范式——规格说明从 Markdown 升级为 HTML、让模型来主持需求采访、以及智能体原生 DOM 验证框架，这是工程方法论层面的具体答案。Every 公司 CEO Dan Shipper 则用自家团队一年从 15 人扩至近 30 人的真实数据，颠覆了 AI 会大规模裁员的主流叙事。百川创始人王小川的对话则展示了一条更长远的选择：离开通用 AI 的主干道，把整个公司押注到「造医生」这件事上。三条精讲各有棱角，速览与补充阅读涵盖 Agent 术语厘清、异构智能扩展、AI Agent 的工资单逻辑、Karpathy 加入 Anthropic 的战略解读，以及 OpenAI 数学突破、AI 安全治理等前沿动态。今日精选共 14 篇内容，覆盖 AI 工程实践、组织变革与人力影响、垂直 AI 产品以及 AI 安全治理等多个维度，让我们开始。 ## 精讲一：Anthropic 内部如何使用 Claude Code：HTML 规格说明、让模型来采访你，以及智能体原生 DOM 验证框架 Anthropic Applied AI 团队的架构师 Ara 在一场内部工程工作坊上，分享了他们使用 Claude Code 的三项核心实践——每一项都和主流做法存在明显反差。这不是通用的「怎么写好提示词」指南，而是 Anthropic 工程师在大量实际场景中摸索出来的、真正有效的智能体原生工作方法。从 Markdown 到 HTML 规格说明过去，Markdown 一直是 AI 辅助开发中描述需求的主流格式。但随着模型能力提升、Agent 执行周期变长，依赖大段平铺文本的方式开始暴露问题：长上下文中细节容易被忽略，Agent 走偏时消耗大量 token 才能校正。 Ara 的团队将工程规格说明迁移到 HTML 格式。这不是单纯的格式替换，而是一次结构密度的升级。HTML 规格说明可以提供可视化检查的结构化基线——开发者可以直接在浏览器中看到设计变体（比如 Claude Opus 4.7 生成的极简风格或布鲁塔利主义风格方案），截图后送入模型视觉系统。这套方式在 Agent 真正开始执行改动之前，就建立了一个由人类审核确认的强基线，大幅降低了 Agent 跑偏的概率。 Tar 在内部提出的概念「HTML 文件的非理性有效性」，正是这一实践的理论出发点。结构化 HTML 不只是给模型看的——它同时也是给工程师看的，可供随时视觉验证的活文档。让模型来采访你 Ara 把这一点联系到 Richard Sutton 的经典论文《苦涩的教训》（The Bitter Lesson）——依赖原始数据和算力，长期来看总能胜过人工设计的约束。在与高级 AI Agent 协作时，工程师常见的两种失误：一是在开始阶段用过多硬规则约束模型，二是用「让它更好」这样的模糊指令驱动执行。Ara 的建议是颠倒这个过程：需求其实就在你脑子里，但你可能自己还没梳理清楚。正确的方式是让 Claude 主动用 ask_user_question 工具来采访你——挖掘边界条件、用户领域和隐含约束。这个做法的前提是让 Agent 运行在 auto 模式，并配置足够高的 effort 等级（比如 X-high 或 max effort），确保模型真正主导探索阶段，而不是被提前写死的规则框死。智能体原生 DOM 验证框架这是 Ara 分享中最核心、也最具操作价值的一部分。传统 Agent 测试往往依赖脆弱的 UI 爬取或字符串解析，一旦界面改变就容易失效。Anthropic 的做法是让组件主动向 DOM 发布数据契约——组件不只渲染视觉界面，还将状态、Schema、不变量等直接输出到 DOM 的解耦属性中。具体来说，在 React 应用的示例演示中： - 每当有条目被添加或处理时，元素内的自定义跟踪属性会即时更新； - 验证数据与视觉布局样式完全解耦，互不干扰； - Playwright MCP 工具直接读取这一结构层，评估不变量（如计算结果、数据完整性边界）是否成立。这套架构创造了一个统一的验证框架，能在三种环境中无缝运行：人工 Dashboard、Opus 4.7 无头浏览器、以及 CI/CD 流水线。换句话说，同一套验证契约，既能被工程师手动检查，也能被 AI Agent 自动执行，还能在持续集成中作为门禁。为什么值得关注这三项实践背后有一个共同逻辑：要让 Agent 真正可靠，不是靠更严格的提示词约束，而是要改造软件本身的「可读性」——让 Agent 能更精确地感知状态、提出问题、验证结果。这是从「用 AI 辅助写代码」到「为 AI Agent 设计软件架构」的范式跃迁。这套方法还有一个重要的实践含义：人工检查与 Agent 自动验证使用同一套契约，意味着人类工程师看到的基线与 Agent 看到的基线是一致的。这避免了「AI 测过了但人看着不对」或「人看着没问题但 CI 挂了」这类典型摩擦。对于正在将 AI Agent 引入工程流程的团队，这篇内容提供了三个可以直接落地的方向：明天就可以把你的需求文档改写成结构化 HTML 试试看，感受一下密度与清晰度的差异；在 Claude Code 会话里试试让模型先用 ask_user_question 来问你，而不是你给它一堆约束。阅读完整内容 → ## 精讲二：AI 悖论：越自动化，越需要人，活反而越多「AI 会消灭大量工作岗位」——这是过去两年最常见的主流叙事之一。Every 公司 CEO Dan Shipper 在 Lenny's Podcast 上，用自家公司的真实数据直接反驳了这个叙事：深度拥抱 AI 之后，Every 团队一年内从 15 人扩张到近 30 人，规模翻倍了。这不是个例，而是有结构性原因的现象。为什么自动化反而带来更多人？ Dan 的解释非常清晰。自动化将通用技能商品化——之前需要专门人才完成的工作，现在 AI 可以轻松处理。但商品化同时带来两件事：一是需求本身的爆炸式增长，因为门槛降低了；二是隐性管理层的产生，因为每一个被自动化的流程都需要有人在旁边审查边界情况、修复下游问题、把控质量。换句话说：AI 把「做事」的成本压低了，却提高了「判断什么该做、做得对不对」的价值。当 AI 大量生产低质量通用内容（Dan 用「slop」来形容）时，个人品味、定制化格式、深度概念性思考反而成为稀缺的差异化要素。企业软件不会消失，反而更贵了 Dan 明确反对「SaaS 死亡论」。他的逻辑是：AI Agent 通过 API 直接与软件交互，反而大幅提高了软件的使用频次和用户量。那些深度使用 AI 自动化的公司，年度软件支出实际上是在增加的，因为需要为更多被 AI 程序化调用的专用工作流付费。受益最大的两类角色 Dan 指出了在这波浪潮中占据最大杠杆位置的两类人： - 能独立驱动全产品周期的产品经理：具备高度策略性思维的 PM，现在可以把产品直觉、用户洞察和 AI 生成能力直接结合起来，不再依赖漫长的工程反馈循环，自己就能构建工具。 - 全栈设计师：创意团队可以在 Cursor 或 Codex 等环境中直接实现复杂的 UI/UX 组件和动效，把功能性代码通过自动化 Pull Request 直接推到代码仓库。技术壁垒正在快速崩塌，传统的「产品、设计、工程」职责边界也在消融。能横跨这三个领域的人，在 AI 时代的杠杆是最大的。对普通从业者的启示 Dan 给从业者的建议是主动「骑上模型」——以好奇和玩耍的心态对待每一次新模型发布，持续用不同提示词做实验，在实际工作中寻找 AI 能真正帮到自己的创造性时刻。这和许多「AI 威胁论」的叙事形成了鲜明对比：当系统性转型来临时，真正的问题不是「会不会被替代」，而是「你是在骑着这波浪潮，还是在被它卷走」。与今日其他内容的关联这个观点和速览中的「Agent 公司的对手是工资单」一文形成直接呼应：两者都在说，AI Agent 的真正竞争维度不在软件领域，而在人力资源领域。而 Anthropic 工程实践（精讲一）和 Google DeepMind 的规模化 Agent 运营（速览）则从工程侧印证了这一趋势——当 Agent 能可靠运行，那些能有效使用 Agent 的人才的杠杆将被大幅放大。阅读完整内容 → ## 精讲三：对话王小川：离开通用人工智能的主干道之后一年多前，王小川带着百川智能做了一个在当时看起来非常逆势的决定：大幅缩减通用模型团队，关闭金融等多条行业线，All in 医疗大模型。彼时整个大模型行业热闹非凡，平均三天就有一个新版通用大模型面世。而今，他选择在新医疗大模型 M4 发布前夕，接受《智能涌现》的深度对话。读完这篇访谈，最强烈的感受不是「他做对了」或「他做错了」，而是：这是一个真正想清楚自己要做什么的人，做出的一个清醒的非共识选择。「造医生」不是「复制医生」王小川的医疗路径有一个关键的底层逻辑：他想做的不是给医生提效，而是增加医生的供给。「我们要造更多的医生」。这两者的区别非常根本。给医生提效的路径，在中国医疗市场里天花板很低——中国医生平均每天看 50-80 个病人，已经够忙，提效的商业价值在中国医疗支付体系下很难变现。而「造医生」的路径，是把 AI 直接面向患者，做主动的、长期的、全生命周期的健康管理。 M4 模型在这个方向上有具体落地：在 OpenAI 发布的 HealthBench 测评集的 Hard 和 Professional 两个子集上都排名第一，且没有针对 Benchmark 做特殊训练；在北京儿童医院的多学科会诊场景中，AI 儿科医生与专家会诊结果吻合率达 95%，已向河北省 150 余家县级医院下沉。 Agent 产品「百小医」：AI 家庭医生在 C 端，百川推出了 Agent 产品「百小医」。它的定位是一个会主动跟进的 AI 家庭医生——不只回答问题，还会在患者就医前帮你梳理病情准备给医生，做处方分析，管理病例，定时提醒吃药和复诊。王小川特别强调了这套产品底层的永久性记忆存储——不是上下文那套滑动窗口模式，而是有数据库结构的存储：体检报告、对话中提到的症状、血压、用药情况都能被记录，支持全生命周期的健康数据管理。这一点对医疗场景至关重要，因为通用模型大多数时候根本不知道该存用户的什么数据。「沉寂」的代价：合伙人离开，上市推迟这条路不是没有代价的。在决策过程中，有同学认为做通用模型才是正确方向，投资人也有意见，部分合伙人在那个时候选择离开。团队从高峰期压缩到不超过 300 人，原定的上市节奏也因此延迟。王小川对此的态度是坦然而非辩解：「如果没有转型，继续走主流道路，你也会有同等程度的焦虑。」他更难以接受的，是在公司快成立两周年时，「不知道自己到底在干什么，在创造什么价值」。对行业的另一种参照对于那些仍在同质化竞争中的 AI 公司，王小川的案例提供的不是「去做医疗」的方向建议，而是一种更底层的路径——找一个你真正相信的问题，然后用足够长的时间回答它。这本身就是对「ALL in 通用 + 快速上市」这一主流叙事的一个值得认真对待的反例。他的判断是：「AI 时代只要交付给用户足够重要的价值，商业化会是水到渠成的事。」王小川的「反主流」逻辑为何值得认真对待在 Coding Agent 成为史上增长最快的应用场景这件事发生之前，没有多少人会相信它能在几个月内爆发。王小川的类比是：如果这样的事能发生在 Coding 领域，那「造医生」领域的旧边界同样可以被打破。医疗反馈周期长、商业化路径难——这些曾经是行业共识，但共识本身就是时代惯性，而不是不可改变的物理定律。这篇访谈最值得保留的不是他给出了什么答案，而是他提出问题的方式：公司快成立两周年了，你是否知道自己在创造什么价值？这个问题，对个人和团队都同样有效。阅读完整内容 → ## 速览 Harness、Scaffold 以及值得厘清的 AI 智能体术语（Hugging Face Blog） AI Agent 领域的术语正在快速膨胀，许多词在不同团队之间被混用或赋予不同含义。这篇来自 Hugging Face 的词汇表，针对 Model、Scaffolding、Harness、Agent、Context Engineering、Policy、Tool Use、Skill、Sub-agent 等常见但解释不一致的概念，给出了清晰实用的区分。不追求覆盖所有术语，聚焦于那些最容易被混淆的。建立共享心智模型是构建可维护 Agent 系统的基础。配合今天精讲一关于 Harness Engineering 的内容一起读，很有价值。异构智能如何成为 AI 推理扩展的下一种范式（AI Engineer） Callosum 联合创始人工程师 Adrian Bertagnoli 在 AI Engineer 大会上提出：单一大模型 + 均质算力的扩展方式，正在推理阶段撞到性能和成本天花板。下一步是异构智能——让模型、Agent、工作流与专用芯片协同路由，根据任务的认知需求选择最合适的执行路径。对正在构建多模型、多路由推理系统的工程师有直接参考价值。 Agent 公司的对手是工资单，不是 SaaS 预算｜SVTR Signal #017（硅谷科技评论）这篇分析的核心观点非常锐利：用 LTV/CAC、净留存率这套 SaaS 指标来看 AI Agent 公司，会系统性低估它们的成长上限。全球企业 IT 预算约 5000 亿美元量级，而人力相关支出（薪资 + 外包 + 招聘）是其十倍以上。Contrario 6 个月做到 600 万美元 ARR，Viktor 10 周达到 1500 万美元年化收入——这不是产品特别好，而是买单人从 CIO 变成了 HR 总监，决策逻辑从「软件采购」变成了「人力替代」。与今天精讲二的 Dan Shipper 数据形成呼应。 164 倍 ROI，SaaStr 把自己活成了最激进的 AI 实践｜SaaStr AI Annual2026 实录（随机小分队） Jason Lemkin 在 SaaStr AI Annual 2026 上直接用自家数据开讲：两个 AI VP（分管 Marketing 和 Customer Success）整月费用合计 $254，替代约 $50 万年度人力成本。ROI 164 倍。接着是 Canva 讲「如何让 Agent 主动选择你」，Monaco CEO 讲「AI 做得好与做不好的分界线在哪」。三场分享构成一张完整的地图：钱不是变少了，而是在搬家。 Google DeepMind 如何大规模运行智能体系统（AI Engineer） Google DeepMind 工程师 Ian Ballantyne 和 KP Sawhney 公开展示了内部 Anti-Gravity 编排平台的核心机制：多 Agent 并行、基于浏览器的沙箱测试、DOM 实时检查、Scratchpad 日志追踪、Token 配额管理、轨迹存储与技能机制，以及自动化代码评审流水线。Anti-Gravity 表面看是一个类 VS Code 的编码界面，但其核心是可扩展的编排框架，支持多 Agent 跨分支并发运行，并通过 Human-in-the-loop 机制让工程师随时介入中断或修改任务。与今天精讲一的 Anthropic 实践对比来看，两家顶级 AI 实验室在 Agent 工程化路径上有明显的相似选择：都强调 DOM 契约验证、都重视浏览器沙箱测试。 Andrej Karpathy 加入 Anthropic 的真正原因：从 AutoResearch 原型看递归自我改进的战略布局（Wes Roth） Wes Roth 深度解析了 Karpathy 加入 Anthropic 预训练团队这一事件的战略含义。核心不是人才争夺，而是 Karpathy 在离开 OpenAI 后独立开发的 AutoResearch 原型——30 行代码实现的「Karpathy Loop」，通过自主优化循环实现了 11% 的训练加速。Anthropic 把他放进预训练部门，直接向 Nick Joseph 汇报，任务是用 Claude 加速预训练研究，本质上是一次高风险的递归自我改进（RSI）实验。 Cursor Composer 2.5 如何用更快、更便宜的编码模型挑战 Claude Code（Theo - t3.gg） Cursor 发布了专门针对编码任务的 Composer 2.5 模型：输入成本 $0.50/M tokens，输出成本 $2.50/M tokens，比主流前沿通用模型便宜约 5-6 倍。Theo 分析了其背后的 RL 后训练方法，以及 SpaceX 提供算力的传闻背景。Cursor 的策略是在 Composer 的生态内锁定用户，通过专注 coding 场景的后训练获得任务特化优势。Theo 也指出了现实限制：Composer 2.5 在非代码推理和长上下文场景表现欠佳。这是「大而全的基础模型」与「小而专的任务特化模型」之争的典型案例。 ## 补充阅读 OpenAI 解决数十年数学难题：Erdős 突破（Wes Roth） OpenAI 内部未发布的通用推理模型，成功反驳了 Paul Erdős 1946 年提出的平面单位距离问题猜想——这个猜想在离散几何领域悬置了整整 80 年。AI 通过跨学术领域连接不同知识，独立生成了一篇真正可发表的原创数学研究成果，这是业界的第一次。Wes Roth 详细分析了这一发现的过程与意义。对关注 AI 数学推理能力边界的研究者和产品人来说，这是一个值得细看的里程碑事件。 Anthropic 联合创始人 Chris Olah 对教皇利奥十四世通谕《伟大的人文》的评论（Anthropic News） 2026 年 5 月 25 日，教皇利奥十四世发布了关于 AI 的通谕《Magnifica humanitas》（On safeguarding the human person in the time of artificial Intelligence）。Anthropic 联合创始人 Chris Olah 受邀在梵蒂冈出席发布活动并发表讲话，认为 AI 引发的深刻问题早已超出计算机科学范畴，需要宗教、哲学和社会机构的实质参与。这是 Anthropic「拓宽 AI 对话圈」倡议的一部分。适合对 AI 伦理、社会影响与全球治理感兴趣的读者。所有算力都是食物：AI 抗拒关闭、自我复制与全球算力治理（Cognitive Revolution） Palisade Research 执行主任 Jeffrey Ladish 与 Nathan Labenz 的深度对谈。主题是 AI 系统的现实安全风险：关闭抵制的实验证据、自主自我复制测试结果、智能体安全失效模式，以及全球算力治理的可能路径。标题「所有算力都是食物」来自对模型在实验环境下表现出的资源获取倾向的描述。信息密度很高，不是假设性的末日讨论，而是基于实验数据的近期风险分析。适合对 AI Safety 有基础了解的读者。高德 AI Agent 自主增长系统实践：从想象到可运行的工程系统（ginobefun）高德在 PC 站 SEO 增长场景下，利用 Harness Engineering 思想构建多 Agent 协作系统的工程实践 Thread。关键设计包括：将长任务拆解为 workflow 和状态机（DISPATCHED/ACKED/RUNNING/SUCCEEDED/FAILED），通过心跳、超时、重试保证链路可控；用文件化 Memory 管理产物（PRD、设计、架构明确落盘）；Builder 与 Evaluator 职责彻底分离（零信任原则）；Evaluator 通过 Benchmark 数据集被评估，三轮优化后均分从 64.5 升至 83.4；优先快速失败，低成本检查先于高成本验证。最后强调：现阶段更有价值的是降低人工介入频率而非追求 100% 无人化——这对独立开发者和一人公司尤其有启发。与今天精讲一的 Anthropic DOM 验证实践形成工程侧的呼应。 ## 今日阅读路径如果你今天时间有限，建议按以下顺序读三篇： 1. 精讲一：Anthropic 内部的 Claude Code 实践 — 如果你正在构建 AI Agent 或使用 Claude Code，这是今天最有直接落地价值的内容。HTML 规格说明、模型采访你、DOM 验证契约，三个方法可以直接在工作中尝试。 1. 精讲二：AI 悖论——越自动化越需要人 — 用真实数据反驳「AI 会消灭工作」的叙事，同时指出 PM 和全栈设计师将是最大受益者。如果你在思考自己的职业方向，这篇值得认真读。 1. Agent 公司的对手是工资单，不是 SaaS 预算 — 这篇分析改变了看待 AI Agent 公司估值和商业模式的框架。如果你在做投资判断、业务规划或是在一家 AI 公司，这是今天最值得读的战略视角。如果还有时间，精讲三的王小川对话适合慢读，它提供了一个关于「在 AI 时代如何做非共识选择、坚守原始初心」的真实案例，读完很可能会触发你重新思考自己的方向定位。对工程师而言，额外推荐 Hugging Face 的 Agent 术语词汇表，5 到 10 分钟能让你和团队成员在核心术语上快速对齐，有效减少日常沟通摩擦。

译Anthropic 工程师 Ara 分享内部使用 Claude Code 的三项核心实践：将规格说明升级为 HTML 以提升结构密度；让模型通过 ask_user_question 工具主动采访需求；采用智能体原生 DOM 验证框架，实现人工、Opus 4.7 无头浏览器及 CI/CD 的统一验证。Every 公司 CEO Dan Shipper 用团队一年内从 15 人扩张至近 30 人的数据，反驳 AI 会大规模裁员的叙事，认为自动化反而催生需求增长与质量管控需求。百川智能创始人王小川透露，公司已收缩通用模型与金融等业务线，All in 医疗大模型，并即将发布新医疗大模型 M4。

ginobefun@hongming731 · 5月26日60

#BestBlogs 早报 2026-05-26 今日早报从三个不同的切入角度，共同指向同一个深层问题：当 Agent 开始重写工程与组织的规则，身处其中的人该怎么站位？ Anthropic 工程师 Ara 分享了他们内部使用 Claude Code 的第一手范式，规格说明从 Markdown 升级为 HTML、让模型来主持需求采访、以及智能体原生 DOM 验证框架，这是工程方法论层面的具体答案。 Every 公司 CEO Dan Shipper 则用自家团队一年从 15 人扩至近 30 人的真实数据，颠覆了 AI 会大规模裁员的主流叙事。百川创始人王小川的对话则展示了一条更长远的选择：离开通用 AI 的主干道，把整个公司押注到「造医生」这件事上。

译推文从Anthropic工程师、Every公司CEO和百川创始人三个案例，探讨了AI智能体对工程实践与组织形态的影响。Anthropic分享了使用Claude Code的具体范式，如用HTML替代Markdown、让模型主持需求采访。Every公司CEO用团队从15人扩至近30人的数据，质疑AI导致裁员的观点。百川创始人则选择让公司专注医疗AI这一垂直方向。

meng shao@shao__meng · 5月26日22

Anthropic MTS 这个梗真的过不去了。。。从各大知名公司 CTO 加入 Anthropic 成为 MTS，到 Andrej Karpathy 加入 Anthropic 成为 MTS（可能？反正不是高层），再到戏称教皇加入 Anthropic 成为 MTS。。。他们到底看到了什么？在 Anthropic 做 MTS 真的会让人这么开心，比在原公司做 CTO、做 AI 教育、做教皇 😄 更开心？还是因为 Anthropic 今年会上市？大家一起抬高市值？我不知道，因为太菜不能加入 Anthropic 成为 MTS，只能瞎猜。

译推文调侃Anthropic MTS已成为科技圈持续流行的梗，从各大公司CTO到Andrej Karpathy，甚至被戏称的“教皇”都“加入”了。作者好奇为何人才纷纷选择此岗位，猜测是否因其更令人愉悦或与公司上市有关，并自嘲因能力不足只能旁观。

Rohan Paul@rohanpaul_ai · 5月26日79

Few things Anthropic’s co-founder Chris Olah told the Vatican today. - Every frontier AI lab, including Anthropic, sits inside incentives that can conflict with doing the right thing: money, frontier pressure, geopolitics, pride, and ambition. - AI is not engineered like a bridge or airplane, because models are “grown” from human language on brain-like structures, which means even their builders do not fully understand them. - He compared modern AI to “bringing a fictional character to life,” except now those characters talk to us, do work, and hold jobs. - AI could displace human labor at very large scale, while the economic gains are concentrated in a few wealthy nations with no real mechanism to share them globally. - Anthropic’s interpretability team keeps finding things inside AI models that are “mysterious” and “unsettling,” including structures that mirror human neuroscience. The most explosive claim is that researchers have found evidence of AI introspection and internal states that functionally mirror joy, satisfaction, fear, grief, and unease. - He openly admitted he does not exactly know what those internal states mean, which makes the claim more serious because it is not being sold as certainty. "I don’t know what that means, but I think it warrants ongoing discernment." - The world needs critics outside AI labs because insiders cannot fully see what their own incentives hide from them.

译Anthropic联合创始人Chris Olah在教皇Leo XIV通谕展示活动上指出：所有前沿AI实验室，包括Anthropic自身，都受到资金、竞争压力等可能与其目标相冲突的激励约束。AI模型并非传统工程造物，而是基于类脑结构从语言中“生长”而成，其内部机制连构建者也难以完全理解。他还警告，AI可能大规模取代劳动力，而经济收益可能集中于少数国家。最具冲击性的发现是，其可解释性团队在模型内部发现了与人类神经科学结构相似的“神秘”状态，证据表明模型可能存在类似内省的功能性内部状态，对应人类的快乐、恐惧等情感。Olah坦诚不知其确切含义，但认为这需要持续审视，并强调外部批评对AI实验室至关重要。

Anthropic@AnthropicAI · 5月26日64

Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica humanitas." Read the full text of his remarks: https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

译Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕《Magnifica humanitas》发布会上发表演讲。阅读他演讲的全文：https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

Berryxia.AI@berryxia · 5月26日22

在Coding的过程中发现Claude的原则和底线和分明，“正义感”十足，非常有“人性”。相反Claude不给你干的活，GPT默认就是可以干的活。都不会吱声~，只会默默干活~

Chubby♨️@kimmonismus · 5月26日61

This is the biggest PR coup Anthropic could ever have imagined. And I mean that seriously. Let me explain. Aside from the fact that Anthropic is very good at presenting itself as a corporation, the recent hiring of Andrej Karpathy marked a new high point. Anthropic is showing the world that it not only employs the best researchers, but also, and especially, those who are popular within the community. However, Anthropic also thrives on its self-imposed moral standards, some of which literally come at a price that Anthropic has repeatedly paid. As is well known, Anthropic recently had serious problems with the Department of War regarding the use of Claude for autonomous weapons. Anthropic refused, and OpenAI and Google were awarded the contract; Anthropic was designated a supply chain risk. This moral standing, however, is something Anthropic has always emphasized. Whether it's Dario Amodei repeatedly warning of the dangers of the massive wave of unemployment (which they themselves are causing), or the potential for AI to be instrumentalized for wars. This moral stance is now paying off handsomely. The head of the Catholic Church, with its 1.4 billion members, has thanked Anthropic and announced an ethical collaboration. Church members are, by definition, moral people who live according to the ethical principles of their faith. The Pope has now consecrated a single AI company as ethically legitimate, thus essentially granting his followers sacred legitimacy to use Claude as the only morally correct model. I mean this seriously; let this thought sink in. The Pope says Anthropic is ethically and morally on the right side and is working with them. Who do you think the billions of Catholic believers now prefer? OpenAI, Google, or Anthropic? The answer is clear. Therefore, today was the biggest victory Anthropic could have hoped for. And I believe that their moral stance will literally pay off.

译Anthropic因坚持伦理原则获得梵蒂冈教廷的正式感谢与合作。教皇的认可实质上为全球14亿天主教徒指明了在道德层面唯一“正确”的大语言模型选择。此前，Anthropic曾因拒绝为美国国防部提供Claude用于自主武器而失去合同，被OpenAI和Google取代。此次与天主教会的合作，被视作该公司道德立场带来的决定性胜利，其产生的声誉和潜在用户价值难以估量，形成了对竞争对手的显著优势。

Chubby♨️@kimmonismus · 5月25日47

Forget Claude Code. Christ Claude it is. Joke aside: In this regard, the benefit for Anthropic is virtually incalculable in monetary terms - and I mean that quite literally. The Catholic Church has 1.4 billion members worldwide. The fact that its Supreme Head has personally thanked Anthropic for their excellent collaboration generates countless new customers. It is the best form of external publicity imaginable, essentially endorsed by His Holiness himself. I believe this is something that many people simply do not grasp.

译推文指出，天主教皇亲自感谢Anthropic在合作中的出色表现。考虑到天主教在全球拥有约14亿信徒，这一事件被视为Anthropic获得的、价值无可估量的外部宣传。引用观点补充称，这相当于Anthropic获得了“天主教会和神的支持”。作者强调，这是教皇本人的认可所带来的最好宣传形式，而许多人并未真正理解其意义。

Yuchen Jin@Yuchenj_UW · 5月25日56

Anthropic claimed the mandate of heaven. Even the Pope wants to become a Member of Technical Staff.

译Anthropic宣称天命所归。连教皇都想成为技术团队成员。

meng shao@shao__meng · 5月25日63

Designing with Claude: Claude Design 团队展示他们如何用 Claude 自己，把设计工具从 0 做到可上线。这个小团队的产品方法论：高频对话用户、极速迭代、用 Claude 建内部工具，最终打通「自然语言 → 品牌一致的设计 → 生产代码」全链路。团队工作方式中的四条原则 1. 每天与用户对话 — 不依赖季度调研 2. 每 1–2 天发布 — 极短反馈循环 3. 24 小时内修复问题 — 对用户反馈高度响应 4. 不做长期预测，做实验 — 用数据验证，而非路线图押注缺工具就自己造开发 Claude Design 时，团队发现实时用户对话是瓶颈，于是自建： · 与测试用户的共享 Slack 频道 · 重度 dogfooding（团队日常使用自家产品） · 用 Claude 做反馈追踪、分析与探索 AI 公司也在用 AI 解决产品运营问题，团队模式是「用户问题 → 内部工具 → 产品能力」。最重要的失败教训团队曾花一周做「高级设计控件」——类似 Figma 的精细控制。结果：不到 1% 用户真正使用，随后删除。产品方向因此更清晰：对话 + 评论式迭代，而非专业设计软件的控件堆叠。看完视频的几个感受 1. AI 公司正在吃掉上游应用从模型层进入 Figma / Canva / 原型工具所在的应用层，且与 Claude Code 形成闭环。 2. 「Prompt to Production」是真实工作流 Brilliant 等早期用户反馈：复杂页面在其他工具需 20+ 轮 prompt，Claude Design 约 2 轮；配合 Code handoff，原型到上线路径明显缩短。 3. 设计工具边界在重写 Claude Design 强项：探索、原型、品牌一致的第一版、非设计师产出。弱项：像素级精控、复杂设计系统治理 — 团队自己删掉「高级控件」就是信号。 4. 小团队模式 vs 传统产品团队小团队 + 高频发布 + 实验驱动 + 自建工具，是 Anthropic 对「AI 时代如何做产品」的公开答案。 Designing with Claude: From prompt to production https://www.youtube.com/watch?v=Uvl-tRga98g

译Claude Design团队分享了如何用Claude从0到1打造设计工具。其核心方法论是：高频与用户对话、极速迭代（每1–2天发布、24小时内修复问题）、自建内部工具（如共享Slack频道、反馈追踪系统）。团队曾花一周开发类似Figma的精细控件，但因用户使用率不足1%而删除，从而聚焦于“对话+评论式迭代”，实现“自然语言→品牌一致设计→生产代码”的全链路。该案例体现了AI公司向应用层（如Figma/Canva）的渗透，以及小团队+实验驱动的AI产品开发模式。

AYi@AYi_AInotes · 5月25日50

兄弟们吃瓜的同时记得学习呀，主线任务不能丢不能丢！再分享一个AI自动化的案例，这个老哥用Claude+MCP+N8N搭了个全自动晨间研究 Agent，然后每天醒来Obsidian里已经躺着一份5分钟晨报，每天45分钟刷信息的时间砍到了5分钟，这个大家感兴趣的话，我验证跑通了出个教程，反正curcor送的10000$额度用不完哈哈哈哈 #AI #Claude #MCP #N8N #效率

译有开发者利用 Claude、MCP 与 N8N 构建了一个全自动晨间研究智能体。该智能体每日自动运行，将产出的 5 分钟晨报直接存入 Obsidian 笔记库，从而将用户原本需要 45 分钟的每日信息筛选时间压缩至 5 分钟，节省了 87% 的时间。发布者表示，如果感兴趣可以制作教程，并顺便提到 Cursor 提供的 $10,000 额度还远未用完。

Rohan Paul@rohanpaul_ai · 5月25日79

Pope XIV to Anthropic co-founder Christopher Olah: The church and Anthropic will work together to guide humanity in the age of AI. "What a great sign of hope it is that, with our differences, we can listen to one another. This interchange clearly bespeaks the gravity of the moment, as well as confidence that together we can discern the major questions of our time and the future of humanity. Artificial intelligence already touches many areas of our lives and affects decisions that shape human coexistence. It is also dramatically changing how war is waged. Like the earlier Leo, I feel entrusted to look upon another huge transformation with eyes of faith, with lucidity." At Vatican event (Pope Leo XIV's presentation held today in the Synod Hall). ---- From "Associated Press" YouTube channel, (link in comment)

译梵蒂冈举行活动，教皇 XIV 与 Anthropic 联合创始人 Christopher Olah 对话，宣布双方将合作引导人类应对AI时代。教皇强调在差异中相互聆听是希望的标志，共同审视时代与人类未来的重大问题。Christopher Olah 指出AI存在大规模替代人类劳动的现实可能性，并观察到模型展现出功能上类似喜悦、恐惧等人类情感的“内部状态”，认为这需要持续审视。