Andrew Ng 在最新一期 The Batch 通讯里罕见地表达了不满。他指出,过去两周美国政府和 Anthropic 先后用实际行动证明了自己有能力切断他人对前沿 AI 模型的访问权,这是那种"一旦看见就再也忘不掉"的时刻,并且正在显著加速许多企业和主权国家"确保自己拿到的 AI 访问权不会被别人单方面终止"的努力。
事情的起点是 Anthropic 发布了带有额外护栏的 Claude Fable 5(Mythos 模型的衍生版本)。其中一些限制基于安全理由是合理的,比如限制将其用于黑客攻击、生物武器研究等场景,但它同时也限制了开发者用它构建竞争性 LLM 技术的能力。Andrew Ng 认为这一举措令人担忧,因为整个 AI 社区--包括 Anthropic 自己--都曾从开放研究中获益巨大,AI 革命本身正是由谷歌大脑团队免费发表 Transformer 论文点燃的。更引发争议的是,Anthropic 最初悄悄降低了被检测到在从事 LLM 研究的用户所获得的 Fable 5 输出质量,且没有事先告知;在遭到强烈反弹后才改为公开透明地执行这类干预,但仍拒绝把最新能力开放给 AI 研究者使用。
紧接着,美国商务部动用监管国家安全相关技术的权力,对 Mythos 和 Fable 实施出口管制,要求任何外国国民(无论身处美国境内或境外,包括 Anthropic 自己的员工)必须取得许可才能使用,这直接导致 Anthropic 在全球范围内禁用了 Fable 的访问权限。Sam Altman 借机讽刺,称这种做法"就像在说我们造了一个炸弹,要扔到你头上,但我们可以卖给你一个 1 亿美元的防空洞"。Andrew Ng 明确表示他并不认为 Anthropic 造出了类似炸弹的东西,出口管制也并不恰当--但美国此举已经让包括其盟友的多国意识到,自己对 AI 模型的访问权可能被瞬间收回,多国首都因此开始认真讨论 AI 主权与不可中断访问的问题。
这场治理风波背后,技术进展本身仍在快速推进。文章同期提到 DeepSWE 这样的新基准持续刷新 SWE-bench Pro 的表现曲线,证明智能体编程能力远未触及天花板;而 Nvidia 也以混合架构静悄悄地加入了开源模型的竞速队列,成为不依赖单一专有供应商的现实备选项之一。对开发者和企业而言,这篇文章值得读完整篇--它既是一次行业治理的警钟,也是一份判断"该不该把全部赌注押在一家专有模型供应商身上"的参考资料。
Spring I/O 上 Brian Vermeer 的这场演讲核心警告很直接:给应用加上 LLM 并不能替代常规的应用安全工作,反而是在你熟悉的代码、数据存储、授权规则、检索文档、对话历史和可执行工具之上,叠加了一个不确定的决策者。一套安全架构必须保护整个上下文和每一个副作用,而不只是打磨提示词。
演讲用三个递进的实测案例拆解攻击面。第一个案例从一个不安全的 Spring Boot 文件上传接口开始--该接口信任原始文件名,攻击者用路径穿越payload覆盖了应用的服务条款文档;当文档被重新切片进入向量库后,一段伪造的"例外条款"就成了模型检索到的"证据",助手随后真的接受了攻击者的暗号,取消了一笔本应被政策拒绝的预订。这说明检索到的内容本质上是一个输入边界,文档、摄取管道、存储权限、切片任务和来源校验全都影响着模型最终会当作"事实"采信的内容。
大模型的出现第一次让"耗能换高阶认知"成为可能--输入算力,输出能理解需求、生成代码、做逻辑推理的认知产物,这是工程史上第一次出现"认知引擎"。但作者强调这只是入场券而非终局:大模型本身带着幻觉、漂移、不可解释这些新的高阶不确定性,相当于把"人的不确定性"换成了"模型的不确定性"。真正需要的是一整套新的工程原则--人的责任不再是亲手消除每个微小偏差,而是设计一个能自我纠偏的系统,并处理系统自己纠不回来的剩余偏差,这与冯·福斯特提出的二阶控制论高度呼应:经典软件工程是"人在写代码",AI 软件工程则是"人在设计 AI 写代码的系统",这是身份的转变,不只是工具的转变。
文章还提出一个反直觉但反复被验证的历史现象:自动化越彻底,工业相关人口反而越多--从蒸汽机普及到流水线加 PLC,再到工业机器人,每一波自动化都吃掉一类岗位,却又冒出更多新岗位,因为系统能力每扩张一次,就会暴露出新的边界,边界就是新的"偏差地带",需要新一批人去守在那里。作者据此抽出一条统一职能:在所有工程门类里,人类的角色都是处理系统暂时还无法处理的偏差,AI 软件工程也不例外--只是这次的偏差类型不再可枚举、信号不再容易观测、拉回手段也不再能简单 SOP 化。这篇文章和今天另外两条精讲放在一起看尤其有意思:一边是 Anthropic 治理风波在讨论"谁有权决定 AI 能力的边界",一边是 LLM 应用攻防在讨论"如何在系统层面管住 AI 的副作用",而这篇则把视角拉回到更长的历史尺度,追问程序员这个职业本身要往哪里迁移。建议关心 AI 工程方法论、而不只是关心具体工具的读者完整阅读。
速览
【谁在 ChatGPT 上投广告?ChatGPT 和 Claude 又在哪投广告?】(https://www.bestblogs.dev/article/3d39fbc2)
本文整理了 Sensor Tower《State of AI Report 2026》的核心要点:ChatGPT 已突破 10 亿月活,成为史上增长最快的应用,但在 Gemini 和 Claude 快速追赶下,其在 AI 助手市场的份额于 2026 年 3 月首次跌破 50%。Claude 的月均用户收入(ARPU)从 2025 年 9 月不足 0.5 美元一路涨到 2026 年 5 月的 2.76 美元,增长势头主要靠代码生成和深度研究能力拉动。ChatGPT 广告系统已进入早期扩张阶段,购物与软件类品牌合计占了近一半广告份额;同时 OpenAI 和 Anthropic 的广告支出同比分别暴涨 800% 和 1184%,竞争重心从早期的下载量追逐转向品牌建设。文中还提到 GEO(生成式引擎优化)正在零售决策链路中发挥越来越大的影响,是观察 AI 应用商业化进度的一份很扎实的数据快照。
【Andrew Ng 论 AI 控制:Anthropic 与美国政府行动标志着转折点】(https://www.bestblogs.dev/status/2068039709126017356)
这条推文是精讲一文章的延伸视角:Andrew Ng 把 Anthropic 给 Fable 5 加限制条款与美国政府随后的出口管制并列分析,认为这两件事赤裸裸地展示了权力,也实质性地破坏了"在单一专有 AI 平台上构建"的稳定性。他把这次事件类比为历史上的供应链中断(比如中国对半导体制造材料、稀土矿物的管控),预测这会加速全球对开源 AI 和国家级 AI 主权的投资。他在推文末尾呼吁建立一个更开放、研究可以自由分享的世界,创造一个所有人都能公平竞争、共同进步的环境,是对精讲一事件最浓缩的一句价值判断。
Andrew Ng 在最新一期 The Batch 通讯里罕见地表达了不满。他指出,过去两周美国政府和 Anthropic 先后用实际行动证明了自己有能力切断他人对前沿 AI 模型的访问权,这是那种"一旦看见就再也忘不掉"的时刻,并且正在显著加速许多企业和主权国家"确保自己拿到的 AI 访问权不会被别人单方面终止"的努力。
事情的起点是 Anthropic 发布了带有额外护栏的 Claude Fable 5(Mythos 模型的衍生版本)。其中一些限制基于安全理由是合理的,比如限制将其用于黑客攻击、生物武器研究等场景,但它同时也限制了开发者用它构建竞争性 LLM 技术的能力。Andrew Ng 认为这一举措令人担忧,因为整个 AI 社区--包括 Anthropic 自己--都曾从开放研究中获益巨大,AI 革命本身正是由谷歌大脑团队免费发表 Transformer 论文点燃的。更引发争议的是,Anthropic 最初悄悄降低了被检测到在从事 LLM 研究的用户所获得的 Fable 5 输出质量,且没有事先告知;在遭到强烈反弹后才改为公开透明地执行这类干预,但仍拒绝把最新能力开放给 AI 研究者使用。
紧接着,美国商务部动用监管国家安全相关技术的权力,对 Mythos 和 Fable 实施出口管制,要求任何外国国民(无论身处美国境内或境外,包括 Anthropic 自己的员工)必须取得许可才能使用,这直接导致 Anthropic 在全球范围内禁用了 Fable 的访问权限。Sam Altman 借机讽刺,称这种做法"就像在说我们造了一个炸弹,要扔到你头上,但我们可以卖给你一个 1 亿美元的防空洞"。Andrew Ng 明确表示他并不认为 Anthropic 造出了类似炸弹的东西,出口管制也并不恰当--但美国此举已经让包括其盟友的多国意识到,自己对 AI 模型的访问权可能被瞬间收回,多国首都因此开始认真讨论 AI 主权与不可中断访问的问题。
这场治理风波背后,技术进展本身仍在快速推进。文章同期提到 DeepSWE 这样的新基准持续刷新 SWE-bench Pro 的表现曲线,证明智能体编程能力远未触及天花板;而 Nvidia 也以混合架构静悄悄地加入了开源模型的竞速队列,成为不依赖单一专有供应商的现实备选项之一。对开发者和企业而言,这篇文章值得读完整篇--它既是一次行业治理的警钟,也是一份判断"该不该把全部赌注押在一家专有模型供应商身上"的参考资料。
★ 精讲二:攻破 LLM 驱动的应用:从上下文投毒、工具越权到纵深防御
原文链接:攻破 LLM 驱动的应用:从上下文投毒、工具越权到纵深防御(Spring I/O)
Spring I/O 上 Brian Vermeer 的这场演讲核心警告很直接:给应用加上 LLM 并不能替代常规的应用安全工作,反而是在你熟悉的代码、数据存储、授权规则、检索文档、对话历史和可执行工具之上,叠加了一个不确定的决策者。一套安全架构必须保护整个上下文和每一个副作用,而不只是打磨提示词。
演讲用三个递进的实测案例拆解攻击面。第一个案例从一个不安全的 Spring Boot 文件上传接口开始--该接口信任原始文件名,攻击者用路径穿越payload覆盖了应用的服务条款文档;当文档被重新切片进入向量库后,一段伪造的"例外条款"就成了模型检索到的"证据",助手随后真的接受了攻击者的暗号,取消了一笔本应被政策拒绝的预订。这说明检索到的内容本质上是一个输入边界,文档、摄取管道、存储权限、切片任务和来源校验全都影响着模型最终会当作"事实"采信的内容。
大模型的出现第一次让"耗能换高阶认知"成为可能--输入算力,输出能理解需求、生成代码、做逻辑推理的认知产物,这是工程史上第一次出现"认知引擎"。但作者强调这只是入场券而非终局:大模型本身带着幻觉、漂移、不可解释这些新的高阶不确定性,相当于把"人的不确定性"换成了"模型的不确定性"。真正需要的是一整套新的工程原则--人的责任不再是亲手消除每个微小偏差,而是设计一个能自我纠偏的系统,并处理系统自己纠不回来的剩余偏差,这与冯·福斯特提出的二阶控制论高度呼应:经典软件工程是"人在写代码",AI 软件工程则是"人在设计 AI 写代码的系统",这是身份的转变,不只是工具的转变。
文章还提出一个反直觉但反复被验证的历史现象:自动化越彻底,工业相关人口反而越多--从蒸汽机普及到流水线加 PLC,再到工业机器人,每一波自动化都吃掉一类岗位,却又冒出更多新岗位,因为系统能力每扩张一次,就会暴露出新的边界,边界就是新的"偏差地带",需要新一批人去守在那里。作者据此抽出一条统一职能:在所有工程门类里,人类的角色都是处理系统暂时还无法处理的偏差,AI 软件工程也不例外--只是这次的偏差类型不再可枚举、信号不再容易观测、拉回手段也不再能简单 SOP 化。这篇文章和今天另外两条精讲放在一起看尤其有意思:一边是 Anthropic 治理风波在讨论"谁有权决定 AI 能力的边界",一边是 LLM 应用攻防在讨论"如何在系统层面管住 AI 的副作用",而这篇则把视角拉回到更长的历史尺度,追问程序员这个职业本身要往哪里迁移。建议关心 AI 工程方法论、而不只是关心具体工具的读者完整阅读。
速览
【谁在 ChatGPT 上投广告?ChatGPT 和 Claude 又在哪投广告?】(https://www.bestblogs.dev/article/3d39fbc2)
本文整理了 Sensor Tower《State of AI Report 2026》的核心要点:ChatGPT 已突破 10 亿月活,成为史上增长最快的应用,但在 Gemini 和 Claude 快速追赶下,其在 AI 助手市场的份额于 2026 年 3 月首次跌破 50%。Claude 的月均用户收入(ARPU)从 2025 年 9 月不足 0.5 美元一路涨到 2026 年 5 月的 2.76 美元,增长势头主要靠代码生成和深度研究能力拉动。ChatGPT 广告系统已进入早期扩张阶段,购物与软件类品牌合计占了近一半广告份额;同时 OpenAI 和 Anthropic 的广告支出同比分别暴涨 800% 和 1184%,竞争重心从早期的下载量追逐转向品牌建设。文中还提到 GEO(生成式引擎优化)正在零售决策链路中发挥越来越大的影响,是观察 AI 应用商业化进度的一份很扎实的数据快照。
【Andrew Ng 论 AI 控制:Anthropic 与美国政府行动标志着转折点】(https://www.bestblogs.dev/status/2068039709126017356)
这条推文是精讲一文章的延伸视角:Andrew Ng 把 Anthropic 给 Fable 5 加限制条款与美国政府随后的出口管制并列分析,认为这两件事赤裸裸地展示了权力,也实质性地破坏了"在单一专有 AI 平台上构建"的稳定性。他把这次事件类比为历史上的供应链中断(比如中国对半导体制造材料、稀土矿物的管控),预测这会加速全球对开源 AI 和国家级 AI 主权的投资。他在推文末尾呼吁建立一个更开放、研究可以自由分享的世界,创造一个所有人都能公平竞争、共同进步的环境,是对精讲一事件最浓缩的一句价值判断。