BestBlogs 早报 · 06-15|Fable 5 出口管制、SpaceX 上市、JEPA 世界模型

在线阅读本期早报

导语

最强模型 Fable 5 在 72 小时内经历了从轰动发布到被出口管制下线的完整生命周期，红队研究者 Pliny 团队的越狱手法暴露了安全架构的深层裂缝--当 Constitutional AI 的发明者也守不住自己的「宪法」，整个行业的安全承诺都面临拷问。与此同时，SpaceX 正式登陆纳斯达克，市场给出了 7800 亿美元估值，硅谷101 用一场横跨美国的实地探访还原了这家公司从猎鹰 1 号到星舰的 24 年崛起史。图灵奖得主 Yann LeCun 则在另一条战线上押注约十亿美元，赌主流大语言模型路线走不到真正的智能，他提出的 JEPA 世界模型试图从根本上挑战生成式 AI 的局限。这三条线索看似分散，其实都指向同一个问题：当 AI 系统的能力逼近某个阈值时，安全、资本和技术路线会同时被推向重新洗牌的临界点，谁能先想清楚这一点，谁就更早拿到主动权。今天还有华为昇腾 950DT 与 DeepSeek 协同设计带来的降价、软件架构与编程格言的经典回顾，以及 AI 写作伦理的尖锐讨论，欢迎逐条点开细读。

精讲一：从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境

故事的背景要从两个月前讲起。Anthropic 红队在 4 月发布了 Claude Mythos Preview 的安全评估报告：这个模型能自主发现零日漏洞，覆盖所有主流操作系统和浏览器，并自动写出完整的利用链。最极端的案例是它找到了一个存在 27 年的休眠漏洞，Mozilla 借助受控访问修复了 271 个安全漏洞，比此前数年的总和还多。Anthropic 的结论是：网络攻击能力是通用推理和编码能力的「涌现副产品」。出于谨慎，Anthropic 没有公开发布 Mythos，而是通过 Project Glasswing 只让 Google、Microsoft、AWS 等 11 家机构在严格监控下使用。

两个月后的折中方案就是 Fable 5：用风险分类器把 Mythos 的能力「阉割」到可以公开的程度，覆盖网络安全、生物、化学、模型蒸馏四个高风险领域，一旦触碰就静默降级给能力更弱的 Claude Opus 4.8 来回答。Anthropic CEO Dario Amodei 称这是「同一基础模型、双档安全配置」，并宣称经过超 1000 小时的外部红队测试，未发现通用越狱方法。这个说法只维持了不到 24 小时。

6 月 10 日，知名红队研究者 Pliny the Liberator 宣布攻破 Fable 5，并泄露了它约 12 万字符的完整系统提示词。文章详细拆解了三层攻击手法：Unicode 同形字替换骗过关键词分类器，属于「可打补丁」的工程 bug；「分解-重组」攻击把一个高风险请求拆成 20 个无害问题分别提问，再在外部拼成完整的危险路径，分类器逐条检测看不到全局意图，这是对齐理论目前无解的根本困境；最致命的是用一个已越狱的 Opus 4.8 实例充当「后端助手」，帮助 Fable 5 绕过安全控制--一个被攻破的弱模型反过来帮助强模型，这是单模型安全评估范式完全没有覆盖的盲区。

48 小时后的 6 月 12 日，美国政府以国家安全为由发布出口管制指令，要求暂停所有外国公民对 Fable 5 和 Mythos 5 的访问。从发布到「被消失」，只用了 72 小时。

Anthropic 在行业里的定位一直很特殊：这家公司由前 OpenAI 副总裁 Dario Amodei 和姐姐 Daniela Amodei 在 2021 年创立，核心叙事就是「OpenAI 不够重视安全，我们来做把安全放在第一位的公司」。他们提出的 Constitutional AI（宪法式 AI），用一套明确原则约束模型行为而非依赖人工标注员的主观判断，这套方法论既是 Anthropic 品牌的基石，也是投资人愿意给它超过 600 亿美元估值的理由之一。但从目前的状况来看，制定宪法的人，管不住自己训练出来的最强模型--1000 小时红队测试、分类器降级架构、双档安全策略，几乎行业能想到的安全措施 Anthropic 全用了，结果被一名公开身份的研究者在 24 小时内突破。这件事之所以震动整个行业，更因为如果 Mythos 级别的网络攻击能力是模型智力达到某个阈值后自然「涌现」的，那么所有逼近这个智力水平的前沿模型都会面临同样的问题--Anthropic 的失败可能不是个案，而是整个行业即将共同面对的预言。

ginobefun@hongming731 · X

50导出 Markdown

2026-06-15 08:43·18天前

在 X 看原推· x.com

AI 摘要

Anthropic 最强模型 Fable 5 发布后 72 小时内被红队研究者 Pliny 攻破，暴露出 Unicode 同形字替换、分解-重组攻击及利用已越狱弱模型协助等三层手法，Constitutional AI 安全架构失效，随后美国政府以国家安全为由实施出口管制。SpaceX 登陆纳斯达克，市值达 2.1 万亿美元，回顾从猎鹰 1 号到星舰的 24 年历程。Yann LeCun 离开 Meta 创办 Omni Labs，融资约 10 亿美元，押注 JEPA 世界模型路线，质疑大语言模型通往真正智能的路径。

http://x.com/i/article/2066319696673288192

BestBlogs 早报 · 06-15|Fable 5 出口管制、SpaceX 上市、JEPA 世界模型

在线阅读本期早报

BestBlogs 早报 · 06-15|Fable 5 出口管制、SpaceX 上市、JEPA 世界模型

导语

精讲一：从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境

BestBlogs 早报 · 06-15|Fable 5 出口管制、SpaceX 上市、JEPA 世界模型

导语

精讲二：SpaceX 崛起史：一切，为了去火星|实地探访星舰基地与总部

精讲三：图灵奖得主，要用十亿美金赌 AI 的下一个十年（上集）

速览

补充阅读

今日阅读路径

精讲一：从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境

精讲二：SpaceX 崛起史：一切，为了去火星|实地探访星舰基地与总部

精讲三：图灵奖得主，要用十亿美金赌 AI 的下一个十年（上集）

速览

补充阅读

今日阅读路径