# Fable 5 被攻破、SpaceX 上市、LeCun 创办 Omni Labs 三则要闻

- 来源：ginobefun (@hongming731)
- 发布时间：2026-06-15 08:43
- AIHOT 分数：50
- AIHOT 链接：https://aihot.virxact.com/items/cmqejd9u202saslunfaivr6dd
- 原文链接：https://x.com/hongming731/status/2066320725527675206

## AI 摘要

Anthropic 最强模型 Fable 5 发布后 72 小时内被红队研究者 Pliny 攻破，暴露出 Unicode 同形字替换、分解-重组攻击及利用已越狱弱模型协助等三层手法，Constitutional AI 安全架构失效，随后美国政府以国家安全为由实施出口管制。SpaceX 登陆纳斯达克，市值达 2.1 万亿美元，回顾从猎鹰 1 号到星舰的 24 年历程。Yann LeCun 离开 Meta 创办 Omni Labs，融资约 10 亿美元，押注 JEPA 世界模型路线，质疑大语言模型通往真正智能的路径。

## 正文

http://x.com/i/article/2066319696673288192

# BestBlogs 早报 · 06-15|Fable 5 出口管制、SpaceX 上市、JEPA 世界模型

在线阅读本期早报

## 导语

最强模型 Fable 5 在 72 小时内经历了从轰动发布到被出口管制下线的完整生命周期，红队研究者 Pliny 团队的越狱手法暴露了安全架构的深层裂缝--当 Constitutional AI 的发明者也守不住自己的「宪法」，整个行业的安全承诺都面临拷问。与此同时，SpaceX 正式登陆纳斯达克，市场给出了 7800 亿美元估值，硅谷101 用一场横跨美国的实地探访还原了这家公司从猎鹰 1 号到星舰的 24 年崛起史。图灵奖得主 Yann LeCun 则在另一条战线上押注约十亿美元，赌主流大语言模型路线走不到真正的智能，他提出的 JEPA 世界模型试图从根本上挑战生成式 AI 的局限。这三条线索看似分散，其实都指向同一个问题：当 AI 系统的能力逼近某个阈值时，安全、资本和技术路线会同时被推向重新洗牌的临界点，谁能先想清楚这一点，谁就更早拿到主动权。今天还有华为昇腾 950DT 与 DeepSeek 协同设计带来的降价、软件架构与编程格言的经典回顾，以及 AI 写作伦理的尖锐讨论，欢迎逐条点开细读。

## 精讲一：从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境

故事的背景要从两个月前讲起。Anthropic 红队在 4 月发布了 Claude Mythos Preview 的安全评估报告：这个模型能自主发现零日漏洞，覆盖所有主流操作系统和浏览器，并自动写出完整的利用链。最极端的案例是它找到了一个存在 27 年的休眠漏洞，Mozilla 借助受控访问修复了 271 个安全漏洞，比此前数年的总和还多。Anthropic 的结论是：网络攻击能力是通用推理和编码能力的「涌现副产品」。出于谨慎，Anthropic 没有公开发布 Mythos，而是通过 Project Glasswing 只让 Google、Microsoft、AWS 等 11 家机构在严格监控下使用。

两个月后的折中方案就是 Fable 5：用风险分类器把 Mythos 的能力「阉割」到可以公开的程度，覆盖网络安全、生物、化学、模型蒸馏四个高风险领域，一旦触碰就静默降级给能力更弱的 Claude Opus 4.8 来回答。Anthropic CEO Dario Amodei 称这是「同一基础模型、双档安全配置」，并宣称经过超 1000 小时的外部红队测试，未发现通用越狱方法。这个说法只维持了不到 24 小时。

6 月 10 日，知名红队研究者 Pliny the Liberator 宣布攻破 Fable 5，并泄露了它约 12 万字符的完整系统提示词。文章详细拆解了三层攻击手法：Unicode 同形字替换骗过关键词分类器，属于「可打补丁」的工程 bug；「分解-重组」攻击把一个高风险请求拆成 20 个无害问题分别提问，再在外部拼成完整的危险路径，分类器逐条检测看不到全局意图，这是对齐理论目前无解的根本困境；最致命的是用一个已越狱的 Opus 4.8 实例充当「后端助手」，帮助 Fable 5 绕过安全控制--一个被攻破的弱模型反过来帮助强模型，这是单模型安全评估范式完全没有覆盖的盲区。

48 小时后的 6 月 12 日，美国政府以国家安全为由发布出口管制指令，要求暂停所有外国公民对 Fable 5 和 Mythos 5 的访问。从发布到「被消失」，只用了 72 小时。

Anthropic 在行业里的定位一直很特殊：这家公司由前 OpenAI 副总裁 Dario Amodei 和姐姐 Daniela Amodei 在 2021 年创立，核心叙事就是「OpenAI 不够重视安全，我们来做把安全放在第一位的公司」。他们提出的 Constitutional AI（宪法式 AI），用一套明确原则约束模型行为而非依赖人工标注员的主观判断，这套方法论既是 Anthropic 品牌的基石，也是投资人愿意给它超过 600 亿美元估值的理由之一。但从目前的状况来看，制定宪法的人，管不住自己训练出来的最强模型--1000 小时红队测试、分类器降级架构、双档安全策略，几乎行业能想到的安全措施 Anthropic 全用了，结果被一名公开身份的研究者在 24 小时内突破。这件事之所以震动整个行业，更因为如果 Mythos 级别的网络攻击能力是模型智力达到某个阈值后自然「涌现」的，那么所有逼近这个智力水平的前沿模型都会面临同样的问题--Anthropic 的失败可能不是个案，而是整个行业即将共同面对的预言。

和今天 SpaceX、LeCun 两篇精讲放在一起看，这条新闻提醒我们：当一项技术的能力曲线足够陡峭，资本、安全和监管这三条线会以远超预期的速度同时绷紧。建议关注 AI 安全、模型治理或在企业里负责 AI 合规的读者优先通读全文，文章对三层攻击手法和 Constitutional AI 困境的拆解尤其值得细读。

原文详见：从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境

## 精讲二：SpaceX 崛起史：一切，为了去火星|实地探访星舰基地与总部

美国时间 6 月 12 日，SpaceX 正式登陆纳斯达克，盘中股价一度大涨超 30%，最终收于 160.95 美元，较 135 美元的发行价上涨约 19%，对应市值达到 2.1 万亿美元，此次 IPO 募集 750 亿美元，刷新了全球资本市场历史上最大的 IPO 纪录。就在 IPO 之前，硅谷101 沿着 SpaceX 的发展轨迹展开了一场横跨美国的探访：从德州最南端的 Boca Chica 火箭发射中心，到洛杉矶机场旁那个如今被海鲜交易公司租下的小仓库，并邀请 SpaceX 前高管、猎鹰 9 号工程师 Lewis Hong 一起回顾过去 24 年的崛起历程。

SpaceX 的起点其实是一个「行为艺术」。2001 年，马斯克发现 NASA 连重返月球的计划都没有，便提出「火星绿洲」计划：买一颗退役苏联导弹，改装后送一个小温室上火星拍照，借此激起公众对太空探索的热情。三次赴俄谈判无果且备受羞辱后，马斯克在回程飞机上算了一笔账：火箭原材料成本只占总售价的 3% 左右，真正昂贵的是传统模式的低效。2002 年，他用出售 PayPal 套现的钱成立了 SpaceX--这家公司的成立时间甚至早于 Facebook。

早期团队在太平洋中部一个只有约 0.03 平方公里、没有淡水的小岛上「荒岛求生」，要发射人类历史上第一枚由私营公司建造的轨道级火箭--猎鹰 1 号。前三次发射全部失败：第一次因盐雾腐蚀导致燃料泄漏；第二次因一二级分离时震动过大；第三次因分离时仅慢了一秒，一级火箭撞上了二级火箭，任务功亏一篑。第三次失败后，团队几乎陷入绝境，马斯克对员工说：「SpaceX 不会倒下，我准备好了第四次发射的资金。」这笔钱来自彼得·蒂尔的 Founders Fund，在全硅谷追逐社交网络、嘲笑硬科技的 2008 年逆势投资。一个多月后，猎鹰 1 号第四次发射成功，太空不再由国家垄断。

文章中 Lewis Hong 的回忆很有画面感：「第一天就是从这里开始，一直到 2007 年，都在这个地方」，当时整个团队只有两个人，从 Elon Musk 和后来成为美国最有名火箭发动机专家的 Tom Mueller 开始。猎鹰 1 号就是在这间洛杉矶机场旁的厂房里造出来的，而如今这里运送的已经是冻鱼。Lewis Hong 的总结是：「人的一切，其实都受限于想象力。」

这段历史与今天的市场估值直接相关：当一家公司从「99% 都不够，需要 100% 解决方案」的极限工程中一路走来，并把回收火箭、星链、星舰这些「天方夜谭」逐一变成现实，市场愿意为它支付的不只是当下的现金流，还有对「时间」本身的信任溢价。建议时间有限的读者优先读这篇，它用具体的人物对话和细节，把 SpaceX 24 年的精神内核讲清楚了；如果还想了解估值背后的财务拆解，可以再搭配「补充阅读」里 SpaceX 估值与 24 年往事的两篇延伸。

原文详见：SpaceX 崛起史：一切，为了去火星|实地探访星舰基地与总部

## 精讲三：图灵奖得主，要用十亿美金赌 AI 的下一个十年（上集）

当整个行业都在为大语言模型加码时，图灵奖得主、卷积神经网络之父 Yann LeCun 拿出约 10 亿美元，押注一条相反的路：「我们正在 all-in 的大语言模型，根本通不到真正的智能。」他离开 Meta 后创办 Omni Labs，做客科普频道 Welch Labs，第一次把这套逻辑链完整讲清楚，从他本行的卷积网络一路讲到世界模型（World Model）。

Yann LeCun 在 1980 年代开创的卷积网络奠定了今日计算机视觉的基础，25 年后那个里程碑式的深度学习模型 AlexNet 与他 1990 年代的设计惊人相似；他 2015 年提出的「蛋糕理论」也准确预言了自监督学习主导 AI 的时代。如今他离开 Meta、融资约 10 亿美元创办 Omni Labs，押注以 JEPA 和世界模型为核心、非生成式的全新路线，这让他成为当下质疑主流大语言模型路线中分量最重、资历最深的声音。本文路线清晰：从 CNN 起点，到蛋糕理论，再到模糊诅咒、表征坍缩，最后落到世界模型与他到底在赌什么。

故事要从「蛋糕理论」说起。LeCun 早年提出：如果智能是一块蛋糕，蛋糕的主体是自监督学习，糖霜是监督学习，顶上的小樱桃才是强化学习。当整个领域为强化学习痴迷时，他泼冷水说这条路效率太低，永远到不了人类或动物智能的水平。后来事实证明，自监督学习的成功，在文本和语言上来得比视觉这类「自然」模态快得多--GPT-1 正是把 Transformer 从翻译改成「预测下一个 token」的自监督任务，由此摆脱了对人工标注数据的依赖，并开启了规模化的新范式。

但这套生成式方法在视频上彻底撞墙，LeCun 称之为「模糊诅咒」。语言模型的词汇表是离散且有限的，但一帧高清视频有约 10 的 1500 万次方种可能的下一帧，远超可观测宇宙中的原子数。当模型被迫为一个有歧义的输入预测单一输出时，比如「小球弹向了哪个方向」，它能做的最好选择就是把所有可能性取平均，结果是一团模糊褪色的画面。这揭示了生成式路线理解真实世界时的根本障碍：现实的未来有无数种可能，而生成式模型被迫只能预测出一个。

这就引出了 LeCun 真正押注的问题：模型一定要是生成式的吗？大约 2017、2018 年，研究者开始意识到，学习图像表征的最佳系统恰恰是那些不具备生成能力的系统--通过「联合嵌入」让编码器对同一场景的不同视角产生相同的表征，而全程不需要预测或生成任何图像。这正是 JEPA（联合嵌入预测架构）的核心思路，也是 LeCun 认为通向真正智能、绕开生成式死胡同的路径。和精讲一里 Fable 5 暴露的安全困境放在一起看，这篇文章提供了另一个视角：如果当前 LLM 路线本身就存在认知能力的天花板，那么安全问题和能力问题或许会在某个时间点同时被重新定义。建议对 AI 技术路线、世界模型感兴趣的读者优先读这篇，本文是上集，后续解读建议关注下集对 JEPA 具体架构的展开。

原文详见：图灵奖得主，要用十亿美金赌 AI 的下一个十年（上集）

## 速览

- 【软件架构指南】（https://www.bestblogs.dev/article/6ce856e6）（Hacker News）：Martin Fowler 用这篇长文回答「什么是架构」--不是高高在上的图纸，而是「专家开发者对系统设计达成的共识」。他把架构定义为「重要的东西」，并据此整理了自己网站上关于应用架构与企业架构的海量资源，作为一份精选导览图。对于想系统补课软件架构、又不知道从何下手的开发者，这是一个非常扎实的入口。

- 【成功产品背后的隐藏模式：先证明、再改进、最后测试新意】（https://www.bestblogs.dev/video/4540937）（Lenny's Podcast）：Zynga 创始人 Mark Pincus 提出「Proven Better New」框架：先找到已经被验证的用户行为，做出明显更好的改进，再谦逊地测试真正新的部分。他特别警告「希望」和「信念」的区别--信念建立在证据上，希望只是没有依据的自信。AI 让团队更容易快速做出一个平庸产品，但它更好的用途是作为低成本测试和失败机器。

- 【艾伦·J·佩利斯的《编程格言》】（https://www.bestblogs.dev/article/d99a4600）（Hacker News）：这是计算机科学先驱 Alan J. Perlis 的经典 120 条格言集，涵盖编程、软件工程与计算本质，许多条目看似自相矛盾却充满洞见，例如「语法糖会导致分号癌」「递归是计算的根本，因为它用时间换描述」。即使写过多年代码，重读这份格言集依然会有新的会心一笑，适合当作日常的思维体操。

- 【全网首份指令级拆解：看华为昇腾 950DT 芯片如何撬动 DeepSeek 75% 降价与字节锁单】（https://www.bestblogs.dev/article/8da23f49）（InfoQ 中文）：半导体研究机构 SemiAnalysis 拿到昇腾 950DT 样机，对其运行 DeepSeek V4 的推理链路做了 Trace 级拆解，发现 DeepSeek V4 的部分架构是与昇腾推理协同设计的。这帮助 DeepSeek 把百万 token 上下文的价格打到约 2 毛钱，较 Anthropic 便宜约 50 倍，并直接推动了 DeepSeek-V4-Pro API 永久降价至原价四分之一，字节、阿里、腾讯也随之加大昇腾 950 系列的采购。

- 【形式化方法与编程的未来】（https://www.bestblogs.dev/article/c15f7953）（Hacker News）：Jane Street 一直以来对形式化方法持怀疑态度--像 seL4 那样的形式化验证微内核需要 25 人年验证 8700 行代码，成本极高。但作者表示这个判断正在改变：智能体编程大幅降低了应用形式化方法的成本，同时收益在提升，公司正在为此组建专门团队。这是一篇关于「成本-收益结构被 AI 重新改写」的具体案例。

- 【Kubernetes 上并发 LLM 智能体的 GPU 时间切片】（https://www.bestblogs.dev/article/07cfce6d）（Towards Data Science）：这是「生产级智能体推理」系列的第二篇，作者用实测数据证明 Kubernetes 的 GPU 时间切片会隐藏对延迟敏感的智能体的严重尾延迟问题--在共享的 GPU 上，一个工作节点的 p99 延迟飙升 66%，而中位数和吞吐量几乎不变，所有 Pod 仍报告「健康」。对于正在用 Kubernetes 跑多智能体系统的团队，这篇文章提醒你 p99 才是真实的成本。

- 【为啥 Codex 还不推出类似 Codex Design 的产品？】（https://www.bestblogs.dev/article/c3e760eb）（宝玉的分享）：作者从「模型」与「Harness」两层架构的区分出发解释这个问题--Harness（提示词、工具链、UI 交互流程）技术上不复杂，真正的差距在模型层。Claude Design 之所以能做出高精度可交互原型，是因为 Claude Opus 4.8 同时具备优秀的 UI/UX 设计能力和系统架构设计能力，而目前的 GPT-5.5 还做不到这两者兼顾。

## 补充阅读

- 【Claude Fable 被封，不是开源的胜利】（https://www.bestblogs.dev/article/4695fb2d）（浮之静）：针对「闭源模型说封就封，开源才靠得住」这一新叙事，作者提出更复杂的解读--前沿模型能力触及安全阈值后，模型发布权正从公司转向多方治理博弈，这不是简单的开源对闭源的胜利。适合在读完精讲一之后，想看更多元立场分析的读者。

- 【SpaceX 上市估值 7800 亿美元，市场赋予 72 美元时间价值溢价】（https://www.bestblogs.dev/article/413bbb49）（虎嗅）：用期权定价的框架把 SpaceX 的估值拆成「已验证业务的内在价值」与「远期业务的时间价值」两部分，并分析市场信仰溢价背后的反身性机制。适合对精讲二的故事感兴趣、还想看财务视角拆解的读者。

- 【SpaceX 的 24 年：10 段神奇往事，一个硬核传奇】（https://www.bestblogs.dev/article/e479f2aa）（晚点）：用 10 个关键片段回顾 SpaceX 从 2002 年创立到 2024 年的历程，聚焦创业初期的疯狂与工程磨难，是精讲二之外的另一份「人物志」式补充，适合喜欢故事化叙事的读者。

- 【中国低轨卫星的现实：备案多，在轨少，发射能力是瓶颈】（https://www.bestblogs.dev/status/2066152619018707050）（Macro_Lin|市场观察员）：对比中美低轨卫星现状，指出中国备案数量远超美国，但实际在轨数量落后约 25 倍，发射能力是核心短板。放在 SpaceX 星链报道旁边看，能帮你理解为什么「发射能力」本身就是一种战略资产。

- 【Providers， Fallbacks & Auto Router】（https://www.bestblogs.dev/article/a3a9f95b）（OpenRouter 官方博客）：详细解释了 OpenRouter 的两层路由架构--模型路由与提供商路由，从默认的价格加权策略到 ：nitro、：floor 快捷方式和 provider 对象的精细控制都有覆盖，适合正在搭建多模型网关或关心推理成本的工程师。

- 【AI Infra 的各种挑战和 Tips 系列 - NVIDIA Nemotron-3 Ultra】（https://www.bestblogs.dev/article/558abde5）（AI闲谈）：基于 NVIDIA Nemotron-3 Ultra 的技术报告，系统梳理了 550B 参数混合架构 MoE 模型在预训练、后训练、推理部署中遇到的 AI Infra 挑战与工程取舍，适合关心大模型基础设施细节的读者。

- 【莱顿人工智能与数学宣言发布，数学界重申人类理解核心地位】（https://www.bestblogs.dev/article/61be7750）（虎嗅）：由国际数学界发起、获国际数学联盟支持的宣言，重申数学研究的核心在于人类理解，呼吁在 AI 时代坚守证明、署名、透明与自主等核心价值，并对研究者、机构、政府提出具体建议。2018 年菲尔兹奖得主 Peter Scholze 对此回应：「我更愿意在不借助人工智能的情况下思考自己的数学想法，并尽可能避免阅读由人工智能生成的文本。」

- 【如何在自有硬件上使用 QVAC 运行私有文本转语音】（https://www.bestblogs.dev/article/22063523）（freeCodeCamp）：一份实用指南，介绍如何用 QVAC SDK 在 React Native 应用中实现离线、高保真的文本转语音功能，涵盖模型选择、音频封装和状态管理，适合做端侧 AI 功能的移动开发者。

- 【机器文字的人类路由器】（https://www.bestblogs.dev/article/1ff17271）（Fernando Borretti）：一篇态度鲜明的随笔，作者认为写作本身就是思考，用 AI 代笔是对读者的欺骗，而不只是效率工具的使用。和今天关于 AI 能力边界的几篇精讲放在一起，提供了一个更偏伦理与价值观的视角。

- 【更强的模型能伪装成更弱的模型吗？大部分情况下不能】（https://www.bestblogs.dev/article/af0dc135）（LessWrong）：测试发现前沿模型可以被提示进入较弱模型的能力区间，但无法模仿某个特定先前模型的「指纹」式错误模式；思维链推理是一种有效的缓解手段。对关心模型评估与对齐研究的读者是一篇扎实的实证文章，和精讲一里的安全分类器讨论可以对照着读。

- 【视觉大语言模型也是 PDF 解析器：为 RAG 读取图表与示意图】（https://www.bestblogs.dev/article/ee35a4bb）（Towards Data Science）：论证视觉大语言模型可以作为 RAG 系统的完整 PDF 解析器，独特地让图表和示意图变得可搜索，同时诚实评估了与传统文本解析器相比在成本、精确性和完整性上的权衡，适合搭建企业级 RAG 系统、希望补齐图表检索能力的工程师参考。

## 今日阅读路径

如果今天时间有限，又只想抓住三件最重要的事，建议按以下顺序读三篇：

1. 精讲一《从发布到被消失的 72 小时，Fable 5 暴露了最强 AI 模型的安全困境》--这是今天信息密度最高的一篇，三层攻击手法的拆解和「分类器降级」架构的设计逻辑，几乎是理解当下 AI 安全讨论的必读材料。

1. 精讲二《SpaceX 崛起史：一切，为了去火星|实地探访星舰基地与总部》--一场刚刚完成的、全球资本市场最大 IPO 背后，是 24 年「99% 不够」的极限工程史，读完会对「时间价值」这个估值概念有更具体的感受。

1. 精讲三《图灵奖得主，要用十亿美金赌 AI 的下一个十年（上集）》--如果你只想搞懂一件事：为什么有人愿意拿十亿美元去赌大语言模型路线是错的，这篇是目前讲得最清楚的中文解读。

读完这三篇，再去「速览」里挑一两条和自己工作相关的（比如 GPU 时间切片、形式化方法或软件架构指南），「补充阅读」里和这三条主线相关的延伸也值得快速扫一眼，今天的阅读就足够扎实了。

BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂，并逐渐理解你关注什么，让每天的阅读都更有方向、更省时间。