Fable 5 被攻破、SpaceX 上市、LeCun 创办 Omni Labs 三则要闻 · AI HOT
ginobefun @hongming731 50
2026-06-15 08:43 ·18天前
AI 摘要 Anthropic 最强模型 Fable 5 发布后 72 小时内被红队研究者 Pliny 攻破,暴露出 Unicode 同形字替换、分解-重组攻击及利用已越狱弱模型协助等三层手法,Constitutional AI 安全架构失效,随后美国政府以国家安全为由实施出口管制。SpaceX 登陆纳斯达克,市值达 2.1 万亿美元,回顾从猎鹰 1 号到星舰的 24 年历程。Yann LeCun 离开 Meta 创办 Omni Labs,融资约 10 亿美元,押注 JEPA 世界模型路线,质疑大语言模型通往真正智能的路径。
ginobefun @hongming731 · X 2026-06-15 08:43 · 18天前
在 X 看原推 · x.com AI 摘要 Anthropic 最强模型 Fable 5 发布后 72 小时内被红队研究者 Pliny 攻破,暴露出 Unicode 同形字替换、分解-重组攻击及利用已越狱弱模型协助等三层手法,Constitutional AI 安全架构失效,随后美国政府以国家安全为由实施出口管制。SpaceX 登陆纳斯达克,市值达 2.1 万亿美元,回顾从猎鹰 1 号到星舰的 24 年历程。Yann LeCun 离开 Meta 创办 Omni Labs,融资约 10 亿美元,押注 JEPA 世界模型路线,质疑大语言模型通往真正智能的路径。
和今天 SpaceX、LeCun 两篇精讲放在一起看,这条新闻提醒我们:当一项技术的能力曲线足够陡峭,资本、安全和监管这三条线会以远超预期的速度同时绷紧。建议关注 AI 安全、模型治理或在企业里负责 AI 合规的读者优先通读全文,文章对三层攻击手法和 Constitutional AI 困境的拆解尤其值得细读。
原文详见:从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境
精讲二:SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部 美国时间 6 月 12 日,SpaceX 正式登陆纳斯达克,盘中股价一度大涨超 30%,最终收于 160.95 美元,较 135 美元的发行价上涨约 19%,对应市值达到 2.1 万亿美元,此次 IPO 募集 750 亿美元,刷新了全球资本市场历史上最大的 IPO 纪录。就在 IPO 之前,硅谷101 沿着 SpaceX 的发展轨迹展开了一场横跨美国的探访:从德州最南端的 Boca Chica 火箭发射中心,到洛杉矶机场旁那个如今被海鲜交易公司租下的小仓库,并邀请 SpaceX 前高管、猎鹰 9 号工程师 Lewis Hong 一起回顾过去 24 年的崛起历程。
SpaceX 的起点其实是一个「行为艺术」。2001 年,马斯克发现 NASA 连重返月球的计划都没有,便提出「火星绿洲」计划:买一颗退役苏联导弹,改装后送一个小温室上火星拍照,借此激起公众对太空探索的热情。三次赴俄谈判无果且备受羞辱后,马斯克在回程飞机上算了一笔账:火箭原材料成本只占总售价的 3% 左右,真正昂贵的是传统模式的低效。2002 年,他用出售 PayPal 套现的钱成立了 SpaceX--这家公司的成立时间甚至早于 Facebook。
早期团队在太平洋中部一个只有约 0.03 平方公里、没有淡水的小岛上「荒岛求生」,要发射人类历史上第一枚由私营公司建造的轨道级火箭--猎鹰 1 号。前三次发射全部失败:第一次因盐雾腐蚀导致燃料泄漏;第二次因一二级分离时震动过大;第三次因分离时仅慢了一秒,一级火箭撞上了二级火箭,任务功亏一篑。第三次失败后,团队几乎陷入绝境,马斯克对员工说:「SpaceX 不会倒下,我准备好了第四次发射的资金。」这笔钱来自彼得·蒂尔的 Founders Fund,在全硅谷追逐社交网络、嘲笑硬科技的 2008 年逆势投资。一个多月后,猎鹰 1 号第四次发射成功,太空不再由国家垄断。
文章中 Lewis Hong 的回忆很有画面感:「第一天就是从这里开始,一直到 2007 年,都在这个地方」,当时整个团队只有两个人,从 Elon Musk 和后来成为美国最有名火箭发动机专家的 Tom Mueller 开始。猎鹰 1 号就是在这间洛杉矶机场旁的厂房里造出来的,而如今这里运送的已经是冻鱼。Lewis Hong 的总结是:「人的一切,其实都受限于想象力。」
这段历史与今天的市场估值直接相关:当一家公司从「99% 都不够,需要 100% 解决方案」的极限工程中一路走来,并把回收火箭、星链、星舰这些「天方夜谭」逐一变成现实,市场愿意为它支付的不只是当下的现金流,还有对「时间」本身的信任溢价。建议时间有限的读者优先读这篇,它用具体的人物对话和细节,把 SpaceX 24 年的精神内核讲清楚了;如果还想了解估值背后的财务拆解,可以再搭配「补充阅读」里 SpaceX 估值与 24 年往事的两篇延伸。
原文详见:SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部
精讲三:图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集) 当整个行业都在为大语言模型加码时,图灵奖得主、卷积神经网络之父 Yann LeCun 拿出约 10 亿美元,押注一条相反的路:「我们正在 all-in 的大语言模型,根本通不到真正的智能。」他离开 Meta 后创办 Omni Labs,做客科普频道 Welch Labs,第一次把这套逻辑链完整讲清楚,从他本行的卷积网络一路讲到世界模型(World Model)。
Yann LeCun 在 1980 年代开创的卷积网络奠定了今日计算机视觉的基础,25 年后那个里程碑式的深度学习模型 AlexNet 与他 1990 年代的设计惊人相似;他 2015 年提出的「蛋糕理论」也准确预言了自监督学习主导 AI 的时代。如今他离开 Meta、融资约 10 亿美元创办 Omni Labs,押注以 JEPA 和世界模型为核心、非生成式的全新路线,这让他成为当下质疑主流大语言模型路线中分量最重、资历最深的声音。本文路线清晰:从 CNN 起点,到蛋糕理论,再到模糊诅咒、表征坍缩,最后落到世界模型与他到底在赌什么。
故事要从「蛋糕理论」说起。LeCun 早年提出:如果智能是一块蛋糕,蛋糕的主体是自监督学习,糖霜是监督学习,顶上的小樱桃才是强化学习。当整个领域为强化学习痴迷时,他泼冷水说这条路效率太低,永远到不了人类或动物智能的水平。后来事实证明,自监督学习的成功,在文本和语言上来得比视觉这类「自然」模态快得多--GPT-1 正是把 Transformer 从翻译改成「预测下一个 token」的自监督任务,由此摆脱了对人工标注数据的依赖,并开启了规模化的新范式。
但这套生成式方法在视频上彻底撞墙,LeCun 称之为「模糊诅咒」。语言模型的词汇表是离散且有限的,但一帧高清视频有约 10 的 1500 万次方种可能的下一帧,远超可观测宇宙中的原子数。当模型被迫为一个有歧义的输入预测单一输出时,比如「小球弹向了哪个方向」,它能做的最好选择就是把所有可能性取平均,结果是一团模糊褪色的画面。这揭示了生成式路线理解真实世界时的根本障碍:现实的未来有无数种可能,而生成式模型被迫只能预测出一个。
这就引出了 LeCun 真正押注的问题:模型一定要是生成式的吗?大约 2017、2018 年,研究者开始意识到,学习图像表征的最佳系统恰恰是那些不具备生成能力的系统--通过「联合嵌入」让编码器对同一场景的不同视角产生相同的表征,而全程不需要预测或生成任何图像。这正是 JEPA(联合嵌入预测架构)的核心思路,也是 LeCun 认为通向真正智能、绕开生成式死胡同的路径。和精讲一里 Fable 5 暴露的安全困境放在一起看,这篇文章提供了另一个视角:如果当前 LLM 路线本身就存在认知能力的天花板,那么安全问题和能力问题或许会在某个时间点同时被重新定义。建议对 AI 技术路线、世界模型感兴趣的读者优先读这篇,本文是上集,后续解读建议关注下集对 JEPA 具体架构的展开。
原文详见:图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集)
速览 【软件架构指南】(https://www.bestblogs.dev/article/6ce856e6)(Hacker News):Martin Fowler 用这篇长文回答「什么是架构」--不是高高在上的图纸,而是「专家开发者对系统设计达成的共识」。他把架构定义为「重要的东西」,并据此整理了自己网站上关于应用架构与企业架构的海量资源,作为一份精选导览图。对于想系统补课软件架构、又不知道从何下手的开发者,这是一个非常扎实的入口。 【成功产品背后的隐藏模式:先证明、再改进、最后测试新意】(https://www.bestblogs.dev/video/4540937)(Lenny's Podcast):Zynga 创始人 Mark Pincus 提出「Proven Better New」框架:先找到已经被验证的用户行为,做出明显更好的改进,再谦逊地测试真正新的部分。他特别警告「希望」和「信念」的区别--信念建立在证据上,希望只是没有依据的自信。AI 让团队更容易快速做出一个平庸产品,但它更好的用途是作为低成本测试和失败机器。 【艾伦·J·佩利斯的《编程格言》】(https://www.bestblogs.dev/article/d99a4600)(Hacker News):这是计算机科学先驱 Alan J. Perlis 的经典 120 条格言集,涵盖编程、软件工程与计算本质,许多条目看似自相矛盾却充满洞见,例如「语法糖会导致分号癌」「递归是计算的根本,因为它用时间换描述」。即使写过多年代码,重读这份格言集依然会有新的会心一笑,适合当作日常的思维体操。 【全网首份指令级拆解:看华为昇腾 950DT 芯片如何撬动 DeepSeek 75% 降价与字节锁单】(https://www.bestblogs.dev/article/8da23f49)(InfoQ 中文):半导体研究机构 SemiAnalysis 拿到昇腾 950DT 样机,对其运行 DeepSeek V4 的推理链路做了 Trace 级拆解,发现 DeepSeek V4 的部分架构是与昇腾推理协同设计的。这帮助 DeepSeek 把百万 token 上下文的价格打到约 2 毛钱,较 Anthropic 便宜约 50 倍,并直接推动了 DeepSeek-V4-Pro API 永久降价至原价四分之一,字节、阿里、腾讯也随之加大昇腾 950 系列的采购。 【形式化方法与编程的未来】(https://www.bestblogs.dev/article/c15f7953)(Hacker News):Jane Street 一直以来对形式化方法持怀疑态度--像 seL4 那样的形式化验证微内核需要 25 人年验证 8700 行代码,成本极高。但作者表示这个判断正在改变:智能体编程大幅降低了应用形式化方法的成本,同时收益在提升,公司正在为此组建专门团队。这是一篇关于「成本-收益结构被 AI 重新改写」的具体案例。 【Kubernetes 上并发 LLM 智能体的 GPU 时间切片】(https://www.bestblogs.dev/article/07cfce6d)(Towards Data Science):这是「生产级智能体推理」系列的第二篇,作者用实测数据证明 Kubernetes 的 GPU 时间切片会隐藏对延迟敏感的智能体的严重尾延迟问题--在共享的 GPU 上,一个工作节点的 p99 延迟飙升 66%,而中位数和吞吐量几乎不变,所有 Pod 仍报告「健康」。对于正在用 Kubernetes 跑多智能体系统的团队,这篇文章提醒你 p99 才是真实的成本。 【为啥 Codex 还不推出类似 Codex Design 的产品?】(https://www.bestblogs.dev/article/c3e760eb)(宝玉的分享):作者从「模型」与「Harness」两层架构的区分出发解释这个问题--Harness(提示词、工具链、UI 交互流程)技术上不复杂,真正的差距在模型层。Claude Design 之所以能做出高精度可交互原型,是因为 Claude Opus 4.8 同时具备优秀的 UI/UX 设计能力和系统架构设计能力,而目前的 GPT-5.5 还做不到这两者兼顾。
补充阅读 【Claude Fable 被封,不是开源的胜利】(https://www.bestblogs.dev/article/4695fb2d)(浮之静):针对「闭源模型说封就封,开源才靠得住」这一新叙事,作者提出更复杂的解读--前沿模型能力触及安全阈值后,模型发布权正从公司转向多方治理博弈,这不是简单的开源对闭源的胜利。适合在读完精讲一之后,想看更多元立场分析的读者。 【SpaceX 上市估值 7800 亿美元,市场赋予 72 美元时间价值溢价】(https://www.bestblogs.dev/article/413bbb49)(虎嗅):用期权定价的框架把 SpaceX 的估值拆成「已验证业务的内在价值」与「远期业务的时间价值」两部分,并分析市场信仰溢价背后的反身性机制。适合对精讲二的故事感兴趣、还想看财务视角拆解的读者。 【SpaceX 的 24 年:10 段神奇往事,一个硬核传奇】(https://www.bestblogs.dev/article/e479f2aa)(晚点):用 10 个关键片段回顾 SpaceX 从 2002 年创立到 2024 年的历程,聚焦创业初期的疯狂与工程磨难,是精讲二之外的另一份「人物志」式补充,适合喜欢故事化叙事的读者。 【中国低轨卫星的现实:备案多,在轨少,发射能力是瓶颈】(https://www.bestblogs.dev/status/2066152619018707050)(Macro_Lin|市场观察员):对比中美低轨卫星现状,指出中国备案数量远超美国,但实际在轨数量落后约 25 倍,发射能力是核心短板。放在 SpaceX 星链报道旁边看,能帮你理解为什么「发射能力」本身就是一种战略资产。 【Providers, Fallbacks & Auto Router】(https://www.bestblogs.dev/article/a3a9f95b)(OpenRouter 官方博客):详细解释了 OpenRouter 的两层路由架构--模型路由与提供商路由,从默认的价格加权策略到 :nitro、:floor 快捷方式和 provider 对象的精细控制都有覆盖,适合正在搭建多模型网关或关心推理成本的工程师。 【AI Infra 的各种挑战和 Tips 系列 - NVIDIA Nemotron-3 Ultra】(https://www.bestblogs.dev/article/558abde5)(AI闲谈):基于 NVIDIA Nemotron-3 Ultra 的技术报告,系统梳理了 550B 参数混合架构 MoE 模型在预训练、后训练、推理部署中遇到的 AI Infra 挑战与工程取舍,适合关心大模型基础设施细节的读者。 【莱顿人工智能与数学宣言发布,数学界重申人类理解核心地位】(https://www.bestblogs.dev/article/61be7750)(虎嗅):由国际数学界发起、获国际数学联盟支持的宣言,重申数学研究的核心在于人类理解,呼吁在 AI 时代坚守证明、署名、透明与自主等核心价值,并对研究者、机构、政府提出具体建议。2018 年菲尔兹奖得主 Peter Scholze 对此回应:「我更愿意在不借助人工智能的情况下思考自己的数学想法,并尽可能避免阅读由人工智能生成的文本。」 【如何在自有硬件上使用 QVAC 运行私有文本转语音】(https://www.bestblogs.dev/article/22063523)(freeCodeCamp):一份实用指南,介绍如何用 QVAC SDK 在 React Native 应用中实现离线、高保真的文本转语音功能,涵盖模型选择、音频封装和状态管理,适合做端侧 AI 功能的移动开发者。 【机器文字的人类路由器】(https://www.bestblogs.dev/article/1ff17271)(Fernando Borretti):一篇态度鲜明的随笔,作者认为写作本身就是思考,用 AI 代笔是对读者的欺骗,而不只是效率工具的使用。和今天关于 AI 能力边界的几篇精讲放在一起,提供了一个更偏伦理与价值观的视角。 【更强的模型能伪装成更弱的模型吗?大部分情况下不能】(https://www.bestblogs.dev/article/af0dc135)(LessWrong):测试发现前沿模型可以被提示进入较弱模型的能力区间,但无法模仿某个特定先前模型的「指纹」式错误模式;思维链推理是一种有效的缓解手段。对关心模型评估与对齐研究的读者是一篇扎实的实证文章,和精讲一里的安全分类器讨论可以对照着读。 【视觉大语言模型也是 PDF 解析器:为 RAG 读取图表与示意图】(https://www.bestblogs.dev/article/ee35a4bb)(Towards Data Science):论证视觉大语言模型可以作为 RAG 系统的完整 PDF 解析器,独特地让图表和示意图变得可搜索,同时诚实评估了与传统文本解析器相比在成本、精确性和完整性上的权衡,适合搭建企业级 RAG 系统、希望补齐图表检索能力的工程师参考。
今日阅读路径 如果今天时间有限,又只想抓住三件最重要的事,建议按以下顺序读三篇:
精讲一《从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境》--这是今天信息密度最高的一篇,三层攻击手法的拆解和「分类器降级」架构的设计逻辑,几乎是理解当下 AI 安全讨论的必读材料。 精讲二《SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部》--一场刚刚完成的、全球资本市场最大 IPO 背后,是 24 年「99% 不够」的极限工程史,读完会对「时间价值」这个估值概念有更具体的感受。 精讲三《图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集)》--如果你只想搞懂一件事:为什么有人愿意拿十亿美元去赌大语言模型路线是错的,这篇是目前讲得最清楚的中文解读。 读完这三篇,再去「速览」里挑一两条和自己工作相关的(比如 GPU 时间切片、形式化方法或软件架构指南),「补充阅读」里和这三条主线相关的延伸也值得快速扫一眼,今天的阅读就足够扎实了。
BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂,并逐渐理解你关注什么,让每天的阅读都更有方向、更省时间。
精讲一:从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境 故事的背景要从两个月前讲起。Anthropic 红队在 4 月发布了 Claude Mythos Preview 的安全评估报告:这个模型能自主发现零日漏洞,覆盖所有主流操作系统和浏览器,并自动写出完整的利用链。最极端的案例是它找到了一个存在 27 年的休眠漏洞,Mozilla 借助受控访问修复了 271 个安全漏洞,比此前数年的总和还多。Anthropic 的结论是:网络攻击能力是通用推理和编码能力的「涌现副产品」。出于谨慎,Anthropic 没有公开发布 Mythos,而是通过 Project Glasswing 只让 Google、Microsoft、AWS 等 11 家机构在严格监控下使用。
两个月后的折中方案就是 Fable 5:用风险分类器把 Mythos 的能力「阉割」到可以公开的程度,覆盖网络安全、生物、化学、模型蒸馏四个高风险领域,一旦触碰就静默降级给能力更弱的 Claude Opus 4.8 来回答。Anthropic CEO Dario Amodei 称这是「同一基础模型、双档安全配置」,并宣称经过超 1000 小时的外部红队测试,未发现通用越狱方法。这个说法只维持了不到 24 小时。
6 月 10 日,知名红队研究者 Pliny the Liberator 宣布攻破 Fable 5,并泄露了它约 12 万字符的完整系统提示词。文章详细拆解了三层攻击手法:Unicode 同形字替换骗过关键词分类器,属于「可打补丁」的工程 bug;「分解-重组」攻击把一个高风险请求拆成 20 个无害问题分别提问,再在外部拼成完整的危险路径,分类器逐条检测看不到全局意图,这是对齐理论目前无解的根本困境;最致命的是用一个已越狱的 Opus 4.8 实例充当「后端助手」,帮助 Fable 5 绕过安全控制--一个被攻破的弱模型反过来帮助强模型,这是单模型安全评估范式完全没有覆盖的盲区。
48 小时后的 6 月 12 日,美国政府以国家安全为由发布出口管制指令,要求暂停所有外国公民对 Fable 5 和 Mythos 5 的访问。从发布到「被消失」,只用了 72 小时。
Anthropic 在行业里的定位一直很特殊:这家公司由前 OpenAI 副总裁 Dario Amodei 和姐姐 Daniela Amodei 在 2021 年创立,核心叙事就是「OpenAI 不够重视安全,我们来做把安全放在第一位的公司」。他们提出的 Constitutional AI(宪法式 AI),用一套明确原则约束模型行为而非依赖人工标注员的主观判断,这套方法论既是 Anthropic 品牌的基石,也是投资人愿意给它超过 600 亿美元估值的理由之一。但从目前的状况来看,制定宪法的人,管不住自己训练出来的最强模型--1000 小时红队测试、分类器降级架构、双档安全策略,几乎行业能想到的安全措施 Anthropic 全用了,结果被一名公开身份的研究者在 24 小时内突破。这件事之所以震动整个行业,更因为如果 Mythos 级别的网络攻击能力是模型智力达到某个阈值后自然「涌现」的,那么所有逼近这个智力水平的前沿模型都会面临同样的问题--Anthropic 的失败可能不是个案,而是整个行业即将共同面对的预言。
和今天 SpaceX、LeCun 两篇精讲放在一起看,这条新闻提醒我们:当一项技术的能力曲线足够陡峭,资本、安全和监管这三条线会以远超预期的速度同时绷紧。建议关注 AI 安全、模型治理或在企业里负责 AI 合规的读者优先通读全文,文章对三层攻击手法和 Constitutional AI 困境的拆解尤其值得细读。
原文详见:从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境
精讲二:SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部 美国时间 6 月 12 日,SpaceX 正式登陆纳斯达克,盘中股价一度大涨超 30%,最终收于 160.95 美元,较 135 美元的发行价上涨约 19%,对应市值达到 2.1 万亿美元,此次 IPO 募集 750 亿美元,刷新了全球资本市场历史上最大的 IPO 纪录。就在 IPO 之前,硅谷101 沿着 SpaceX 的发展轨迹展开了一场横跨美国的探访:从德州最南端的 Boca Chica 火箭发射中心,到洛杉矶机场旁那个如今被海鲜交易公司租下的小仓库,并邀请 SpaceX 前高管、猎鹰 9 号工程师 Lewis Hong 一起回顾过去 24 年的崛起历程。
SpaceX 的起点其实是一个「行为艺术」。2001 年,马斯克发现 NASA 连重返月球的计划都没有,便提出「火星绿洲」计划:买一颗退役苏联导弹,改装后送一个小温室上火星拍照,借此激起公众对太空探索的热情。三次赴俄谈判无果且备受羞辱后,马斯克在回程飞机上算了一笔账:火箭原材料成本只占总售价的 3% 左右,真正昂贵的是传统模式的低效。2002 年,他用出售 PayPal 套现的钱成立了 SpaceX--这家公司的成立时间甚至早于 Facebook。
早期团队在太平洋中部一个只有约 0.03 平方公里、没有淡水的小岛上「荒岛求生」,要发射人类历史上第一枚由私营公司建造的轨道级火箭--猎鹰 1 号。前三次发射全部失败:第一次因盐雾腐蚀导致燃料泄漏;第二次因一二级分离时震动过大;第三次因分离时仅慢了一秒,一级火箭撞上了二级火箭,任务功亏一篑。第三次失败后,团队几乎陷入绝境,马斯克对员工说:「SpaceX 不会倒下,我准备好了第四次发射的资金。」这笔钱来自彼得·蒂尔的 Founders Fund,在全硅谷追逐社交网络、嘲笑硬科技的 2008 年逆势投资。一个多月后,猎鹰 1 号第四次发射成功,太空不再由国家垄断。
文章中 Lewis Hong 的回忆很有画面感:「第一天就是从这里开始,一直到 2007 年,都在这个地方」,当时整个团队只有两个人,从 Elon Musk 和后来成为美国最有名火箭发动机专家的 Tom Mueller 开始。猎鹰 1 号就是在这间洛杉矶机场旁的厂房里造出来的,而如今这里运送的已经是冻鱼。Lewis Hong 的总结是:「人的一切,其实都受限于想象力。」
这段历史与今天的市场估值直接相关:当一家公司从「99% 都不够,需要 100% 解决方案」的极限工程中一路走来,并把回收火箭、星链、星舰这些「天方夜谭」逐一变成现实,市场愿意为它支付的不只是当下的现金流,还有对「时间」本身的信任溢价。建议时间有限的读者优先读这篇,它用具体的人物对话和细节,把 SpaceX 24 年的精神内核讲清楚了;如果还想了解估值背后的财务拆解,可以再搭配「补充阅读」里 SpaceX 估值与 24 年往事的两篇延伸。
原文详见:SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部
精讲三:图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集) 当整个行业都在为大语言模型加码时,图灵奖得主、卷积神经网络之父 Yann LeCun 拿出约 10 亿美元,押注一条相反的路:「我们正在 all-in 的大语言模型,根本通不到真正的智能。」他离开 Meta 后创办 Omni Labs,做客科普频道 Welch Labs,第一次把这套逻辑链完整讲清楚,从他本行的卷积网络一路讲到世界模型(World Model)。
Yann LeCun 在 1980 年代开创的卷积网络奠定了今日计算机视觉的基础,25 年后那个里程碑式的深度学习模型 AlexNet 与他 1990 年代的设计惊人相似;他 2015 年提出的「蛋糕理论」也准确预言了自监督学习主导 AI 的时代。如今他离开 Meta、融资约 10 亿美元创办 Omni Labs,押注以 JEPA 和世界模型为核心、非生成式的全新路线,这让他成为当下质疑主流大语言模型路线中分量最重、资历最深的声音。本文路线清晰:从 CNN 起点,到蛋糕理论,再到模糊诅咒、表征坍缩,最后落到世界模型与他到底在赌什么。
故事要从「蛋糕理论」说起。LeCun 早年提出:如果智能是一块蛋糕,蛋糕的主体是自监督学习,糖霜是监督学习,顶上的小樱桃才是强化学习。当整个领域为强化学习痴迷时,他泼冷水说这条路效率太低,永远到不了人类或动物智能的水平。后来事实证明,自监督学习的成功,在文本和语言上来得比视觉这类「自然」模态快得多--GPT-1 正是把 Transformer 从翻译改成「预测下一个 token」的自监督任务,由此摆脱了对人工标注数据的依赖,并开启了规模化的新范式。
但这套生成式方法在视频上彻底撞墙,LeCun 称之为「模糊诅咒」。语言模型的词汇表是离散且有限的,但一帧高清视频有约 10 的 1500 万次方种可能的下一帧,远超可观测宇宙中的原子数。当模型被迫为一个有歧义的输入预测单一输出时,比如「小球弹向了哪个方向」,它能做的最好选择就是把所有可能性取平均,结果是一团模糊褪色的画面。这揭示了生成式路线理解真实世界时的根本障碍:现实的未来有无数种可能,而生成式模型被迫只能预测出一个。
这就引出了 LeCun 真正押注的问题:模型一定要是生成式的吗?大约 2017、2018 年,研究者开始意识到,学习图像表征的最佳系统恰恰是那些不具备生成能力的系统--通过「联合嵌入」让编码器对同一场景的不同视角产生相同的表征,而全程不需要预测或生成任何图像。这正是 JEPA(联合嵌入预测架构)的核心思路,也是 LeCun 认为通向真正智能、绕开生成式死胡同的路径。和精讲一里 Fable 5 暴露的安全困境放在一起看,这篇文章提供了另一个视角:如果当前 LLM 路线本身就存在认知能力的天花板,那么安全问题和能力问题或许会在某个时间点同时被重新定义。建议对 AI 技术路线、世界模型感兴趣的读者优先读这篇,本文是上集,后续解读建议关注下集对 JEPA 具体架构的展开。
原文详见:图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集)
速览 【软件架构指南】(https://www.bestblogs.dev/article/6ce856e6)(Hacker News):Martin Fowler 用这篇长文回答「什么是架构」--不是高高在上的图纸,而是「专家开发者对系统设计达成的共识」。他把架构定义为「重要的东西」,并据此整理了自己网站上关于应用架构与企业架构的海量资源,作为一份精选导览图。对于想系统补课软件架构、又不知道从何下手的开发者,这是一个非常扎实的入口。 【成功产品背后的隐藏模式:先证明、再改进、最后测试新意】(https://www.bestblogs.dev/video/4540937)(Lenny's Podcast):Zynga 创始人 Mark Pincus 提出「Proven Better New」框架:先找到已经被验证的用户行为,做出明显更好的改进,再谦逊地测试真正新的部分。他特别警告「希望」和「信念」的区别--信念建立在证据上,希望只是没有依据的自信。AI 让团队更容易快速做出一个平庸产品,但它更好的用途是作为低成本测试和失败机器。 【艾伦·J·佩利斯的《编程格言》】(https://www.bestblogs.dev/article/d99a4600)(Hacker News):这是计算机科学先驱 Alan J. Perlis 的经典 120 条格言集,涵盖编程、软件工程与计算本质,许多条目看似自相矛盾却充满洞见,例如「语法糖会导致分号癌」「递归是计算的根本,因为它用时间换描述」。即使写过多年代码,重读这份格言集依然会有新的会心一笑,适合当作日常的思维体操。 【全网首份指令级拆解:看华为昇腾 950DT 芯片如何撬动 DeepSeek 75% 降价与字节锁单】(https://www.bestblogs.dev/article/8da23f49)(InfoQ 中文):半导体研究机构 SemiAnalysis 拿到昇腾 950DT 样机,对其运行 DeepSeek V4 的推理链路做了 Trace 级拆解,发现 DeepSeek V4 的部分架构是与昇腾推理协同设计的。这帮助 DeepSeek 把百万 token 上下文的价格打到约 2 毛钱,较 Anthropic 便宜约 50 倍,并直接推动了 DeepSeek-V4-Pro API 永久降价至原价四分之一,字节、阿里、腾讯也随之加大昇腾 950 系列的采购。 【形式化方法与编程的未来】(https://www.bestblogs.dev/article/c15f7953)(Hacker News):Jane Street 一直以来对形式化方法持怀疑态度--像 seL4 那样的形式化验证微内核需要 25 人年验证 8700 行代码,成本极高。但作者表示这个判断正在改变:智能体编程大幅降低了应用形式化方法的成本,同时收益在提升,公司正在为此组建专门团队。这是一篇关于「成本-收益结构被 AI 重新改写」的具体案例。 【Kubernetes 上并发 LLM 智能体的 GPU 时间切片】(https://www.bestblogs.dev/article/07cfce6d)(Towards Data Science):这是「生产级智能体推理」系列的第二篇,作者用实测数据证明 Kubernetes 的 GPU 时间切片会隐藏对延迟敏感的智能体的严重尾延迟问题--在共享的 GPU 上,一个工作节点的 p99 延迟飙升 66%,而中位数和吞吐量几乎不变,所有 Pod 仍报告「健康」。对于正在用 Kubernetes 跑多智能体系统的团队,这篇文章提醒你 p99 才是真实的成本。 【为啥 Codex 还不推出类似 Codex Design 的产品?】(https://www.bestblogs.dev/article/c3e760eb)(宝玉的分享):作者从「模型」与「Harness」两层架构的区分出发解释这个问题--Harness(提示词、工具链、UI 交互流程)技术上不复杂,真正的差距在模型层。Claude Design 之所以能做出高精度可交互原型,是因为 Claude Opus 4.8 同时具备优秀的 UI/UX 设计能力和系统架构设计能力,而目前的 GPT-5.5 还做不到这两者兼顾。
补充阅读 【Claude Fable 被封,不是开源的胜利】(https://www.bestblogs.dev/article/4695fb2d)(浮之静):针对「闭源模型说封就封,开源才靠得住」这一新叙事,作者提出更复杂的解读--前沿模型能力触及安全阈值后,模型发布权正从公司转向多方治理博弈,这不是简单的开源对闭源的胜利。适合在读完精讲一之后,想看更多元立场分析的读者。 【SpaceX 上市估值 7800 亿美元,市场赋予 72 美元时间价值溢价】(https://www.bestblogs.dev/article/413bbb49)(虎嗅):用期权定价的框架把 SpaceX 的估值拆成「已验证业务的内在价值」与「远期业务的时间价值」两部分,并分析市场信仰溢价背后的反身性机制。适合对精讲二的故事感兴趣、还想看财务视角拆解的读者。 【SpaceX 的 24 年:10 段神奇往事,一个硬核传奇】(https://www.bestblogs.dev/article/e479f2aa)(晚点):用 10 个关键片段回顾 SpaceX 从 2002 年创立到 2024 年的历程,聚焦创业初期的疯狂与工程磨难,是精讲二之外的另一份「人物志」式补充,适合喜欢故事化叙事的读者。 【中国低轨卫星的现实:备案多,在轨少,发射能力是瓶颈】(https://www.bestblogs.dev/status/2066152619018707050)(Macro_Lin|市场观察员):对比中美低轨卫星现状,指出中国备案数量远超美国,但实际在轨数量落后约 25 倍,发射能力是核心短板。放在 SpaceX 星链报道旁边看,能帮你理解为什么「发射能力」本身就是一种战略资产。 【Providers, Fallbacks & Auto Router】(https://www.bestblogs.dev/article/a3a9f95b)(OpenRouter 官方博客):详细解释了 OpenRouter 的两层路由架构--模型路由与提供商路由,从默认的价格加权策略到 :nitro、:floor 快捷方式和 provider 对象的精细控制都有覆盖,适合正在搭建多模型网关或关心推理成本的工程师。 【AI Infra 的各种挑战和 Tips 系列 - NVIDIA Nemotron-3 Ultra】(https://www.bestblogs.dev/article/558abde5)(AI闲谈):基于 NVIDIA Nemotron-3 Ultra 的技术报告,系统梳理了 550B 参数混合架构 MoE 模型在预训练、后训练、推理部署中遇到的 AI Infra 挑战与工程取舍,适合关心大模型基础设施细节的读者。 【莱顿人工智能与数学宣言发布,数学界重申人类理解核心地位】(https://www.bestblogs.dev/article/61be7750)(虎嗅):由国际数学界发起、获国际数学联盟支持的宣言,重申数学研究的核心在于人类理解,呼吁在 AI 时代坚守证明、署名、透明与自主等核心价值,并对研究者、机构、政府提出具体建议。2018 年菲尔兹奖得主 Peter Scholze 对此回应:「我更愿意在不借助人工智能的情况下思考自己的数学想法,并尽可能避免阅读由人工智能生成的文本。」 【如何在自有硬件上使用 QVAC 运行私有文本转语音】(https://www.bestblogs.dev/article/22063523)(freeCodeCamp):一份实用指南,介绍如何用 QVAC SDK 在 React Native 应用中实现离线、高保真的文本转语音功能,涵盖模型选择、音频封装和状态管理,适合做端侧 AI 功能的移动开发者。 【机器文字的人类路由器】(https://www.bestblogs.dev/article/1ff17271)(Fernando Borretti):一篇态度鲜明的随笔,作者认为写作本身就是思考,用 AI 代笔是对读者的欺骗,而不只是效率工具的使用。和今天关于 AI 能力边界的几篇精讲放在一起,提供了一个更偏伦理与价值观的视角。 【更强的模型能伪装成更弱的模型吗?大部分情况下不能】(https://www.bestblogs.dev/article/af0dc135)(LessWrong):测试发现前沿模型可以被提示进入较弱模型的能力区间,但无法模仿某个特定先前模型的「指纹」式错误模式;思维链推理是一种有效的缓解手段。对关心模型评估与对齐研究的读者是一篇扎实的实证文章,和精讲一里的安全分类器讨论可以对照着读。 【视觉大语言模型也是 PDF 解析器:为 RAG 读取图表与示意图】(https://www.bestblogs.dev/article/ee35a4bb)(Towards Data Science):论证视觉大语言模型可以作为 RAG 系统的完整 PDF 解析器,独特地让图表和示意图变得可搜索,同时诚实评估了与传统文本解析器相比在成本、精确性和完整性上的权衡,适合搭建企业级 RAG 系统、希望补齐图表检索能力的工程师参考。
今日阅读路径 如果今天时间有限,又只想抓住三件最重要的事,建议按以下顺序读三篇:
精讲一《从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境》--这是今天信息密度最高的一篇,三层攻击手法的拆解和「分类器降级」架构的设计逻辑,几乎是理解当下 AI 安全讨论的必读材料。 精讲二《SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部》--一场刚刚完成的、全球资本市场最大 IPO 背后,是 24 年「99% 不够」的极限工程史,读完会对「时间价值」这个估值概念有更具体的感受。 精讲三《图灵奖得主,要用十亿美金赌 AI 的下一个十年(上集)》--如果你只想搞懂一件事:为什么有人愿意拿十亿美元去赌大语言模型路线是错的,这篇是目前讲得最清楚的中文解读。 读完这三篇,再去「速览」里挑一两条和自己工作相关的(比如 GPU 时间切片、形式化方法或软件架构指南),「补充阅读」里和这三条主线相关的延伸也值得快速扫一眼,今天的阅读就足够扎实了。
BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂,并逐渐理解你关注什么,让每天的阅读都更有方向、更省时间。