向阳乔木@vista8

2026-05-20 02:04·44天前

AI 摘要

Yann LeCun离职Meta后创办AMI，押注基于世界模型的JEPA架构，与主流LLM不同。他批评LLM虽在语言任务有效，但缺乏预测行动后果和规划能力，无法真正理解物理世界且结构上不安全。LeCun倡导在抽象表示空间进行预测的自监督学习，以推动智能泛化。同时，他推进Tapestry项目，通过联邦学习构建去中心化的全球共识模型，应对AI控制集中化问题。

http://x.com/i/article/2056796739886264320

LeCun从Meta离职创业，押注一个"反LLM"的架构方向

Yann LeCun 有一个让人不舒服的习惯：他说的话，几年后往往会被证明是对的。

自监督学习、世界模型、表示空间预测……这些他在 2016 年 NeurIPS 主题演讲里就讲过的东西，今天已经成了整个行业的热词。

而他现在说的是：LLM 不是通往人类级智能的路，整个行业都在挖同一条错误的沟。

这是他接受播客 Unsupervised Learning 采访时的核心观点。

他刚从 Meta 离职，创办了新公司 AMI（Advanced Machine Intelligence），押注一个完全不同的架构方向。

LLM 能做什么，不能做什么

LeCun 的立场经常被误读。他不是说 LLM 没用。

"LLM 是很多有用 AI 产品的基础，我自己也在用。它们很好，就它们能做的事情而言。"

问题在于，它们能做的事情有一条清晰的边界：语言本身就是推理基底的领域。

数学证明、代码生成、法律文本……这些领域里，语言符号本身就承载了推理过程，LLM 在这里表现出色。

但一旦跳出这个边界，进入物理世界，问题就来了。

他举了一个例子：洗车店在你家 100 米外，你应该走路去吗？这个问题对人类来说显而易见，但 LLM 大多数时候会回答"应该走"。

因为它不理解"洗车"这件事的物理含义，它只是在操作语言符号。

更根本的问题是两个：

第一，LLM 无法预测自己行动的后果。

推理靠的是逐个预测下一个 token，不是对结果建模。

第二，LLM 没有规划能力。

规划需要搜索和优化，找到一个能达成目标的行动序列。自回归预测做不到这件事。

这两点，LeCun 认为是智能行为的核心。

缺了它们，无论模型规模多大，都不会到达人类级智能。

世界模型是什么，为什么重要

"世界模型"这个词现在已经快变成营销术语了，各家都在用。

LeCun 给了一个非常干净的定义：

世界模型就是让一个系统能够预测自己行动后果的东西。

就这么简单。

他拿一个水瓶举例：推瓶底，它会滑；推瓶口，它可能倒。

人类不需要在像素级别预测水怎么流，我们在抽象表示层做预测。

这个抽象层，就是世界模型的工作空间。

有了世界模型，系统就可以在脑子里"演练"一系列行动，找到能完成任务的那条路，然后再执行。

这是规划，不是自回归。

对比一下当前的机器人方案：大量依赖模仿学习，每个任务都要收集海量演示数据，换个场景就得重新来。

LeCun 的问题是：一个 17 岁的人，20 小时就能学会开车。我们有几百万小时的驾驶数据，还没做出 L5 自动驾驶。模仿学习哪里出了问题？

答案是：没有世界模型，系统无法泛化到没见过的情况。

JEPA：为什么不生成像素

LeCun 的架构叫 JEPA，Joint Embedding Predictive Architecture，联合嵌入预测架构。

理解它需要先知道为什么生成式方法不行。

直觉上，让模型"预测下一帧画面"似乎是学习世界规律的好方法。

但现实是高维、连续、充满噪声的，在像素层面做预测代价极高，而且学到的大多是无关紧要的细节。

JEPA 的思路是：不预测像素，在表示空间做预测。

把原始输入（图像、视频）编码成抽象表示，然后训练一个预测器，从一个表示预测另一个表示。

这样系统被迫学习的是语义层面的结构，而不是像素细节。

他在 Meta 的研究团队做了大量对比：生成式方法（VAE、掩码自编码器等）在图像和视频表示学习上的效果，系统性地不如 JEPA 类方法（DINO、V-JEPA 等）。

这个发现在他看来是决定性的："所有成功的表示学习架构都是非生成式的，所有生成式的基本上都失败了。"

这里有一个技术难题值得一提：JEPA 类方法有一个叫表示坍塌（representation collapse）的问题。

Meta 大佬观点推理

在 X 查看原推导出 Markdown

向阳乔木@vista8 · X

62导出 Markdown

2026-05-20 02:04·44天前

在 X 看原推· x.com

AI 摘要

http://x.com/i/article/2056796739886264320

LeCun从Meta离职创业，押注一个"反LLM"的架构方向

Yann LeCun 有一个让人不舒服的习惯：他说的话，几年后往往会被证明是对的。

自监督学习、世界模型、表示空间预测……这些他在 2016 年 NeurIPS 主题演讲里就讲过的东西，今天已经成了整个行业的热词。

而他现在说的是：LLM 不是通往人类级智能的路，整个行业都在挖同一条错误的沟。

这是他接受播客 Unsupervised Learning 采访时的核心观点。

他刚从 Meta 离职，创办了新公司 AMI（Advanced Machine Intelligence），押注一个完全不同的架构方向。

LLM 能做什么，不能做什么

LeCun 的立场经常被误读。他不是说 LLM 没用。

"LLM 是很多有用 AI 产品的基础，我自己也在用。它们很好，就它们能做的事情而言。"

问题在于，它们能做的事情有一条清晰的边界：语言本身就是推理基底的领域。

数学证明、代码生成、法律文本……这些领域里，语言符号本身就承载了推理过程，LLM 在这里表现出色。

但一旦跳出这个边界，进入物理世界，问题就来了。

LeCun从Meta离职创业，押注一个"反LLM"的架构方向

LLM 能做什么，不能做什么

世界模型是什么，为什么重要

JEPA：为什么不生成像素

LeCun从Meta离职创业，押注一个"反LLM"的架构方向

LLM 能做什么，不能做什么

安全问题：LLM 在结构上就不安全

图灵奖三人组为什么分道扬镳

他在 Meta 十年，真正做了什么

Tapestry：另一个不太一样的赌注

给研究者的一句话

世界模型是什么，为什么重要

JEPA：为什么不生成像素

安全问题：LLM 在结构上就不安全

图灵奖三人组为什么分道扬镳

他在 Meta 十年，真正做了什么

Tapestry：另一个不太一样的赌注

给研究者的一句话