当前视频生成模型仅学到“手靠近→杯子动”的相关性,而非因果机制,导致抓杯子时杯子提前飞起。Aether AI 创始人黄碧薇教授提出因果世界模型(Causal World Model),旨在让 AI 理解物理运行机制而非仅预测表象。其 benchmark 显示,引入因果结构可使机器人成功率提升 25-50%,样本需求降低 5-10 倍。这标志着下一代 AI 需从“知道是什么”进化到“知道为什么”,尤其在机器人、自动驾驶等真实物理场景中。
AI有些地方真的还是"啥也不是的层面"! 空白和进步空间巨大!
AI现在连抓个杯子都抓不对,手还没真碰到,杯子自己就飞起来了。
极客公园这期对谈里,Aether AI创始人黄碧薇教授举了这个例子:今天的视频生成模型学的是"手靠近杯子,杯子常常会动"这种相关性,而不是"为什么动、我这一抓到底会发生什么"这种因果。
聊天里说错话改改就行,可一旦进入物理世界--机器人、自动驾驶、生物医药。
一个变量算错,后果就是真的。幻觉在这里可没那么好玩。
所以下一代AI的分野,不是把世界预测得更像,是真正理解世界为什么这样运行。
这就是因果世界模型想干的事:让AI不只看表象,更看懂机制。
黄教授团队的benchmark显示,因果结构能让机器人成功率提升25-50%,样本需求降5-10倍。
同一堆数据,换个结构,经济性直接变了。
以前大家觉得规模化利用相关性就能一路走到黑,现在物理世界把这套玩法直接打脸了。 真正的智能,得从"知道是什么"进化到"知道为什么"。