Jim Fan 揭示机器人'炫技易做家务难'的莫拉维克悖论成因
机器人领域存在"莫拉维克悖论":后空翻等杂技比做饭、清洁更容易实现。前者可在模拟中训练并零样本迁移,无需感知环境;后者需要真实的视觉、接触物理和物体动力学,难以模拟。这导致外界困惑——机器人能炫技却做不好家务,只因通用灵巧性仍是未解难题。
我正在观察机器人学内部的一个微型莫拉维克悖论:对人类来说困难的体操动作,对机器人来说反而比烹饪、清洁、组装这类“不性感”的任务容易得多。这导致圈外人士产生一种认知失调:“所以,机器人能做跑酷和霹雳舞,但为什么不能照看我的狗?”相信我,我被我父母问这个问题的次数比你想象的要多……
“机器人莫拉维克悖论”还造成一种错觉,让人觉得物理AI的能力远比实际水平先进得多。我不是在针对Unitree,这一现象普遍适用于近期行业里所有炫技式的杂技演示。这里有一个简单的测试:如果你在侧翻机器人前方立一堵墙,它会用全力撞上去,制造一场闹剧。因为它只是过拟合了那单个参考动作,对周围环境毫无感知。
悖论存在的原因如下:训练一个“盲人体操运动员”远比训练一个能看能操作的机器人容易。前者可以完全在仿真中解决,并零样本迁移到现实世界;而后者需要极度逼真的渲染、接触物理以及混乱的现实物体动力学——这些都无法很好地仿真。
想象一下,你可以不通过互联网来训练大语言模型,而是从纯粹手工打造的文本控制台游戏中训练。机器人研究者们算是撞了大运。我们恰巧生活在一个加速物理引擎已经如此出色的世界,以至于我们几乎不用任何真实数据就能实现令人印象深刻的杂技动作。但我们还没有发现同样的作弊码来实现通用的灵巧操作。
在那之前,我们依然会被困惑的父母追问。