Geoffrey Hinton指出语言只是思考的工具之一,AI推理可以是真正的思考,因为语言本身就是一种思考形式。人类和AI能用文字建模,但真正思考超越文字,涵盖图像、空间感和物理运动等多模态。最聪明的系统是能整合所有模态的AI,这代表下一个大突破方向:让AI像人类一样通过多感官、多维度理解世界,从而打破智能边界。多模态是最终出路,但文本基础仍需巩固以确保发展效果。
Geoffrey Hinton直接把AI思考的本质讲透了! "语言只是思考的工具之一,不是全部。"
他说,人类和AI都能用文字建模几乎任何东西,但真正的思考远远超出文字,它还包括图像、空间感、物理运动这些更丰富的形式。
最聪明的系统,就是那个能把所有这些模态全部用起来的系统。
这才是下一个大突破的方向:不再是单纯把语言玩得更溜,而是让AI真正学会像人类一样,用多感官、多维度的方式去理解世界。
当AI开始同时掌握文字、图像、空间和动作的时候,智能的边界会彻底被打破。
所以多模态才是最终的出路?那么,文本的基础肯定也不能丢失,基石打好才有更好的发效果。