VLA是否还记得基础知识?衡量视觉-语言-动作模型中常识与世界知识的保留程度 · AI HOT