看到不等于知道:视觉语言模型 (VLMs) 是否知道何时不应回答空间问题(以及为什么)? · AI HOT