多模态视觉语言模型的人类中心区域适应 · AI HOT