局部模态替换:实现更深度融合的视觉语言模型 · AI HOT