Stateful Visual Encoder:为视觉-语言模型引入有状态视觉编码器 · AI HOT