TIPSv2:通过增强的 Patch-文本对齐推进视觉-语言预训练 · AI HOT