语言模型评估中的多项选择归一化 · AI HOT