多模态大语言模型的乘法运算:基于文本、图像和音频输入的计算 · AI HOT