我们提前测试了 Meta 的 Muse Spark 模型,并在 FrontierMath 上进行了评估。其得分为… · AI HOT