Muse Spark是Meta继Llama 4后推出的原生多模态推理模型,支持文本与图像输入。该模型在图像理解、医疗健康及代理搜索任务上达到SOTA水平,但Agent与多任务编排等主打功能评分未达顶尖。官方强调其计算效率较Llama 4 Maverick提升一个数量级,并透露更大模型正在开发中。技术路线采用"多小模型并行推理"策略,以低延迟换取性能,而非依赖单一大模型的长时间思考。
不是牛油果是缪斯! Meta刚刚发布了新模型!
Meta 刚刚终于发布了他们继Llama4后的首个大模型 Muse Spark! (我不确定到底应不应该翻译成缪斯哈) 这是一个原生多模态推理模型, 支持文本+图片输入.
从性能上看, 目前这个模型并不是 SOTA 级别的, 官方放出的分数表格很鸡贼, 我给大家画了一下哪个是最高的, 大家就可以看出, 这个模型更对是面向图像理解, 健康与医疗任务, 代理搜索类任务优化的(这三个SOTA了).而 Agent, 多任务编排, 并行推理, 视觉推理链这些虽然是这次的主打功能, 但是相关测试评分没有到达 SOTA 级别.
目前上下文窗口和参数量都没有公开, 不过官方报道里面提了一嘴 "The results are clear: we can reach the same capabilities with over an order of magnitude less compute than our previous model, Llama 4 Maverick"
并且说 "With larger models in development", 所以我们可以推测, 这并不是个旗舰模型, 而是系列模型中的先导模型, 并且从Blog中的技术介绍 "scaling Muse Spark with multi-agent thinking enables superior performance with comparable latency" 可以推测, 想表达的是 "跑 N 个小模型并行推理,而不是跑 1 个大模型长时间思考", 这个策略通常只对单模型足够小, 推理足够快时才有意义, 否则成本会爆炸.