日本团队 Sakana AI 推出 Fugu(Fugu Ultra),一个仅 0.6B 参数的多智能体编排系统,通过统一 API 调用。它不是单体大模型,而是 AI“项目经理”:简单任务自处理,复杂任务自动拆分,从全球模型池选择模型分配思考、执行、验证角色,多轮协作输出答案。编排策略由训练生成,而非手工 prompt。Fugu Ultra 在多个基准上超过 Claude 和 GPT,性能匹敌 Fable 和 Mythos,绕开 scaling law 军备竞赛。缺点包括黑箱性、复杂任务延迟高、简单任务成本更高。此举标志着多智能体编排从实验室走向可用生产力工具,开启编排层赛道。
全网都在吹日本Fugu跑分超GPT,但我敢说99%的人没看懂它真正炸场的地方。
首先这玩意儿根本不是什么超大单体大模型,
它全身上下只有0.6B参数,本职工作就其实就是个AI项目经理,
简单任务自己处理,复杂任务自动拆分,从全球顶级模型池里挑最合适的选手,分配思考执行验证三种角色,多轮协作最后合成答案。
你调用它和调普通模型没区别,一行API的事, 但背后的编排策略是训练出来的,不是人手写prompt调路由磨出来的,它可以发掘出人类根本想不到的协作模式。
我觉得最狠的还不是跑分超了Claude和GPT,关键是它直接绕开了scaling law的军备竞赛。
不用堆万亿参数,不用砸超算中心,靠更聪明的协作机制就能摸到前沿模型的天花板,AI的竞争第一次从拼参数变成了拼管理。
当然不是银弹,比如黑箱不透明,复杂任务延迟更高,简单题用它反而更贵。
但这件事的信号意义比跑分数字重要一百倍,意味着多智能体编排从实验室玩具正式变成了可用的生产力工具。