AYi@AYi_AInotes

2026-06-23 18:31·9天前

AI 摘要

日本团队 Sakana AI 推出 Fugu（Fugu Ultra），一个仅 0.6B 参数的多智能体编排系统，通过统一 API 调用。它不是单体大模型，而是 AI“项目经理”：简单任务自处理，复杂任务自动拆分，从全球模型池选择模型分配思考、执行、验证角色，多轮协作输出答案。编排策略由训练生成，而非手工 prompt。Fugu Ultra 在多个基准上超过 Claude 和 GPT，性能匹敌 Fable 和 Mythos，绕开 scaling law 军备竞赛。缺点包括黑箱性、复杂任务延迟高、简单任务成本更高。此举标志着多智能体编排从实验室走向可用生产力工具，开启编排层赛道。

全网都在吹日本Fugu跑分超GPT，但我敢说99%的人没看懂它真正炸场的地方。

首先这玩意儿根本不是什么超大单体大模型，

它全身上下只有0.6B参数，本职工作就其实就是个AI项目经理，

简单任务自己处理，复杂任务自动拆分，从全球顶级模型池里挑最合适的选手，分配思考执行验证三种角色，多轮协作最后合成答案。

你调用它和调普通模型没区别，一行API的事，但背后的编排策略是训练出来的，不是人手写prompt调路由磨出来的，它可以发掘出人类根本想不到的协作模式。

我觉得最狠的还不是跑分超了Claude和GPT，关键是它直接绕开了scaling law的军备竞赛。

不用堆万亿参数，不用砸超算中心，靠更聪明的协作机制就能摸到前沿模型的天花板，AI的竞争第一次从拼参数变成了拼管理。

当然不是银弹，比如黑箱不透明，复杂任务延迟更高，简单题用它反而更贵。

但这件事的信号意义比跑分数字重要一百倍，意味着多智能体编排从实验室玩具正式变成了可用的生产力工具。

orchestration layer这条新赛道，今天正式开跑咯🚀

Sakana AIIntroducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' model matches the performance of Fable and ...

智能体产品更新部署/工程

在 X 查看原推

AYi@AYi_AInotes · X

73导出 Markdown