Sakana 把自家多智能体编排系统商业化了,SWE-Pro 等基准刷到 SOTA,但关键问题是:动态编排 frontier models 的成本和延迟,实际跑起来到底比单模型调用好多少?做 Agent 工作流的值得申请 beta 试试。
Sakana公司正式推出其商业AI产品Sakana Fugu的测试版,这是一个多智能体编排系统。该系统在SWE-Pro、GPQA-D和ALE-Bench等多个基准测试中达到了业界领先水平,能够动态协调前沿模型,为每个任务自主选择最优的智能体组合与角色。Fugu提供与OpenAI兼容的API,便于用户以最小改动集成到现有工作流中。产品线包括针对低延迟优化的Fugu Mini,以及利用完整模型池进行深度复杂推理的Fugu Ultra。目前可通过申请链接参与测试。
我们正在发布全新商业 AI 产品的 beta 测试版:Sakana Fugu 🐡,一个多智能体编排系统!
博客文章:https://sakana.ai/fugu-beta
Fugu 在 SWE-Pro、GPQA-D 和 ALE-Bench 上达到了 SOTA 水平,并且一直是我们内部的秘密武器。它能够动态协调前沿模型,针对每项任务自主选择最优的智能体组合与角色。
作为兼容 OpenAI 的 API 提供服务,你只需极少的改动就能将 Fugu 无缝集成到现有工作流程中。
🐟 Fugu Mini:针对延迟优化的高速编排 🐡 Fugu Ultra:利用完整模型池进行深度、复杂的推理
在此申请 beta 测试:https://forms.gle/BtKkhc2CfLKk1dvNA