开源深度研究系统Onyx在DeepResearch Bench上排名第一,超越了Claude和ChatGPT。其核心设计十分反直觉:顶层调度器(orchestrator)被完全剥夺了网络搜索和URL访问权限,仅负责任务分解与评估。这种约束迫使调度器专注于高阶战略思考,避免了传统系统中调度器因能搜索而过早给出浅层答案的缺陷。Onyx采用两层架构和三阶段流水线,并完全开源,支持接入企业内部数据源。
这个团队的研究也是有点反常识,对于LLM的研究调度也是有点不一样的研究。
一个开源团队发现把深度研究系统中最聪明的总指挥调节器直接剥夺搜索权限。
反而让整个系统在DeepResearch Bench上直接登顶吊打Claude和ChatGPT。
这个反直觉的设计让Onyx成为目前公开可用的最强深度研究员
它叫Onyx GitHub上已经完全开源你现在就能跑
故事听起来简单却戳穿了几乎所有大厂AI Agent的共同毛病。
传统深度研究系统包括OpenAI o1系列Anthropic和Google的方案都给调节器塞满了工具它能搜索网页打开链接读文档写报告一条龙到底。
结果呢?
调度器一拿到搜索权就忍不住自己动手它开始疯狂拉结果浅尝辄止根本不做高质量的任务分解最后产出的报告永远是表面级。
Onyx的团队观察到这个致命bug后做了件谁都没敢做的事把调度器的搜索工具彻底砍掉
它只能写任务brief只能分解query只能评估下级agent交回来的中间报告但它自己绝不能上网不能检索不能提前下结论
这一刀直接逼着调节器做真正的"高阶战略思考"