Cursor 团队为训练 Composer 模型构建了一个始终运行的 Agent 舰队系统。主 Agent(Fleet Manager)在远程机器上运行,通过 SSH 连接数百台子 Agent 机器,利用本地工具和磁盘文件“inbox”实现状态共享与协调。每轮循环检查舰队健康,将故障推送至 Slack/PagerDuty,并主动终止或重启进程。子 Agent 并行执行研究实验。系统基于此前长运行 Agent 研究,主 Agent 拥有编码 ML 实验隐性知识的 Skills。核心是使用 Cursor 自身产品,通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。
为大规模训练 Composer 模型,Cursor 团队构建了始终运行的 Agent 舰队系统,本质是一个 Loop,实现数千个 Agent 的协同工作和自我管理
系统架构与工作原理
主 Agent(Fleet Manager): · 运行在大型远程机器上,配备本地常用工具 + 一个磁盘文件作为"inbox"(舰队共享收件箱) · 通过 SSH 连接数百台子 Agent 机器,收集状态并写入 inbox · 每轮循环检查舰队健康状况: · 保持健康任务后台运行 · 将故障/异常推送至 Slack 或 PagerDuty · 可主动控制舰队:终止、重启进程,处理瞬时故障
子 Agent:数百个并行运行的研究任务 Agent,专注于具体实验。
构建基础:基于 Cursor 此前公开的长运行 Agent 研究,赋予主 Agent 多项 Skills,这些技能编码了运行 ML 实验、审查监控结果等的隐性知识。
关键设计:使用 Cursor 自身产品,inbox 文件 + 良好 skills 实现状态共享和协调。