Anthropic内部透露,99%工程师运行300+自改进agent swarm。核心是“close the loop”——模型自验证输出,包含计划、动态工作流、自我检查并迭代。效果远超多数300美元agent课程,但token消耗更高。
今天飞机上听了一下Anthropic "人精"们的演讲分享,觉得不错分享给大家。(含中英字幕)
Anthropic内部的人说,他们99%的工程师都在跑300+个自改进的agent swarm。
核心不是堆更多agent,而是"close the loop",给模型一个验证自己输出的机制。
让它自己跑计划模式、动态工作流、自我检查,然后根据真实反馈迭代。
他们内部已经在大量使用这种自循环系统,效果据说远超大多数花300美元买的agent课程。
关键在于不是一次性生成,而是让agent在多次尝试中不断修正和进化。
这其实把agent从"工具"变成了"能自我迭代的系统"。
当验证和反馈真正进入循环后,agent的可靠性会大幅提升,而不是只靠第一次输出赌对错。
当然,这也意味着token消耗会更高,但换来的是明显更强的执行能力和自我纠错能力。