推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。
说个反常识的判断, 80% 的 Agent 生产崩溃,跟模型智商没半毛钱关系, 基本都死在上下文溢出、工具调错、子代理失控上, 2026 年真正的分水岭在 Harness 和 Loop,不是模型啊,
兄弟@wizardly_ai 这篇工程笔记写得很肝,但把这件事拆透了。 Harness 是什么, 是给 Agent 配的办公室制度、安保系统和质检流程, 让它不至于一激动就把公司搞砸。
独立验证节点是命脉,分层记忆不是全塞进 prompt, 延迟绑定工具只给目录、用的时候再拉完整 schema。
Loop 是什么? 是让它自己发现该干什么、分派任务、验证结果、记录状态,你不再是坐在电脑前一遍遍打 prompt 的人,你变成设计循环的人。
以前我们学怎么写 Prompt, 后来学怎么编排 Agent, 现在学怎么给 Agent 加运行时, 下一步是学怎么让运行时自己跑。
Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny, 现在写的是循环,不是 prompt。
最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效, 好模型配差循环出昂贵垃圾,普通模型配好循环加验证反而能稳定出货。
模型是可替换的引擎, Harness 是让你不翻车的底盘和安全系统, Loop 是让你不用 24 小时盯着方向盘的自动驾驶。 这三样加起来,才是能积累、能传承的 Agent 工程能力。 这才是 2026 年真正该卷的东西吧 hhh