AYi@AYi_AInotes

2026-06-25 18:51·7天前

AI 摘要

推文指出80%的Agent生产崩溃与模型智商无关，根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness（办公室制度、安保系统、质检流程，含独立验证节点、分层记忆、延迟绑定工具）和Loop（自我发现、任务分派、验证结果、状态记录）。好模型配差循环产生昂贵垃圾，普通模型配好循环加验证反而稳定出货。模型是可替换引擎，Harness是底盘安全系统，Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

说个反常识的判断， 80% 的 Agent 生产崩溃，跟模型智商没半毛钱关系，基本都死在上下文溢出、工具调错、子代理失控上， 2026 年真正的分水岭在 Harness 和 Loop，不是模型啊，

兄弟@wizardly_ai 这篇工程笔记写得很肝，但把这件事拆透了。 Harness 是什么，是给 Agent 配的办公室制度、安保系统和质检流程，让它不至于一激动就把公司搞砸。

独立验证节点是命脉，分层记忆不是全塞进 prompt，延迟绑定工具只给目录、用的时候再拉完整 schema。

Loop 是什么？是让它自己发现该干什么、分派任务、验证结果、记录状态，你不再是坐在电脑前一遍遍打 prompt 的人，你变成设计循环的人。

以前我们学怎么写 Prompt，后来学怎么编排 Agent，现在学怎么给 Agent 加运行时，下一步是学怎么让运行时自己跑。

Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny，现在写的是循环，不是 prompt。

最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效，好模型配差循环出昂贵垃圾，普通模型配好循环加验证反而能稳定出货。

模型是可替换的引擎， Harness 是让你不翻车的底盘和安全系统， Loop 是让你不用 24 小时盯着方向盘的自动驾驶。这三样加起来，才是能积累、能传承的 Agent 工程能力。这才是 2026 年真正该卷的东西吧 hhh