# Agent生产崩溃80%与模型无关，Harness与Loop才是2026分水岭

- 来源：AYi (@AYi_AInotes)
- 发布时间：2026-06-25 18:51
- AIHOT 分数：61
- AIHOT 链接：https://aihot.virxact.com/items/cmqtemykg02xysl0ew3qyfe3c
- 原文链接：https://x.com/AYi_AInotes/status/2070097636829307284

## AI 摘要

推文指出80%的Agent生产崩溃与模型智商无关，根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness（办公室制度、安保系统、质检流程，含独立验证节点、分层记忆、延迟绑定工具）和Loop（自我发现、任务分派、验证结果、状态记录）。好模型配差循环产生昂贵垃圾，普通模型配好循环加验证反而稳定出货。模型是可替换引擎，Harness是底盘安全系统，Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

## 正文

说个反常识的判断，
80% 的 Agent 生产崩溃，跟模型智商没半毛钱关系，
基本都死在上下文溢出、工具调错、子代理失控上，
2026 年真正的分水岭在 Harness 和 Loop，不是模型啊，

兄弟@wizardly_ai 这篇工程笔记写得很肝，但把这件事拆透了。
Harness 是什么，
是给 Agent 配的办公室制度、安保系统和质检流程，
让它不至于一激动就把公司搞砸。

独立验证节点是命脉，分层记忆不是全塞进 prompt，
延迟绑定工具只给目录、用的时候再拉完整 schema。

Loop 是什么？
是让它自己发现该干什么、分派任务、验证结果、记录状态，你不再是坐在电脑前一遍遍打 prompt 的人，你变成设计循环的人。

以前我们学怎么写 Prompt，
后来学怎么编排 Agent，
现在学怎么给 Agent 加运行时，
下一步是学怎么让运行时自己跑。

Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny，
现在写的是循环，不是 prompt。

最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效，
好模型配差循环出昂贵垃圾，普通模型配好循环加验证反而能稳定出货。

模型是可替换的引擎，
Harness 是让你不翻车的底盘和安全系统，
Loop 是让你不用 24 小时盯着方向盘的自动驾驶。
这三样加起来，才是能积累、能传承的 Agent 工程能力。
这才是 2026 年真正该卷的东西吧 hhh

### 引用推文

> Wizard：http://x.com/i/article/2069720576693022720
