AYi@AYi_AInotes

2026-06-25 01:14·8天前

AI 摘要

推文认为Prompt Engineering终结，Loop Engineering取而代之。典型场景：@karpathy晚上设好研究循环，自动改脚本、跑测试、保留正确结果、丢弃错误，人睡觉机器跑。四大支柱均来自生产环境：1）硬性退出条件与独立验证，防止模型“自认为完成”；2）上下文当有限预算管理，定期压缩、用子Agent隔离子任务；3）工具少而精、可安全重试、错误信息可读；4）Maker-Checker模式（如Claude Code已用），干活与检查分离。@bcherny总结：不再prompt Claude，而是写loops让它们跑。模型正成为标准件，工程价值转向长期自治系统设计。

Prompt Engineering已死，Loop Engineering接棒，

@karpathy 的做法我感觉最有画面感，晚上设好研究循环，自动改脚本，跑测试，留对的，扔错的，自己去睡觉，早上起来直接看结果，全程几乎不插手。

这就是现在圈里聊的Loop Engineering，从指挥AI一步步走，变成设计一个能自己跑完的系统。

四个支柱，每一个都是生产环境踩出来的血泪坑。

1️⃣知道什么时候停，别信它自己说搞定了，代码跑不通，逻辑有漏洞的情况比比皆是，要加硬性退出条件和独立验证，无数项目从demo到落地就死在这一步。

2️⃣保持上下文干净，循环跑久了旧错误，死胡同，冗余思考堆在一起，决策质量直线下滑，要把上下文当有限预算管，定期压缩，用子Agent隔离子任务。

3️⃣给真正能用的工具，不是堆一百个凑数量，要少而精不重叠，可安全重试，错误信息能被看懂，这是生产环境最容易翻车的地方。

4️⃣有能说不的机制，Agent不会挑自己的毛病，自己改作业永远满分，必须把干活的和检查的分开，也就是Maker-Checker模式，Claude Code团队早就在用了。

@bcherny 说得最直白，我已经不prompt Claude了，我写loops，然后让它们跑。

模型正在慢慢变成标准件，同一个模型，配上更好的循环设计，效果能从中等拉到顶级。真正的工程价值，早就从单次对话转移到了长期自治系统的设计上。

做Agent的朋友可以对照着查一遍，什么时候你从写提示词的人，变成了设计系统的人，什么时候才算摸到了下一阶段的门槛。

Akshay 🚀http://x.com/i/article/2069072431252434944

智能体大佬观点现象/趋势

在 X 查看原推

AYi@AYi_AInotes · X

58导出 Markdown