推文认为Prompt Engineering终结,Loop Engineering取而代之。典型场景:@karpathy晚上设好研究循环,自动改脚本、跑测试、保留正确结果、丢弃错误,人睡觉机器跑。四大支柱均来自生产环境:1)硬性退出条件与独立验证,防止模型“自认为完成”;2)上下文当有限预算管理,定期压缩、用子Agent隔离子任务;3)工具少而精、可安全重试、错误信息可读;4)Maker-Checker模式(如Claude Code已用),干活与检查分离。@bcherny总结:不再prompt Claude,而是写loops让它们跑。模型正成为标准件,工程价值转向长期自治系统设计。
Prompt Engineering已死,Loop Engineering接棒,
@karpathy 的做法我感觉最有画面感,晚上设好研究循环,自动改脚本,跑测试,留对的,扔错的,自己去睡觉,早上起来直接看结果,全程几乎不插手。
这就是现在圈里聊的Loop Engineering,从指挥AI一步步走,变成设计一个能自己跑完的系统。
四个支柱,每一个都是生产环境踩出来的血泪坑。
1️⃣知道什么时候停,别信它自己说搞定了,代码跑不通,逻辑有漏洞的情况比比皆是,要加硬性退出条件和独立验证,无数项目从demo到落地就死在这一步。
2️⃣保持上下文干净,循环跑久了旧错误,死胡同,冗余思考堆在一起,决策质量直线下滑,要把上下文当有限预算管,定期压缩,用子Agent隔离子任务。
3️⃣给真正能用的工具,不是堆一百个凑数量,要少而精不重叠,可安全重试,错误信息能被看懂,这是生产环境最容易翻车的地方。
4️⃣有能说不的机制,Agent不会挑自己的毛病,自己改作业永远满分,必须把干活的和检查的分开,也就是Maker-Checker模式,Claude Code团队早就在用了。