AI Agent 演进:从提示工程到系统工程 · AI HOT
ginobefun@hongming73162
2026-05-28 16:39·36天前
AI 摘要AI智能体(Agent)的发展正经历工程范式转变,核心是从Prompt Engineering转向更系统的工程构建。这体现在六大模块的演进:1)提示词按需加载上下文;2)规划能力可拆解复杂任务;3)记忆采用文件系统与检索混合模式;4)工具层直接使用CLI和Script;5)工作流与灵活的Skill模块混合;6)环境需要安全的Workspace与Runtime。总体而言,好的智能体是用工程系统来承载模型的不确定性,模型负责推理,系统负责边界。
ginobefun@hongming731 · X2026-05-28 16:39·36天前
在 X 看原推· x.comAI 摘要AI智能体(Agent)的发展正经历工程范式转变,核心是从Prompt Engineering转向更系统的工程构建。这体现在六大模块的演进:1)提示词按需加载上下文;2)规划能力可拆解复杂任务;3)记忆采用文件系统与检索混合模式;4)工具层直接使用CLI和Script;5)工作流与灵活的Skill模块混合;6)环境需要安全的Workspace与Runtime。总体而言,好的智能体是用工程系统来承载模型的不确定性,模型负责推理,系统负责边界。
- Environment:从无状态问答,到有运行环境
早期 Agent 更像聊天工具,问完答完就结束了,不需要太多运行环境。
现在不同了。Agent 要读写文件、执行命令、生成中间结果、保存 Memory、调用工具,就需要一个 Workspace,也需要 Runtime。
个人场景可以跑在本地电脑上,灵活但风险更高。企业场景更适合放进 Sandbox 或云端容器里,限制权限,隔离文件系统,避免误操作影响真实服务。
这一步很重要。Agent 能力越强,越不能只看效果,还要看权限、安全、审计和回滚。
总体来看,Agent 的变化不是某个单点技术升级,而是整个工程范式在变化。
过去我们更关心「怎么写好 Prompt」。现在更关键的是:怎么组织上下文,怎么拆任务,怎么沉淀记忆,怎么调用工具,怎么保留流程确定性,怎么给 Agent 一个安全的运行环境。
也就是说,好的 Agent 不是靠模型硬扛一切,而是用工程系统承载模型的不确定性。模型负责推理和执行,系统负责边界和秩序。Agent 真正成熟,大概就是从这里开始的。
现在的 Agent 已经更像一个会做任务管理的执行者。它可以把一个模糊的大目标拆成多个子任务,生成 Todo List,按步骤执行,遇到问题再调整计划。
这背后不是提示词技巧变神了,而是模型的推理能力、长上下文能力和指令遵循能力都变强了。
- Memory:从向量检索,到文件系统 + 检索混合
早期谈 Memory,常见做法是把资料放进向量数据库,用 RAG 检索出来再交给模型。
现在的方向更务实。短期记忆要做压缩和摘要,不再把所有对话都塞进上下文。长期记忆则越来越多地回到文件系统,比如用 Markdown 记录用户偏好、任务日志、项目知识、经验总结。
文件的好处是可读、可改、可组织。复杂场景再配合 SQLite、向量检索或企业级搜索,这样既保留召回能力,也让知识沉淀更可控。
- Tools:从 Function Call,到 CLI 和 Script
以前让 Agent 调工具,通常要把能力封装成 API,再写 Function Call 的 Schema。工具一多,开发和维护成本会很高。
现在越来越多 Agent 开始直接使用 CLI 和 Script。比如 git、grep、curl、npm、python 这些命令,对人来说有门槛,但对模型反而很自然,因为它在训练中见过大量类似内容。
Script 则可以把复杂流程封装起来。Agent 不需要理解所有接口细节,只要知道调用哪个脚本、传入什么参数就行。
这代表工具层正在从「人类适配模型」,变成「模型使用已有计算机能力」。
- Workflow:从固定流程,到 Skill 和 Workflow 混合
Workflow 曾经是 Agent 落地的主流方式。因为模型不够稳定,所以用固定流程限制它,保证第一步、第二步、第三步都按规则执行。
现在很多流程可以沉淀成 Skill。任务说明、执行步骤、边界条件写在 Markdown 里,关键动作交给 Script 执行。这样更灵活,也更容易复用。
但 Workflow 还没有过时。对稳定性要求高的场景,尤其是企业流程、审批、交易、生产系统,固定流程仍然很重要。更现实的做法是:Skill 负责灵活,Workflow 负责兜底。
- Environment:从无状态问答,到有运行环境
早期 Agent 更像聊天工具,问完答完就结束了,不需要太多运行环境。
现在不同了。Agent 要读写文件、执行命令、生成中间结果、保存 Memory、调用工具,就需要一个 Workspace,也需要 Runtime。
个人场景可以跑在本地电脑上,灵活但风险更高。企业场景更适合放进 Sandbox 或云端容器里,限制权限,隔离文件系统,避免误操作影响真实服务。
这一步很重要。Agent 能力越强,越不能只看效果,还要看权限、安全、审计和回滚。
总体来看,Agent 的变化不是某个单点技术升级,而是整个工程范式在变化。
过去我们更关心「怎么写好 Prompt」。现在更关键的是:怎么组织上下文,怎么拆任务,怎么沉淀记忆,怎么调用工具,怎么保留流程确定性,怎么给 Agent 一个安全的运行环境。
也就是说,好的 Agent 不是靠模型硬扛一切,而是用工程系统承载模型的不确定性。模型负责推理和执行,系统负责边界和秩序。Agent 真正成熟,大概就是从这里开始的。