# AI Agent 演进：从提示工程到系统工程

- 来源：ginobefun (@hongming731)
- 发布时间：2026-05-28 16:39
- AIHOT 分数：62
- AIHOT 链接：https://aihot.virxact.com/items/cmppax0be0dgkslv4uuhytwxb
- 原文链接：https://x.com/hongming731/status/2059917580538962334

## AI 摘要

AI智能体（Agent）的发展正经历工程范式转变，核心是从Prompt Engineering转向更系统的工程构建。这体现在六大模块的演进：1）提示词按需加载上下文；2）规划能力可拆解复杂任务；3）记忆采用文件系统与检索混合模式；4）工具层直接使用CLI和Script；5）工作流与灵活的Skill模块混合；6）环境需要安全的Workspace与Runtime。总体而言，好的智能体是用工程系统来承载模型的不确定性，模型负责推理，系统负责边界。

## 正文

Agent 这几年变化很快，但如果只盯着 Claude Code、Codex、OpenClaw、Hermes 这些新名字，很容易越看越乱。

更好的理解方式，是回到 Agent 的几个基本模块：Prompt、Planning、Memory、Tools、Workflow、Environment。名字看起来没变，但里面的实现方式已经变了很多。

1. Prompt：从写一大段提示词，到按需加载上下文

早期做 Agent，很多精力都花在写 System Prompt 上。一个任务一个 Agent，一个 Agent 一大段提示词，里面塞满角色、目标、规则、示例和注意事项。

现在的趋势是把 System Prompt 变轻，只保留稳定的底层规则。真正会变化的内容，比如任务流程、领域知识、用户偏好、工具说明，会拆到 SKILL.md、AGENTS.md、USER.md 这类文件里。

Agent 需要什么，就读什么。这其实是从 Prompt Engineering 走向 Context Engineering。

2. Planning：从一步步想，到能拆解长任务

早期 Planning 很多时候只是让模型「一步一步思考」。简单问题还可以，任务一长就容易断。

现在的 Agent 已经更像一个会做任务管理的执行者。它可以把一个模糊的大目标拆成多个子任务，生成 Todo List，按步骤执行，遇到问题再调整计划。

这背后不是提示词技巧变神了，而是模型的推理能力、长上下文能力和指令遵循能力都变强了。

3. Memory：从向量检索，到文件系统 + 检索混合

早期谈 Memory，常见做法是把资料放进向量数据库，用 RAG 检索出来再交给模型。

现在的方向更务实。短期记忆要做压缩和摘要，不再把所有对话都塞进上下文。长期记忆则越来越多地回到文件系统，比如用 Markdown 记录用户偏好、任务日志、项目知识、经验总结。

文件的好处是可读、可改、可组织。复杂场景再配合 SQLite、向量检索或企业级搜索，这样既保留召回能力，也让知识沉淀更可控。

4. Tools：从 Function Call，到 CLI 和 Script

这是很关键的变化。

以前让 Agent 调工具，通常要把能力封装成 API，再写 Function Call 的 Schema。工具一多，开发和维护成本会很高。

现在越来越多 Agent 开始直接使用 CLI 和 Script。比如 git、grep、curl、npm、python 这些命令，对人来说有门槛，但对模型反而很自然，因为它在训练中见过大量类似内容。

Script 则可以把复杂流程封装起来。Agent 不需要理解所有接口细节，只要知道调用哪个脚本、传入什么参数就行。

这代表工具层正在从「人类适配模型」，变成「模型使用已有计算机能力」。

5. Workflow：从固定流程，到 Skill 和 Workflow 混合

Workflow 曾经是 Agent 落地的主流方式。因为模型不够稳定，所以用固定流程限制它，保证第一步、第二步、第三步都按规则执行。

现在很多流程可以沉淀成 Skill。任务说明、执行步骤、边界条件写在 Markdown 里，关键动作交给 Script 执行。这样更灵活，也更容易复用。

但 Workflow 还没有过时。对稳定性要求高的场景，尤其是企业流程、审批、交易、生产系统，固定流程仍然很重要。更现实的做法是：Skill 负责灵活，Workflow 负责兜底。

6. Environment：从无状态问答，到有运行环境

早期 Agent 更像聊天工具，问完答完就结束了，不需要太多运行环境。

现在不同了。Agent 要读写文件、执行命令、生成中间结果、保存 Memory、调用工具，就需要一个 Workspace，也需要 Runtime。

个人场景可以跑在本地电脑上，灵活但风险更高。企业场景更适合放进 Sandbox 或云端容器里，限制权限，隔离文件系统，避免误操作影响真实服务。

这一步很重要。Agent 能力越强，越不能只看效果，还要看权限、安全、审计和回滚。

总体来看，Agent 的变化不是某个单点技术升级，而是整个工程范式在变化。

过去我们更关心「怎么写好 Prompt」。现在更关键的是：怎么组织上下文，怎么拆任务，怎么沉淀记忆，怎么调用工具，怎么保留流程确定性，怎么给 Agent 一个安全的运行环境。

也就是说，好的 Agent 不是靠模型硬扛一切，而是用工程系统承载模型的不确定性。模型负责推理和执行，系统负责边界和秩序。Agent 真正成熟，大概就是从这里开始的。