Google博客以“新员工入职协调Agent”为例,指出AI智能体从演示走向生产需完成三大架构转变,核心是上下文与状态解耦。首先,采用持久化状态机,通过明确进度节点替代对话历史记录状态,解决上下文污染、token成本爆炸和推理幻觉问题。其次,引入事件驱动休眠门控,使Agent在等待外部事件时挂起以零资源消耗。最后,通过多Agent委托机制,将专项任务交由独立子Agent处理,避免提示词膨胀并支持独立优化。完整示例代码已开源。
构建支持暂停、恢复且永不丢失上下文的长时间运行 AI 智能体(基于 ADK)
大多数 Agent 教程的终点是一个无状态的聊天机器人,容器一重启,什么都忘了。但真实的企业工作流不可能在一次 API 调用里完成。HR 入职流程跨越两周,发票纠纷要等供应商回复几天,销售跟进序列拉开一个月。这些流程被大量「空闲等待」主导,无状态架构天然无法应对。
Google 博客通过一个「新员工入职协调 Agent」实例,展示了三项让 Agent 从 Demo 走向生产的架构转变。
第一项是持久化状态机。不再靠对话历史追踪进度,而是定义显式的状态 schema:START、WELCOME_SENT、DOCUMENTS_SIGNED、IT_PROVISIONED、HARDWARE_DELIVERED、COMPLETED,六个明确节点。Agent 每次唤醒,从 session state 而非聊天记录里读取当前位置。这彻底解决了三个无状态架构的致命问题:对话历史在数百轮后充满过期噪音(上下文污染)、每次推理都要重放完整历史(token 成本爆炸)、长时间空闲后恢复时模型幻觉出从未发生过的中间步骤(推理幻觉)。
第二项是事件驱动休眠门控。Agent 在等待人工签字时不再主动轮询,而是挂起自身,等到外部事件(如文件签署通知)到达后才被唤醒。零资源占用,不会因为长时间等待而消耗 token 或算力。
第三项是多 Agent 委托。IT 账号配置这类专项任务,交给独立的 IT 子 Agent 完成,主 Agent 只负责协调和状态推进。这避免了单体 Agent 提示词膨胀,也让各子任务可以独立优化。