腾讯指出,智能体在执行长任务时面临上下文信息堆积导致的成本增加与目标遗忘问题。其提出的解决方案是结合“上下文卸载”与“Mermaid任务画布”:将详细内容存至外部,上下文仅保留索引;并用图表将执行过程结构化为带状态与依赖的任务地图。方案采用分层记忆系统。实验显示,该方案在网页搜索任务中最高节省约61% Token,代码修复任务节省31%-33% Token且完成率提升,复杂任务通过率从20%提升至30%-35%。消融实验证明,结合任务画布的结构化压缩效果更优。
腾讯这篇文章讨论的是一个很现实的问题:Agent 做长任务时,越来越容易被自己的上下文拖垮。
我们平时让 Agent 搜索资料、读文件、改代码、跑测试、写报告,看起来每一步都很正常。但这些过程会不断产生大量中间信息:网页正文、搜索结果、工具返回、日志、代码片段、报错信息、旧版本方案。任务一长,这些内容就会不断堆进上下文里。
问题就来了。
上下文越来越长,Token 成本会越来越高;更麻烦的是,Agent 会被旧信息干扰。它可能忘记最初目标,重复搜索已经查过的资料,混淆不同子任务,或者被前面已经无关的日志带偏。也就是说,信息并没有丢,但它被堆得太乱,Agent 反而找不到重点。
所以文章要解决的核心问题是:
怎样让 Agent 在长任务里少背负冗余信息,同时还能记得任务进展,并在需要时找回原始证据。
作者提出的方案,可以概括为一句话:
短期记忆压缩 = 上下文卸载 + Mermaid 任务画布。
先说「上下文卸载」。
它的思路很简单:不是所有信息都要一直放在模型眼前。完整网页、完整日志、完整工具结果,可以先存到外部文件系统里。上下文里只保留一条摘要、一个路径、一个索引。等 Agent 真需要细节时,再通过路径把原文找回来。