Deep Research Agent正从实时搜索循环演进为两阶段工作流:第一阶段通过网络调研将知识沉淀为本地文件(.md/.json/.csv),实现知识"具象化"存储;第二阶段Agent直接挂载这些文件进行离线迭代,彻底切断网络调用。这种"探索与利用解耦"架构带来确定性、毫秒级读取速度、一致性校验和Token成本优化四重优势,使长周期任务转向基于静态知识库的高效内循环。
这个思路可以借鉴,将传统 deep research agent 分成两个阶段,先尽可能的搜索可能的信息,保存成本地文件,然后基于本地文件去生成报告。
原推翻译:
在2025年,深度研究的套路非常直线:上网搜索 → 阅读内容 → 逻辑推理 → 不断重复,直到得出结果。在这个过程中,哪怕是执行最小的循环步骤,AI 都会去互联网上重新抓取一遍数据。
但到了2026年,处理长周期任务被明确划分成了两个截然不同的阶段:
阶段一:通过网络读写进行调研与规划。 这一阶段仍然是搜索、阅读和推理,但请注意,目标不再是直接给出最终答案。它的唯一任务是把互联网上的零散知识"具象化",全部沉淀并保存成我们本地硬盘里的文件(比如 .md、.json 或 .csv 格式的文件)。
阶段二:智能体"挂载"本地文件,开启内循环。 这时,AI 智能体像插入硬盘一样挂载这些整理好的本地文件,然后只对着这些文件进行阅读、执行代码和写入操作。从此以后,它再也不需要通过联网来做信息对齐(grounding)了。
为什么要在第二阶段毫不留情地砍掉联网获取信息的环节呢?原因有四点:
- 确定性(Determinism): 本地文件就像是时间静止的快照,里面的内容绝不会变。而网上的内容太不稳定了,随时可能被修改、变成 404 无法访问,或者突然弹出一个付费墙拦住你的去路。
- 速度(Speed): 读取本地硬盘的数据只需要几毫秒,而去网上抓取一个网页动辄要花上好几秒。AI 智能体在执行循环任务时,需要的是飞快、紧凑的迭代速度,网络延迟是绝对等不起的。