高德地图在SEO增长场景的实践表明,当前AI智能体的核心挑战是如何管理与约束其生成能力。文章展示了将“从机会发现到发布”的长任务编排为可监控的带状态机工作流;使用文件化Memory管理所有产物以保证可追溯性;并贯彻“生成”与“评审”分离的“零信任”原则,评审方需独立验证所有声明。此外,他们对评审Agent本身进行Benchmark评估并多轮优化,以数据驱动其能力提升。该系统在“路书”功能验证中实现了全程无人介入、连续运行且主流程无Bug,印证了未来AI产品的竞争力在于构建围绕模型的可靠系统。
很多人谈 AI Agent,容易停留在一个很热闹的想象里:让 AI 自己发现需求、写代码、测试、上线,然后自动进入下一轮。
高德这篇文章真正有价值的地方,是它没有停留在想象,而是把这个过程拆成了一套可运行、可监控、可复盘的工程系统。
文章讲的是高德地图 PC 站在 SEO 增长场景下的一次实践:他们尝试用 Harness Engineering 的方式,让多个 AI Agent 协作完成从增长机会发现、方案设计、PRD 编写、架构设计、代码实现、测试验证到日常环境发布的完整流程。前期以「路书」功能做验证,从输入提案到发布日常环境,全程 0 人为介入,连续运行 4 小时,最终实现主流程无 P0 Bug。
但这篇文章最值得看的,不是「AI 又能自动开发了」,而是它展示了一个更本质的问题:当 AI 已经具备较强的生成能力之后,真正的难点变成了如何管理它、约束它、评估它,以及让它在长期任务中稳定工作。
文章里有几个很重要的实践。
第一,把长任务做成 workflow 和状态机。每个子 Agent 都要经历 DISPATCHED、ACKED、RUNNING、SUCCEEDED 或 FAILED,并通过心跳、超时、重试和失败处理来保证链路可控。这意味着系统不再是简单地「给 AI 一个任务」,而是像管理一组不稳定但能力很强的虚拟员工。