MapAgent:面向城市级车道级地图生成的工业级智能体框架
阅读原文· arxiv.org百度地图团队把Agent验证循环接入车道级地图生成,360+城市落地且自动化率超95%,复杂路口和长尾场景提升明显,做自动驾驶和在线地图的可以直接看结论。
MapAgent是一种工业级智能体架构,用于生成符合规范的车道级地图。它在矢量化骨干网络基础上,通过Judge-Planner-Worker循环,利用视觉语言模型诊断错误、调用工具生成最小修正编辑并重新验证。系统仅在骨干网络置信度低的瓦片区域选择性触发,保持高吞吐量。MapAgent已集成至百度地图,支撑全国360多个城市的车道级地图生成,整体生产自动化率超95%。
车道级地图是自动驾驶和车道级导航的关键基础设施,然而,为数百个城市构建和维护标准化的车道网络仍然高度依赖于人工。最近,端到端的矢量化建图方法可以直接从传感器数据预测车道几何和拓扑结构,但它们通常将建图规范与交通规则视为隐含的、依赖于数据集的监督信号。此外,在复杂场景(例如标线磨损、缺失或遮挡)中,仅凭视觉证据往往无法唯一确定正确的车道配置,导致规范违反成为人工后期编辑的主要来源。我们提出了 MapAgent,这是一个工业级的智能体架构,它增强了一个矢量化主干网络,用于生成符合规范的车道地图。MapAgent 并不仅仅是在地图预测中添加一个智能体循环,而是在一个有限的、由验证驱动的 Judge-Planner-Worker(评判-规划-执行)循环中,将主干感知与明确的规范验证、约束感知推理和确定性地图编辑相结合。一个视觉-语言评判器(Judge)通过联合检查视觉证据和草稿向量来诊断错误,而一个调用工具的规划器(Planner)则生成最小化的修正编辑,并在编辑后进行再验证。为了在城市场景的大规模生产中保持可扩展性,MapAgent 仅在主干网络置信度较低的地图瓦片上被选择性触发,从而在保持吞吐量的同时增加适度的开销。在真实世界数据集上的实验表明,与强大的生产基线相比,MapAgent 取得了持续的性能提升,尤其是在复杂和长尾场景中。此外,MapAgent 已被集成到百度地图中,支持全国超过 360 个城市的车道级地图生成,并将整体生产自动化率提升至 95% 以上,证明了 MapAgent 在大规模车道级地图生成中的实用性和有效性。