一篇由40位作者完成的综述论文提出了一个用于智能体研究的“能力层级×法则体系”世界模型分类框架。三个能力层级包括:进行单步预测的L1预测器、执行多步行动条件推演的L2模拟器,以及能随世界变化自我修订的L3演化器。法则体系涵盖物理、数字、社会与科学四大领域。该框架综合了400多篇文献和100多个代表性系统,覆盖基于模型的强化学习、视频生成、网页/GUI智能体、多智能体模拟和科学发现等领域,并识别了各层级的失败模式与评估原则。其核心价值在于,当智能体从聊天机器人转向目标达成者时,瓶颈从语言转向环境,此框架为不同领域的研究者提供了设计和评估世界模型的共同语言。
// Agentic World Modeling //
Massive 40-author survey just dropped. Cleanest taxonomy of world models in agent research I've seen.
(bookmark it)
The paper proposes a "levels × laws" framework.
Three capability levels:
L1 Predictors do one-step transitions
L2 Simulators do multi-step action-conditioned rollouts
L3 Evolvers self-revise as the world changes
It discusses four law regimes, including physical, digital, social, scientific.