AI 摘要
微软研究团队发现,导致AI智能体在长视野任务中失败的核心瓶颈是任务视野长度,而非模型容量。随着目标距离增加,探索空间组合爆炸与信用分配模糊化使模型失效。解决之道并非增加算力,而是通过“视野缩减”:利用宏动作重新参数化动作空间,将多个低级决策压缩为一个高级动作。该方法能立即稳定训练,并使模型在训练时使用缩减视野,在推理时却能泛化到更长的原始视野,实现“视野泛化”。这一发现挑战了将长视野问题简单归因于模型能力的普遍观点。
Neat study on long-horizon agent generalization.
NEW paper from Microsoft Research. Nice study on long-horizon agent generalization. (bookmark it) The team runs a study where the only variable is task horizon ...