PlanningBench:一个用于评估和训练大语言模型的可扩展、可验证规划数据生成框架 · AI HOT