AI 摘要
PlanBench-XL 评估LLM工具使用智能体在大型工具生态系统中的长时域规划能力
PlanBench-XL
Evaluating Long-Horizon Planning of LLM Tool-Use Agents in Large-Scale Tool Ecosystems
PlanBench-XL 评估LLM工具使用智能体在大型工具生态系统中的长时域规划能力
PlanBench-XL
Evaluating Long-Horizon Planning of LLM Tool-Use Agents in Large-Scale Tool Ecosystems
PlanBench-XL 评估LLM工具使用智能体在大型工具生态系统中的长时域规划能力
PlanBench-XL
Evaluating Long-Horizon Planning of LLM Tool-Use Agents in Large-Scale Tool Ecosystems