Berryxia.AI@berryxia Qwen-AgentWorld:原生语言世界模型,模拟7种Agent环境并超越Claude Opus 4.8和GPT-5.4Qwen-AgentWorld是一个原生语言世界模型,端到端以环境建模为训练目标,而非事后适配。它在单一模型中模拟MCP、Search、Terminal、SWE、Web、OS、Android等7种Agent环境,并在AgentWorldBench上超越Claude Opus 4.8和GPT-5.4。两个探索方向:1)将世界模型用作可控Sim RL的环境模拟器,模拟环境训练的Agent在部分任务上超过真实环境训练;2)仅做环境预测(不进行Agent训练)的预测能力零微调迁移到多轮Agent任务,在多个benchmark上均有提升。已开源35B MoE版本及对应benchmark。
Qwen: 📣📣 Meet Qwen-AgentWorld - a native language world model that simulates 7 agent environments (MCP, Search, Terminal, SW...
同一事件,精选展示《Qwen-AgentWorld:面向通用智能体的语言世界模型》
推荐理由:这是我最近看到最有想法的Agent方向探索,直接从环境建模入手,而不是让模型死记硬背操作,且零样本迁移能力很惊艳,做Agent的开发者必读。