# 阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列

- 来源：IT之家（RSS）
- 发布时间：2026-06-16 12:21
- AIHOT 分数：54
- AIHOT 链接：https://aihot.virxact.com/items/cmqg6b4u000apslnctsf4e334
- 原文链接：https://www.ithome.com/0/964/748.htm

## AI 摘要

6月16日，阿里巴巴发布千问具身智能大模型Qwen-Robot系列，包括VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld。Qwen-RobotNav统一指令跟随、点/目标导航、目标追踪和自动驾驶四类任务；Qwen-RobotManip基于超38100小时开源语料库实现多机型训练；Qwen-RobotWorld通过自然语言动作接口跨场景预测物理规律。三个模型可单独或协同部署。此外，5月20日发布的Qwen3.7-Max在Arena全球大模型盲测总榜中位列国产模型第一。

## 正文

IT之家 6 月 16 日消息，阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列，包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld 三大模型。

这是千问大模型家族首个完整的具身智能模型系列 —— 三个模型分别为机器人装上灵巧的手、认路的脚和会思考的大脑，既可单独部署，也能协同运转，让不同形态的机器人迈向真实落地有了可靠的“通用底座”。

Qwen-RobotNav：物理智能体的行动入口 — 通过可控观测编码和工具接口，把视觉语言能力接入移动控制，统一了指令跟随、点 / 目标导航、目标追踪和自动驾驶四类任务

Qwen-RobotManip：物理智能体的交互基石 — 通过规范状态-动作空间和相机坐标系下的末端执行器增量位姿，把视觉语言能力接入操作控制，基于完全由开源数据构建的 >38,100 小时语料库实现了大规模多机型训练

Qwen-RobotWorld：物理智能体的无限世界 — 通过自然语言动作接口，把视觉语言能力接入世界动态预测，让同一个世界模型能够跨操作、驾驶和导航场景预测符合物理规律的未来。

IT之家注意到，5 月 20 日，阿里巴巴发布全新一代千问旗舰模型 Qwen3.7-Max，在三方机构 Arena 全球大模型盲测总榜中，Qwen3.7-Max 超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与 GPT、Claude、Gemini 最强模型接近，位列国产模型第一。