# 雷军谈小米自动驾驶模型 Xiaomi OneVL：业内率先通过潜空间推理将 VLA、世界模型统一到一套框架

- 来源：IT之家（RSS）
- 发布时间：2026-05-14 08:57
- AIHOT 分数：67
- AIHOT 链接：https://aihot.virxact.com/items/cmp4tnad208o2sljxarwh8j06
- 原文链接：https://www.ithome.com/0/950/100.htm

## AI 摘要

小米技术正式发布并开源一步式潜空间语言视觉推理框架Xiaomi OneVL。该框架在业内率先通过潜空间推理，将视觉语言动作模型与世界模型统一到同一套框架中。在推理、规划等多个主流基准上，该模型全面刷新了潜在推理方法的性能上限，在精度上超越显式思维链方案，在速度上对齐“仅答案”预测的潜空间思维链方案。小米已全面开源其模型权重及训练、推理代码。

## 正文

IT之家 5 月 14 日消息，小米技术昨日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。

小米创办人、董事长兼 CEO 雷军昨晚发文谈及了小米自动驾驶模型 Xiaomi OneVL。他表示，Xiaomi OneVL 在业内率先通过潜空间推理，将 VLA、世界模型统一到同一套框架中。

雷军还提到，在推理、规划等多个主流基准上，Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。模型与代码全面开源。雷军最后还向全球开发者、研究人员发出邀请，探索自动驾驶大模型更多可能性。

根据小米技术官方介绍，Xiaomi OneVL 在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一，在具备 XLA 模型强悍推理能力的基础上，大幅提升了推理的速度和精度，是行业内具备开创性的方案，在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。

小米已将 Xiaomi OneVL 的模型权重和训练、推理代码全面开源，IT之家汇总链接如下：

技术报告：https://arxiv.org/abs/2604.18486

项目主页：https://Xiaomi-Embodied-Intelligence.github.io/OneVL

开源代码：https://github.com/xiaomi-research/onevl
