NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE,让 AI 编程 agent 自主操控真实机器人做实验。系统自动搭建环境、重置场景、改进操控策略(从启发式到强化学习)、收集数据、分析失败并迭代代码,全程无需人类参与。高精度测试任务(细针脚插入、穿剪扎带、安装 GPU)中自主训练策略达 99% 成功率(pass@8)。测试了 Codex、Claude Code、Kimi Code 三款 agent,发现“物理 scaling law”:8 台机器人并行探索比 1 台或 4 台推进快得多。所有代码将开源。
NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来一轮,人类只需要早上起来看报告就行。
ENPIRE 的全称是 Agentic Robot Policy Self-Improvement in the Real World,由 NVIDIA GEAR 实验室联合 CMU、UC Berkeley 共同开发。Jim Fan 是 GEAR 实验室的联合负责人,他把这个方向叫 AutoResearch,意思是让 AI 来做科研。之前这个概念只在纯数字环境里跑通过,ENPIRE 是第一次把它搬到了物理世界。
系统的运作方式是这样的:给一组 AI 编程 agent 分配一队机器人、一批 GPU 和足够的 token 预算,然后设定一个目标,比如"尽快完成这个任务,让机器人保持忙碌但别出事"。接下来人就可以走了。
agent 会自动做四件事:
- 搭建环境:包括自动重置场景和自动判断成败
- 改进操控策略:从启发式学习到行为克隆到强化学习都会尝试