OpenAI发布了Codex的Windows版Computer Use功能。根据演示视频,Codex已能处理像素级的Windows原生GUI操作,例如在收到“测试我正在做的WinUI应用”指令后,能直接打开Paint(画图)应用,流畅地选择工具、调色并一笔一笔绘制图案,这展示了其vision-action loop的成熟度。官方通过WinUI测试等场景,暗示该功能面向真实的生产环境。同时,通过ChatGPT移动应用,用户可以从手机端启动、审核和引导Codex在Windows机器上执行任务,形成“手机指挥+桌面执行”的跨设备协作流程。
holy,发现OpenAI 的野心是真大啊,Codex可能是接下来普通人能用到的最顶的生产力工具🤔
昨晚OpenAI发布的Codex Windows版Computer Use,说是人类工作方式的一次范式级转变也不为过吧哈哈。
这Codex on Windows 视频,我看很多人都在截图那个 goblin,但我觉得更值得看的是 goblin 出现前的那 3 秒。
那 3 秒里,Codex 收到了一条指令:「测试我正在做的 WinUI 应用」,
兄弟们注意,这个不是"打开浏览器搜一下",也不是"写段代码",就是要测试一个 Windows 原生桌面应用,然后它打开了 Paint,选画笔、调颜色、一笔一笔拖出一个完整图案,整个过程特别丝滑流畅!
这意味着至少有两件事: 1 Codex 的 vision-action loop 已经能处理像素级 GUI 操作,不是点按钮,是真的在画画,这东西之前只在 macOS 上见过,现在 Window 版本竟然一步到位了!
2 官方刻意用 WinUI 测试开场,是在暗示:这不是玩具喔,我们在给开发者和企业用的真实生产环境!