开发者 AlexFinn 在连续两个月、每天数小时并行使用 Codex 和 Claude Code 后,决定转向 Codex。其核心原因在于 Codex 拥有强大的自测闭环功能:每次代码改动后,它会在内置浏览器中自动验证,形成“改→测→修”的自动化循环。这一机制将首次交付有 bug 的改动比例从约 40% 显著降低至 ≤3%,可靠性大幅提升,更利于开发者保持心流。他建议开发者不要对任何公司忠诚,应始终使用当下最好的工具。
连续两个月,每天数小时,Codex 与 Claude Code 并行使用后,@AlexFinn 决定转向 Codex,为什么?
在 Alex 的判断中,关键变量是:模型智商或代码生成速度已不是关键,自测闭环更重要,Codex 会在内置浏览器里验证每次改动,形成「改 → 测 → 修」的自动化循环。
Codex 自测闭环后,从 40% 的改动首次交付就有 bug,到 ≤3%,可靠性明显提升,更容易进入心流。
我的补充:除内置浏览器外,Codex 还有 Computer Use 和 Chrome 扩展可以搭配使用,做网站自动化验证测试。