AYi@AYi_AInotes

2026-06-16 20:48·16天前

AI 摘要

OpenAI Codex 2026版以统一执行层+编排中枢架构覆盖App、CLI、IDE、Cloud、Web五入口，模型迭代至GPT-5.4 for Codex，Spark版快15倍。平台层由MCP、Skills（开放标准）、Plugins（可分发）构成。SWE-Bench Pro Public上56.8%微弱领先，OSWorld-Verified 64.7%接近人类；Claude Code在百万token重构占优，Codex强在异步执行与并行调度。最佳实践：Prompt含Goal/Context/Constraints/Done-when，用AGENTS.md固化持久指令，MCP按高频痛点优先配置。

http://x.com/i/article/2066860172387995648

所有深度用 AI 编程的朋友，这篇 Codex 全景指南值得存好，架构生态横评和最佳实践一次讲透

有个细节我琢磨了好几天，OpenAI 给 GPT-5.3-Codex 下的官方定语很有意思，没有说是最强编程模型，而是一句有点耐人寻味的话--第一个对创造自身起到关键作用的模型。

我翻译一下：OpenAI 自己的工程师，已经在用 Codex 来造下一代 Codex 了。

我觉得这句话比任何 benchmark 都狠，它告诉我们，除了这个模型有多强，还有就是这个模型已经成了 OpenAI 自己的研发底盘。

也就是说2021 年那个被弃用的补全工具、去年那个帮你改 bug 的助手--跟现在这个比，根本不是一个物种。

我决定写一个系列，这是第一篇。

这篇不讲具体操作，先把全景图铺开：它的架构到底长什么样、核心能力在哪、跟 Claude Code / Cursor / Devin 比谁更能打、官方给的最佳实践有什么能直接抄。后面几篇再一个一个拆--AGENTS.md、Skills、MCP、多 Agent 编排的实操。

▸ 五个入口，一套配置--先搞懂这个，后面才不会晕

▸ 插件化 + MCP + Skills：这才是它跟别人拉开身位的地方

▸ 为什么我说它是目前最强执行引擎（附一张对比表，也说说它的软肋）

▸ 七条能直接抄的官方最佳实践

一、先搞懂架构--一套执行层，长了五张脸

我第一次把 2026 版 Codex 的所有入口捋了一遍之后，才明白为什么很多人刚接触会懵，因为它同时出现在五个地方：App、CLI、IDE 插件、Cloud、Web。

所以这不只是五个产品那么简单，更像是是一套统一执行层 + 编排中枢，长了五张脸。

Codex App：桌面命令中心，macOS 版，今年最大的形态变化。

定位很明确--AI 编程的指挥中心，你可以在里面并行跑活、管长时任务、加 skills 和 automations、审查 diff，全程沙箱保安全。

为什么今年才出桌面端？OpenAI 自己的解释我挺认同的--2025 年 4 月 Codex 刚出的时候，问题还是"agent 能干什么"；

到了今年，模型能端到端处理复杂长时任务了，问题变成了"怎么同时管好一堆 agent"。

那问题变了，界面就得跟着变。

CLI + IDE 插件：

终端和编辑器里的深度集成，这里有一个细节我踩过一次坑才注意到--它们共用同一份配置，在一个表面改了 config，另一个表面立刻生效，不用各配一遍 MCP，很细节的一件事，但挺省心的。

Cloud Sandbox：异步执行的核心。长时任务、并行工作全挂云上，不占你本地资源，跑完进审查队列。

Web / ChatGPT 集成：统一登录，所有表面共享 Skills、MCP 配置、AGENTS.md 记忆。

模型底座：这条时间线值得看一眼，因为一年里迭代太密了：

2025 年 12 月 GPT-5.2-Codex → 2026 年 2 月 5 日 GPT-5.3-Codex → 2 月 12 日 GPT-5.3-Codex-Spark（纯文本、低延迟小号版） → 3 月 5 日 GPT-5.4 for Codex。其中 Spark 那步我特别想提一嘴--它是 OpenAI 第一个跑在 Cerebras 硬件上的生产模型，比早期 Codex 快 15 倍，专门为实时交互编码做的。这步棋的意义不是"更快了"，是"可以一边聊一边出代码了"。

AYi@AYi_AInotes · X

55导出 Markdown

2026-06-16 20:48·16天前

在 X 看原推· x.com

AI 摘要

http://x.com/i/article/2066860172387995648

所有深度用 AI 编程的朋友，这篇 Codex 全景指南值得存好，架构生态横评和最佳实践一次讲透

我翻译一下：OpenAI 自己的工程师，已经在用 Codex 来造下一代 Codex 了。

我觉得这句话比任何 benchmark 都狠，它告诉我们，除了这个模型有多强，还有就是这个模型已经成了 OpenAI 自己的研发底盘。

也就是说2021 年那个被弃用的补全工具、去年那个帮你改 bug 的助手--跟现在这个比，根本不是一个物种。

我决定写一个系列，这是第一篇。

所有深度用 AI 编程的朋友，这篇 Codex 全景指南值得存好，架构生态横评和最佳实践一次讲透

一、先搞懂架构--一套执行层，长了五张脸

所有深度用 AI 编程的朋友，这篇 Codex 全景指南值得存好，架构生态横评和最佳实践一次讲透

二、插件化 + MCP + Skills--这三层才是真正的分水岭

三、为什么我说它是目前最强执行引擎--但也别神化

四、能直接抄的七条官方最佳实践

写在最后

一、先搞懂架构--一套执行层，长了五张脸

二、插件化 + MCP + Skills--这三层才是真正的分水岭

三、为什么我说它是目前最强执行引擎--但也别神化

四、能直接抄的七条官方最佳实践

写在最后