OpenAI内部报告:智能体Codex如何改变工作
阅读原文· openai.comOpenAI 第一次用内部数据量化智能体如何改变工作,非开发者增速 137 倍比工程师还猛,Codex 已经吃掉内部 99.8% 的输出 token——这不是产品更新,但比大多数发布会都更值得做策略的人看一眼。
OpenAI 在2025年8月至2026年6月间观察到,智能体产品 Codex 取代 ChatGPT 成为主要工作工具,各部门输出 token 中 Codex 占比从不足10%升至99.8%。80.6%个体用户曾发起预计等效人类工作时间超30分钟的请求,70.2%超1小时,25.6%超8小时;99百分位用户每日生成超60小时 agent turns。非开发者用户增长迅猛:个体用户增长137倍,组织用户增长189倍。Legal、Finance、Recruiting 部门在2026年4月前后跨过 Codex 使用过半拐点,平均每位律师或招聘人员超85%输出 token 来自 Codex。
智能体如何改变工作方式 | OpenAI
2026年6月25日
公司
智能体如何改变工作方式
一份新的经济研究论文,在前沿层面衡量 Codex 的经济潜力。
阅读论文
智能体 AI 将知识工作的单位从单次交互转变为委托式的、长周期任务。聊天机器人的交互往往简短且独立。智能体可以自主运行数分钟甚至数小时,统筹调用工具、与环境交互、并迭代求解方案。因此,智能体正迅速成为工作中最强大的 AI 工具。
过去一年,我们在 OpenAI 内部亲身见证了这场转变。在 Codex 向公众发布后的最初几个月里,ChatGPT 仍是 OpenAI 内部默认的工作 AI 工具。截至 2025 年 8 月,OpenAI 员工平均只有不到 10% 的模型 token 用于 Codex。而现在,包括法律、招聘等非技术部门在内的每个部门,都已将 Codex 作为首要的工作 AI 工具。这种模式反映了我们相信的未来工作方式——随着智能体工具能力的扩展和可及性的提升,这一切将成为现实。
Codex 活跃用户占比
Codex 输出 token 占比
Codex 的采用与其能力同步增长。随着 Codex 利用更强的模型和新的产品功能,它逐渐能够承担更多富有成效的任务。在个人用户、组织用户和 OpenAI 员工这三类群体中,我们记录了过去一年的四个趋势:
- 人们使用 Codex 完成更长周期的工作。截至 2026 年 5 月,80.6% 的抽样个人用户至少提出过一次预计超过 30 分钟人力的 Codex 请求,70.2% 的用户至少提出过一次预计超过 1 小时的请求,25.6% 的用户至少提出过一次预计超过 8 小时的请求。
- Codex 成为 OpenAI 每个部门的首要 AI 工具。工程部门率先迁移,但法务、财务和招聘部门也在 2026 年 4 月左右将 Codex 作为他们的首要 AI 工具。对于普通 OpenAI 员工而言,Codex 的使用现在占输出 token 的 85% 以上。由于 Codex 用户往往比非用户使用更多 token,因此它在整体 token 中的占比更高:Codex 占 OpenAI 内部每周输出 token 的 99.8%。
- 非开发者用户的采用增长尤其迅速,超过了开发者用户的增速。自 2025 年 8 月以来,非开发者用户在个人用户中增长了 137 倍,在组织用户中增长了 189 倍,在 OpenAI 内部增长了 12 倍。
- Codex 使 OpenAI 员工能够执行其岗位描述之外的任务。虽然技术性使用在工程师中仍然最为普遍,但非技术用户也经常使用 Codex 进行编码或技术执行,包括自动化、数据转换、工具开发、调试和结构化分析。
AI 智能体在更困难的任务上工作时间更长。
近四分之一的 Codex 请求是针对需要一个人超过一小时才能完成的任务¹。随着 Codex 独立处理长上下文任务的能力提升,用户从短交互转向了更困难、耗时更长的任务。
下面的图表估算了跨越四个人工时间阈值的个人用户比例:需要一个人超过 30 分钟、超过一小时、超过四小时和超过八小时的任务²。从 2025 年 12 月到 2026 年 5 月,提出估计对应需要一个人超过 30 分钟的工作请求的用户比例上升至 80.6%。提出需要一个人超过一小时的工作请求的比例上升至 70.2%。提出需要一个人超过八小时的工作请求的比例从低基数增长最快。
智能体使用量的增长可以从每日 Codex 运行时长中看出。在 OpenAI 的日活跃用户中,使用最频繁的用户会在一天内要求 Codex 运行数小时的智能体工作。到 2026 年 6 月,处于第 99 百分位的用户每天常规生成超过 60 小时的 Codex 智能体轮次,这些任务分布在多个并行的智能体上。随着 Codex 变得更强大且更易于并行化,用户从每次只要求 Codex 给出一个答案,逐渐转向在一天内协调多个智能体任务。
采纳范围持续从工程师扩展到 OpenAI 其他部门
OpenAI 的工程师率先逐步采纳 Codex。到 2025 年 12 月,公司内普通工程师已将他们对 OpenAI 产品的主要使用量转移到了 Codex。如今,普通工程师 99% 的产出 token 是通过 Codex 而非 ChatGPT 生成的。法务、财务和招聘部门直到 2026 年 4 月左右才转向以 Codex 为主要使用方式,但它们的过渡速度快得多。OpenAI 内部的普通律师或招聘人员现在超过 85% 的产出 token 都是在 Codex 上生成的。
在过去六个月里,Codex 在 OpenAI 内部的使用深度和强度都在加大。在活跃的内部用户中,各部门的合并产出 token 量出现了急剧增长。研究部门的增幅最大:到 2026 年 6 月,中位使用量是 2025 年 11 月的 56 倍。客户支持部门增长了 32 倍,工程部门增长了 27 倍,而法务部门虽然增长更缓慢,但也达到了 11 月水平的 13 倍。
这两种模式共同说明了 Codex 如何改变了 OpenAI 利用 AI 进行生产性工作的方式。在整个公司范围内,用户正在从聊天机器人转向智能体,将其作为与 AI 交互的主要形式,并部署着指数级增长的智能体劳动。
非开发人员是增长最快的用户群体
在所有用户群体——OpenAI、组织用户和个人用户中,Codex 的使用最初以开发者为主,这是该工具起步时天然的目标受众。然而,随着 Codex 向更通用的知识工作扩展,非开发者的采用率增长得更快。如下方用户增长图表所示,在个人、组织和 OpenAI 用户群体中,非开发者每周活跃用户的增长速度快于开发者用户。到 2026 年 6 月初,个人非开发者用户数量自 2025 年 8 月以来增长了 137 倍。组织非开发者用户增长了 189 倍,而 OpenAI 非开发者用户增长了 12 倍——这很可能是因为该群体原本的起点已远高于平均水平。
这种转变并不意味着每位非开发者都像工程师一样使用 Codex。相反,它意味着更多非开发者正在利用 Codex 完成某种智能体工作。
Codex 正在扩展潜在的生产性工作边界
Codex 使非技术部门能够加速之前受技术专长瓶颈制约的工作流程。下方的热力图比较了 OpenAI 内部的推断职业与 Codex 输出所代表的工作类型。在数据科学和研究领域,工程与编码是最大的工作类别;而在财务与业务运营、市场营销、运营及其他部门中,知识工作则是最大的类别。
即便如此,智能体工具可以扩展个人工作者的能力范围。例如,业务职能人员通过 Codex 完成的工作中,超过四分之一涉及工程或编码。智能体能够降低跨任务边界的迁移成本,帮助工作者完成以前需要更多专业技术支持的相邻工作。
职业与使用 Codex 完成的工作对比
职业与使用 Codex 完成的工作对比
| 工作类别 | |
|---|---|
| 合并后的推断部门 | 工程/编码 |
| 工程 | 72% |
| 数据科学/研究 | 51% |
| 财务/业务运营 | 31% |
| 产品/市场营销/运营 | 25% |
| 其他 | 50% |
部门内输出 token 占比
这对智能体的经济潜力意味着什么
非工程师员工对智体工具的更多使用,拓展了这些工作者所能完成的工作边界。这对于决定如何重新设计工作流程的企业、学习哪些技能变得更有价值的员工,以及试图理解AI如何改变劳动力市场的政策制定者和研究人员而言,都至关重要。
我们的论文展示了前沿用户如何在前沿领域采用能力强大的智体工具。我们的结果揭示了当人们能够广泛、低摩擦地使用能力强大的智体工具时会发生什么:随着工具改进,人们会将其用于耗时更长、更复杂、跨职能更多的工作。随着时间的推移,这很可能就是未来工作的模样。
- 2026年
- 经济研究
- Codex
作者
OpenAI
脚注
- 1 任务周期是通过基于LLM作为评判器、并访问Codex转录记录来估算的。
- 2 这些阈值是模型估算的,因此应将其视为方向性而非精确值。这同样仅基于个体数据,并基于0.1%用户的随机样本查询。
继续阅读
查看全部

OpenAI与博通发布面向LLM优化的推理芯片 公司 2026年6月24日

Daybreak:保护全球每个组织的安全工具 安全 2026年6月22日

三星电子为员工引入ChatGPT和Codex 公司 2026年6月21日
我们使用Cookie
我们使用Cookie来帮助本网站正常运行、了解服务使用情况,并支持营销工作。请访问“管理Cookie”随时更改偏好。查看我们的了解更多信息。
管理Cookie 拒绝非必要Cookie 接受全部