OpenAI为确保Codex这类Coding Agent在研发流水线中的安全与可控性,设计了一套四层管控框架。核心原则是让低风险操作零摩擦,高风险操作必须显式审批。框架包括:通过沙箱和审批机制定义技术执行边界,其中创新的Auto-review模式利用子代理自动审阅Codex动作,实现AI审AI;实施默认拒绝、显式允许的网络策略;通过身份与凭证管理将Codex活动绑定至企业工作区并纳入合规日志;以及按命令语义分级放行或拦截。真正的重点是Agent-Native Telemetry,它通过OpenTelemetry导出用户意图、Agent推理路径、审批决策等完整因果链,弥补了传统日志无法解释“为什么”的缺陷。这份遥测数据既用于安全运营,如由AI安全三角分诊Agent自动分析EDR警报并分类响应,也复用于内部运营分析,实现安全与效率的统一。
当 Agent 自己审批 Agent:OpenAI 是怎么管住 Codex 的?
当 Codex 这样的 Coding Agent 能读写仓库、运行命令、调用开发工具,它进入研发流水线,你如何同时保住效率和可控性?保证企业安全?
OpenAI 给出的答案是一套四层框架:受限执行 + 网络策略 + 身份治理 + Agent-Native Telemetry。指导原则:让低风险的日常操作零摩擦,让高风险操作必须显式停下来等审查。 https://openai.com/index/running-codex-safely/
四个控制面
1. 沙箱 + 审批 · 沙箱定义"技术执行边界":能写哪里、能不能联网、哪些路径只读。 · 审批策略定义"什么情况下必须停下来问人":通常是越界沙箱时触发。