OpenAI 联合 Trail of Bits 发起 Patch the Planet 计划,AI 辅助开源项目漏洞修复
阅读原文· openai.comOpenAI把最前沿的模型用来实打实地挖真实漏洞,还搭配专家验证,这比刷基准榜更有长期价值,对依赖开源的公司是个好信号。
OpenAI 联合 Trail of Bits 推出 Patch the Planet 计划,利用 GPT‑5.5‑Cyber 和 Codex Security 等模型进行 AI 辅助安全研究,经人工专家审核后协助开源项目修复漏洞。初始参与项目包括 cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go、freenginx、Python 等。Trail of Bits 已在 19 个项目中识别数百个安全漏洞,合并数十个补丁,并开发出模糊测试、历史 CVE 变体分析、差分测试等可复用工作流。例如,通过 Codex 在一天内构建覆盖数十个入口点的模糊测试实验室,而人工通常需数周。参与项目可获得 ChatGPT Pro、Codex Security 访问权限及 API 额度。
OpenAI
2026年6月22日
安全
Patch the Planet:一项旨在支持开源维护者的Daybreak计划
加载中…
我们正在推出 Patch the Planet,这是一项与 Trail of Bits 共同构建的 Daybreak 计划,旨在帮助维护者加固世界所依赖的关键开源软件。我们将使用我们最具网络能力的模型进行 AI 辅助安全研究,并结合专家人工审查,不仅识别漏洞,还帮助修补这些漏洞。
AI 正在加速漏洞发现,但仅靠发现并不能保护用户。许多维护者已经需要以相同有限的时间与资源,更快速地处理更多报告。Patch the Planet 的构建目的是减轻而非增加这一负担:安全工程师在报告到达维护者之前先审查发现,与项目合作开发补丁和测试,并构建可复用的工作流程,帮助团队在首次修复落地后持续提升安全性。
Trail of Bits 已将其整个安全研究组织投入此次初步冲刺。他们正直接与维护者合作,调查并验证漏洞,开发和测试补丁,并协调漏洞披露事宜。
此外,我们还将与 HackerOne 和 Calif 合作,他们将在漏洞分类、协调披露以及额外的针对性漏洞发现方面帮助我们进一步推进相关工作。
Patch the Planet 的运作方式
Patch the Planet 下的每一次合作都从与维护者协商开始。针对每次协作,安全工程师会与维护者一道了解每个项目的需求、偏好以及哪些安全领域最需要额外投入:漏洞验证、补丁开发、CI/CD 改进,或长期安全工程。达成一致后,研究人员会调查潜在漏洞,验证有意义的问题,开发或完善补丁,支持测试,并通过项目的既定渠道协调披露。
初始参与者包括 cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go 项目、freenginx、Python 和 python.org。这些项目支撑着广泛使用的网络、加密、软件供应链和语言基础设施,增强其安全性可使众多下游产品和服务受益。更多项目将在后续轮次中加入。
安全研究人员配备了我们的前沿模型以及 Codex Security,用于支持分析、补丁开发、测试和文档编写。参与项目可获得 ChatGPT Pro 的使用权、Codex Security 的条件访问权限,以及用于核心开源开发、维护者自动化和发布工作流的 API 额度。Trail of Bits 开发了用于去重、分类和修补的 AI 辅助工作流,项目可在该支持下运行。
开发者的早期现场笔记与发现
Trail of Bits 已指派专职安全工程师,在 19 个开源项目中全职使用 Codex 和 GPT‑5.5‑Cyber,目前已识别出数百个安全问题并合并了数十个补丁,还有更多补丁正在协调披露中。
初始冲刺还产生了可复用的安全基础设施:模糊测试工具、历史 CVE 分析流水线、差异测试系统、威胁模型、扩展的测试套件,以及用于去重、误报过滤、严重性修正和补丁生成的工作流。部分项目特定细节将在测试、修复和协调披露推进过程中稍后分享。一些早期示例展示了该团队能够构建和发现的内容:
不到一天打造一个模糊测试实验室。Trail of Bits 工程师利用重复的 Codex /goal 运行与 GPT‑5.5‑Cyber,构建了一个完整的模糊测试实验室,覆盖数十个入口点、变体构建、平台和新颖的测试种子。工程师设定目标并优化提示词;系统随后利用覆盖率反馈不断扩展到新的攻击面、瞄准边缘案例,并过滤掉弱或无效的候选输入。
Trail of Bits 的工程师发现,在少量指导的情况下,GPT‑5.5‑Cyber 在以下方面做出了有用决策:应扩大哪些覆盖范围、应探测哪些构建版本和入口点,以及哪些候选对象过于薄弱而不值得继续跟进。整个搭建过程不到一天。Trail of Bits 估计,如果手工搭建同样的实验环境,通常至少需要数周时间。
一个可复用的流水线,用于查找已知漏洞的变体。该团队构建了一套端到端系统,该系统接收历史 CVE、提取相关漏洞模式、在目标代码库中搜索关联缺陷,并通过专门的判别智能体发送候选发现结果。该流水线对结果进行去重、过滤可能的误报,并将最强证据路由至安全工程师进行人工确认。
这将多年的公开漏洞历史转化为一种可跨项目重复应用的搜索策略。Trail of Bits 发现,这类模型在此类变体分析中尤其高效,在被审查的代码库中发现了许多额外问题。
差异测试从数周或数月缩短至数天。同一协议的不同实现通常在相同输入下应表现一致。当它们出现分歧时,其中一种可能包含缺陷。大规模应用这一思路通常很困难,因为工程师必须编写自定义垫片和胶水代码,将每种实现连接到一个通用测试框架。
Codex 生成并迭代了该代码,使得多种实现之间可以进行模糊测试,并研究它们的行为差异。该工作流过滤了许多弱信号或无效结果,并产生了一组相对高信号的候选对象供专家审查。团队在数天内就取得了这些结果,压缩了以往需要数周或数月的工作。Trail of Bits 正在继续扩展和优化这些测试,之后才会发布特定项目的细节。
团队依据项目规范和RFC,利用Codex开发了威胁模型、攻击分类体系、不变性测试以及基于属性的测试,用于检验软件行为是否符合其规格承诺。这些方法揭示了预期行为与实际行为之间的显著差异,同时为项目带来了更广泛的测试覆盖、更完善的文档,并改进了CI/CD及软件供应链相关工具。
在安全工程师将每一项发现提交给维护者之前,都会经过严格审查。Trail of Bits的工程师会手动审核每一个安全议题,然后再提交给维护者;这一步骤的附加价值不容低估。虽然前沿AI模型在发现和修补漏洞方面能力很强,但它们也会产生大量误报,这可能会加剧维护者本已不堪重负的积压工作。Patch the Planet通过让专门的Trail of Bits研究人员复现证据、对照项目专属文档和威胁模型核查发现、去除重复项、重新评估严重性,并对已确认的漏洞进行优先级排序来解决这个问题。研究人员还会根据维护者的偏好开发和提交补丁。维护者始终掌握着哪些补丁被部署以及披露方式如何处理的最终决定权。
OpenAI Daybreak 已经发现了什么
Patch the Planet 建立在 Daybreak 更广泛的工作基础之上,这些工作展示了前沿模型如何帮助防御者发现、验证并修复广泛使用的软件中的严重漏洞。
我们在此分享一些早期亮点,同时暂不公开漏洞利用机制以及尚在披露过程中的项目具体细节。随着补丁部署完成和协调披露流程结束,我们计划发布更深入的技术报告,详细介绍个别发现、研究方法、验证工作流以及其他防御者可以借鉴的经验教训。
我们的发现覆盖软件栈的每一层,还有更多发现正在披露过程中。
操作系统
- **Linux Kernel:**GPT‑5.5‑Cyber 在超过 3000 万行代码中识别出安全相关组件,标记了潜在安全问题,然后通过动态方式验证,生成了 8 个内核指针信息泄露概念验证(PoC)和 24 个本地权限提升利用代码。我们注意到,共识别出数百个问题,这里列出的是自动生成 PoC 的那部分。
- **OpenBSD:**我们的模型在 OpenBSD 内核的 System V 信号量实现中发现了一个存在 23 年的释放后使用漏洞。OpenAI 的研究人员复现了该问题,并确认它可能允许无特权的本地用户将权限提升至 root。
- **FreeBSD:**Calif 的安全研究人员使用 Codex 发现并利用概念验证漏洞验证了 FreeBSD 中的多个本地权限提升漏洞。在一项更广泛的 FreeBSD 活动中,OpenAI 研究人员确认了 34 个漏洞,并生成了 7 个本地权限提升 PoC。
网络
- dnsmasq:Codex Security 独立识别出了与后续在 2.92rel2 中修复的六个 dnsmasq CVE 中四个对应的漏洞模式:CVE-2026-4890、CVE-2026-4891、CVE-2026-4892 和 CVE-2026-5172。
- HTTP/2 Bomb:Calif 使用 Codex 识别出了“HTTP/2 Bomb”——一种影响包括 NGINX、Apache、IIS 和 Pingora 在内的主要 HTTP/2 实现的拒绝服务技术。Calif 的分析表明,超过 88 万个面向互联网的网站运行着受影响且启用 HTTP/2 的服务器软件。
浏览器
- Chrome:OpenAI 研究人员发现并报告了 Chrome V8 JavaScript 引擎中的五个可被利用的漏洞,其中三个在引入后数天内便被识别并修复。
- Safari:在约一周的重点 WebKit 工作中,发现并报告了超过 10 个可被利用的 Safari 漏洞。
- Firefox:OpenAI Preparedness 团队在安全评估期间使用 GPT‑5.5 发现了一个 WebAssembly 漏洞(CVE-2026-8390),Mozilla 在 Pwn2Own 柏林竞赛前两天修补了该漏洞,导致六个已注册的 Firefox 参赛条目中有五个退出。在该竞赛中,没有成功演示针对 Firefox 的利用。
共享基础设施,共享防御
开源软件是共享基础设施,保护它的安全也应是共同的责任。人工智能正在改变漏洞发现的速度,当前的工作重点在于确保这些成果能够惠及最需要它们的维护者和用户。
“修补星球”(Patch the Planet)项目旨在将完整的防御闭环服务于维护者:发现、验证、严重性评估、披露、补丁开发、测试和部署。前沿模型可以加速其中的部分环节,但目标是为负责共享基础设施的人提供更好的工具和更强的能力,同时保留他们对变更落地方式的自主权。
这第一轮冲刺展示了维护者、安全工程师与AI辅助工作流之间持续协作所能取得的成果:即时修复、更强的项目基础设施,以及可复用的安全工作,这些工作将持续改进开源软件。
这仅仅是个开始。随着更多修复落地和协调披露的完成,我们计划针对选定的发现、发现和验证这些发现的方法,以及防御者可以采用的工作流发布更详细的技术报告,以帮助保护每个人所依赖的软件。如果你是一名维护者,可以在此申请加入“修补星球”项目。
- 2026