BestBlogs 早报 · 06-23|OpenAI Daybreak 把补丁规模化，美团做出海报闭环，Gray Swan 谈红队对抗

在线阅读本期早报

BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。

导语

AI 安全正在从「找洞」转向「补洞」。今天的精讲一里，OpenAI 把这件事说得很直白：模型已经让发现漏洞不再是瓶颈，真正的瓶颈是「修补」--Codex Security 上线以来扫描过 3000 多万次提交、覆盖 3 万多个代码库，超过 50 万个问题被自动判定修复；同时升级的 GPT-5.5-Cyber 在 CyberGym 上刷到 85.6% 的单模型最高分。这套从「找洞」到「补洞」的工程化思路，和精讲三里 Gray Swan 两位联合创始人 Zico Kolter、Matt Fredrikson 的判断形成了呼应--他们提醒大家，模型越大不会自动越安全，「能不能扛住对抗攻击」本身是一种需要专门训练的能力，真正检验防御力的标尺只有红队对抗：他们的自动化红队系统 Shade 已经能在多数场景里比人类更擅长攻破模型，而在「人类 vs 浏览器智能体」的对抗挑战里，人类抗钓鱼的表现甚至只排到第四。

如果说这两条精讲讲的是「补洞」与「测洞」的两端，精讲二讲的则是另一种「补」--把设计师脑子里那种说不清楚的「设计感」补成可训练、可量化的工程能力。美团技术团队拆解了他们的海报生成体系：PosterCraft 解决「能不能生成」，PosterOmni 解决「能不能编辑」，PosterReward 解决「好不好评判」，三者形成一个生成-编辑-评判的技术闭环，相互训练、持续进化，目前已经落地到外卖套餐图、IP 形象「袋鼠团团」等真实场景。三条精讲放在一起看，正好覆盖了今天 AI 工程里最实在的三个问题：漏洞怎么修得过来，模型到底有多容易被攻破，以及一种模糊的人类直觉能力，要怎么变成可以被规模化训练的系统。

★ 精讲一：Daybreak：保护全球每一家组织的安全工具

原文链接：Daybreak：保护全球每一家组织的安全工具（OpenAI News）

OpenAI 这篇官方博客的核心判断很直接：AI 已经改变了网络安全的「物理规律」。过去多年，发现一个严重漏洞需要稀缺的专业经验、大量时间和对复杂系统的深度熟悉；现在前沿模型能够在大型代码库里自主导航、推演攻击路径、验证假设，把过去隐藏极深的安全问题挖出来。结果是，瓶颈彻底反转--防御者不再缺漏洞报告，缺的是把报告变成实际补丁、协调披露、推动团队部署修复的能力。一份漏洞报告本身不会保护任何人，真正有价值的环节是验证问题、理解影响范围、开发并测试补丁。

围绕这个判断，OpenAI 把 Daybreak 计划做成了一整条从发现到修复的工程流水线。Codex Security 自三月上线研究预览以来，已经扫描超过 3000 万次提交、覆盖 3 万多个代码库，人工审核者手动确认修复了 7 万多个问题，另有超 50 万个问题被自动判定为已修复--这个体量本身就说明，安全工作要规模化，靠的不是更多人工审查，而是把「理解代码 + 判断威胁模型 + 生成定向补丁 + 验证结果」整个流程内置进开发工具链，人类只保留对「查哪些问题、改哪些代码、披露哪些信息」的最终决策权。今天同步更新的 Codex Security 插件，开箱即可做深度扫描或增量审查，输出带严重等级、受影响代码位置、验证证据和修复建议的完整报告。

与此同时，面向受信防御者限量发布的 GPT-5.5-Cyber 全量版本也在今天上线。这个模型在 CyberGym（衡量 Agent 能否复现已知软件漏洞）上拿到 85.6% 的单模型最高分，相比 GPT-5.5 的 81.8% 有明显提升；在更贴近真实场景的 ExploitGym（测试能否把已知漏洞变成真正可执行的攻击）上是 39.5% 对 25.95%，在 SEC-bench Pro 上是 69.8% 对 63.1%。对于多数防御者，OpenAI 建议的起点仍是搭配 Codex Security 的标准版 GPT-5.5；GPT-5.5-Cyber 专门留给那些授权工作确实需要更激进能力、同时配有更强验证与监控机制的受信团队。

ginobefun@hongming731 · X

48导出 Markdown

2026-06-23 07:59·10天前

在 X 看原推· x.com

AI 摘要

OpenAI Daybreak计划转向“补洞”：Codex Security扫描超3000万次提交、覆盖3万+代码库，超50万问题被自动判定修复；GPT-5.5-Cyber在CyberGym达85.6%单模型最高分，并推出Patch the Planet推动开源补丁落地。美团技术团队构建PosterCraft（文字渲染）、PosterOmni（六类编辑）、PosterReward（质量评判）闭环，PosterReward在高级基准达86.0%准确率，已落地外卖海报。Gray Swan创始人指出模型容量不自动提升安全性，自动化红队系统Shade多数场景已超越人类攻破能力。

http://x.com/i/article/2069208006232039424

BestBlogs 早报 · 06-23|OpenAI Daybreak 把补丁规模化，美团做出海报闭环，Gray Swan 谈红队对抗

在线阅读本期早报

BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。

BestBlogs 早报 · 06-23|OpenAI Daybreak 把补丁规模化，美团做出海报闭环，Gray Swan 谈红队对抗

导语

★ 精讲一：Daybreak：保护全球每一家组织的安全工具

BestBlogs 早报 · 06-23|OpenAI Daybreak 把补丁规模化，美团做出海报闭环，Gray Swan 谈红队对抗

导语

★ 精讲二：美团海报生成 AIGC 技术创新与实践

★ 精讲三：神话模型之后的红队测试访谈：对话 Zico Kolter 与 Matt Fredrikson（Gray Swan）

速览

补充阅读

今日阅读路径

★ 精讲一：Daybreak：保护全球每一家组织的安全工具

★ 精讲二：美团海报生成 AIGC 技术创新与实践

★ 精讲三：神话模型之后的红队测试访谈：对话 Zico Kolter 与 Matt Fredrikson（Gray Swan）

速览

补充阅读

今日阅读路径