# 超Claude Mythos 5成绩：OpenAI最强"抓虫AI"GPT-5.5-Cyber刷新CyberGym纪录

- 来源：IT之家（RSS）
- 发布时间：2026-06-23 15:17
- AIHOT 分数：72
- AIHOT 链接：https://aihot.virxact.com/items/cmqqd3i4n08ovslp5tx11vjne
- 原文链接：https://www.ithome.com/0/967/463.htm

## AI 摘要

OpenAI于6月22日扩展Daybreak网络安全项目，面向安全防御团队有限开放完整版GPT-5.5-Cyber（网络安全专用模型）。在CyberGym单模型评测中，GPT-5.5-Cyber得85.6%，GPT-5.5为81.8%，Claude Mythos 5为83.8%。ExploitGym测试中得分39.5%（GPT-5.5为25.95%）。SEC-bench Pro测试中得分69.8%（GPT-5.5为63.1%）。OpenAI称漏洞发现速度已因AI显著加快，当前瓶颈在修复环节。

## 正文

IT之家 6 月 23 日消息，OpenAI 公司昨日（6 月 22 日）发布公告，宣布扩展 Daybreak 网络安全项目，面向安全防御团队有限开放完整版 GPT-5.5-Cyber（网络安全专用模型）。

IT之家注：Daybreak 是 OpenAI 公司推出的网络安全计划，类似 Anthropic 推出的 Project Glasswing 项目，主要帮助防御团队发现、验证和修复漏洞，缩短漏洞进入生产环境后的处置周期。

OpenAI 在博文中指出，强大 AI 模型显著加快漏洞发现速度，目前行业的痛点和瓶颈，已转向修复这些披露的漏洞。对于软件团队而言，评估影响、编写修复代码、完成测试，并最终发布补丁，整个链条依然耗时。

模型能力方面，根据 CyberGym（网络安全评测集）的单模型成绩，GPT-5.5-Cyber 取得 85.6% 的最高成绩，刷新了 GPT 系列模型在 CyberGym 测试中的得分纪录。作为对比，GPT-5.5 模型得分为 81.8%，而 Claude Mythos 5 模型的得分为 83.8%。

在 ExploitGym 测试（考验智能体能否将已知漏洞转化为可执行的攻击代码）中，GPT-5.5-Cyber 的得分为 39.5%，而 GPT-5.5 为 25.95%。

在 SEC-bench Pro 测试中，GPT-5.5-Cyber 的得分为 69.8%，而 GPT-5.5 的得分为 63.1%。SEC-bench Pro 测试用于评估智能体在复杂软件目标上的长期漏洞发现能力和概念验证生成能力。
