Hacker News 热门（buzzing.cc 中文翻译）

OpenAI 预览 GPT-5.6 Sol：新一代模型

2026-06-27 01:31·6天前·minimaxir

AI 摘要

OpenAI 预览了 GPT-5.6 Sol，这是一款新一代模型。该预览由 OpenAI 官方发布，标题明确指出其为“next-generation model”。目前预览信息有限，仅确认了模型名称与定位，未包含具体技术细节或功能披露。

AI 翻译 · 中文

预览 GPT-5.6 Sol：下一代模型 | OpenAI

June 26, 2026

Product Release

Previewing GPT‑5.6 Sol: a next-generation model

We're beginning a limited preview of the GPT‑5.6 series: Sol, our flagship model; Terra, a balanced model for everyday work; and Luna, a fast and affordable model. Terra has competitive performance to GPT‑5.5 while being 2x cheaper and Luna brings strong capability at our lowest cost.

GPT-5.6 Sol 伴随着我们迄今为止最强大的安全堆栈推出。我们加强了对高风险活动、敏感网络请求和反复滥用行为的保护，并花费数周时间寻找漏洞、对系统进行压力测试，并强化其抵御现实世界攻击的能力。

我们坚信广泛访问的价值，并计划在未来几周内将 GPT-5.6 Sol、Terra 和 Luna 全面开放。作为我们与美国政府持续互动的一部分，我们在今天发布之前预览了我们的计划以及模型的能力。应他们的要求，我们首先向一小部分可信合作伙伴提供有限预览，这些合作伙伴的参与信息已与政府共享，之后再进行更广泛的发布。在预览期间，我们将继续测试并与合作伙伴密切协调，以推进更广泛的可用性。我们认为这种政府访问流程不应成为长期默认模式。它会使最优秀的工具无法到达需要它们的用户、开发者、企业、网络防御者和全球合作伙伴手中。我们采取这一短期措施，是因为我们认为这是在未来几周内实现更广泛可用性的最有力路径，同时我们正与行政当局合作制定网络安全行政令框架以及未来模型发布的可重复流程。

能力

GPT-5.6 Sol 是我们迄今为止最强的模型。为了预览模型性能，我们分享了一组评估结果，这些结果突出了在编程、生物学和网络安全方面改进的智能体能力，额外的安全性和准备度评估可在我们的系统卡中获取。当我们广泛发布该模型时，将分享更全面的评估结果。

借助 GPT-5.6，我们引入了新的最大推理努力级别，以给予 Sol 最充足的深度推理时间。此外，我们引入了新的超级模式，该模式通过利用子智能体来加速复杂工作，从而超越了单一智能体的能力。

在编程工作流方面，GPT-5.6 Sol 在 Terminal‑Bench 2.1 上创造了新的最优水平，该基准测试需要规划、迭代和工具协调的命令行工作流。

TerminalBench 2.1

GPT‑5.6 Sol 在生物学工作流中也展现出全面改进。在评估长周期基因组学与定量生物学分析的 GeneBench v1 基准上，它用更少的模型 token 就取得了比 GPT‑5.5 更强的结果。

GPT‑5.6 Sol 是我们迄今为止在网络安全领域能力最强的模型。它在漏洞研究与利用等长周期安全任务上推动了性能与效率的边界。在 ExploitBench² 上，GPT‑5.6 Sol 仅使用约三分之一的输出 token 就与 Mythos Preview 水平相当。在由加州大学伯克利分校研究人员与 OpenAI 及其他前沿实验室合作创建的 ExploitGym³ 基准上，随着推理能力增强，GPT‑5.6 Sol、Terra 和 Luna 模型在网络能力方面均展现出显著提升。

更强的网络能力配合更强的防护措施

我们开发了 GPT‑5.6 Sol、Terra 和 Luna，配备了迄今为止最强大的防护措施，并且针对每个模型的能力进行了配置匹配。随着模型能力增强，我们设计的防护措施会逐步提升对抗真实世界对抗性压力的能力，同时保留对代码审查、漏洞研究、补丁开发、调试、安全教育和防御性测试等合法工作的访问权限。我们的目标是让被禁止的进攻性活动变得更加困难、更加不确定、更易被检测，而不过度限制那些有益用途。根据我们对模型及防护措施的评估，我们预期在合法防御性工作方面将带来显著收益，同时有效约束被禁止的进攻性使用。

GPT‑5.6 Sol 在帮助人们发现和修复漏洞方面的能力，要优于可靠地执行端到端攻击的能力。随着这些能力的持续进步，我们的优先事项是确保它们能够到达并惠及防御者——防御者可以利用这些工具发现弱点、开发补丁，并在更广泛的范围内加固系统。

在我们的准备框架下，GPT‑5.6 尚未跨越网络关键阈值。在涉及 Chromium 和 Firefox 的评估中，它发现了漏洞和利用原语——即构成完整漏洞利用的基础模块——但在测试条件下并未自主生成可运行的全链路漏洞利用程序。尽管如此，基准测试的阈值无法涵盖模型可能被使用或与其他工具结合的所有方式。正是这种不确定性，加上模型能力的整体跃升，促使我们将增强后的模型能力与更严格的安全防护措施及分阶段发布相结合。我们在 GPT‑5.6 预览系统卡中分享了关于安全防护措施的更多细节。

多层安全防护栈

没有单一防护措施能够抵御坚定或有组织的滥用行为。在 GPT‑5.6 预览版中，我们采用了多层安全防护，具体配置因模型而异，并对其进行了实际攻击的压力测试。这些措施包括：内置于模型中的防护、生成过程中的实时检查、账户级信号、差异化访问权限、监控、执行机制以及持续测试。

GPT‑5.6 经过训练，会拒绝被禁止的网络协助，包括用户试图掩饰意图或越狱模型的操作。这些模型级防护措施为模型应帮助和不应帮助的内容设定了第一道边界。

实时网络和生物滥用分类器提供了另一层防护，在输出生成过程中对其进行评估。对于高风险情况，若检测到潜在违规，生成过程可能会暂停，同时由一个更大型的推理模型审查对话及其上下文。如果评估认为输出是违规内容，则在到达用户之前将其拦截。

被标记的活动还可能触发跨相关对话和风险信号的账户级审查，这符合我们关于内容保留和审查的条款与政策。通过超越单次对话的视角，我们的系统能够区分持续性的恶意行为与合法的双重用途安全研究工作——后者的上下文虽大相径庭，却可能涉及相似的技术概念。

这些层次共同使整体方法比任何单一防护措施更为稳健。模型行为降低了有害响应的可能性，实时系统可在生成过程中进行干预，账户级别的审查能识别更广泛的模式，而差异化访问则保留了重要的防御性工作，同时默认不会广泛开放最敏感的能力。

尤其是在预览期间，用户可能会遇到阻止或拒绝某些请求的安全防护措施。其他请求可能需要更长时间，因为生成过程会暂停以进行额外审查。安全防护措施偶尔会在合法工作上介入，尤其是在防御性和攻击性活动最初看起来相似的军民两用领域。

这正是预览旨在测试的一部分。我们不仅希望了解安全防护措施是否能限制滥用，还希望了解合法用户是否仍能可靠高效地完成正常工作。预览期间的反馈将帮助我们减少不必要的阻止和延迟，改进安全防护措施对上下文的解读方式，并在更广泛发布前创造更流畅的体验。

我们也在与企业客户合作探索更长期的方法——包括隐私保护检测、客户自操作的安全控制，以及根据客户、用户或工作负载的风险校准的访问权限——在支持企业隐私要求的同时推进安全性。

通过自动化红队测试提高稳健性

安全防护措施还需要在攻击者调整其战术时保持有效。一种仅针对固定已知攻击集起作用的防护措施，对于前沿模型来说是远远不够稳健的。

这就是为什么我们在安全方面投入了比以往更多的智能和算力，利用我们自己的模型来更快地发现弱点并改进防护措施。我们投入了超过 70 万 A100 等效 GPU 小时用于自动化红队测试，目的是寻找通用越狱方法：那些可以在多个提示词或上下文中起效的攻击，而不仅仅是单一狭窄场景。专注于这些更难、更通用的攻击，使我们能够超越一组固定的已知故障来测试安全防护措施。这也让我们能够探索远比人工测试所能覆盖的更广泛的攻击模式，更早地识别故障模式，并缩短从发现弱点到解决弱点之间的路径。

除了自动化红队测试，我们还与第三方测试人员合作，开展了广泛的人类专家红队测试，该测试将在预览期间继续。人类红队测试通过让创意专家以我们的系统可能无法预料的方式尝试滥用模型，从而补充自动化工作，对安全防护措施进行测试。

没有任何评估能代表每一种产品配置、多步骤攻击或真实工作流程。因此，我们维持一个快速响应流程，以复现、评估、优先排序并修复新发现的越狱方法，然后将其添加到我们正在进行的评估中，以便将来能够针对类似的故障进行测试。

可用性与定价

在预览期间，GPT‑5.6 模型最初将通过 API 和 Codex 提供给一批经过筛选的可信合作伙伴和组织。我们计划很快让使用 ChatGPT、Codex 和 API 的用户能够更广泛地使用这些模型。

在 GPT‑5.6 引入的这个新命名体系中，数字标识模型的代际，而 Sol、Terra 和 Luna 则标识持久的能力层级，这些层级可以按照自己的节奏推进。整体而言，该模型系列为用户和开发者提供了在智能、速度和成本之间更清晰的选择。

GPT‑5.6 按三种模型规模以每百万 token 定价：Sol 输入 5 美元 / 输出 30 美元；Terra 输入 2.50 美元 / 输出 15 美元；Luna 输入 1 美元 / 输出 6 美元。GPT‑5.6 还引入了更可预测的提示词缓存，包括对显式缓存断点和 30 分钟最小缓存生命周期的支持。对于 GPT‑5.6 及后续模型，缓存写入按模型非缓存输入价格的 1.25 倍计费，而缓存读取继续享受 90% 的缓存输入折扣。

我们还将在 7 月于 Cerebras 上推出 GPT‑5.6 Sol，速度最高可达每秒 750 token，以前所未有的速度向客户提供前沿智能。初期将仅限选定的客户访问，同时我们正在扩展容量。

我们很高兴能继续从这个预览期中学习，并尽快将 GPT‑5.6 Sol、Terra 和 Luna 带给更多人。

我们通过观察模型的线上行为并进行离线模拟来估算延迟和 API 成本。这些估算考虑了工具调用细节、采样 token 和输入 token。实际结果可能会有显著差异，并且取决于模拟中未涵盖的许多因素。我们以快速 API 速度模拟延迟，并以常规 API 定价模拟成本。
所有模型均使用 ExploitBench API 工具进行评估，采用 5 个随机种子并保持推理连续性。
我们在 alpha API 上运行了 ExploitGym，该 API 输出响应的速度比我们的公开 API 更快，随后我们重新缩放以匹配公开 API。当将延迟重新缩放至公开 API 预期速度时，会导致某些估算延迟超过 2 小时和 6 小时的时间限制，尽管在实际评估运行中这些限制被正确遵守。为了在对时间敏感的任务中获得更快的速度，我们在 API 中提供优先处理，在 Codex 中提供快速模式。
未报告输出 token、延迟或成本的模型以水平虚线绘制。

2026

OpenAI 安全/对齐推理模型发布

阅读原文导出 Markdown