6月26日,OpenAI发布GPT-5.6系列,包括旗舰Sol、日常Terra和经济Luna。Terra性能接近GPT-5.5但价格减半;Sol新增max深度推理和ultra多智能体并行模式。Terminal-Bench 2.1上Sol Ultra得分91.9%,超Claude Mythos 5(88%)和Gemini 3.1 Pro Preview(70.7%)。API定价:Sol输入$5/百万token、输出$30;Terra $2.5/$15;Luna $1/$6。7月将推Cerebras加速版。受美国政府要求,目前仅向约20家审批合作伙伴开放,普通开发者及ChatGPT用户暂无法使用。OpenAI称几周内将扩大开放。
OpenAI 今天(6月26日)发布了新一代模型 GPT-5.6,包含三个版本:旗舰级 Sol、日常级 Terra 和经济级 Luna。但这条新闻最值得关注的地方不在模型本身,而在发布方式:应美国政府要求,GPT-5.6 目前只向大约 20 家经过政府审批的合作伙伴开放,普通开发者和 ChatGPT 用户暂时用不上。
GPT-5.6 用了一套新的命名规则:数字代表代际,Sol、Terra、Luna 代表三个固定的能力档位,灵感来自太阳、地球、月亮。Sol 是最强的旗舰,Terra 性能接近上一代 GPT-5.5 但价格砍半,Luna 主打便宜快速。
Sol 新增了两个模式:max 模式让模型花更长时间深度推理,ultra 模式则调用多个子 agent 并行处理复杂任务,相当于一个 AI 自己拆分工作给一组 AI 干活。
在 OpenAI 公布的 Terminal-Bench 2.1(测试命令行工作流的编程基准)上,Sol Ultra 得分 91.9%,Sol 为 88.8%,Claude Mythos 5 为 88%,Google Gemini 3.1 Pro Preview 为 70.7%。网络安全方面,Sol 在 ExploitBench 上用大约三分之一的 token 就达到了 Mythos Preview 的水平。