BestBlogs 早报 · 06-27|OpenAI 启动 GPT-5.6 Sol 受限预览，LangChain 提示词缓存，Sean Goedecke 算推理

在线阅读本期早报

BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。

导语

OpenAI 把 GPT-5.6 Sol、Terra、Luna 一起摆上台面，新的 max 与 ultra 模式让旗舰在编码评测上再进一步，发布节奏却因安全审查而格外克制。模型更强之后，如何把 Agent 用得起、跑得久成了更现实的问题。LangChain 用提示词缓存把 token 成本砍掉近八成，Sean Goedecke 则算了一笔账，证明被唱衰的推理生意其实稳稳赚钱。能力竞赛之外，今天更像一堂 AI 经济账。

今天还有翁荔时隔一年更新的 Scaling Laws 长文、腾讯混元与字节火山引擎的工业级推理与 Agent 架构实践、阿里 OpenSandbox 的凭据隔离方案，以及一组关于职业能力、具身数据与英特尔翻身的延伸阅读，适合在能力与成本两条线索之间来回对照着读。

如果说过去一年大家比的是「谁的模型分数更高」，那么今天这批内容更像是在回答下一个阶段的真问题：模型已经足够强，接下来拼的是工程化落地与单位经济。三篇精讲分别从能力前沿、成本压缩与盈利账本切入，速览与补充阅读则补上了底层推理优化、企业级 Agent 架构、安全沙箱与人才能力等多个侧面。建议读的时候带着一个问题：当能力不再稀缺，真正的护城河会落在哪里。

★ 精讲一：GPT-5.6 Sol 前瞻：下一代模型预览

来源：OpenAI News | 评分 93 | 详见

OpenAI 启动了 GPT-5.6 系列的有限预览，一口气推出三款定位不同的模型：旗舰款 Sol、面向日常工作的均衡款 Terra，以及主打速度与低成本的 Luna。官方给出的口径是，Terra 在性能上可与上一代 GPT-5.5 掰手腕，价格却便宜一半；Luna 则在 OpenAI 自家最低成本档位上提供了相当强的能力。换句话说，这次更新不是单点拔高，而是把「同等能力更便宜、更便宜也够用」这件事一次性铺到了三个价位段上。

能力层面最值得关注的是两项新机制。GPT-5.6 引入了全新的 max 推理档，给 Sol 留出最充分的深度推理时间；同时新增 ultra 模式，通过调用子智能体（subagents）来加速复杂任务，突破了单一智能体的能力上限。在编码场景里，Sol 在 Terminal-Bench 2.1 这一考验命令行规划、迭代与工具协调的评测上刷新了 SOTA，得分 88.8%，而 ultra 模式更进一步达到 91.9%。生物学方面，它在 GeneBench v1 的长程基因组分析上以更少 token 取得了优于 GPT-5.5 的结果；网络安全方向，Sol 在 ExploitBench 上用约三分之一的输出 token 就追平了更高规格的对手，并在 UC Berkeley 联合多家前沿实验室构建的 ExploitGym 上，随推理预算增加而稳定提升。值得注意的是，这些收益往往伴随更高的 token 效率--同样的任务用更少的 token 完成，这本身就是一种变相的成本下降。

但这次发布真正的信号，藏在「克制」二字里。Sol 配备了 OpenAI 迄今最稳健的安全栈，团队花了数周做对抗测试与加固。更关键的是，首发只面向少数可信伙伴，且这些伙伴名单已与美国政府共享--这是 OpenAI 配合政府网络安全审查、分阶段放开能力的一部分。OpenAI 明确表示并不希望这种政府准入流程成为长期默认，但作为短期步骤接受了它，目标是在未来几周内走向更广泛可用。

值得留意的是这次发布的叙事重心转移。过去 OpenAI 的版本更新往往把笔墨放在「能力又强了多少」，这次却用相当篇幅解释「为什么要先做有限预览」。Sol、Terra、Luna 三档并行的产品线，本质上是在把同一波能力提升，按成本和场景重新切分给开发者、企业与终端用户；而政府准入流程的引入，则说明随着模型在网络安全等高风险方向的能力跃升，发布这件事本身正在被纳入更复杂的治理框架。能力越强，放开越要讲方法，这是和以往「发布即全面开放」最大的不同之处。

ginobefun@hongming731 · X

54导出 Markdown

2026-06-27 08:23·6天前

在 X 看原推· x.com

AI 摘要

OpenAI 推出 GPT-5.6 系列有限预览，包括旗舰 Sol、均衡 Terra 和低成本 Luna。Sol 在 Terminal-Bench 2.1 达 88.8%，ultra 模式升至 91.9%；Terra 性能对标 GPT-5.5 但价格减半。LangChain 提示词缓存将 token 成本降低 49%-80%（claude-haiku 降 77%，gpt-5.4-mini 降 80%）。Sean Goedecke 测算：4 张 A100 推理 70B 模型成本约 1 美元/百万 token，对比 GPT-5.4-mini 定价 4.5 美元，推理业务明显盈利。

http://x.com/i/article/2070663412787576832

BestBlogs 早报 · 06-27|OpenAI 启动 GPT-5.6 Sol 受限预览，LangChain 提示词缓存，Sean Goedecke 算推理

在线阅读本期早报

BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。

BestBlogs 早报 · 06-27|OpenAI 启动 GPT-5.6 Sol 受限预览，LangChain 提示词缓存，Sean Goedecke 算推理

导语

★ 精讲一：GPT-5.6 Sol 前瞻：下一代模型预览

BestBlogs 早报 · 06-27|OpenAI 启动 GPT-5.6 Sol 受限预览，LangChain 提示词缓存，Sean Goedecke 算推理

导语

★ 精讲二：Deep Agents 的提示词缓存

★ 精讲三：AI 推理显然是盈利的

速览

补充阅读

今日阅读路径

★ 精讲一：GPT-5.6 Sol 前瞻：下一代模型预览

★ 精讲二：Deep Agents 的提示词缓存

★ 精讲三：AI 推理显然是盈利的

速览

补充阅读

今日阅读路径