OpenAI 启动 GPT-5.6 系列有限预览:旗舰 Sol、均衡款 Terra(性能比肩 GPT-5.5 但便宜一半)和低成本 Luna。新增 max 深度推理档与 ultra 模式,Sol 在 Terminal-Bench 2.1 以 88.8% 刷新编码 SOTA。LangChain 拆解 Deep Agents 提示词缓存,可削减 token 成本 49%-80%(claude-haiku -77%、gpt-5.4-mini -80%)。Sean Goedecke 核算 AI 推理服务毛利率可达 70%-80%,DeepSeek-V4-Pro 市场价约 87 美分已贴近成本。
BestBlogs 早报 · 06-27
GPT-5.6 Sol / Deep Agents 提示词缓存 / AI 推理成本 / Scaling Laws / 翁荔
【1】 ★ 精讲|GPT-5.6 Sol 前瞻:下一代模型预览 OpenAI 启动 GPT-5.6 系列有限预览:旗舰 Sol、均衡款 Terra(性能比肩 GPT-5.5 但便宜一半)、低成本 Luna。新增 max 深度推理档与调用子智能体的 ultra 模式,Sol 在 Terminal-Bench 2.1 上以 88.8% 刷新编码 SOTA。这次首发只面向少数可信伙伴,并配合美国政府网络安全审查分阶段放开--能力跃升与安全门槛同步收紧,才是本次发布最值得关注的信号。 来源:OpenAI News https://www.bestblogs.dev/article/97e62d58
【2】 ★ 精讲|Deep Agents 的提示词缓存 LangChain 拆解了把生产级 Agent 成本压下来的关键杠杆--提示词缓存。难点在于各家策略割裂:Anthropic、Gemini 支持显式断点,OpenAI 走最长前缀自动缓存,Gemini 仅有隐式缓存。其 Deep Agents 框架做了 provider 无关封装,在真实 Agent 轨迹上把 token 成本砍掉 49%-80%(claude-haiku -77%、gpt-5.4-mini -80%)。会话越长收益越大,长程任务最受益。 来源:LangChain Blog https://www.bestblogs.dev/article/91444258