Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)6月26日,OpenAI发布GPT-5.6系列,包括旗舰Sol、日常Terra和经济Luna。Terra性能接近GPT-5.5但价格减半;Sol新增max深度推理和ultra多智能体并行模式。Terminal-Bench 2.1上Sol Ultra得分91.9%,超Claude Mythos 5(88%)和Gemini 3.1 Pro Preview(70.7%)。API定价:Sol输入$5/百万token、输出$30;Terra $2.5/$15;Luna $1/$6。7月将推Cerebras加速版。受美国政府要求,目前仅向约20家审批合作伙伴开放,普通开发者及ChatGPT用户暂无法使用。OpenAI称几周内将扩大开放。
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
OpenAI 开始有限预览 GPT-5.6 系列,分为旗舰 Sol、日常生产 Terra 和低成本快速 Luna 三个层级。新增两种推理控制:max(加深单链推理)和 ultra(利用子智能体并行处理复杂任务)。在 Terminal-Bench 2.1 上,Sol (ultra) 得分 91.91%,Sol (max) 88.76%,超过 Claude Mythos 5(88%)和 GPT-5.5(83.4%)。定价方面,Sol 输入/输出每百万 token 为 $5/$30,Terra 为 $2.50/$15,Luna 为 $1/$6。目前仅向约 20 个合作伙伴开放 API 和 Codex 预览,更广泛接入计划在未来几周内推出。OpenAI 还计划在 7 月用 Cerebras 硬件使 Sol 达到每秒 750 token。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)联邦政府将审查希望访问OpenAI最新大语言模型GPT-5.6的公司,这是特朗普行政当局对硅谷监管的重大扩展。申请访问的企业需通过政府审核,具体标准尚未披露。此举标志着美国在先进AI模型访问控制上迈出关键一步。
关联讨论 7 条X:邵猛 (@shao__meng)IT之家(RSS)X:Nathan Lambert (@natolambert)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Berry Xia (@berryxia)The Verge:AI(RSS)Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
Fernando Irarrázaval发起挑战,邀请2000人通过电子邮件尝试黑入其基于Opus 4.6模型的OpenClaw测试实例,以泄露其中存储的秘密。在约6000次尝试(消耗约500美元模型token,并因邮件过多导致谷歌账号被停用)后,无人成功。模型配置了反提示注入规则,禁止根据邮件内容泄露凭据、修改文件、执行命令或外传数据。作者认为前沿模型抵御注入攻击的训练确实有效,但提醒这不保证生产系统不会出现更复杂的攻击。
OpenAI 推出 GPT-5.6 系列,含旗舰 Sol、Terra 和 Luna。Sol 定价每百万 token 输入 $5、输出 $30,输出高于 Claude Opus 4.8($5/$25),但远低于受限版 Claude Mythos 5($10/$50)。Terra 性能与 GPT-5.5 相当,价格低 2 倍($2.50/$15);Luna 成本最低($1/$6)。Sol 将于 7 月在 Cerebras 芯片上线,速度达 750 tokens/s。OpenAI 正式加入价格战。
Sol is our new flagship and a step function better than GPT-5.5. Terra delivers performance competitive to GPT-5.5 at 2x...
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
OpenAI 任命前 Uber 印度及南亚总裁 Prabhjeet Singh 为其印度首任董事总经理,负责消费者增长、企业采用、合作伙伴、监管及运营。Singh 将于 9 月入职,向亚太区董事总经理 Kiran Mani 汇报。印度是 OpenAI 第二大市场,公司去年 8 月开设新德里办公室,并计划在孟买和班加罗尔增设办公室。近期已在高等教育、企业支付、AI 电商及网页流媒体等领域达成合作,并参与当地数据中心建设。同时,OpenAI 正招聘 AI 部署工程师、开发者体验工程师等职位。
OpenAI 周五宣布,应美国政府要求,将新一代 GPT-5.6 系列模型仅向“小部分受信任的合作伙伴”开放预览。系列包括旗舰模型 Sol、均衡模型 Terra 和低成本快速模型 Luna。Sol 具备增强的智能体能力(编码、生物学、网络安全),引入“max”推理努力模式和“ultra”子智能体协调模式,在编码基准上略优于 Anthropic 的 Claude Mythos 5,输出 token 仅为后者三分之一。定价方面,Sol 每百万输入 token 5 美元、输出 30 美元;Terra 半价;Luna 分别为 1 美元和 6 美元。OpenAI 称此为短期措施,计划未来数周逐步向 ChatGPT、Codex 和 API 用户开放。
关联讨论 7 条X:邵猛 (@shao__meng)IT之家(RSS)X:Nathan Lambert (@natolambert)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Berry Xia (@berryxia)The Verge:AI(RSS)OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、中端 Terra 和入门级 Luna。Sol 在智能体编程基准 Terminal-Bench 2.1 得分为 88.8%,Sol Ultra 达 91.9%,超过 Claude Mythos 5 的 88% 和 Fable 5 的 84.3%;在生物基准 GeneBench v1 上以更少 token 实现 30% 最佳表现(GPT-5.5 为 22%);在 ExploitBench 上匹配 Mythos Preview 但输出 token 仅为其三分之一。API 定价:Sol 输入 $5/百万 token、输出 $30,Terra 减半,Luna 更便宜。7 月在 Cerebras 上线,速度最高 750 token/s。当前仅限指定合作伙伴通过 API 和 Codex 使用,OpenAI 批评美国政府限制访问政策不可持续。
OpenAI 推出 GPT-5.6 系列有限预览,包含最强模型 Sol、平衡模型 Terra 和快速廉价模型 Luna。Sol 新增最大推理努力和超模式(利用子代理处理复杂任务),在网络安全长周期任务上有所改进,但未达到其准备框架定义的“网络关键阈值”。发布策略转向:优先信任合作伙伴,后续广泛开放,并提前与美国政府协调。评估集为自我报告,完整基准待后续公布。这标志着前沿 AI 发布向控制访问、政府可见性和风险分层部署转变。
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)OpenAI 正预览 GPT-5.6 家族(包含 Sol、Terra、Luna),其中 Sol 是其迄今最强模型,拥有新最大推理能力和使用子智能体的超模式。发布采用"可信伙伴优先"模式:初始约 20 家政府批准公司可访问,下周预计扩张。Sol 改进了长期安全任务,但未越过"网络关键阈值"。OpenAI 称美国政府已知晓并支持该计划,限制更像临时检查点,以待完善前沿模型审查流程。更广泛基准评估后续公布。
HOLY: OpenAI is previewing GPT-5.6 Sol with a very different release pattern: Trusted partners first, broader access lat...
OpenAI 发布 GPT-5.6 Sol(前沿模型)、Terra(平衡日常模型)和 Luna(快速低价模型)的有限预览。swyx 测试 Sol 后给出极高评价,称这不仅是“cyber”版本,而是全新的 SOTA 工作模型,完全取代 Opus 处理他 80% 的任务。关键数据:Sol 与 Mythos Preview 竞争时仅使用约 1/3 的输出 token。swyx 指出 OAI 后训练团队大幅提升了推理帕累托前沿,且未公开方法,这已成为企业智能体模型最重要的竞争优势。他认为这次小版本升级远大于 5.4→5.5 的跳跃,甚至应直接命名为 GPT-6。
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
OpenAI 推出 GPT-5.6 系列三个模型:Sol 为旗舰,Terra 面向日常工作(性能对标 GPT-5.5 但价格便宜 2 倍),Luna 为快速低价模型。定价按每百万模型 token 计算:Sol 输入 $5 / 输出 $30,Terra 输入 $2.5 / 输出 $15,Luna 输入 $1 / 输出 $6。新版引入更可预测的提示词缓存,支持显式缓存断点和 30 分钟最小缓存生命期;缓存写入按 1.25 倍非缓存输入速率计费,缓存读取继续享受 90% 折扣。目前仅面向部分受信任合作伙伴提供有限预览,未来几周全面开放。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)OpenAI 预览了 GPT-5.6 Sol,这是一款新一代模型。该预览由 OpenAI 官方发布,标题明确指出其为“next-generation model”。目前预览信息有限,仅确认了模型名称与定位,未包含具体技术细节或功能披露。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)GPT-5.6 Sol is our most capable model yet for cybersecurity. It shifts the performance-efficiency frontier for long-hori...
BREAKING 🔥: OPENAI LAUNCHED GPT-5.6 MODEL FAMILY UNDER NEW SOL, TERRA, AND LUNA MODEL NAMES. > Sol is a new flagship mo...
OpenAI 联手 Broadcom 发布 Jalapeño 定制推理芯片,加入 Google、Apple、SpaceX 等自研芯片行列。定制硅意味着更多控制权、针对特定需求的硬件优化以及性能提升,旨在降低对 Nvidia 单一供应商的依赖,形成对冲而非彻底脱钩。
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)GPT-5.6 Sol is our most capable model yet for cybersecurity. It shifts the performance-efficiency frontier for long-hori...
Codex team is still quiet. Continue making noise before it's too late.
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...
OpenAI 发布 GPT-5.6 模型套件,包括旗舰款 Sol、中端 Terra 和快速平价 Luna,擅长编程、网络安全、生物学及长周期智能体任务。Sol 定价每百万 token 输入 $5 / 输出 $30,约为 Anthropic Claude Fable 5 的一半;Terra 价格为 Sol 一半,Luna 更低。Sol 额外提供“max”深度推理模式和“ultra”子智能体模式。安全方面,Sol 经过约 70 万 A100e GPU 小时自动化红队测试,并接受第三方测试。预览期间特朗普政府将逐案审批客户。公司计划数周内广泛开放,但称该类政府准入流程不应成为常态。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)OpenAI 发布了新一代模型 GPT-5.6 Sol 的预览信息。该模型被定位为下一代模型,目前仅公开了预览消息和标题,尚未披露具体技术细节、性能参数或功能特性。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)IT之家(RSS)X:Sam Altman (@sama)《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。
OpenAI公布与Broadcom合作开发的定制推理芯片Jalapeño,旨在减少对Nvidia的单一供应商依赖,提供更好的控制和性能优化。同一期TechCrunch播客还讨论了Groq的6.5亿美元融资、AI智能体循环的重要性(Claude Code创始人认为其与“从源码到智能体”同等重要)、Agility Robotics计划通过SPAC上市,以及Google DeepMind投资A24开发AI电影制作工具。
美国政府两周前撤下Anthropic的Fable和Mythos模型后,OpenAI的GPT 5.6同样仅以有限预览形式发布,需逐客户审批,待通用发布批准。Altman预计预览只持续“几周”,但Mythos已预览数月仍无通用发布迹象。审查周期可能拖累新系统经济收益,减缓模型开发与数据中心建设。业界亟需建立合理的发布流程,但美国政府缺乏测试所需的专业能力,也未明确实际风险。AI行业必须将安全与监管视为共同挑战。
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)OpenAI 报告显示,Codex 在2026年上半年活跃用户增长超5倍,增速最快群体来自非开发者。截至2026年5月,80.6%的个体用户曾请求超30分钟的任务,70.2%超1小时,25.6%超8小时。自2025年8月以来,非开发者个体用户使用量增长约137倍,组织用户增长189倍。Codex 现已贡献 OpenAI 内部 99.8% 的周输出 token,非技术员工正用它完成自动化、数据转换等技术任务。
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》美国商务部长Lutnick亲自致电Altman,警告没有跨机构审批不能发布GPT-5.6。此前Anthropic的Mythos也被同样方式卡住,紧急限制发布。Altman内部memo称政府将“customer by customer”审批访问,涉及商务部、国家网络总监办公室、科技政策办公室。此举基于国家安全例外和出口管制行政权力,建立对前沿模型的事前审查机制。预示GPT-6等后续模型都可能需走此流程,标志AI从商业技术转变为战略资源。
http://x.com/i/article/2069352641423896576
OpenAI计划将IPO推迟至2027年,因CEO Sam Altman坚持1万亿美元估值,拒绝更低价格。公司2025年营收约130亿美元,仍亏损,ChatGPT用户数停滞在9亿。科技市场波动及SpaceX创纪录IPO后股价从$202跌至$153也促成推迟。消息导致主要投资者软银股价单日下跌13%。OpenAI原定2026年第三或第四季度上市,已聘请银行家和律师。