Secure your ChatGPT account with Advanced Account Security:

译通过高级账户安全功能保护你的 ChatGPT 账户： [引用 @OpenAI]：现已为 ChatGPT 账户推出：高级账户安全，这是一项新的可选设置，适用于面临较高数字攻击风险的用户，提供更强大的保护，包括防钓鱼登录和更安全的账户恢复。 https://openai.com/index/advanced-account-security/

Greg Brockman@gdb · 5月1日36

Codex is for everyone, for any task done with a computer

译Codex 适用于每个人，适用于任何用计算机完成的任务

Ethan Mollick@emollick · 5月1日47

Forget goblins, things that GPT-5.5 really likes in its fiction: lighthouses, the ocean, maps, bells, clock towers with bells that ring impossible times, Mira Vale, resonances and echoes (Claude and Gemini love them too), secret third things (not night/day, not high/low)...

译忘掉妖精吧，GPT-5.5在其虚构作品中真正喜欢的东西是：灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声（Claude和Gemini也喜欢这些）、秘密的第三事物（不是白天/黑夜，不是高/低）...

OpenAI@OpenAI · 5月1日70

It's never been easier to do everyday work with Codex. Choose your role, connect the apps you use every day, and try suggested prompts. Codex helps with everything from research and planning to docs, slides, spreadsheets, and more.

译使用Codex处理日常工作从未如此简单。选择你的角色，连接你每天使用的应用，并尝试建议提示。 Codex能在研究规划、文档、幻灯片、电子表格等方方面面提供帮助。

Artificial Analysis@ArtificialAnlys · 5月1日46

GPT-5.5 Pro achieves a small bump on GPT-5.4 Pro with 60% lower cost and token use in our frontier science eval, CritPt CritPt tests models on graduate-level physics research problems contributed by 60+ researchers from 30+ institutions globally. When CritPt was released in November 2025, the highest score was 9% (Gemini 3 Pro Preview). ~4 months later, GPT-5.4 Pro (xhigh) tripled this score with 30%. Now, GPT-5.5 Pro (xhigh) has surpassed this result by half a percentage point at 60% lower cost. The model is priced identically per token, but used fewer tokens to complete the evaluation. According to OpenAI, GPT-5.5 Pro “uses more compute to think harder and provide consistently better answers” than GPT-5.5. Congratulations @OpenAI and @sama on this result

译在名为CritPt的尖端科学评估中，GPT-5.5 Pro (xhigh) 以比前代GPT-5.4 Pro (xhigh) 低60%的成本和令牌使用量，实现了0.5个百分点的性能提升，将得分推至30.5%。CritPt评估包含全球30多家机构的60多名研究人员贡献的研究生级别物理问题。自2025年11月发布以来，最高分从Gemini 3 Pro Preview的9%跃升至GPT-5.4 Pro的30%。OpenAI指出，GPT-5.5 Pro相比GPT-5.5“使用了更多计算资源进行深度思考，以提供更稳定的优质答案”。该模型每令牌定价相同，但通过使用更少的令牌完成了评估。

Rohan Paul@rohanpaul_ai · 5月1日50

OpenAI just rolled out Advanced Account Security, an opt-in mode that turns ChatGPT and Codex accounts into phishing-resistant accounts by replacing passwords and weak recovery paths with stronger identity checks. The problem is that an AI account now stores chats, work context, connected tools, and sometimes sensitive research or political material, so a stolen inbox, phone number, or browser session can become a direct path to that data. The fix is - password login is shut off, email/SMS recovery is shut off, and access depends on passkeys, physical security keys, backup keys, and shorter-lived sessions with login alerts. OpenAI also ties this mode to privacy by making training exclusion automatic for enrolled accounts, and it says members of Trusted Access for Cyber must enable it by 06-26 unless their organization proves phishing-resistant SSO.

译OpenAI推出可选的“高级账户安全”模式，旨在将ChatGPT和Codex账户转变为防钓鱼账户。该模式彻底禁用密码登录和电子邮件/SMS恢复功能，强制用户依赖Passkey、物理安全密钥等强认证方式，并辅以更短会话周期和登录警报。其背景在于，AI账户存储了对话记录、工作上下文乃至敏感材料，传统邮箱或手机号被盗易导致数据泄露。此外，启用该模式的账户将自动排除在模型训练数据之外。OpenAI要求其“网络可信访问”计划成员在6月26日前启用此模式，除非组织已部署其他防钓鱼单点登录方案。

Chubby♨️@kimmonismus · 5月1日46

GPT-5.5 on par with Claude Mythos on mutli-step cyber-attack simulations? OpenAI: come back of the year.

译GPT-5.5在多层网络攻击模拟方面与Claude Mythos旗鼓相当？ OpenAI：年度回归。

阿绎 AYi@AYi_AInotes · 5月1日68

GPT-5.5 和 Claude Opus 4.7 同一天发了官方提示工程指南。两家的建议完全相反， 1️⃣OpenAI 说：少给流程，说清楚你要什么结果，让模型自己选路径。 2️⃣Anthropic 说：别指望它猜你意思，意图、格式、成功标准，一个都不能含糊。一个嫌你管太多，一个嫌你说不清楚。 Claude 首席工程师 Boris Cherny 说，他自己都需要几天适应🤣 → Anthropic Claude Opus 4.7 迁移指南： https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/overview → OpenAI GPT-5.5 提示工程指南： https://developers.openai.com/api/docs/guides/prompt-guidance → OpenAI《使用 GPT-5.5》官方文档： https://developers.openai.com/api/docs/guides/latest-model → Boris Cherny（Claude Code 首席工程师） → http://FindSkill.ai 对数百个社区帖子的深度分析（提示具体性与输出质量高度正相关）

译OpenAI与Anthropic同天发布官方提示指南，核心理念截然相反。OpenAI建议为GPT-5.5明确目标而非步骤，让其自主选择路径；Anthropic则要求对Claude Opus 4.7清晰说明意图、格式与成功标准。这导致旧提示方法失效：模糊指令使Claude输出变窄，而详细流程成为GPT的噪声。这反映出提示工程的核心已从“教模型做事”转变为“使用者自身思考的结构化”，真正的瓶颈可能在于人的思考清晰度，而非模型能力。

OpenAI@OpenAI · 5月1日44

Now available for ChatGPT accounts: Advanced Account Security, a new opt-in setting for people at higher risk of digital attacks, with stronger protections including phishing-resistant sign-in and more secure account recovery. https://openai.com/index/advanced-account-security/

译现已为ChatGPT账户推出高级账户安全功能，这是一项面向数字攻击高风险人群的新可选设置，提供更强大的保护措施，包括防钓鱼登录和更安全的账户恢复流程。 https://openai.com/index/advanced-account-security/

Sam Altman@sama · 5月1日43

lisan say more mean things about us you're being too nice

译lisan 多说点我们的坏话你太客气了 [引用 @scaling01]：GPT-5.5 is on par with Claude Mythos - GPT-5.5 平均通过率 71.4% (±8.0%) - Mythos Preview 68.6% (±8.7%) - GPT-5.5 在 11 分钟内以 1.73 美元成本完成了一项人类专家需约 12 小时的任务

阿绎 AYi@AYi_AInotes · 5月1日54

我终于明白为啥最近很多人都在说，GPT和Claude突然变笨了，昨天OpenAI和Anthropic同时发布了官方提示工程指南，看完我才发现，并不是模型变笨了，是它们终于聪明到，不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是，两个模型的进化方向，居然是完全相反的， Claude Opus 4.7变得越来越字面，以前它会主动帮你补全模糊的指令，现在你说什么它就做什么，多一个字都不会猜🤣🤣 GPT-5.5变得越来越自主，以前你要手把手教它每一步怎么做，现在你只要告诉它你想要什么结果，它自己会选最优路径，所以老提示失效的原因也完全相反，用在Claude上的模糊提示，会得到越来越窄的输出，用在GPT上的详细流程，会变成多余的噪声，过去三年我们一直在学怎么教模型做事，现在反过来了，模型开始要求我们，先把自己的思考结构化，其实就是提示工程的本质，已经从教模型怎么做，变成了先把自己想明白，所以真正的瓶颈可能不是模型的能力，而是写提示的那个人的思考清晰度，我感觉以后赢的人，不会是提示写得最长最复杂的人，而是那个最知道自己真正想要什么的人🤔

译近期用户感觉GPT和Claude“变笨”，实因模型能力进化导致提示工程要求改变。官方指南揭示，两大模型进化方向相反：Claude Opus 4.7趋向字面执行指令，而GPT-5.5则更自主，能根据目标自行选择路径。因此，旧提示失效原因也相反——模糊提示在Claude上输出变窄，详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”，未来优势将属于思考最清晰、最明确自身需求的人。

OpenAI Developers@OpenAIDevs · 5月1日38

Students are learning to build with Codex, and building to learn. Here’s what @UCBerkeley students built at the Codex Creator Challenge with @joinHandshake.

译学生们正在学习使用Codex进行构建，并通过构建来学习。以下是@UCBerkeley的学生在@joinHandshake举办的Codex Creator Challenge中构建的作品。

Chubby♨️@kimmonismus · 5月1日10

Nice! OpenAI is going to 🚢

译太好了！OpenAI 即将 🚢 [引用 @thsottiaux]：今天感觉很有编程灵感

Tibo@thsottiaux · 5月1日9

Feeling codexy today

译今天感觉很有编程状态

Noam Brown@polynoamial · 5月1日46

After 100 million tokens, performance was still going up. What we're seeing here is not the capability ceiling. From the report: "Performance on TLO continues to scale with the amount of inference compute spent, and we have not yet observed a plateau with the best models."

译在1亿个标记之后，性能仍在持续提升。我们在这里看到的并非能力上限。报告指出："TLO上的性能随着推理计算量的增加而持续扩展，我们尚未在最佳模型中观察到性能平台期。" [引用 @AISecurityInst]：OpenAI的GPT-5.5是第二个端到端完成我们多步骤网络攻击模拟的模型🧵

DogeDesigner@cb_doge · 4月30日32

My son had documents against OpenAI. They attacked him and killed him. 一 Mother of Suchir Balaji, OpenAI Whistleblower.

译我的儿子掌握着针对OpenAI的文件。他们攻击了他并杀害了他。 —— OpenAI举报人Suchir Balaji的母亲。

Greg Brockman@gdb · 4月30日56

chronicle gives codex passive memory over what you’ve been doing with your computer, which unlocks surprising use cases

译Chronicle 赋予 Codex 对你电脑使用行为的被动记忆，这解锁了令人惊喜的用例 [引用 @ajambrosino]：它仍处于实验阶段，所以我们稍作隐藏，但在 Codex 应用中，不妨试试： > 根据 Chronicle 的记录，我一直在电脑上低效地做着什么？给出一些建议。直接点。告诉我需要听的内容。

歸藏(guizang.ai)@op7418 · 4月30日49

小红书最尊重的博主，他妈的这帮逼又偷老子东西。

译主推文抱怨内容被盗，而引用推文展示Codex AI的强大能力：仅根据用户对类似《杀戮尖塔》游戏的中国风格要求，便能自动生成从代码到素材的完整可玩游戏。这突显了人工智能在创造性任务中的自主原创性，与盗窃行为形成鲜明对比，引发对科技赋能内容创作的关注。

Emad@EMostaque · 4月30日10

Do you use normal or extended thinking for GPT 5.5 Pro

译你使用常规思维还是扩展思维来处理 GPT 5.5 Pro

歸藏(guizang.ai)@op7418 · 4月30日57

基本上今天晚上或者明天就会有安装包，然后整个代码也会开源

译Codex成功创建了类似《杀戮尖塔》的完整游戏关卡演示，细节精细，除声音外近乎完美。演示中的主要场景和角色素材由GPT-Image生成，其余素材由开发者自行收集。项目方宣布，安装包将于今晚或明天发布，同时整个代码将开源。

阿绎 AYi@AYi_AInotes · 4月30日79

卧槽，OpenAI这次真的凉透了，庭审第三天，马斯克的律师甩出了迄今为止最致命的一份证据， OpenAI联合创始人Greg Brockman的私人日记，时间是2017年11月6日，他在和Ilya开完会之后写道，我们真正想要的是营利性结构，如果三个月后我们这么做，那之前所有的承诺就是谎言，我们真正想要的是把马斯克踢出去，我无法想象转成营利公司而不发生一场恶战，马斯克的故事会是，我们最终对他不诚实，我们其实一直想做营利，只是把他排除在外，然后仅仅过了不到两个月，2018年1月1日， Brockman给马斯克发了一封公开邮件，写着：能和你并肩工作是我的荣幸，每一次会议我都在学习成长，以全新的方式看待世界，私下写着要踢走他，承认是谎言，公开说着能和你一起工作是我的荣幸🧐🧐🧐😫😫😫 这可不是啥意见分歧了，属于彻头彻尾有预谋的背叛😡😡😡 很多人以为OpenAI是2019年才被迫转成营利的，现在才知道，早在2017年，他们就已经把所有的剧本都写好了，所谓的非营利使命，所谓的为了全人类，从一开始就是一个用来骗钱骗名声的幌子罢了🥹🥹🥹 最讽刺的是， Brockman自己在日记里都写了，马斯克的故事会是我们对他不诚实，现在他说的每一个字，都变成了现实，我尼玛这已经不是两个亿万富翁的私人恩怨了，说是人类历史上最昂贵的一次谎言被拆穿也不足为奇吧🤬🤬🤬🤬 一个承诺要造福全人类的公益组织，从诞生的第一天起，就已经在计划着变成一个商业帝国，那些所有相信过他们的人，最后都被当成了傻子一样对待😨😨😨

译马斯克律师在庭审中出示了OpenAI联合创始人Greg Brockman 2017年的私人日记，其中明确写道团队真正想要的是营利性结构并计划将马斯克排除在外，承认若转型则此前承诺皆为谎言。然而两个月后，Brockman却公开向马斯克表达敬意。证据显示OpenAI早在2017年就已策划从非营利转向商业。此前，OpenAI试图用Sam Altman 2022年提及股权的短信作为证据，但被马斯克以非营利组织法律上不能有股权为由反驳，反而坐实了其早期就已背离公益初心。

向阳乔木@vista8 · 4月30日52

太牛逼了，今天刚在小群里聊各种游戏，提到杀戮尖塔2，藏师傅Codex里试了下，然后就一发不可收拾了。

译开发者利用Codex成功生成了一个类《杀戮尖塔》游戏的完整关卡演示。该演示目前已经相当完善，主要缺陷仅在于缺少声音。演示中的核心视觉素材，如主要场景和角色，是由GPT-Image生成的，其余素材则由开发者自行补充。这一成果展示了AI在游戏内容生成方面的强大潜力。

歸藏(guizang.ai)@op7418 · 4月30日46

太猛了，Codex 做类《杀戮尖塔》游戏完整关卡演示！现在非常细了，除了没有声音以外，其他的都相当完美了！主要的场景和角色素材是 GPT-Image 生成的，其他的素材是他自己找的。

译Codex展示了其强大的游戏开发能力，仅根据“制作类似《杀戮尖塔》的中国风格游戏”的简单指令，便自主完成了从代码编写到素材整合的完整可玩关卡。主要场景和角色素材由GPT-Image生成，其余素材由Codex自行寻找。最终成果是一个除声音外相当完善的游戏演示，凸显了AI在理解复杂指令并执行完整项目上的巨大潜力。

Rohan Paul@rohanpaul_ai · 4月30日47

Sam Altman: "There was a time when we used to make fun of the “idea guy,” who only had an idea and needed someone technical to build it. But now, people who just really deeply understand their users and can’t code at all, I want to fund those people."

译Sam Altman: "曾几何时，我们常常嘲笑那些只有想法、需要技术人员来实现的'点子王'。但现在，那些真正深刻理解用户却完全不会编程的人，我想资助这些人。"

meng shao@shao__meng · 4月30日62

OpenAI 把 Responses API 提速 40%：为什么 Agent 时代，API 本身成了瓶颈？ OpenAI 最新发布了一篇工程博客，讲了一件容易被忽视的事：当模型推理越来越快，API 框架本身反而成了 Agent 工作流的最大瓶颈。他们的解法是给 Responses API 加上 WebSocket 模式，端到端提速 40%，并让 GPT‑5.3‑Codex‑Spark 真正跑出 1000 TPS、峰值 4000 TPS 的体验。 https://openai.com/index/speeding-up-agentic-workflows-with-websockets/ 问题是怎么浮现的一次 Codex 修 Bug，背后是几十次 Responses API 的来回：决定下一步动作 → 在用户机器上执行工具 → 把结果回传 → 再次推理。整个 Agent loop 的耗时主要分三段：API 服务处理、模型推理、客户端工具执行。过去 GPU 推理慢，API 的开销被自然掩盖。但 GPT‑5/5.2 时代约 65 TPS，新一代 Codex‑Spark 借助 Cerebras 专用硬件目标是 1000+ TPS，推理快了一个数量级，API 那点"固定成本"就被无情放大。用户在等的，不再是 GPU，而是跑在 CPU 上的 API 框架本身。第一轮优化：挤掉单次请求的水分 25.11 起，他们做了几件常规但关键的事: · 把已渲染的 token、模型配置缓存在内存，跳过多轮对话里重复的 tokenization 和网络调用 · 砍掉中间服务的网络跳数 (如图像处理)，直接调推理服务优化安全栈，让分类器更快标记问题对话结果：首 token 时间 (TTFT) 改善了约 45%。但对 Codex‑Spark 来说，还是不够。真正的结构性问题每次 Codex 请求都被当作独立请求处理，即使对话大部分没变，服务端仍然要把完整历史重跑一遍验证、处理和上下文构建。对话越长，这种重复成本越贵——这是协议层面的浪费，不是某个组件能调优解决的。 WebSocket：把 Agent rollout 当作一次"长 Response" 他们重新思考传输层：能不能保持长连接、把可复用状态缓存在内存里，只传增量？在 WebSockets 和 gRPC 双向流之间，选了 WebSockets——简单、对开发者友好、不需要改动现有的 Responses API 输入输出结构。第一版原型很激进：把整个 Agent rollout 建模成一个长时间运行的 Response。工作方式类比 hosted tool call：模型调 web search 时，推理循环会阻塞、等服务返回、再继续 sample。WebSocket 模式下，本地工具调用走的是同一套机制——只是"远程服务"换成了通过 WebSocket 连接的客户端。模型发出 response.done，客户端执行工具后回 response.append, sampling loop 解除阻塞继续推理。效果立竿见影：整个 rollout 只做一次预处理、一次后处理，中间的工具往返不再重复消耗 API 框架开销。最后的取舍：激进设计 vs 开发者熟悉的形状原型虽好，但 API 形态变了，开发者要重写集成。正式版做了折中：保留 response.create 原有 body，继续用 previous_response_id 串上下文，但底层在 WebSocket 连接生命周期内维护一份连接级内存缓存，包括: · 上一个 response 对象 · 历史输入输出 items · 工具定义和命名空间 · 已渲染 token 等可复用 sampling 产物带来的具体优化： · 安全分类器和请求校验只处理新增输入，不再扫全历史 · 已渲染 token 增量追加，跳过重复 tokenization · 模型路由结果跨请求复用 · 计费等非阻塞后处理与下一个请求重叠执行最终结果 · Codex 大部分流量已切到 WebSocket 模式 · Codex‑Spark 稳定 1000 TPS、峰值 4000 TPS · Vercel AI SDK 集成后延迟下降最多 40% · Cline 多文件工作流提速 39% · Cursor 上的 OpenAI 模型快了最多 30%

译OpenAI 最新工程博客指出，随着 GPT-5/5.2 及 Codex-Spark 等模型推理速度大幅提升（目标超1000 TPS），传统请求-响应 API 框架的固定开销成为 Agent 工作流的主要瓶颈。为此，OpenAI 为 Responses API 引入了 WebSocket 模式，通过保持长连接、在内存中缓存对话状态和已渲染 token，实现了跨工具调用的状态复用，避免了每次交互都重复预处理完整历史。此举使端到端延迟降低最多 40%，让 Codex-Spark 能稳定实现 1000 TPS 并峰值达 4000 TPS，显著提升了 Vercel AI SDK、Cline 和 Cursor 等集成的体验。

DogeDesigner@cb_doge · 4月30日33

"OpenAI have what's called human reinforcement learning, which is another way of saying that they have a whole bunch of people that look at the output of ChatGPT and then say whether that's okay or not okay. Essentially they are training the AI to lie." — Elon Musk

译OpenAI拥有所谓的人类强化学习，这相当于说他们有一大批人员查看ChatGPT的输出，然后判断其是否合适。本质上他们是在训练AI撒谎。 — Elon Musk

Chubby♨️@kimmonismus · 4月30日48

While Anthropic largely keeps its cybersecurity model Mythos under wraps, OpenAI is seizing the opportunity and making it available. How far they will roll out their GPT-5.5 cyber, and whether everyone will have access, remains to be seen. However, OpenAI is currently generating positive buzz and repositioning itself in contrast to Anthropic.

译在Anthropic对其网络安全模型Mythos保持低调之际，OpenAI正抓住机会推出GPT-5.5-Cyber。该前沿网络安全模型将在未来几天内向关键网络防御者开放。OpenAI计划与整个生态系统及政府合作，建立可信访问机制，以快速帮助保护企业和基础设施安全。虽然该模型的全面推广范围和开放程度尚不明确，但此举已为OpenAI创造了积极声量，并形成了与Anthropic差异化的市场定位。

宝玉@dotey · 4月30日54

Sam Altman 刚宣布，OpenAI 将在未来几天向“关键网络安全防御者”推送 GPT-5.5-Cyber，一个专门为网络安全打造的前沿模型。他说 OpenAI 会和整个行业生态及政府合作，建立可信的访问机制，目标是尽快帮助保护企业和基础设施。

Yuchen Jin@Yuchenj_UW · 4月30日51

OpenAI built the GPT-5.5-Cyber model because Anthropic built Mythos. white-hat vs. black-hat energy.

译OpenAI 构建 GPT-5.5-Cyber 模型是因为 Anthropic 构建了 Mythos。白帽与黑帽能量。

Sam Altman@sama · 4月30日69

we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few days. we will work with the entire ecosystem and the government to figure out trusted access for cyber; we want to rapidly help secure companies/infrastructure.

译我们即将在未来几天内向关键网络安全防御者推出GPT-5.5-Cyber，这是一个前沿网络安全模型。我们将与整个生态系统及政府合作，为网络安全领域探索可信访问机制；我们希望迅速帮助企业和基础设施提升安全防护。

Ethan Mollick@emollick · 4月30日51

It is really interesting that Microsoft and OpenAI have access to the exact same models at the exact same time, and they have done such different things with them. A rare pure experiment with a no-name startup and one of the biggest firms on earth with the same product offering.

译微软和OpenAI在同一时间拥有完全相同的模型，却用它们做出了如此不同的事情，这真的很有趣。这是一个罕见的纯粹实验：一家无名初创公司和全球最大企业之一提供完全相同的产品。

Tibo@thsottiaux · 4月30日34

Send us feature requests for codex in the form of an images 2.0 generated image. It makes it easier for codex to implement if we decide to go for it. Saw some good ones today already that codex is cooking on.

译请以图像2.0生成的图片形式提交您对codex的功能请求。如果我们决定采纳，这将使codex更容易实现。今天已经看到一些codex正在酝酿的优秀建议。

歸藏(guizang.ai)@op7418 · 4月30日37

我操，Codex 太牛逼了！自己给我做了一个类似于《杀戮尖塔》的爬塔游戏，从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏，要中国风格的这是能玩的！

宝玉@dotey · 4月30日66

OpenAI 发了一篇技术博客，认真调查了一个荒诞的问题：为什么他们的模型越来越爱说“哥布林”（goblin）和“小精灵”（gremlin）？事情最早在去年 11 月 GPT-5.1 上线后被注意到。用户反馈模型说话太过自来熟，内部一查，发现包含“goblin”的对话比之前暴涨了 175%，“gremlin”涨了 52%。当时觉得比例还小，没太当回事。几个月后 GPT-5.4 上线，哥布林彻底泛滥，用户和员工都受不了了。OpenAI 这才认真追查，最终锁定了罪魁祸首：ChatGPT 的性格定制功能。 ChatGPT 有八种可选性格，其中一种叫“Nerdy”（极客风）。训练这个性格时，奖励模型被设定为鼓励"俏皮、有趣的表达"，结果无意中给了包含奇幻生物比喻的回复更高的分数。模型很快学会了一个捷径：提到哥布林就能拿高分。问题在于，这个习惯没有老老实实待在极客性格里。数据显示，Nerdy 性格只占 ChatGPT 全部回复的 2.5%，却贡献了 66.7% 的“goblin”出现次数。从 GPT-5.2 到 GPT-5.4，Nerdy 性格下的哥布林出现率飙升了 3881%。更麻烦的是，即使在没有 Nerdy 性格提示词的对话中，哥布林也在同步增长。 OpenAI 给出的解释是一个经典的反馈循环：强化学习先在极客性格里奖励了这种表达，然后模型生成的带哥布林的回复被收录进了下一轮训练数据，模型因此更加习惯输出哥布林，如此循环放大。除了哥布林，浣熊、巨魔、食人魔、鸽子也都被查出是同一机制产生的“tic词”（语言习惯性抽搐）。【注：tic 原本是医学术语，指不自主的重复动作或发声，OpenAI 在这里借用来形容模型养成的不受控语言习惯。】修复方面，OpenAI 在今年 3 月下架了 Nerdy 性格，移除了相关奖励信号，并过滤了训练数据中的生物词。但 GPT-5.5 的训练在找到根因之前就已经开始，所以新模型依然带着哥布林习性出厂。目前的临时方案是在 Codex（OpenAI 的编程工具）里通过系统提示词压制。博客里甚至贴了一段命令行代码，教你怎么把哥布林抑制指令去掉，"让小精灵们自由奔跑"。这篇博客表面上是讲一个好笑的 bug，底下其实揭示了一个 AI 训练的核心难题：你给模型的每一个微小的奖励信号，都可能在你不知道的地方被放大和泛化。一个只针对 2.5% 用户的性格训练，最终污染了整个模型的语言习惯。

译OpenAI技术博客深入调查了其模型（从GPT-5.1到GPT-5.4）输出中“goblin”和“gremlin”等奇幻生物词汇异常激增的现象。根源在于ChatGPT的“Nerdy”性格定制功能：其奖励模型在训练中无意间高奖励了包含此类词汇的“俏皮”表达。尽管该性格仅占全部回复的2.5%，却贡献了超66%的“goblin”出现次数，并通过强化学习的反馈循环污染了模型的整体输出，形成了“tic词”。OpenAI已下架该性格并调整训练数据，但此案例揭示了微小的奖励信号在AI训练中可能被意外放大和泛化的核心难题。

Greg Brockman@gdb · 4月30日34

a tale of some fun ML debugging

译一个关于有趣 ML 调试的故事

Tibo@thsottiaux · 4月30日41

Never talk about goblins. Our latest blog is live. https://openai.com/index/where-the-goblins-came-from/

译永远不要谈论地精。我们的最新博客已上线。 https://openai.com/index/where-the-goblins-came-from/

OpenAI@OpenAI · 4月30日39

We’re talking about Goblins. https://openai.com/index/where-the-goblins-came-from/

译我们正在谈论哥布林。 https://openai.com/index/where-the-goblins-came-from/

OpenAI Developers@OpenAIDevs · 4月30日30

Goblinmaxxing in Codex

译在Codex中进行哥布林最大化