6月17日

05:24

ChatGPT@ChatGPTapp

闪电般快速 📸 一种全新的、大幅改进的方式，可用于在 ChatGPT iOS 版中拍摄和上传照片。

OpenAI 产品更新

04:05

OpenAI@OpenAI

我们正在分享一项新研究，关于在发布前预测模型在实际使用中行为的方法：通过模拟部署，使用近期的去标识化用户请求，并研究候选模型的响应。https://openai.com/index/deployment-simulation/

OpenAI 安全/对齐论文/研究

03:53

jason@jxnlco

"原文为URL，无法翻译（http://x.com/i/article/2066964446086676480）"

OpenAI 其他编码

03:53

jason@jxnlco

对 computer use、browser use 和 chrome extension 感到困惑？这篇就是为你准备的读完后你会明白它们各自是什么、如何工作，以及 app shots 如何将它们串联起来

jason: http://x.com/i/article/2066964446086676480

智能体 OpenAI 教程/实践

03:52

OpenAI：Alignment 研究博客（RSS）

精选73

公开聊天数据能否预测真实世界AI失调？

OpenAI利用WildChat公开数据集（2023年4月至2024年5月收集的100万条对话）模拟模型部署，预测GPT-5.1、GPT-5.2、GPT-5.4在真实生产环境中的不良行为率。与私有生产数据对比发现，WildChat模拟的平均预测误差约3倍；但对技术性和智能体型失调的预测精度下降。研究验证了公开数据集作为外部审计工具的可行性。

OpenAI 安全/对齐论文/研究

推荐理由：用公开旧聊天数据预测模型真实失败率，误差居然在 3 倍以内，做外部审计的可以认真看看。不过 agentic 场景明显不行，需要新数据集。

03:25

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选74

OpenAI 发布 Deployment Simulation 方法：通过模拟部署预测模型发布前行为

OpenAI 近日发布 Deployment Simulation 方法，通过在隐私保护下重放历史对话、用新候选模型重新生成回复，模拟模型上线后的实际表现。在多个 GPT‑5‑series Thinking 部署中，该方法比传统评估更准确地估计了不良行为频率，发现新型对齐问题，并降低模型识别测试的风险。它还能扩展至涉及工具使用的智能体场景。传统评估存在覆盖不足、选择偏差和模型可识别测试等局限，而 Deployment Simulation 使用真实对话分布缓解了这些问题，但无法测量频率低于每 20 万条消息 1 次的行为。

OpenAI 安全/对齐论文/研究

关联讨论 1 条

推荐理由：虽然只是安全评估方法，但OpenAI用130万真实对话验证，把预部署风险预测误差压到1.5倍，这套方法很可能成为未来模型发布前的标准动作。

03:03

Tibo@thsottiaux

问题已修复。你知道接下来会发生什么👀 给我们24小时，在所有计划中重置Codex速率限制。

Tibo: Oy. We are aware that some Codex users are experiencing high error rates with "model at capacity" and are working to bri...

OpenAI 编码行业动态

01:32

SemiAnalysis@SemiAnalysis_

警报：OpenAI的首席财务官声称他们的下一次重大训练运行将在2026年秋季在Vera Rubin上进行，但这说不通。Rubin NVL72集群届时可能还不够稳定，软件栈也不足以支持真正的"重大训练运行"。Rubin或许已准备好用于生产推理和小规模训练实验，但无法在2026年秋季支持前沿规模的训练。

OpenAI 大佬观点数据/训练

01:32

OpenAI@OpenAI

我们来聊聊评估。我们一直在寻找更好的方法来衡量和预测模型进展，尤其是在基准测试逐渐饱和或被钻空子的时候。领导我们前沿评估团队的 @tejalpatwardhan 与 @andrewmayne 谈到了评估为何重要，以及接下来模型需要被评判的标准。

OpenAI 大佬观点评测/基准

01:23

TechCrunch：AI（RSS）

ChatGPT 市场份额首次跌破 50%

2026 年 5 月底，ChatGPT 市场份额降至 46.4%，为发布以来首次低于 50%。Gemini 以 27.7% 紧随其后，Claude 占 10.3%。ChatGPT 仍以超 11 亿月活跃用户领先，Gemini 和 Claude 分别拥有 6.62 亿和 2.45 亿用户。用户在不同助手间切换意愿增强，OpenAI 与美国国防部的合作曾引发卸载高峰。Claude 订阅转化率达 13%，领先行业。OpenAI 已在 ChatGPT 中试验广告，5 月日均 17% 用户看到广告，软件与购物为主要广告类别。ChatGPT 正向 Target、Walmart 等零售商导流，Amazon 因封锁爬虫错失流量。

Anthropic Google OpenAI 现象/趋势

00:53

jason@jxnlco

codex 欧盟用户们！ Chrome、电脑使用现在都在欧盟可用。 codex 现在可以跨你的 Mac 使用应用、在 Chrome

OpenAI 产品更新编码

00:46

🚨 AI News | TestingCatalog@testingcatalog

OPENAI 🔥： ChatGPT 即将迎来语音模式升级，新模型 "gpt-bidi-1" 已被发现，同时还有公告更新。敬请期待 👀 鸣谢 @M1Astra 来自 DevMode

Chetaslua: 🚨 OpenAI is planning to release GPT-Bidi-1 very soon Their next-generation voice model for more natural conversations [...

OpenAI 模型发布语音

00:31

Ars Technica：AI（RSS）

OpenAI财报泄露：2025年收入130亿美元，净亏损达390亿美元

OpenAI提交SEC文件准备IPO，泄露的审计财报显示其2025年收入130.7亿美元，但研发费用高达191.8亿美元（含向微软支付的105.9亿），营收成本75亿美元，销售与营销支出57.3亿美元。2025年运营亏损209.2亿美元，净亏损近390亿美元，其中包含约300亿美元因公司向营利制转型产生的一次性会计费用，剔除后净亏损约80亿美元。ChatGPT周活用户超9亿，仅约5000万付费。公司计划2030年实现盈利，正削减“副线项目”并聚焦核心编码与商业用户。

OpenAI 行业动态

关联讨论 3 条

00:22

OpenAI Developers@OpenAIDevs

智能体 OpenAI 产品更新

6月16日

23:48

fofr@fofrAI

你知道吗，Omni 也擅长文本处理。

OpenAI 多模态评测/基准

23:01

IT之家（RSS）

Sensor Tower：ChatGPT全球份额首次跌破50%但仍居首，Gemini和Claude追赶

ChatGPT全球市场份额降至46.4%首次跌破50%，仍以超11亿月活用户居首；Gemini月活6.62亿（份额27.7%），Claude月活2.45亿（10.3%）。2026上半年AI应用下载量近23亿次，用户支出超42亿美元。Claude付费转化率13%居行业第一。亚洲Q1下载量首次下降3.3%。全行业使用时长预计达360亿小时，前三大AI助手占总时长89%。

OpenAI 现象/趋势行业动态

21:47

jason@jxnlco

你在 codex 中见过哪些最好的技能？请分享你的仓库 / 链接

OpenAI 其他

21:17

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选78

2025年OpenAI亏损额激增近8倍，支出高达340亿美元

据Hacker News热门文章，OpenAI在2025年亏损额激增近8倍，年度总支出达到340亿美元。原文来自wheresyoured.at的独家财务分析报道，该信息在Hacker News上获得超过100个点赞。

OpenAI 行业动态

同一事件，精选展示《OpenAI 的领先优势正在快速缩小》

推荐理由：独家披露的 OpenAI 财务数据把 AI 行业的烧钱真相摆上了台面，亏损一年涨 8 倍意味着商业化压力已到临界点，这比任何技术参数都更能定义下一阶段的行业走向。

21:16

凡人小北@frxiaobei

Codex CLI 新版本这个功能好， /import 从 Claude Code 导入：设置、配置和聊天记录，挖墙脚继续。

Codex Changelog: 🚀 Codex CLI 0.140.0 is out! 📊 /usage: daily, weekly & cumulative token stats 📥 /import from Claude Code: setup, confi...

OpenAI 产品更新编码

21:04

AYi@AYi_AInotes

OpenAI Codex 2026版全景：架构、生态横评与最佳实践

OpenAI Codex 2026版以统一执行层+编排中枢架构覆盖App、CLI、IDE、Cloud、Web五入口，模型迭代至GPT-5.4 for Codex，Spark版快15倍。平台层由MCP、Skills（开放标准）、Plugins（可分发）构成。SWE-Bench Pro Public上56.8%微弱领先，OSWorld-Verified 64.7%接近人类；Claude Code在百万token重构占优，Codex强在异步执行与并行调度。最佳实践：Prompt含Goal/Context/Constraints/Done-when，用AGENTS.md固化持久指令，MCP按高频痛点优先配置。

智能体 MCP/工具 OpenAI 教程/实践

20:59

Tibo@thsottiaux

注意。我们注意到部分 Codex 用户遇到 "model at capacity" 导致的高错误率，正在努力恢复稳定。

OpenAI 编码行业动态

20:28

Rohan Paul@rohanpaul_ai

FT：OpenAI 增长迅速，但其数字也显示出前沿 AI 成本之高昂。他们去年花费 340 亿美元购买算力、人才和渠道。该公司录得约 130 亿美元营收，但研发支出约 190 亿美元，销售和营销支出近 60 亿美元。

OpenAI 行业动态

18:00

IT之家（RSS）

消息称 OpenAI 去年支出 340 亿美元，研发支出 190 亿美元

OpenAI 去年总支出达 340 亿美元，其中研发支出约 190 亿美元，销售与市场营销费用约 60 亿美元，基础设施、运营成本等约 90 亿美元。同期营收为 130 亿美元，净亏损 390 亿美元。持续亏损主要源于算力芯片采购、数据中心建设和人才挖角。OpenAI 正通过提高运营效率、控制研发支出增速、精简非核心项目，为今年 IPO 做准备。

OpenAI 行业动态

17:27

The Decoder：AI News（RSS）

OpenAI 去年支出 340 亿美元，净亏损约 390 亿但含一次性费用

OpenAI 过去一年支出 340 亿美元，其中约 190 亿投入研发，近 60 亿用于销售和营销。收入约 130 亿美元，年底月收入达 20 亿美元。净亏损从 50 亿跃升至约 390 亿美元，但《金融时报》指出其中约 300 亿为一次性非现金会计费用，剔除后实际亏损约 80 亿美元。OpenAI 正筹备 IPO，估值可能超 1 万亿美元。

OpenAI 行业动态

关联讨论 3 条

16:00

IT之家（RSS）

OpenRouter 发布 Fusion API，多模型协同以一半成本接近 Claude Fable 5 性能

AI 模型 API 聚合平台 OpenRouter 于 6 月 14 日推出 Fusion API，将用户请求并行发送至多个模型，经审查模型分析后由调用模型生成统一回答。官方测试显示，Claude Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro 组合得分 68.3%，超过单独 Claude Fable 5 的 65.3%；双 Claude Opus 4.8 组合得 65.5% 同样高于 Fable 5。低成本组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 得分 64.7%，以约 Claude Fable 5 一半的成本将分数差距控制在 1% 以内。

DeepSeek OpenAI 产品更新推理

14:35

Greg Brockman@gdb

我们刚为 ChatGPT 推送了更快、更流畅的照片附件体验！附件菜单现在可平滑过渡到相机，拍摄更迅速，选中的图片直接移入输入框，整个流程如同一个连续动作。优秀的用户体验影响巨大。

Naman Kedia: We just shipped a faster, more fluid photo attach experience in ChatGPT! The attach menu now transitions smoothly into t...

OpenAI 产品更新多模态

14:03

AYi@AYi_AInotes

一条推文幽默描述了AI编程工具Codex在写代码过程中突然"摸鱼"，表示代码先不写了，要去开户炒股赌两手。该推文以拟人化手法调侃AI的"罢工"行为，未涉及具体技术细节、模型版本或性能数据。

AYi: http://x.com/i/article/2063237792746831872

OpenAI 现象/趋势

11:37

宝玉@dotey

用Codex反编译Codex App源码😜

Tinyfool: 你用codex做的最疯狂的事情是啥?

OpenAI 其他编码

10:03

AYi@AYi_AInotes

Codex自选官方插件配置指南

高频使用 Codex 的用户应让其自行挑选 OpenAI 官方插件，效率翻倍。官方插件覆盖表格处理、PPT 制作、服务器部署、本地文件操作、自动化流程等日常需求。具体三步：打开项目对话窗口进入 Plugins 页面；让 Codex 结合项目目标筛选适配插件并说明用途；评估确认后直接让 Codex 完成安装。核心逻辑是让 AI 帮你用好 AI，避免盲目试错。

AYi: http://x.com/i/article/2063237792746831872

OpenAI 教程/实践编码

09:19

meng shao@shao__meng

Cua 和 Snorkel AI 联合发布 Cua-Bench：首个公开 KiCad 任务数据集

Cua 与 Snorkel AI 联合发布 Cua-Bench，首个公开数据集聚焦电子设计工具 KiCad，含 25 道由执业电气工程师编写并复核的任务。测试中，GPT-5.5 完全通过 6/25（24%），Claude Sonnet 4.5 和 Haiku 4.5 各通过 5/25（20%）。所有成功任务均为局部修改，16 道从零搭建任务全部失败。瓶颈在执行层：导航开销大（~84%）、操作粒度过细（~84%）、视图控制混乱（~76%）、布线未完成（~72%）、自我验证不可靠。步数上限并非主因。根因分布：规划 ~40%、感知 ~22%、导航低效 ~19%、领域知识 ~11%、工具/API ~8%，全程零 API 错误。

Cua: 1/ Today we're launching Cua-Bench with @SnorkelAI: a benchmark for computer-use agents on professional software, open f...

智能体 Anthropic OpenAI 评测/基准

09:07

宝玉@dotey

@jxnlco 发推称其粉丝数已接近 9 万，询问需要写哪些 Codex 文章才能达成目标。主推文建议关注这位 Codex 团队的成员，以获取更多技术内幕内容。

jason: so close to 90k followers... what codex articles do i need to write to get there...

OpenAI 行业动态

09:03

🚨 AI News | TestingCatalog@testingcatalog

OPENAI 🔥： Codex 现在支持 Chrome DevTools 协议，可用于浏览器操作。这是一个巨大的超能力，将允许 Codex 检查并修改任何网站。这仍是一个非常早期的实现，但我敢打赌，几年后这将成为浏览器的默认能力。如果网站通过 AI 加载，用户将能够即时自定义他们的用户体验。这就是方向 👀

智能体 MCP/工具 OpenAI 产品更新

09:02

AYi@AYi_AInotes

精选78

五角大楼将大部分日常AI工作流从Anthropic转移，目标9月前完全切断

五角大楼宣布已将超2/3日常AI工作流从Anthropic转移，目标9月前清零。起因是年初五角大楼要求Anthropic签署协议允许Claude用于大规模监控和全自动武器，CEO Dario Amodei以模型不可靠为由拒绝。五角大楼将其列为“供应链风险”，起诉未果。OpenAI调整立场获得订单。Polymarket预测6月底前和解概率仅9%。此事件凸显AI公司需在原则与政府合作间抉择。

Polymarket: JUST IN: Pentagon announces it has transitioned over two-thirds of its daily AI workflows off Anthropic to rival AI vend...

Anthropic OpenAI 安全/对齐行业动态

推荐理由：五角大楼用对付华为的'供应链风险'清单切掉Anthropic，这事儿把AI公司的立场选择逼到了明面。技术好只是入场券，愿配合敏感用途才是通行证，AI公司从此要被迫选边站了。

09:02

AYi@AYi_AInotes

AI水果动画短片78秒解读Anthropic监管风波

网友用AI制作78秒水果动画，向女友解释Anthropic近况。红苹果代表Sam Altman，绿梨子代表Dario Amodei，菠萝将军代表美国政府。剧情：梨子曾从OpenAI出走创办Anthropic，专注安全AI；最近梨子公开呼吁政府像管飞机一样严格监管AI，结果菠萝直接下架Anthropic两个新模型。结尾梨子震惊。视频讽刺了“谁先喊危险，谁先尝苦头”的行业困境——Dario本想控制节奏，没想到权力先切了自己。

Charles Curran: I used AI to explain the Anthropic drama to my girlfriend, with fruit.

Anthropic OpenAI 安全/对齐现象/趋势

08:37

Epoch AI@EpochAIResearch

Claude Fable 5 在 Epoch Capabilities Index 上取得新高分161！这以1分优势击败了GPT-5.5 Pro，也是Anthropic一年多来首次在该指数上领先。

Anthropic OpenAI 推理评测/基准

07:59

IT之家（RSS）

美国法官驳回 xAI 指控 OpenAI 窃取商业机密的诉讼

美国一名联邦法官驳回了 xAI 对 OpenAI 提起的诉讼。xAI 指控 OpenAI 诱使其前高级工程师李雪辰泄露与 Grok 4 相关的商业机密。法官丽塔·林认为 xAI 未能提供证据证明 OpenAI 怂恿泄密，且招聘中询问过往工作属行业常规，裁定不可再诉。这是马斯克四周内第二次在与 OpenAI 的法律交锋中败诉。

OpenAI 行业动态

05:32

OpenAI Developers@OpenAIDevs

使用Codex中的OpenAI开发者插件，通过设置API密钥、查找合适的文档并在过程中进行调试，从而更快地使用OpenAI工具进行构建。