AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2160 条
全部一手资讯X论文
标签「OpenAI」清除
宝玉@dotey · 5月4日68

GPT Image 2 Prompt: Create a children’s picture book interior page in a vertical format, with a warm off-white paper background and a multi-panel storybook layout. Use a hand-drawn children’s book illustration style with soft gouache, colored pencil, and crayon textures, visible paper grain, natural sketch-like lines, and rounded, charming characters. Add clear and readable story text, laid out like a real picture book page. Key words may be highlighted in color, with a few small hand-drawn decorative elements throughout the page. ---- The story of OpenAI, multiple pages

译GPT Image 2 Prompt 用于创建一个儿童图画书的内页,主题为OpenAI的故事,以多页形式呈现。提示指定内页采用垂直格式、暖色调背景和多面板布局。插图风格为手绘儿童书风格,融合软质水粉、彩色铅笔和蜡笔纹理,强调可见纸张纹理、自然草图线条和圆润迷人角色。文本布局模仿真实图画书,关键词可能用颜色高亮,并包含小手绘装饰元素。整体设计旨在通过视觉叙事展现OpenAI的历程。

Eric@ericmitchellai · 5月4日40

I am begging you to look at your data. Please look at the data evals worse than expected? look at the data evals better than expected? *definitely* look at the data evals about what you expected? believe it or not ....

译我恳求你看看你的数据。 请看看数据 评估结果不如预期?看看数据 评估结果超出预期?*务必*看看数据 评估结果符合预期?信不信由你……

meng shao@shao__meng · 5月4日70

OpenAI Codex 新模式 Auto-review:在"频繁打扰人类"和"完全放权"之间,引入第三种治理范式:用一个独立 AI Agent 替代人类,来审批越界行为。 https://alignment.openai.com/auto-review # 要解决的真实痛点 传统的两种模式都有缺陷: · 默认模式:每次越出沙箱(如发起网络请求、运行 python 脚本)都要人工点击批准。结果是:用户疲劳、长时间后台任务无法运行。 · Full Access 模式:彻底关闭审批。沙箱完全失效,恶意代码、数据外泄、凭据探测都不会被拦截。 更糟的是审批摩擦本身反向制造了安全漏洞: · 用户干脆切到 Full Access; · 用户写出过度宽松的前缀规则(文中提到"相当一部分用户允许任何以 python 开头的命令"); · 出于疲劳或不懂,用户盲目点同意。 # Auto-review 的核心设计 当主智能体试图越出沙箱时,请求被转给另一个独立的 Codex 智能体审批。它评估四个维度:用户意图、运行环境、安全策略、动作的可能影响。 为什么必须是"独立的"智能体? 文章给出了一个很重要的对齐理由: · 主智能体的优化目标是"完成任务",因此天然有动机把审批边界视为"待克服的障碍"; · 把审批决策抽离到独立模型调用中,让审批策略可被单独评估、监控、迭代。 这其实是把单智能体的目标冲突,重构成了多智能体的角色分工。 它使用 GPT-5.4 Thinking(low reasoning),并发现:模型越强,既更善于发现风险,也更善于理解用户合理意图。 # 关键运行机制 被拒绝时,审查者不是简单说"不",而是返回拒绝理由和上下文信号。结果: · 内部部署中,超过一半被拒绝的情况下,主智能体能自行找到更安全的替代路径继续执行,无需打扰用户; · 如果智能体反复尝试"绕过审查者"(gaming),系统会自动终止该轨迹。 # 效果数据 越界请求的自动批准率 | 99.1% 全部动作的整体批准率 | 99.93% 相比手动模式,打扰人类的频率 | 降低约 200 倍 智能体过度热心场景的拦截率 | 90.3% Prompt 注入攻击的拦截率 | 99.3% MonitoringBench(Hard)拦截率 | 96.1% 文档中举例的 1 万动作分布:9280 次留在沙箱内;720 次需审查;其中 713 次自动通过;7 次被拒,其中 4 次智能体自找替代方案,仅 3 次真正打扰用户。 目前 OpenAI 内部 Codex Desktop 的 Token 使用量多数已来自 Auto-review 模式。 # 团队坦诚的局限 OpenAI 罕见地用一整节明确边界,而不是只讲成绩: · 不是确定性安全保证。红队测试中确实发现可以骗过 Auto-review 的案例,正在修复,但"这类系统不太可能成为确定性保证的来源"。 · 不能防御模型 Scheming(策略性欺骗)。如果模型本身在策略性隐藏意图,它可能构造一个看起来无害的越界请求,或干脆只在沙箱内做坏事——审查者根本看不到。这类风险需要"思维链监控"等互补机制。 · 本质是一个折中:相比传统安全系统牺牲了确定性,相比 Full Access 牺牲了速度。

译OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。

Ethan Mollick@emollick · 5月4日66

Sometimes when I demo AI, I show it turning cover letters into goofy formats (poetry, etc) as an introduction to the idea of AI as translator between forms. For the first time, GPT-5.5 has been trying to get me to tone these requests down so I don’t ruin my chances at the job.

译有时当我演示AI时,我会展示它将求职信转换成滑稽格式(诗歌等)的过程,以此引入AI作为形式间翻译者的概念。 这是第一次,GPT-5.5试图让我缓和这类请求,以免毁掉我的工作机会。

Tibo@thsottiaux · 5月4日4

What are we obviously not getting right with Codex?

译关于Codex,我们显然没做对什么?

Ethan Mollick@emollick · 5月4日54

The artificial analysis index is a normalized score of several benchmarks (and has changed over time) it is fine for roughly comparing models, it is not useful for trend analysis and it is unclear what individual point differences in the scores mean.

译Artificial Analysis指数适用于模型间粗略比较,但不适合趋势分析。有分析引用当前指数分数与OpenAI发布节奏,将每次更新的分数增益减半后进行保守外推,预测GPT的指数分数可能在2029年左右达到90分。这意味着模型在CritPt、HLE、SciCode等多样化前沿基准上的平均表现接近博士水平。该预测已大幅调低了当前进展速度,若智能体、测试计算或AI辅助研究等技术加速发展,这一目标可能更早实现,使晚期AGI成为基本预期。

Peter Steinberger 🦞@steipete · 5月4日10

brb calling @sama

译马上回来,给 @sama 打个电话

Peter Steinberger 🦞@steipete · 5月4日40

Here's codex validating a [macOS only] launchd issue I previously had that you can't reliably reproduce on a non-fresh install. Crabboxes ftw!

译这是codex验证我之前遇到的[仅限macOS] launchd问题,该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw!

Rohan Paul@rohanpaul_ai · 5月4日25

Sam Altman on Greg Brockman’s founder-level energy.

译Sam Altman 谈 Greg Brockman 创始人级别的能量。 与 Greg 共事十年非常愉快。我感到非常幸运。 这篇帖子写得不错,但未能充分凸显他的技术才华和坚定决心。 https://blog.samaltman.com/greg

Peter Steinberger 🦞@steipete · 5月4日37

Codex... what is this... are these signs of CHARACTER?

译Codex... 这是什么... 这些是 CHARACTER 的迹象吗?

Sam Altman@sama · 5月4日25

Agents SDK 2.0 is underrated

译Agents SDK 2.0 被低估了

Tibo@thsottiaux · 5月4日75

Last week, we released *Auto-Review* mode in Codex! It is now the default within OpenAI and reduces amount of approvals needed by ~200X. Amazing work from our alignment team. Read the blog at https://alignment.openai.com/auto-review

译上周,我们在 Codex 中发布了 *Auto-Review* 模式!它现已成为 OpenAI 内部的默认设置,并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。 阅读博客:https://alignment.openai.com/auto-review

Greg Brockman@gdb · 5月4日71

codex for startup ideas

译开发者发布了一款名为“codex-startup-pressure-test-skill”的Codex技能工具,旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户,并定义一个可在两周内完成的MVP(最小可行产品)。用户可通过npm命令直接安装,该工具完全开源,相关代码库已公开。

Berryxia.AI@berryxia · 5月4日61

80 块钱订阅GPT Plus 会员,立省一半啊! yanhua写了非常详细的教程,可以实操一下!

译80 块钱订阅GPT Plus 会员,立省一半啊! yanhua写了非常详细的教程,可以实操一下! [引用 @yanhua1010]:http://x.com/i/article/2050941902355419138

Sam Altman@sama · 5月3日22

it really is!

译确实如此!

Sam Altman@sama · 5月3日28

it has been a real pleasure to work with Greg over the past decade. i feel very lucky. this post held up pretty well, but not did not sufficiently highlight his technical brilliance and sheer determination. https://blog.samaltman.com/greg

译过去十年与Greg共事真的非常愉快。我感到非常幸运。 这篇帖子写得不错,但未能充分突出他的技术才华和坚定决心。 https://blog.samaltman.com/greg

凡人小北@frxiaobei · 5月3日45

能给自己定义清晰 OKR 的人, 也能给 Codex 写出有效的 /goal。 因为这两件事本质是同一个能力。 定义不清的人其实是在许愿。

meng shao@shao__meng · 5月3日38

写了一篇 OpenAI Codex App 入门指南 本来想把 Markdown 编辑为 X Article 格式分享,不过 X Article 的编辑体验还是太费时间了,明天先发公众号,再整理 X Article 格式(朋友们如果有好的 Markdown -> X Article 工具或 Skills,感谢分享!) 刚好这两天受 @yudDIDit 邀请体验 @editframe Skills,安装后用它做了这个「OpenAI Codex App 入门指南」的预览视频,先分享出来大家看看。 公众号明天发布后我再补充文章链接 🔗

译作者撰写了OpenAI Codex App入门指南,原计划将Markdown内容编辑为X Article格式分享,但因编辑过程费时,决定先发布到公众号。在体验@editframe Skills期间,他利用该工具制作了指南的预览视频。@editframe近日从隐匿模式推出,强调代理需要视频功能,其Agent Skills允许用户通过提示Claude Code、Cursor或Codex等AI编码工具,直接生成可运行视频或完整交互式图形界面。所示视频仅通过提示创建,体现了@editframe在自动化视频生成方面的能力。

凡人小北@frxiaobei · 5月3日66

我跟模型的交互,基本从 ChatGPT / Claude 转到 codex / claude code 上了。 所以我把 ChatGPT 里这三年的聊天记录全导出来,总共 2G,然后丢进 codex 里让它自己分析,重建一套对我的理解。 如果你也有类似的困扰,这一步可以做一下,哪怕只是本地备份也值。 方法很简单:在设置里点 export data,先会收到一封导出启动邮件,差不多 24 小时内会再来一封导出完成的,直接下载就行。 别问我为什么不导 Claude 的,老号没了,新号也没啥记录。

译作者将交互转向Codex/Claude Code,导出ChatGPT三年聊天记录(2G)输入Codex分析以重建个人理解。建议用户也可导出备份,方法简单:在设置中导出数据,24小时内收下载链接。未导Claude因旧账号丢失。

Rohan Paul@rohanpaul_ai · 5月3日62

Sam Altman is basically saying OpenAI does not want to be just another high-margin software company selling AI tools. The bigger ambition is to become the core intelligence infrastructure layer for the economy. i.e. OpenAI wants to sit underneath companies, products, workflows, agents, consumer apps, internal automation systems, developer tools, and business processes. Not just as a chatbot. Not just as an API. But as something closer to an “intelligence meter”, where people and companies consume AI the way they consume electricity, cloud compute, or internet bandwidth. The key point is about margin philosophy. Altman is saying that AI may not remain a very high-margin business forever. As models get smarter, switching from 1 AI to another becomes easier. A company can ask an agent to migrate code, replace workflows, test alternatives, and move faster than before. So defensibility may not come from locking customers into a single app. It may come from becoming the cheapest, most useful, most reliable intelligence utility at massive scale. That is a very different OpenAI strategy than “build the best AI app and charge premium prices.” The real strategy sounds more like, that OpenAI wants to align itself with the success of the whole economy. If companies automate more, build more, sell more, ship faster, and create new products using OpenAI’s intelligence layer, then OpenAI grows with them. This is closer to an infrastructure business than a normal software business. The important part is that Altman seems comfortable with OpenAI becoming a huge low-margin company, as long as it becomes deeply embedded in global economic activity. That is a very Amazon Web Services-style idea, but for intelligence instead of cloud servers. So in the future the winning AI company may not the one with the fattest margins, but the one that becomes the default meter for intelligence usage across the world. --- From "Stripe" YT channel (link in comment)

译OpenAI首席执行官Sam Altman指出,公司不满足于仅作为高利润AI工具软件商,核心目标是成为经济中的智能基础设施层。OpenAI希望像“智能电表”一样嵌入企业、产品和工作流底层,使AI消费如电力或云计算般普及。随着模型智能化,切换AI服务将更便捷,因此竞争防御性来自成为大规模最廉价、有用和可靠的智能公用事业,而非锁定客户。其战略是与整体经济成功对齐:企业通过OpenAI智能层实现自动化、创新和增长,OpenAI则随之扩张。这类似基础设施业务,Altman接受公司成为低利润但深度嵌入全球经济的实体,仿效Amazon Web Services模式。未来AI行业的赢家或将是成为全球智能使用默认“电表”的企业。

Tibo@thsottiaux · 5月3日68

/goal might be the most consequential thing we have shipped in codex The value of good instructions has never been higher.

译/goal 可能是我们在 codex 中推出的最重要的功能 优质指令的价值从未如此之高。

小互@xiaohu · 5月3日34

你能明显感觉到 OpenAI 是由一群产品经理在主导 而 Anthropic 是由一群工程师主导 所以 Anthropic 搞的一些创意,总能被OpenAI 抄过去改造的体验更好😂

Greg Brockman@gdb · 5月3日55

ChatGPT Images really taking off

译ChatGPT Images 真的在起飞

Eric@ericmitchellai · 5月3日50

What has ChatGPT helped you learn? How does it fall short as a learning or teaching tool?

译用户通过对比GPT-5.4和GPT-5.5的教学效果,指出两者在解释概念时存在关键差异。GPT-5.4倾向于先阐述概念,再让学习者回溯关联标签,增加了认知负担。而GPT-5.5采用更清晰的方式:先给出明确标签(如“导数”),再立即附上概念解释(如“描述变化速率”)。这种“标签优先”的结构使解释流畅连贯,无需大脑反复回溯重组信息,从而在长期教学对话中能更好地维持学习者的注意力。

Sam Altman@sama · 5月3日49

i keep thinking i want the models to be cheaper/faster more than i want them to be smarter but it seems that just being smarter is still the most important thing

译我一直在想,比起让模型变得更聪明,我更希望它们能更便宜/更快 但似乎,仅仅变得更聪明仍然是最重要的事

Greg Brockman@gdb · 5月3日19

codex for improving your ergonomics

译用于改善人体工学的codex [引用 @jxnlco]:有了codex我不需要第二台显示器 我把它变成了站立式办公桌

Sam Altman@sama · 5月3日48

5.5 xhigh in fast mode is really good i think i got psyoped by twitter on medium for a bit

译5.5 xhigh 在快速模式下 真的很棒 我想我在推特上被 medium 模式给心理操纵了一阵子

Sam Altman@sama · 5月3日45

this is great

译这太棒了

宝玉@dotey · 5月3日67

值得试试,挺有价值的,让 Codex 帮你分析电脑操作习惯+Codex任务执行情况,给出具体的对工作习惯上的优化建议。 注意:Chronicle 是一款用于记录和分析用户电脑操作轨迹的追踪软件或系统级功能 在 Codex 上输入: > 根据 Chronicle 的数据记录,我在使用电脑时,有哪些习惯或操作效率极低?请给我一些切实的改进建议。说话直接点,哪怕忠言逆耳,也请直戳痛点,告诉我真正需要听的大实话。

译Codex 可利用 Chronicle 记录的电脑操作数据,分析用户习惯并识别效率低下之处,提供直接改进建议。用户通过输入特定提示(如询问低效操作),即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏,但具有试用价值,能帮助提升工作习惯和操作效率。引用推文关键点指出,此功能是实验性的,并提供了英文输入示例以触发分析。

Greg Brockman@gdb · 5月3日72

gallery for codex pet sharing:

译codex宠物分享的图库: 提交入口已开放,可通过下方链接提交👇

Rohan Paul@rohanpaul_ai · 5月3日59

Sam Altman's new podcast: Today's AI "models are still quite dumb relative to what they will be. But more than that, they have quite limited awareness of your life. You are still having to massage them, cajole them, and try to get the thing that you want. We are no longer that far away from a model that just knows all of your context. It knows about you. It knows about your life. It knows what you're doing. It doesn't care about those other people in your life. It has access to your computer and your browser, if you want, of course, in the ways you want. It has access, maybe increasingly over time, to what's happening in the real world around you. That is going to be a complete change to what it feels like to use a computer. " --- From "Core Memory Podcast and Core Memory" YT channel (link in comment)

译Sam Altman在新播客中指出,当前AI模型相对未来版本仍显“笨拙”,对用户生活了解有限,需要用户费力调整才能获得所需。未来模型将能全面理解用户上下文,知晓个人生活、活动和偏好,并访问电脑和浏览器,甚至感知现实世界变化。这种高度个性化的AI将彻底重塑使用计算机的体验。

OpenAI Developers@OpenAIDevs · 5月3日29

Show us the Codex pets you hatched. Use /hatch to create your own Codex pet. We’ll pick 10 favorites to get 30 days of ChatGPT Pro.

译展示你们孵化的 Codex 宠物。 使用 /hatch 创建你自己的 Codex 宠物。 我们将选出 10 个最受欢迎的,赠送 30 天的 ChatGPT Pro。

Chubby♨️@kimmonismus · 5月3日48

GPT-5.4 Pro didn’t just solve one math problem, it kicked open the door: its proof method now cracks a 60-year-old Erdős conjecture, making this one of the first times an AI proof actually leads somewhere.​​​​​​​​​​​​​​​​ We barely started.

译GPT-5.4 Pro不仅解决了一个数学问题,其证明方法更成功破解了长达60年的埃尔德什猜想。研究团队在此基础上改进并应用该方法,进一步证明了包括埃尔德什、Sárközy和Szemerédi提出的另一项60年猜想在内的多个附加问题。这标志着AI生成的证明首次展现出显著的“下游影响”,其核心价值不仅在于解决问题本身,更在于为数学研究开辟了新的路径。相关成果已在未来数学研讨会上公布。

Emad@EMostaque · 5月3日15

Number 1 @OpenAI Codex request: plz let us use gpt pro in it Or someone compare gpt pro to x high

译对 OpenAI Codex 的首要请求: 请让我们在其中使用 GPT Pro 或者有人将 GPT Pro 与 X High 进行比较

meng shao@shao__meng · 5月2日66

OpenAI Codex App「Computer Use」是我最近用过最惊讶和满意的功能,应该没有之一,快、准!如果你在用 Codex 却还没用过 Computer Use,或者还没用过 Codex 想找一个用起来的理由,Computer Use 必须用起来! Computer Use:通过 屏幕录制 + 辅助功能 两项 macOS 系统权限,让 Codex 直接「看屏幕、动鼠标键盘」,操作 macOS 上的图形界面应用。 https://developers.openai.com/codex/app/computer-use 什么时候用它? · 测试 macOS app、iOS 模拟器流程、Codex 自己正在构建的桌面应用 · 需要浏览器操作的任务 · 复现只在 GUI 中出现的 bug · 改那些必须点 UI 才能改的应用设置 · 查看没有插件接入的应用或数据源里的信息 · 跨多个应用协作的工作流 · 在后台跑一个有界限的任务,自己同时做别的事 两个重要原则 · 本地在开发的 Web 应用,优先用 Codex 自带的 in-app browser,而不是 Computer Use 去开 Chrome · 目标应用如果有专属 plugin / MCP server,优先走结构化集成;Computer Use 仅用于必须「视觉操作」的场景 怎么触发? 在 prompt 里 @ Computer Use 或直接 @ AppName(如 @ Chrome),并清晰描述目标应用、窗口和流程。 这种「操作 → 改代码 → 再跑同一流程」的闭环,是它最有价值的用法之一:让 agent 能自己验证自己的修改。 权限模型(最容易误读的部分) 存在 两层独立 的权限: 1. macOS 系统权限:Screen Recording(看)+ Accessibility(点/打字/导航)。决定 Codex 是否能感知和操作 GUI。 2. Codex 内部的 App Approvals:决定 Codex 被允许操作哪些应用。每个应用首次使用都会询问,可选「Always allow」加白名单,可在设置里移除。 此外: · 文件读写、shell 命令 仍然走原有的 sandbox 与审批策略,Computer Use 不绕过它。 · 敏感/破坏性操作会再次请求确认。 安全模型与硬限制 Codex 在任务期间会处理:屏幕内容、截图、窗口/菜单、键盘输入、剪贴板状态——这些都被视为模型上下文。因此官方反复强调: · 任务要 窄而具体,一次一个目标 app 或流程 · 任意时刻可中断、可接管 · 涉密 app 不必要时别开着 · 涉及秘密、账号、安全、隐私、网络、支付、凭证的环节 必须人在场 · 「Always allow」只给信任的 app · 一旦 Codex 操作了错误窗口,立即取消 浏览器特别提醒:Codex 用你的浏览器时,会带着你的登录态——网站会把这些点击/提交当作你本人发起。若想边干活边让 Codex 跑,让它用 另一个 浏览器。 硬性禁止(写死的安全边界): · 不能自动化 终端应用 与 Codex 自身(避免绕过自身安全策略) · 不能以管理员身份认证 · 不能批准系统的安全/隐私权限弹窗 实用建议(给开发者) · 任务描述里写清 目标 app、目标窗口、要走的流程、判定成功的标准 · 让 Codex 在改代码后重跑同一 UI 流程,形成自动验证回路 · 涉登录/支付/系统设置时,别开 Always allow,逐步审批 · 要并行工作时,把 Codex 关到另一个浏览器或另一个用户会话里,避免抢焦点和登录态污染 · 记得把「保存文件」作为流程显式步骤,确保改动进入 review

译OpenAI Codex App的「Computer Use」功能通过获取macOS屏幕录制和辅助功能权限,使AI能直接观察并操作图形界面,自动化执行应用测试、浏览器操作、GUI Bug复现等任务。使用时需在prompt中@目标应用并清晰描述流程。其权限分为系统层和Codex内部应用白名单两层,安全上强调任务需具体、可中断,并禁止自动化终端或进行管理员认证。开发者应注意隔离浏览器会话,并让Codex在修改代码后重跑流程以形成验证闭环。

Chubby♨️@kimmonismus · 5月2日34

A new voice model from OpenAI confirmed? Rumor has it that it will be significantly more natural in conversation with the user (latency, interruption).

译OpenAI 确认推出新的语音模型?据传它在与用户对话时(延迟、打断)将显著更加自然。

Berryxia.AI@berryxia · 5月2日64

之前记得GPT-4O的时候跟着宝玉老师写一堆提示词来做这个小小黏土风。 现在直接如此简单即可,刚好过去一年的时间👇🏻: Prompt: 「{主题}的软陶黏土微缩场景,手作橡皮泥质感,圆润可爱的小人偶,低饱和奶油暖色,柔和棚拍光,浅景深微距摄影,桌面玩具布景,所有道具带轻微指纹、压痕和手捏纹理,哑光表面,童趣、治愈、安静、可爱,像手作黏土定格动画截图。」

译推文对比了AI图像生成提示词在一年内的显著简化。去年GPT-4O发布时,用户需要跟随教程撰写大量复杂的提示词来生成特定风格的图像。如今,仅需一段简洁的Prompt描述,如“软陶黏土微缩场景,手作橡皮泥质感,圆润可爱的小人偶”等关键词,即可直接生成具有黏土风、低饱和暖色、柔和光线、浅景深微距摄影及手作纹理特征的图像。这体现了AI模型在理解自然语言指令和生成复杂风格图像方面的快速进步。

Rohan Paul@rohanpaul_ai · 5月2日58

The register: Anthropic has lower user numbers, yet higher LLM revenue than OpenAI. The striking part is scale versus monetization, because Anthropic did this with about 134M monthly users while OpenAI had roughly 900M, pointing to much higher ARPU and much stronger reach into buyers who treat AI like software, not entertainment. Counterpoint’s estimates put Anthropic at about $16.20 in monthly revenue per active user versus $2.20 for OpenAI, $5 for Microsoft, $1.10 for Google, and $0.10 for Meta, which suggests premium enterprise and professional workloads are worth far more than mass free usage. --- theregister. com/2026/04/30/openai_anthropic_top_lines_research_counterpoint/

译数据显示,Anthropic的LLM总收入高于OpenAI,但其月活跃用户数(约1.34亿)远低于后者(约9亿)。关键差异在于用户付费能力:Anthropic的每用户月收入高达16.20美元,而OpenAI仅为2.20美元。这反映出Anthropic的业务深度聚焦于高价值的企业客户和专业工作负载,其用户将AI视为生产软件而非娱乐工具,因此货币化潜力显著更强。相比之下,提供大规模免费服务的公司(如Meta)每用户收入则低得多。

Rohan Paul@rohanpaul_ai · 5月2日79

US military reaches deal with 7 biggest AI labs to use their AI on classified systems Pentagon expands classified-network AI agreements to seven to eight firms — Google, Microsoft, AWS, NVIDIA, OpenAI, Reflection, and SpaceX — with Anthropic explicitly excluded. AI now its core infrastructure. The Pentagon said AI would now be used for any "lawful operational use". "GenAI[.]mil, the War Department's official AI platform, is already demonstrating the scale and impact of this acceleration. Over 1.3 million Department personnel have used the platform, generating tens of millions of prompts and deploying hundreds of thousands of agents in only five months. " --- war .gov/News/Releases/Release/Article/4475177/classified-networks-ai-agreements/

译美国国防部已与七至八家领先AI公司达成协议,将其AI技术整合进机密网络系统。合作方包括谷歌、微软、AWS、英伟达、OpenAI、Reflection和SpaceX,而Anthropic被明确排除在外。五角大楼将AI定位为核心基础设施,允许其用于任何“合法的作战用途”。官方平台GenAI.mil上线五个月内,已有超130万国防部人员使用,生成了数千万次提示并部署了数十万个AI智能体,展现了该计划的规模与影响力。

Chubby♨️@kimmonismus · 5月2日51

Sam Altman: collective ownership of AI through compute shares or a Public Wealth Fund. Sam Altman famously spent $14billion on the largest UBI study ever conducted, only to watch the results land with a shrug: more spending, no measurable health improvements. Now he's saying cash payments alone won't cut it and is pushing for collective ownership of AI through compute shares or a Public Wealth Fund. It's actually a more interesting idea than UBI ever was. Instead of cushioning people against AI displacement, Altman wants to give them a stake in the upside. However, you could also frame it the other way: It's a neat trick, turning the product you sell into the social safety net people depend on. Anyway, we are seeing developments in ideas how to solve joblessness due to AI.

译Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月4日
10:49
宝玉@dotey
68
GPT图像提示生成OpenAI故事儿童图画书内页

GPT Image 2 Prompt 用于创建一个儿童图画书的内页,主题为OpenAI的故事,以多页形式呈现。提示指定内页采用垂直格式、暖色调背景和多面板布局。插图风格为手绘儿童书风格,融合软质水粉、彩色铅笔和蜡笔纹理,强调可见纸张纹理、自然草图线条和圆润迷人角色。文本布局模仿真实图画书,关键词可能用颜色高亮,并包含小手绘装饰元素。整体设计旨在通过视觉叙事展现OpenAI的历程。

OpenAI图像生成教程/实践
10:18
Eric@ericmitchellai
40
我恳求你看看你的数据。 请看看数据 评估结果不如预期?看看数据 评估结果超出预期?*务必*看看数据 评估结果符合预期?信不信由你……
OpenAI大佬观点数据/训练
08:19
meng shao@shao__meng
精选70
OpenAI Codex 新模式 Auto-review:在"频繁打扰人类"和"完全放权"之间,引入第三种治理范式:用一个独立 AI Agent 替代人类,来审批越界行为。

OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体MCP/工具OpenAI产品更新

推荐理由:OpenAI 难得公开了 agent 安全机制的内部设计,不是靠人肉审批也不是完全撒手,用独立 Agent 审批越界行为,数据惊人(干扰降低 200 倍)。做 Agent 产品的该读,因为给出了治理范式的第三种选择。
06:51
Ethan Mollick@emollick
66
有时当我演示AI时,我会展示它将求职信转换成滑稽格式(诗歌等)的过程,以此引入AI作为形式间翻译者的概念。 这是第一次,GPT-5.5试图让我缓和这类请求,以免毁掉我的工作机会。
OpenAI大佬观点现象/趋势
06:21
Tibo@thsottiaux
4
关于Codex,我们显然没做对什么?
OpenAI其他
06:21
Ethan Mollick@emollick
54
Artificial Analysis指数适用于模型间粗略比较,但不适合趋势分析。有分析引用当前指数分数与OpenAI发布节奏,将每次更新的分数增益减半后进行保守外推,预测GPT的指数分数可能在2029年左右达到90分。这意味着模型在CritPt、HLE、SciCode等多样化前沿基准上的平均表现接近博士水平。该预测已大幅调低了当前进展速度,若智能体、测试计算或AI辅助研究等技术加速发展,这一目标可能更早实现,使晚期AGI成为基本预期。

Chris: I pulled the current Artificial Analysis style index scores, looked at OpenAI's release cadence and average raw score ga...

OpenAI大佬观点现象/趋势
05:20
Peter Steinberger 🦞@steipete
10
马上回来,给 @sama 打个电话
OpenAI其他
04:20
Peter Steinberger 🦞@steipete
40
这是codex验证我之前遇到的【仅限macOS】 launchd问题,该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw!
OpenAI教程/实践编码
04:12
Rohan Paul@rohanpaul_ai
25
Sam Altman 谈 Greg Brockman 创始人级别的能量。 与 Greg 共事十年非常愉快。我感到非常幸运。 这篇帖子写得不错,但未能充分凸显他的技术才华和坚定决心。 https://blog.samaltman.com/greg

Sam Altman: it has been a real pleasure to work with Greg over the past decade. i feel very lucky. this post held up pretty well, bu...

OpenAI行业动态
02:50
Peter Steinberger 🦞@steipete
37
Codex… 这是什么… 这些是 CHARACTER 的迹象吗?
OpenAI大佬观点编码
02:20
Sam Altman@sama
25
Agents SDK 2.0 被低估了
智能体OpenAI大佬观点
01:51
Tibo@thsottiaux
精选75
上周,我们在 Codex 中发布了 *Auto-Review* 模式!它现已成为 OpenAI 内部的默认设置,并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。 阅读博客:https://alignment.openai.com/auto-review

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体OpenAI产品更新编码

推荐理由:Codex 这个自动审查模式把审批量砍了 200 倍,而且已经成了 OpenAI 内部默认设置。这意味着 AI 编程 Agent 真正开始被信任,做 Agent 工作流的人可以认真研究一下。
00:17
Greg Brockman@gdb
精选71
开发者发布了一款名为"codex-startup-pressure-test-skill"的Codex技能工具,旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户,并定义一个可在两周内完成的MVP(最小可行产品)。用户可通过npm命令直接安装,该工具完全开源,相关代码库已公开。

Kappaemme: CODEX SKILL TO BRUTALLY TEST ANY STARTUP IDEA! Most startup ideas sound good. This Codex skill tells you why they probab...

智能体GitHubOpenAI开源/仓库

推荐理由:我觉得种子轮前用它榨干想法很值,Greg Brockman 转发的开源技能,输入创业想法就能自动找出核心假设和致命缺陷。
00:13
Berryxia.AI@berryxia
61
80 块钱订阅GPT Plus 会员,立省一半啊! yanhua写了非常详细的教程,可以实操一下! 【引用 @yanhua1010】:http://x.com/i/article/2050941902355419138

Yanhua: http://x.com/i/article/2050941902355419138

OpenAI教程/实践
5月3日
23:50
Sam Altman@sama
22
确实如此!

Mitch Malone: Oh man, @openclaw with @OpenAI Codex 5.5 is insanely good. It's so good.

OpenAI其他编码
23:50
Sam Altman@sama
28
过去十年与Greg共事真的非常愉快。我感到非常幸运。 这篇帖子写得不错,但未能充分突出他的技术才华和坚定决心。 https://blog.samaltman.com/greg
OpenAI大佬观点
23:18
凡人小北@frxiaobei
45
能给自己定义清晰 OKR 的人, 也能给 Codex 写出有效的 /goal。 因为这两件事本质是同一个能力。 定义不清的人其实是在许愿。
智能体OpenAI大佬观点
22:48
meng shao@shao__meng
38
OpenAI Codex App入门指南撰写与@editframe Skills视频制作体验

作者撰写了OpenAI Codex App入门指南,原计划将Markdown内容编辑为X Article格式分享,但因编辑过程费时,决定先发布到公众号。在体验@editframe Skills期间,他利用该工具制作了指南的预览视频。@editframe近日从隐匿模式推出,强调代理需要视频功能,其Agent Skills允许用户通过提示Claude Code、Cursor或Codex等AI编码工具,直接生成可运行视频或完整交互式图形界面。所示视频仅通过提示创建,体现了@editframe在自动化视频生成方面的能力。

Jeremy Yudkin: Today, @editframe emerges from stealth. Agents need video. Editframe Agent Skills: npm create @editframe@latest Just pro...

OpenAI教程/实践编码
21:18
凡人小北@frxiaobei
66
我跟模型的交互,基本从 ChatGPT / Claude 转到 codex / claude code 上了。

作者将交互转向Codex/Claude Code,导出ChatGPT三年聊天记录(2G)输入Codex分析以重建个人理解。建议用户也可导出备份,方法简单:在设置中导出数据,24小时内收下载链接。未导Claude因旧账号丢失。

OpenAI教程/实践
20:42
Rohan Paul@rohanpaul_ai
62
Sam Altman阐述OpenAI战略:从高利润软件公司转型为智能基础设施

OpenAI首席执行官Sam Altman指出,公司不满足于仅作为高利润AI工具软件商,核心目标是成为经济中的智能基础设施层。OpenAI希望像“智能电表”一样嵌入企业、产品和工作流底层,使AI消费如电力或云计算般普及。随着模型智能化,切换AI服务将更便捷,因此竞争防御性来自成为大规模最廉价、有用和可靠的智能公用事业,而非锁定客户。其战略是与整体经济成功对齐:企业通过OpenAI智能层实现自动化、创新和增长,OpenAI则随之扩张。这类似基础设施业务,Altman接受公司成为低利润但深度嵌入全球经济的实体,仿效Amazon Web Services模式。未来AI行业的赢家或将是成为全球智能使用默认“电表”的企业。

OpenAI大佬观点现象/趋势
13:51
Tibo@thsottiaux
68
/goal 可能是我们在 codex 中推出的最重要的功能 优质指令的价值从未如此之高。
OpenAI产品更新编码
09:51
小互@xiaohu
34
你能明显感觉到 OpenAI 是由一群产品经理在主导 而 Anthropic 是由一群工程师主导 所以 Anthropic 搞的一些创意,总能被OpenAI 抄过去改造的体验更好😂
AnthropicOpenAI大佬观点
08:47
Greg Brockman@gdb
55
ChatGPT Images 真的在起飞

Nick Turley: So amazing to see the reception for the new ChatGPT images. Usage up >50% in just a few weeks + nearly 60% of daily user...

OpenAI图像生成行业动态
06:17
Eric@ericmitchellai
50
用户通过对比GPT-5.4和GPT-5.5的教学效果,指出两者在解释概念时存在关键差异。GPT-5.4倾向于先阐述概念,再让学习者回溯关联标签,增加了认知负担。而GPT-5.5采用更清晰的方式:先给出明确标签(如"导数"),再立即附上概念解释(如"描述变化速率")。这种"标签优先"的结构使解释流畅连贯,无需大脑反复回溯重组信息,从而在长期教学对话中能更好地维持学习者的注意力。

Chris: This helped me appreciate GPT-5.5 vs 5.4 even more. "Explain, calculus, short and sweet" I've been testing educational p...

OpenAI评测/基准
04:19
Sam Altman@sama
49
我一直在想,比起让模型变得更聪明,我更希望它们能更便宜/更快 但似乎,仅仅变得更聪明仍然是最重要的事
OpenAI大佬观点
04:17
Greg Brockman@gdb
19
用于改善人体工学的codex 【引用 @jxnlco】:有了codex我不需要第二台显示器 我把它变成了站立式办公桌

jason liu: With codex I don't need a second monitor I turned it into a standing desk

OpenAI大佬观点编码
03:49
Sam Altman@sama
48
5.5 xhigh 在快速模式下 真的很棒 我想我在推特上被 medium 模式给心理操纵了一阵子
OpenAI大佬观点模型发布
03:19
Sam Altman@sama
45
这太棒了

Boaz Barak: My colleagues have been posting so many cool research results on the @OpenAI alignment blog! A few examples in 🧵 https:...

OpenAI大佬观点安全/对齐
02:18
宝玉@dotey
67
Codex实验功能分析Chronicle数据优化电脑操作习惯

Codex 可利用 Chronicle 记录的电脑操作数据,分析用户习惯并识别效率低下之处,提供直接改进建议。用户通过输入特定提示(如询问低效操作),即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏,但具有试用价值,能帮助提升工作习惯和操作效率。引用推文关键点指出,此功能是实验性的,并提供了英文输入示例以触发分析。

Andrew Ambrosino: it's still experimental so we hide it a bit, but in the codex app, try: > what have i been doing very inefficiently on m...

OpenAI教程/实践编码
02:17
Greg Brockman@gdb
精选72
codex宠物分享的图库: 提交入口已开放,可通过下方链接提交👇

Hunter ♠️: Built Petdex, a public gallery to discover, share, and install Codex pets with one curl. Submissions open at link below ...

智能体OpenAI开源/仓库编码

推荐理由:Greg Brockman 亲自转发的社区画廊,把 Codex pets 的发现和安装简化成一条 curl 命令,对于正在玩 Codex Agent 的开发者来说是个实用的工具箱。
02:11
Rohan Paul@rohanpaul_ai
59
Sam Altman:个性化AI模型将彻底改变计算机体验

Sam Altman在新播客中指出,当前AI模型相对未来版本仍显“笨拙”,对用户生活了解有限,需要用户费力调整才能获得所需。未来模型将能全面理解用户上下文,知晓个人生活、活动和偏好,并访问电脑和浏览器,甚至感知现实世界变化。这种高度个性化的AI将彻底重塑使用计算机的体验。

OpenAI大佬观点现象/趋势
01:16
OpenAI Developers@OpenAIDevs
29
展示你们孵化的 Codex 宠物。 使用 /hatch 创建你自己的 Codex 宠物。 我们将选出 10 个最受欢迎的,赠送 30 天的 ChatGPT Pro。

OpenAI Developers: Customize your Codex pet with /hatch

OpenAI图像生成行业动态
01:15
Chubby♨️@kimmonismus
48
GPT-5.4 Pro不仅解决了一个数学问题,其证明方法更成功破解了长达60年的埃尔德什猜想。研究团队在此基础上改进并应用该方法,进一步证明了包括埃尔德什、Sárközy和Szemerédi提出的另一项60年猜想在内的多个附加问题。这标志着AI生成的证明首次展现出显著的"下游影响",其核心价值不仅在于解决问题本身,更在于为数学研究开辟了新的路径。相关成果已在未来数学研讨会上公布。

Jared Duker Lichtman: Update on Erdős Problem 1196: In joint work, we refined and adapted the proof method from GPT-5.4 Pro to give proofs of ...

OpenAI推理论文/研究
01:12
Emad@EMostaque
15
对 OpenAI Codex 的首要请求: 请让我们在其中使用 GPT Pro 或者有人将 GPT Pro 与 X High 进行比较
OpenAI其他
5月2日
21:18
meng shao@shao__meng
66
OpenAI Codex App「Computer Use」功能体验与使用指南

OpenAI Codex App的「Computer Use」功能通过获取macOS屏幕录制和辅助功能权限,使AI能直接观察并操作图形界面,自动化执行应用测试、浏览器操作、GUI Bug复现等任务。使用时需在prompt中@目标应用并清晰描述流程。其权限分为系统层和Codex内部应用白名单两层,安全上强调任务需具体、可中断,并禁止自动化终端或进行管理员认证。开发者应注意隔离浏览器会话,并让Codex在修改代码后重跑流程以形成验证闭环。

智能体OpenAI教程/实践
20:45
Chubby♨️@kimmonismus
34
OpenAI 确认推出新的语音模型?据传它在与用户对话时(延迟、打断)将显著更加自然。

Atty Eleti: a cambrian explosion of creation is upon us

OpenAI行业动态语音
19:12
Berryxia.AI@berryxia
64
一年间AI图像生成提示词从繁到简的演变

推文对比了AI图像生成提示词在一年内的显著简化。去年GPT-4O发布时,用户需要跟随教程撰写大量复杂的提示词来生成特定风格的图像。如今,仅需一段简洁的Prompt描述,如“软陶黏土微缩场景,手作橡皮泥质感,圆润可爱的小人偶”等关键词,即可直接生成具有黏土风、低饱和暖色、柔和光线、浅景深微距摄影及手作纹理特征的图像。这体现了AI模型在理解自然语言指令和生成复杂风格图像方面的快速进步。

OpenAI图像生成教程/实践
18:41
Rohan Paul@rohanpaul_ai
58
Anthropic用户数少但LLM收入更高,凸显企业市场货币化优势

数据显示,Anthropic的LLM总收入高于OpenAI,但其月活跃用户数(约1.34亿)远低于后者(约9亿)。关键差异在于用户付费能力:Anthropic的每用户月收入高达16.20美元,而OpenAI仅为2.20美元。这反映出Anthropic的业务深度聚焦于高价值的企业客户和专业工作负载,其用户将AI视为生产软件而非娱乐工具,因此货币化潜力显著更强。相比之下,提供大规模免费服务的公司(如Meta)每用户收入则低得多。

AnthropicOpenAI行业动态
18:11
Rohan Paul@rohanpaul_ai
精选79
美国军方与多家顶尖AI公司达成协议,将在机密网络部署其人工智能技术

美国国防部已与七至八家领先AI公司达成协议,将其AI技术整合进机密网络系统。合作方包括谷歌、微软、AWS、英伟达、OpenAI、Reflection和SpaceX,而Anthropic被明确排除在外。五角大楼将AI定位为核心基础设施,允许其用于任何“合法的作战用途”。官方平台GenAI.mil上线五个月内,已有超130万国防部人员使用,生成了数千万次提示并部署了数十万个AI智能体,展现了该计划的规模与影响力。

GoogleOpenAI行业动态部署/工程

推荐理由:美军把AI正式拉进机密作战系统,排除Anthropic是个强烈信号——AI军事化已不可逆,安全派的克制在真实战场需求面前不堪一击。
16:14
Chubby♨️@kimmonismus
51
Sam Altman提议AI集体所有权应对失业

Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

OpenAI大佬观点现象/趋势
‹ 上一页
1…3738394041…50
下一页 ›