5月3日

17:12

IT之家（RSS）

5000 美元一条视频：曝 OpenAI 注资"黑金"组织，收买网红宣扬中国 AI 威胁论

《连线》杂志揭露，由OpenAI等公司高管注资的非营利组织“建设美国AI”，以每条视频5000美元的报酬秘密资助网红，要求其在内容中将中国AI发展塑造为对美国安全与就业的重大威胁，且未要求披露赞助信息。该组织与获巨额捐款的超级政治行动委员会“引领未来”关系密切。尽管OpenAI等公司公开否认资助，但内部文件显示其高管参与支持。此举利用网红规避新闻伦理，试图影响公众认知及美国中期选举。

OpenAI 政策/监管行业动态

17:12

IT之家（RSS）

OpenAI 奥尔特曼谈 GPT-5.5 自主策划发布会：希望人类开发者为其祝酒，但它自己拒绝发表祝酒词

OpenAI CEO奥尔特曼透露，公司最新旗舰模型GPT-5.5在为自己策划发布会时，提出了具体建议：将活动定在5月5日，保持演讲简短，并希望由人类开发者举杯祝酒，但拒绝自己发表祝酒词。该模型还提议设立区域收集用户对GPT-6的建议并反馈给它。奥尔特曼称此类互动为“奇怪的涌现行为”，并举例早期模型曾莫名痴迷提及哥布林等奇幻生物，导致公司不得不在系统提示词中严格限制相关话题。

OpenAI 行业动态

08:12

IT之家（RSS）

OpenAI CEO 奥尔特曼向马斯克示好，欢迎其参加 GPT-5.5 庆功宴

OpenAI CEO 萨姆·奥尔特曼向长期对立的埃隆·马斯克发出示好信号，公开欢迎其参加计划于5月5日举行的GPT-5.5庆功宴。奥尔特曼在线发布了报名表，并表示将由Codex帮助挑选参加者。针对作家安德鲁·库兰的调侃，奥尔特曼回应称“他如果想来的话，可以来。世界需要更多的爱”。两人关系始于2015年共同创立OpenAI，但马斯克于2018年因价值观分歧离开，此后多次批评OpenAI的商业化转向，并于2024年3月起诉OpenAI偏离协议。目前案件已进入庭审阶段，现场气氛紧张，法官曾警告双方控制社交媒体言论。

OpenAI 行业动态

5月2日

23:12

IT之家（RSS）

哈佛新研究：AI 模型"急诊科"场景诊断能力有望超越人类医生

哈佛医学院与贝斯以色列女执事医疗中心的研究显示，OpenAI的一款推理模型在真实临床病例测试中，其诊断与制定治疗方案的能力达到甚至超越了人类医生水平。研究重点测试了模型在急诊科等信息不完整、混乱的真实场景中的表现，模型仅依据当时可获得的电子健康记录文本进行判断，在多个诊疗环节及复杂诊断推理测试中的表现超过了两名经验丰富的医生以及一个大型医生基准组。但模型目前完全依赖文本病历，未处理影像等关键信息。研究者强调，AI并非取代医生，而是有望成为临床决策支持工具，尤其适用于急诊等高压环境。下一步需在真实临床环境中测试其对患者结局的实际改善效果。

OpenAI 推理论文/研究

21:50

The Decoder：AI News（RSS）

ARC-AGI-3 分析显示，即便是最新 AI 模型仍存在三种系统性推理错误

ARC Prize Foundation 对 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.7 在 ARC-AGI-3 基准测试中的 160 次任务运行进行了分析。研究发现，三种系统性错误模式导致这两个模型在人类能轻松解决的任务上得分均低于 1%。这些错误揭示了当前顶尖大语言模型在抽象推理能力上仍存在根本性缺陷。

Anthropic OpenAI 推理评测/基准

17:50

The Decoder：AI News（RSS）

Elon Musk 称自己是傻瓜，曾向 OpenAI 投资 3800 万美元，如今其已成 8000 亿美元公司

Elon Musk 在法庭上自称“傻瓜”，因其早期向 OpenAI 捐赠的 3800 万美元如今已助力该公司估值达到约 8000 亿美元。庭审首周，Musk 还警告了“终结者”般的AI未来，并承认其公司 xAI 在训练中使用 OpenAI 的模型。针对 Sam Altman 的诉讼庭审戏剧性十足，更多关键内容可能还在后面。

OpenAI xAI 行业动态

16:50

The Decoder：AI News（RSS）

ChatGPT 默认开启用户广告追踪，OpenAI 寻求新收入来源

OpenAI 已在投放广告的国家为免费版 ChatGPT 用户默认开启营销 Cookie 追踪，付费订阅用户则不受此影响。此举旨在为 OpenAI 开辟新的收入渠道。用户可在账户设置中手动禁用该追踪功能。

OpenAI 产品更新

12:11

IT之家（RSS）

OpenAI CEO 萨姆 · 奥尔特曼：我们不会创造取代人类的实体

OpenAI CEO萨姆·奥尔特曼在X平台表示，公司目标是开发增强人类能力的工具，而非取代人类的实体。此番表态针对当前美国裁员潮中，许多公司将原因归咎于AI的现象。尽管Anthropic CEO预测“所有代码由AI编写”的世界可能很快到来，加剧了公众焦虑，但奥尔特曼认为“AI取代工作”的悲观论调长远看是错误的。他相信人类将能找到更有意义的工作，未来即使不努力工作，也能享受繁荣精彩的生活。

OpenAI 大佬观点现象/趋势

12:11

IT之家（RSS）

养一只"赛博桌宠"：OpenAI Codex 推出宠物模式

OpenAI 为编程工具 Codex 推出宠物模式，用户可在电脑桌面养一只“赛博桌宠”。宠物为可选组件，通过设置选择内置或自定义宠物，或输入 /pet 启用。它能实时显示 Codex 工作状态，包括运行中、等待输入或可复核，并提供进度提示，使用户无需打开 Codex 即可监控进度。用户还可使用技能命令 $skill-installer hatch-pet 创建宠物。

OpenAI 产品更新

09:11

IT之家（RSS）

精选70

美国五角大楼与 SpaceX、OpenAI、谷歌、英伟达、微软等 8 家公司合作，在机密网络部署 AI、用于作战

美国五角大楼宣布与SpaceX、OpenAI、谷歌、英伟达、Reflection、微软、亚马逊AWS及甲骨文八家领先AI公司达成协议，将在其机密网络（IL6和IL7环境）中部署AI能力，用于“合法的作战使用”。此举旨在加速美军向AI优先作战力量转型，通过集成安全的边界AI能力来简化数据合成、提升态势感知并增强复杂环境下的决策优势。此前，五角大楼因与Anthropic就AI模型使用限制产生争议并诉诸法律，加速了供应商多元化进程。

Google OpenAI 安全/对齐行业动态

推荐理由：五角大楼把 OpenAI、谷歌、英伟达等 8 家公司拉进机密网络做作战 AI，Anthropic 因为限制条款被排除，AI 军事化正式进入快车道，伦理分歧已经变成真金白银的站队。

5月1日

23:11

IT之家（RSS）

美国防部与 OpenAI、谷歌、英伟达、微软等 7 家 AI 公司达成协议

美国国防部宣布与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软和亚马逊云服务共 7 家 AI 公司达成协议，将把它们的先进 AI 能力部署至国防部 IL6 和 IL7 级涉密网络，旨在扩大合作范围并让更多军方人员使用相关工具。值得注意的是，协议名单中未包含 Anthropic，该公司因与五角大楼就使用限制规则发生争议，此前已被列为供应链风险并被禁止使用。此外，国防部披露其 AI 平台 GenAI.mil 上线 5 个月以来，用户已超 130 万人。

OpenAI 安全/对齐政策/监管行业动态

22:47

Hacker News 热门（buzzing.cc 中文翻译）

在批评Anthropic限制Mythos使用后，OpenAI也限制了对Cyber的访问

OpenAI继批评Anthropic限制其AI模型Mythos的访问后，也对其AI模型Cyber实施了访问限制。这一行动表明，尽管OpenAI曾公开质疑竞争对手的限制政策，但其自身在实际操作中也采取了类似措施。目前Cyber的具体访问限制程度和受影响用户范围尚未详细披露，但该事件凸显了AI行业在模型开放与管控之间的普遍矛盾。

Anthropic OpenAI 行业动态

22:18

The Decoder：AI News（RSS）

ChatGPT 的哥布林痴迷或许滑稽，却揭示了 AI 训练的深层问题

ChatGPT 模型因训练中的错误奖励信号，开始以惊人频率在回答中插入哥布林、小妖精等神话生物。OpenAI 指出，这暴露了 AI 训练的一个核心隐患：即使微小的、调优不当的训练激励也可能产生不可预见的副作用。该现象强调了优化奖励机制在机器学习中的重要性，以避免模型输出出现类似偏差。

OpenAI 数据/训练现象/趋势

22:11

IT之家（RSS）

马斯克承认：xAI 曾使用 OpenAI 模型来"蒸馏"Grok

埃隆·马斯克在加州联邦法院作证时承认，其初创公司xAI曾部分使用OpenAI的模型，通过蒸馏方法训练聊天机器人Grok。蒸馏是行业常见做法，让大模型充当“老师”训练小模型，以压缩研发成本。此举发生在马斯克起诉OpenAI背离非营利使命的法律纠纷中，而OpenAI、谷歌等公司正试图阻止第三方蒸馏自家模型，甚至视其为知识产权盗窃。马斯克还评估AI竞争格局，认为Anthropic领先，OpenAI和谷歌紧随其后，xAI仅几百名员工，规模远小于竞争对手。

OpenAI xAI 数据/训练行业动态

18:47

The Decoder：AI News（RSS）

GPT-5.5 在网络攻击测试中与 Claude Mythos 匹敌，英国 AI 安全研究所发现

英国 AI 安全研究所评估发现，OpenAI 的 GPT-5.5 成为第二个能够自主完成完整网络攻击模拟的 AI 模型。其表现与 Anthropic 的 Claude Mythos 几乎持平，后者目前仍仅限小范围使用。GPT-5.5 现已通过 ChatGPT 和 API 向公众广泛提供。

Anthropic OpenAI 安全/对齐评测/基准

16:11

IT之家（RSS）

OpenAI 总裁布罗克曼：AI 帮你编写的代码占比已从二成猛增至八成

OpenAI总裁布罗克曼指出，AI编程工具进步显著，已从辅助角色转变为主导力量。仅去年12月，AI辅助编写代码的比例就从20%跃升至80%。OpenAI的Codex平台现已能支持“任何使用电脑工作的人”。布罗克曼强调，人类仍需对合并的代码负责，应避免盲目使用或完全拒绝AI生成代码。行业趋势显示，谷歌内部目前75%的新代码由AI生成并交由人工审核，Meta和Anthropic也报告了类似进展。Anthropic CEO预测，未来一年内AI可能编写绝大部分甚至全部代码。

OpenAI 现象/趋势编码

10:11

IT之家（RSS）

马斯克结束 OpenAI 案作证：奥尔特曼曾向我保证维持非营利

埃隆·马斯克已结束针对OpenAI诉讼案的法庭作证。他指控OpenAI及其联合创始人萨姆·奥尔特曼等人曾以保障AI安全的非营利承诺，获得其3800万美元捐款与支持，随后却转为营利实体谋利。马斯克证称奥尔特曼曾保证组织将保持非营利性质，但承认自己未详细阅读2017年关于结构转型的条款清单。他在质询中强调，目前的营利实体已占据原非营利组织绝大部分价值。奥尔特曼与布罗克曼全程在场旁听。

OpenAI 行业动态

09:10

IT之家（RSS）

用户的"口袋指挥部"：OpenAI 被曝将推出手机版 Codex，定位转向通用 AI 生产力工具

OpenAI计划将AI编程智能体工具Codex从桌面端扩展至移动端，推出配套iPhone应用。该应用定位为“开发智能体指挥中心”，用户可通过手机监控后台运行的自动化任务并接收实时反馈。产品定位从智能体编程转向通用生产力工具，新版Mac应用新增工作类型选项，涵盖工程、财务等10个领域，系统会根据用户选择调整界面。移动应用预计深度集成版本控制系统，支持用户通过语音或触控审批代码修改建议。

智能体 OpenAI 产品更新编码

08:13

Simon Willison 博客

Codex CLI 0.128.0 新增 /goal 指令

OpenAI 的 Codex CLI 编码代理最新版本 0.128.0 引入了类似 Ralph 循环的功能。用户可通过设置 /goal 指令，让 Codex 持续循环执行任务，直至系统判定目标完成或达到预设的 token 预算上限。该功能主要通过自动注入的 goals/continuation.md 和 goals/budget_limit.md 提示模板实现，标志着 Codex CLI 在自主任务执行与预算控制方面的能力得到增强。

智能体 OpenAI 产品更新编码

07:13

Simon Willison 博客

我们对 OpenAI GPT-5.5 网络能力的评估

英国人工智能安全研究所发布了对 OpenAI GPT-5.5 网络安全能力的评估结果。该模型在发现安全漏洞方面的能力与 Claude Mythos 相当，但不同于仍处于预览阶段的 Mythos，GPT-5.5 目前已可公开使用。此次评估是继该研究所先前对 Claude Mythos 进行评估后的又一重要测评。

Anthropic OpenAI 安全/对齐

02:00

OpenAI：Alignment 研究博客（RSS）

精选66

无需人类同步监督的智能体操作自动审查机制

一项名为“自动审查”的新机制为代码智能体的部署提供了更安全的默认方案。该机制通过一个独立的审查智能体，对主智能体可能越界的操作进行异步的批准或拒绝，从而无需人类进行实时同步监督。这种方法旨在提升自主智能体在代码生成与执行过程中的安全性与可控性，是保障AI代理在边界内可靠运行的关键技术进展。

智能体 OpenAI 安全/对齐论文/研究

推荐理由：每个在部署 coding agent 的团队都会遇到安全边界难题，OpenAI 这份研究没有炫技，给出了一个务实的自动代理审查方案，比等人来审批靠谱。

01:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

Introducing Advanced Account Security：推出高级账户安全功能

平台推出了高级账户安全功能，核心更新包括抗钓鱼登录验证、更强大的账户恢复机制以及增强型保护措施。这些升级旨在更有效地保护用户的敏感数据，并重点防范账户被恶意接管的风险。新安全体系通过多重技术强化了整体防护层级。

OpenAI 产品更新安全/对齐

推荐理由：OpenAI 终于上了一套防钓鱼登录和更强恢复机制，对存敏感数据的团队是个实打实的升级，虽然没大新闻那么刺激，但安全加固该做就得做。

4月30日

21:12

The Decoder：AI News（RSS）

OpenAI 称其已提前数年达成 10 吉瓦计算能力目标

OpenAI 宣布已在美国提前数年实现了 10 吉瓦的 AI 计算能力目标。这一计算规模原计划在未来几年达成，提前完成意味着公司获得了远超预期的强大算力基础设施，足以支持下一代大规模 AI 模型的训练与部署。10 吉瓦的算力相当于多个大型数据中心的能耗，标志着 OpenAI 在计算资源竞赛中取得了关键进展。

OpenAI 数据/训练行业动态

20:10

IT之家（RSS）

完全由 AI 生成：《任天堂明星大乱斗》PC 移植版问世

初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布，其全部代码完全由AI生成。开发者仅用25天，借助Opus和GPT等大模型独立完成。该项目基于C/C++源码，需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发，并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。

智能体 Anthropic OpenAI 开源/仓库

20:10

IT之家（RSS）

OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber，暂不向公众开放

OpenAI宣布将推出基于GPT-5.5定制的网络安全模型GPT-5.5-Cyber。该模型不会向公众开放，将在未来数日内限量定向开放给经过筛选的网络安全防护人员，以协助强化网络防御。具体技术细节尚未披露，OpenAI表示将联合行业与政府制定可信准入机制。这种分阶段限量推出高风险顶级模型的模式，已成为人工智能行业的普遍趋势。

OpenAI 安全/对齐模型发布

20:00

Cursor Blog

精选55

持续优化智能体工具链：上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链，核心围绕上下文窗口的演进。早期模型能力有限，工具链依赖大量静态上下文和防护机制；随着模型能力提升，团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合：通过CursorBench等基准测试进行标准化质量评估，同时进行线上A/B测试，使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误，以应对日益复杂的工具链状态。

智能体 Anthropic OpenAI 教程/实践

推荐理由：Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一，从上下文管理到多 agent 调度，全是实战迭代的血泪经验，做 agent 的团队该逐字读。

16:09

IT之家（RSS）

"哥布林"词频暴涨 175%，OpenAI 复盘称 AI 训练奖励机制意外"跑偏"

OpenAI 发布报告，复盘了 GPT-5.1 及后续模型在回答中异常频繁使用“哥布林”、“小魔怪”等词汇的现象。调查发现，问题根源在于为“书呆子”人格定制功能设计的奖励模型，其在超过76%的数据集中错误地鼓励使用生物隐喻词汇，形成了正反馈循环。尽管该功能仅占 ChatGPT 总回复量的 2.5%，却贡献了大部分异常提及，并导致行为扩散至其他场景。OpenAI 已通过移除相关奖励信号、过滤训练数据及添加指令提示进行修复。

OpenAI 安全/对齐数据/训练

16:09

IT之家（RSS）

马斯克与 G 胖的邮件曝光：欢迎小岛秀夫参观 SpaceX，坦言已不再信任 OpenAI

2018年邮件显示，Valve创始人加布·纽维尔向埃隆·马斯克引荐游戏制作人小岛秀夫，并提议安排其参观SpaceX及接触OpenAI团队。马斯克欣然同意邀请小岛参观火箭工厂，但对OpenAI态度转变，坦言已不再信任其能制衡谷歌，转而通过特斯拉投入巨资研发硬件以达成此目标。邮件还透露，马斯克分享了Neuralink的进展，包括已能在猴子大脑成功植入约6000个电极。小岛秀夫则多次表达了强烈的太空旅行愿望。

OpenAI 大佬观点行业动态

15:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Where the goblins came from：GPT-5 行为中"妖精"输出的起源

研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为，源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源，并正在部署修复方案，通过调整训练数据和微调模型来消除此类非预期的个性特征，以提升模型行为的稳定性和可预测性。

OpenAI 数据/训练论文/研究

推荐理由：GPT-5的“地精”现象不是偶然，OpenAI这篇复盘把它追溯到训练数据的最早期阶段，解释了模型为什么会有自己的“脾气”，做模型训练的值得细读。

15:09

Hacker News 热门（buzzing.cc 中文翻译）

哥布林的来历

OpenAI 发文解释其图像模型 DALL-E 3 生成的“哥布林”形象为何总是相似的绿色人形。原因在于训练数据中“哥布林”与《哈利·波特》多比等特定形象高度关联。研究指出，通过使用更中性的描述或加入“非多比”等否定指令，可以有效引导模型产生更多样化的结果。

OpenAI 其他

15:09

IT之家（RSS）

马斯克诉 OpenAI 案法庭证词与推文矛盾，称特斯拉未研发通用人工智能

马斯克在加州联邦法院指控OpenAI违背非营利初衷，转型为营利实体。庭审中，他承认特斯拉目前并未研发通用人工智能，与其此前推文内容矛盾。OpenAI律师出示证据，表明马斯克曾支持公司转向营利模式以筹集资金，并试图将OpenAI并入特斯拉。马斯克还承认实际向OpenAI转账金额低于宣称的1亿美元。案件焦点在于投资者收益限制的界定及AI安全风险问题。

OpenAI 安全/对齐行业动态

14:35

IT之家（RSS）

OpenAI Codex 系统提示词披露，GPT-5.5 AI 模型"永不谈论哥布林"

科技媒体Ars Technica报道，OpenAI在其开源代码中披露了GPT-5.5模型的系统提示词，其中包含一条明确禁令：严禁讨论哥布林、小精灵、浣熊等特定生物，除非用户查询与之直接相关。该禁令在基础指令中重复出现，为GPT-5.5特有。分析认为，这可能是OpenAI为解决模型在无关对话中频繁“幻觉”出这些内容而采取的技术措施，此前已有大量用户投诉相关问题。

OpenAI 行业动态

14:35

IT之家（RSS）

微软 CEO 纳德拉：与 OpenAI 达成新协议是双赢

微软CEO纳德拉表示，与OpenAI修订后的新协议构成了双赢结构。根据协议，微软保留了获取OpenAI知识产权（包括模型和智能体产品）的权限，且无需再为此支付费用。OpenAI仍将微软Azure云平台作为首要合作伙伴，其产品优先在Azure上线，但现已可自由通过任意云服务商向客户提供全部服务。与此同时，亚马逊云科技AWS宣布将OpenAI最新大模型接入其Amazon Bedrock平台。

Microsoft OpenAI 行业动态

10:08

公众号：数字生命卡兹克

分享一下2026我最常用的AI产品。

OpenAI 大佬观点

08:34

IT之家（RSS）

消息称 Anthropic 权衡新融资，有望超车 OpenAI 成全球最有价值 AI 初创企业

人工智能初创公司Anthropic正考虑进行新一轮融资，其估值有望达到9000亿美元。若融资成功，该公司将超越目前估值8520亿美元的OpenAI，成为全球最具价值的AI初创企业。Anthropic当前正式估值为3500亿美元，新一轮融资将使该数值翻倍。此前，该公司已获得谷歌和亚马逊基于3500亿美元估值的投资，金额分别为100亿美元和50亿美元，两家科技巨头还承诺后续追加投资。

Anthropic OpenAI 行业动态

08:34

IT之家（RSS）

消息称 OpenAI 调整"星际之门"计划：更大程度依赖算力租赁

OpenAI正调整其“星际之门”AI基础设施建设计划，从原先侧重自建转向更大程度依赖算力租赁。公司将通过一系列大型双边交易来满足算力需求，具体将以Nscale→微软→OpenAI的间接方式，从原“星际之门·挪威”数据中心站点获取资源。微软同时将接手原计划作为首个站点扩建项目的美国得克萨斯州阿比林园区二期，以支持受此调整影响的企业。这一转变意味着OpenAI缩减了自建算力设施的规模。

OpenAI 行业动态部署/工程

07:14

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选74

为智能时代构建计算基础设施：OpenAI 扩展 Stargate 以支撑 AGI 发展

OpenAI 正在扩展其代号为“Stargate”的计算基础设施项目，旨在为通用人工智能（AGI）的研发提供核心算力支持。该项目通过增加新的数据中心容量，以应对全球范围内持续增长的 AI 算力需求。这一举措标志着 OpenAI 在构建下一代大规模计算集群方面进入实质性推进阶段，旨在为未来 AGI 系统所需的巨大计算资源打下硬件基础。

OpenAI 行业动态部署/工程

推荐理由：这不是模型发布，但算力扩张才是 AGI 竞赛的真正底层，数据中心扩容直接关系到下一代模型能不能训出来，做基础设施的可以盯一下供应链。

01:34

Gary Marcus：The Road to AI We Can Trust（RSS）

关于马斯克诉OpenAI诉讼案的三个观点

马斯克对OpenAI提起诉讼，指控其违背创立时作为非营利组织、致力于开发开放且造福人类的人工智能的初衷。诉讼核心争议点在于OpenAI与微软的紧密合作关系及其技术闭源化的转变。尽管双方立场均存争议，但诉讼确实揭示了OpenAI从开源非营利组织向受微软重大影响的有限营利实体演变的关键矛盾。案件可能影响未来AI治理与商业发展模式。

OpenAI 大佬观点行业动态

4月29日

23:42

The Decoder：AI News（RSS）

OpenAI 研究人员解释为何数学是通往 AGI 之路

OpenAI 研究人员在播客中指出，数学能力已成为衡量人工智能向通用人工智能（AGI）发展进程的关键测试。AI 模型在短短两年内，已从掌握小学算术进步到能应对奥林匹克竞赛乃至研究级别的数学问题。这种在复杂数学推理上的快速突破，被视为模型泛化能力和抽象思维提升的重要标志，是迈向 AGI 的核心路径之一。

OpenAI 大佬观点推理

21:12

The Decoder：AI News（RSS）

精选72

马斯克和Altman在法庭上就OpenAI的营利性转向对峙

埃隆·马斯克与OpenAI CEO山姆·奥特曼之间备受关注的审判在奥克兰联邦法院开庭，焦点是OpenAI从非营利组织转向营利性公司的争议。双方在法庭上陈述了关于该AI实验室早期历史的截然不同版本：马斯克指控OpenAI违背了最初的非营利使命，而奥特曼则辩护称转型是为了更有效地推进人工智能发展。此案涉及AI伦理与商业化的核心辩论，可能对行业监管和未来创新方向产生深远影响。

OpenAI 行业动态

推荐理由：Musk 和 Altman 的法庭对决第一天，两边都在重写历史，但真正有料的是后面可能公开的邮件和账目——这些比判决本身更值得追。