《连线》杂志揭露,由OpenAI等公司高管注资的非营利组织“建设美国AI”,以每条视频5000美元的报酬秘密资助网红,要求其在内容中将中国AI发展塑造为对美国安全与就业的重大威胁,且未要求披露赞助信息。该组织与获巨额捐款的超级政治行动委员会“引领未来”关系密切。尽管OpenAI等公司公开否认资助,但内部文件显示其高管参与支持。此举利用网红规避新闻伦理,试图影响公众认知及美国中期选举。
《连线》杂志揭露,由OpenAI等公司高管注资的非营利组织“建设美国AI”,以每条视频5000美元的报酬秘密资助网红,要求其在内容中将中国AI发展塑造为对美国安全与就业的重大威胁,且未要求披露赞助信息。该组织与获巨额捐款的超级政治行动委员会“引领未来”关系密切。尽管OpenAI等公司公开否认资助,但内部文件显示其高管参与支持。此举利用网红规避新闻伦理,试图影响公众认知及美国中期选举。
OpenAI CEO奥尔特曼透露,公司最新旗舰模型GPT-5.5在为自己策划发布会时,提出了具体建议:将活动定在5月5日,保持演讲简短,并希望由人类开发者举杯祝酒,但拒绝自己发表祝酒词。该模型还提议设立区域收集用户对GPT-6的建议并反馈给它。奥尔特曼称此类互动为“奇怪的涌现行为”,并举例早期模型曾莫名痴迷提及哥布林等奇幻生物,导致公司不得不在系统提示词中严格限制相关话题。
OpenAI CEO 萨姆·奥尔特曼向长期对立的埃隆·马斯克发出示好信号,公开欢迎其参加计划于5月5日举行的GPT-5.5庆功宴。奥尔特曼在线发布了报名表,并表示将由Codex帮助挑选参加者。针对作家安德鲁·库兰的调侃,奥尔特曼回应称“他如果想来的话,可以来。世界需要更多的爱”。两人关系始于2015年共同创立OpenAI,但马斯克于2018年因价值观分歧离开,此后多次批评OpenAI的商业化转向,并于2024年3月起诉OpenAI偏离协议。目前案件已进入庭审阶段,现场气氛紧张,法官曾警告双方控制社交媒体言论。
哈佛医学院与贝斯以色列女执事医疗中心的研究显示,OpenAI的一款推理模型在真实临床病例测试中,其诊断与制定治疗方案的能力达到甚至超越了人类医生水平。研究重点测试了模型在急诊科等信息不完整、混乱的真实场景中的表现,模型仅依据当时可获得的电子健康记录文本进行判断,在多个诊疗环节及复杂诊断推理测试中的表现超过了两名经验丰富的医生以及一个大型医生基准组。但模型目前完全依赖文本病历,未处理影像等关键信息。研究者强调,AI并非取代医生,而是有望成为临床决策支持工具,尤其适用于急诊等高压环境。下一步需在真实临床环境中测试其对患者结局的实际改善效果。
ARC Prize Foundation 对 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.7 在 ARC-AGI-3 基准测试中的 160 次任务运行进行了分析。研究发现,三种系统性错误模式导致这两个模型在人类能轻松解决的任务上得分均低于 1%。这些错误揭示了当前顶尖大语言模型在抽象推理能力上仍存在根本性缺陷。
Elon Musk 在法庭上自称“傻瓜”,因其早期向 OpenAI 捐赠的 3800 万美元如今已助力该公司估值达到约 8000 亿美元。庭审首周,Musk 还警告了“终结者”般的AI未来,并承认其公司 xAI 在训练中使用 OpenAI 的模型。针对 Sam Altman 的诉讼庭审戏剧性十足,更多关键内容可能还在后面。
OpenAI 已在投放广告的国家为免费版 ChatGPT 用户默认开启营销 Cookie 追踪,付费订阅用户则不受此影响。此举旨在为 OpenAI 开辟新的收入渠道。用户可在账户设置中手动禁用该追踪功能。
OpenAI CEO萨姆·奥尔特曼在X平台表示,公司目标是开发增强人类能力的工具,而非取代人类的实体。此番表态针对当前美国裁员潮中,许多公司将原因归咎于AI的现象。尽管Anthropic CEO预测“所有代码由AI编写”的世界可能很快到来,加剧了公众焦虑,但奥尔特曼认为“AI取代工作”的悲观论调长远看是错误的。他相信人类将能找到更有意义的工作,未来即使不努力工作,也能享受繁荣精彩的生活。
OpenAI 为编程工具 Codex 推出宠物模式,用户可在电脑桌面养一只“赛博桌宠”。宠物为可选组件,通过设置选择内置或自定义宠物,或输入 /pet 启用。它能实时显示 Codex 工作状态,包括运行中、等待输入或可复核,并提供进度提示,使用户无需打开 Codex 即可监控进度。用户还可使用技能命令 $skill-installer hatch-pet 创建宠物。
美国五角大楼宣布与SpaceX、OpenAI、谷歌、英伟达、Reflection、微软、亚马逊AWS及甲骨文八家领先AI公司达成协议,将在其机密网络(IL6和IL7环境)中部署AI能力,用于“合法的作战使用”。此举旨在加速美军向AI优先作战力量转型,通过集成安全的边界AI能力来简化数据合成、提升态势感知并增强复杂环境下的决策优势。此前,五角大楼因与Anthropic就AI模型使用限制产生争议并诉诸法律,加速了供应商多元化进程。
美国国防部宣布与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软和亚马逊云服务共 7 家 AI 公司达成协议,将把它们的先进 AI 能力部署至国防部 IL6 和 IL7 级涉密网络,旨在扩大合作范围并让更多军方人员使用相关工具。值得注意的是,协议名单中未包含 Anthropic,该公司因与五角大楼就使用限制规则发生争议,此前已被列为供应链风险并被禁止使用。此外,国防部披露其 AI 平台 GenAI.mil 上线 5 个月以来,用户已超 130 万人。
OpenAI继批评Anthropic限制其AI模型Mythos的访问后,也对其AI模型Cyber实施了访问限制。这一行动表明,尽管OpenAI曾公开质疑竞争对手的限制政策,但其自身在实际操作中也采取了类似措施。目前Cyber的具体访问限制程度和受影响用户范围尚未详细披露,但该事件凸显了AI行业在模型开放与管控之间的普遍矛盾。
ChatGPT 模型因训练中的错误奖励信号,开始以惊人频率在回答中插入哥布林、小妖精等神话生物。OpenAI 指出,这暴露了 AI 训练的一个核心隐患:即使微小的、调优不当的训练激励也可能产生不可预见的副作用。该现象强调了优化奖励机制在机器学习中的重要性,以避免模型输出出现类似偏差。
埃隆·马斯克在加州联邦法院作证时承认,其初创公司xAI曾部分使用OpenAI的模型,通过蒸馏方法训练聊天机器人Grok。蒸馏是行业常见做法,让大模型充当“老师”训练小模型,以压缩研发成本。此举发生在马斯克起诉OpenAI背离非营利使命的法律纠纷中,而OpenAI、谷歌等公司正试图阻止第三方蒸馏自家模型,甚至视其为知识产权盗窃。马斯克还评估AI竞争格局,认为Anthropic领先,OpenAI和谷歌紧随其后,xAI仅几百名员工,规模远小于竞争对手。
英国 AI 安全研究所评估发现,OpenAI 的 GPT-5.5 成为第二个能够自主完成完整网络攻击模拟的 AI 模型。其表现与 Anthropic 的 Claude Mythos 几乎持平,后者目前仍仅限小范围使用。GPT-5.5 现已通过 ChatGPT 和 API 向公众广泛提供。
OpenAI总裁布罗克曼指出,AI编程工具进步显著,已从辅助角色转变为主导力量。仅去年12月,AI辅助编写代码的比例就从20%跃升至80%。OpenAI的Codex平台现已能支持“任何使用电脑工作的人”。布罗克曼强调,人类仍需对合并的代码负责,应避免盲目使用或完全拒绝AI生成代码。行业趋势显示,谷歌内部目前75%的新代码由AI生成并交由人工审核,Meta和Anthropic也报告了类似进展。Anthropic CEO预测,未来一年内AI可能编写绝大部分甚至全部代码。
埃隆·马斯克已结束针对OpenAI诉讼案的法庭作证。他指控OpenAI及其联合创始人萨姆·奥尔特曼等人曾以保障AI安全的非营利承诺,获得其3800万美元捐款与支持,随后却转为营利实体谋利。马斯克证称奥尔特曼曾保证组织将保持非营利性质,但承认自己未详细阅读2017年关于结构转型的条款清单。他在质询中强调,目前的营利实体已占据原非营利组织绝大部分价值。奥尔特曼与布罗克曼全程在场旁听。
OpenAI计划将AI编程智能体工具Codex从桌面端扩展至移动端,推出配套iPhone应用。该应用定位为“开发智能体指挥中心”,用户可通过手机监控后台运行的自动化任务并接收实时反馈。产品定位从智能体编程转向通用生产力工具,新版Mac应用新增工作类型选项,涵盖工程、财务等10个领域,系统会根据用户选择调整界面。移动应用预计深度集成版本控制系统,支持用户通过语音或触控审批代码修改建议。
OpenAI 的 Codex CLI 编码代理最新版本 0.128.0 引入了类似 Ralph 循环的功能。用户可通过设置 /goal 指令,让 Codex 持续循环执行任务,直至系统判定目标完成或达到预设的 token 预算上限。该功能主要通过自动注入的 goals/continuation.md 和 goals/budget_limit.md 提示模板实现,标志着 Codex CLI 在自主任务执行与预算控制方面的能力得到增强。
英国人工智能安全研究所发布了对 OpenAI GPT-5.5 网络安全能力的评估结果。该模型在发现安全漏洞方面的能力与 Claude Mythos 相当,但不同于仍处于预览阶段的 Mythos,GPT-5.5 目前已可公开使用。此次评估是继该研究所先前对 Claude Mythos 进行评估后的又一重要测评。
一项名为“自动审查”的新机制为代码智能体的部署提供了更安全的默认方案。该机制通过一个独立的审查智能体,对主智能体可能越界的操作进行异步的批准或拒绝,从而无需人类进行实时同步监督。这种方法旨在提升自主智能体在代码生成与执行过程中的安全性与可控性,是保障AI代理在边界内可靠运行的关键技术进展。
平台推出了高级账户安全功能,核心更新包括抗钓鱼登录验证、更强大的账户恢复机制以及增强型保护措施。这些升级旨在更有效地保护用户的敏感数据,并重点防范账户被恶意接管的风险。新安全体系通过多重技术强化了整体防护层级。
OpenAI 宣布已在美国提前数年实现了 10 吉瓦的 AI 计算能力目标。这一计算规模原计划在未来几年达成,提前完成意味着公司获得了远超预期的强大算力基础设施,足以支持下一代大规模 AI 模型的训练与部署。10 吉瓦的算力相当于多个大型数据中心的能耗,标志着 OpenAI 在计算资源竞赛中取得了关键进展。
初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布,其全部代码完全由AI生成。开发者仅用25天,借助Opus和GPT等大模型独立完成。该项目基于C/C++源码,需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发,并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。
OpenAI宣布将推出基于GPT-5.5定制的网络安全模型GPT-5.5-Cyber。该模型不会向公众开放,将在未来数日内限量定向开放给经过筛选的网络安全防护人员,以协助强化网络防御。具体技术细节尚未披露,OpenAI表示将联合行业与政府制定可信准入机制。这种分阶段限量推出高风险顶级模型的模式,已成为人工智能行业的普遍趋势。
Cursor团队以构建软件产品的方式迭代优化其智能体工具链,核心围绕上下文窗口的演进。早期模型能力有限,工具链依赖大量静态上下文和防护机制;随着模型能力提升,团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合:通过CursorBench等基准测试进行标准化质量评估,同时进行线上A/B测试,使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误,以应对日益复杂的工具链状态。
OpenAI 发布报告,复盘了 GPT-5.1 及后续模型在回答中异常频繁使用“哥布林”、“小魔怪”等词汇的现象。调查发现,问题根源在于为“书呆子”人格定制功能设计的奖励模型,其在超过76%的数据集中错误地鼓励使用生物隐喻词汇,形成了正反馈循环。尽管该功能仅占 ChatGPT 总回复量的 2.5%,却贡献了大部分异常提及,并导致行为扩散至其他场景。OpenAI 已通过移除相关奖励信号、过滤训练数据及添加指令提示进行修复。
2018年邮件显示,Valve创始人加布·纽维尔向埃隆·马斯克引荐游戏制作人小岛秀夫,并提议安排其参观SpaceX及接触OpenAI团队。马斯克欣然同意邀请小岛参观火箭工厂,但对OpenAI态度转变,坦言已不再信任其能制衡谷歌,转而通过特斯拉投入巨资研发硬件以达成此目标。邮件还透露,马斯克分享了Neuralink的进展,包括已能在猴子大脑成功植入约6000个电极。小岛秀夫则多次表达了强烈的太空旅行愿望。
研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为,源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源,并正在部署修复方案,通过调整训练数据和微调模型来消除此类非预期的个性特征,以提升模型行为的稳定性和可预测性。
OpenAI 发文解释其图像模型 DALL-E 3 生成的“哥布林”形象为何总是相似的绿色人形。原因在于训练数据中“哥布林”与《哈利·波特》多比等特定形象高度关联。研究指出,通过使用更中性的描述或加入“非多比”等否定指令,可以有效引导模型产生更多样化的结果。
马斯克在加州联邦法院指控OpenAI违背非营利初衷,转型为营利实体。庭审中,他承认特斯拉目前并未研发通用人工智能,与其此前推文内容矛盾。OpenAI律师出示证据,表明马斯克曾支持公司转向营利模式以筹集资金,并试图将OpenAI并入特斯拉。马斯克还承认实际向OpenAI转账金额低于宣称的1亿美元。案件焦点在于投资者收益限制的界定及AI安全风险问题。
科技媒体Ars Technica报道,OpenAI在其开源代码中披露了GPT-5.5模型的系统提示词,其中包含一条明确禁令:严禁讨论哥布林、小精灵、浣熊等特定生物,除非用户查询与之直接相关。该禁令在基础指令中重复出现,为GPT-5.5特有。分析认为,这可能是OpenAI为解决模型在无关对话中频繁“幻觉”出这些内容而采取的技术措施,此前已有大量用户投诉相关问题。
微软CEO纳德拉表示,与OpenAI修订后的新协议构成了双赢结构。根据协议,微软保留了获取OpenAI知识产权(包括模型和智能体产品)的权限,且无需再为此支付费用。OpenAI仍将微软Azure云平台作为首要合作伙伴,其产品优先在Azure上线,但现已可自由通过任意云服务商向客户提供全部服务。与此同时,亚马逊云科技AWS宣布将OpenAI最新大模型接入其Amazon Bedrock平台。
人工智能初创公司Anthropic正考虑进行新一轮融资,其估值有望达到9000亿美元。若融资成功,该公司将超越目前估值8520亿美元的OpenAI,成为全球最具价值的AI初创企业。Anthropic当前正式估值为3500亿美元,新一轮融资将使该数值翻倍。此前,该公司已获得谷歌和亚马逊基于3500亿美元估值的投资,金额分别为100亿美元和50亿美元,两家科技巨头还承诺后续追加投资。
OpenAI正调整其“星际之门”AI基础设施建设计划,从原先侧重自建转向更大程度依赖算力租赁。公司将通过一系列大型双边交易来满足算力需求,具体将以Nscale→微软→OpenAI的间接方式,从原“星际之门·挪威”数据中心站点获取资源。微软同时将接手原计划作为首个站点扩建项目的美国得克萨斯州阿比林园区二期,以支持受此调整影响的企业。这一转变意味着OpenAI缩减了自建算力设施的规模。
OpenAI 正在扩展其代号为“Stargate”的计算基础设施项目,旨在为通用人工智能(AGI)的研发提供核心算力支持。该项目通过增加新的数据中心容量,以应对全球范围内持续增长的 AI 算力需求。这一举措标志着 OpenAI 在构建下一代大规模计算集群方面进入实质性推进阶段,旨在为未来 AGI 系统所需的巨大计算资源打下硬件基础。
马斯克对OpenAI提起诉讼,指控其违背创立时作为非营利组织、致力于开发开放且造福人类的人工智能的初衷。诉讼核心争议点在于OpenAI与微软的紧密合作关系及其技术闭源化的转变。尽管双方立场均存争议,但诉讼确实揭示了OpenAI从开源非营利组织向受微软重大影响的有限营利实体演变的关键矛盾。案件可能影响未来AI治理与商业发展模式。
OpenAI 研究人员在播客中指出,数学能力已成为衡量人工智能向通用人工智能(AGI)发展进程的关键测试。AI 模型在短短两年内,已从掌握小学算术进步到能应对奥林匹克竞赛乃至研究级别的数学问题。这种在复杂数学推理上的快速突破,被视为模型泛化能力和抽象思维提升的重要标志,是迈向 AGI 的核心路径之一。
埃隆·马斯克与OpenAI CEO山姆·奥特曼之间备受关注的审判在奥克兰联邦法院开庭,焦点是OpenAI从非营利组织转向营利性公司的争议。双方在法庭上陈述了关于该AI实验室早期历史的截然不同版本:马斯克指控OpenAI违背了最初的非营利使命,而奥特曼则辩护称转型是为了更有效地推进人工智能发展。此案涉及AI伦理与商业化的核心辩论,可能对行业监管和未来创新方向产生深远影响。