AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「OpenAI」清除
7月1日周三
23:03IT之家(RSS)57OpenAI 推出 GeneBench-Pro 基准测试,评估 AI 模型生物学计算能力
20:21Chubby♨️71OpenAI首席经济学家:AI补充就业?数据已显严峻
18:51Chubby♨️41OpenAI分拆团队内存效率架构突破即将公布
18:10The Decoder:AI News(RSS)70精选OpenAI论文揭示GPT-5.6三个Pro变体,打破单一顶级策略
16:03IT之家(RSS)56软银完成对 OpenAI 的 100 亿美元追加投资,10 月 1 日将再投 100 亿美元
15:03IT之家(RSS)69OpenAI:ChatGPT 全球采用率持续扩大,非英语用户占比过半
14:00Greg Brockman56OpenAI 推 GeneBench-Pro 基准,GPT-5.6 Sol 显著进步
13:30Greg Brockman13Codex已经变得非常好了
11:56jason32Codex用Computer Use整理PDF文件
11:03IT之家(RSS)65ChatGPT Atlas 等 6 款 AI 浏览器曝 BioShocking 漏洞,可诱导泄露敏感数据
10:53Peter Steinberger 🦞33Sonnet 5定价远高于多个竞品模型
08:32Rohan Paul58atomic.chat对比测试:Sonnet 5在物理碰撞演示中与GPT 5.5持平,成本低6倍
08:29Greg Brockman62ChatGPT Plus 美区上线个人理财功能
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
05:58ChatGPT61ChatGPT个人财务功能向美国Plus用户开放
05:31Rohan Paul61OpenAI 将部分模型推理成本降低过半,未登录 ChatGPT 仅用几百张 GPU
04:50Chubby♨️56OpenAI 推理成本减半 + 自研芯片,Sonnet 5 发布平淡
03:31OpenAI Developers26AI智能体推动工程角色转变
03:23Peter Steinberger 🦞24OpenAI:Agent使工程转向设定方向与审查
02:08The Decoder:AI News(RSS)56OpenAI 将访客 ChatGPT 用户的推理成本降低逾一半
01:37OpenAI58OpenAI 推出 GeneBench-Pro 生物基准测试
01:03OpenAI:官网动态(RSS · 排除企业/客户案例)41OpenAI 发布 Genebench-Pro 基准测试:10个案例研究详解
01:03OpenAI:官网动态(RSS · 排除企业/客户案例)70精选OpenAI 发布 GeneBench-Pro:计算生物学研究级基准测试
01:00OpenAI Developers45OpenAI数据基础设施发现硬件与18年开源bug
00:19Chubby♨️59OpenAI 新推理优化技术使模型运行成本减半以上
00:13OpenAI:官网动态(RSS · 排除企业/客户案例)62精选OpenAI Signals 数据揭示 ChatGPT 全球采用趋势
6月30日周二
23:23Peter Steinberger 🦞48Peter Steinberger澄清:OpenClaw未被OpenAI收购,希望获得建设性帮助
23:02IT之家(RSS)62消息称 OpenAI 通过系统底层优化,将 AI 模型推理成本减半
22:36小互42Google及Claude Sonnet 5今晚发布新模型
22:30DogeDesigner61Sam Altman声称不为钱,但通过OpenAI合作伙伴企业赚取数十亿美元
22:02IT之家(RSS)49OpenAI 修复 Codex 额度消耗异常故障并重置用户额度
20:25The Verge:AI(RSS)57两次击败马斯克的律师 Bill Savitt
19:38The Decoder:AI News(RSS)70精选Meta秘密测试ChatGPT等竞品:承包商假扮未成年发送数万条危机提示
16:02IT之家(RSS)70精选黑石未来3~5年拟投300亿美元在日本建AI数据中心,联合成立AI XPV平台
15:55jason4OpenAI 艺术资助计划设想
13:29Rohan Paul61OpenAI 份额下滑,Anthropic 反超至 41%
12:27Berryxia.AI34乔纳森的OpenAI 首作产品,真的没有什么新鲜玩意了。
12:26HuggingFace Daily Papers(社区热门论文)57SafePyramid: 上下文策略防护的分层安全基准
11:23歸藏(guizang.ai)51Codex 因消耗过快再次重置使用限制并补偿
11:23歸藏(guizang.ai)30OpenAI 与 Work Louder 合作推出 Codex 定制键盘
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
23:03
IT之家(RSS)
57
OpenAI 推出 GeneBench-Pro 基准测试,评估 AI 模型生物学计算能力

OpenAI 发布 GeneBench-Pro 基准测试,评估 AI 模型在生物学计算中的真实研究能力。测试让模型面对模糊、不完整甚至带干扰的数据环境,自主完成数据探索、方法选择和策略修正。GeneBench-Pro 覆盖基因组学、定量生物学和转化医学等方向,共 129 道题,分布于 10 个大领域和 21 个子领域。为避免长流程评分偏差,OpenAI 采用合成数据构建题目。目前已在 Hugging Face 开源 10 道示例题并提供交互界面,后续将开放 50 道题给 Artificial Analysis 进行第三方独立评测。

OpenAI数据/训练评测/基准
20:21
Chubby♨️@kimmonismus
71
OpenAI首席经济学家:AI补充就业?数据已显严峻

OpenAI首席经济学家Ronnie Chatterji在ECB辛特拉会议上表示,AI可能补充而非替代就业,类比PC让经济学家更高效。但数据显示,AI采用最快的美国金融和信息行业,2026年平均每月减少2.8万个岗位。Challenger数据称今年已有约10.2万个岗位削减归因于AI,John Challenger认为其影响前所未有。

OpenAI行业动态
18:51
Chubby♨️@kimmonismus
41
@AndrewCurran_ 预测一项重大架构突破即将公布,重点提升内存效率,来自从OpenAI分拆的团队(非SSI)。主推文@Kim 指出,若属实其意义远超普通模型发布--内存效率是长上下文模型、AI智能体和推理成本的核心瓶颈,架构级突破可使长时间跨度AI系统大幅降价并更实用。Andrew被视为最可靠信源之一,Kim认为可能正处于转折点。

Andrew Curran: I'm posting this prediction now so I can quote it later. There has been a significant breakthrough in architecture - spe...

OpenAI大佬观点推理
18:10
The Decoder:AI News(RSS)
精选70
OpenAI论文揭示GPT-5.6三个Pro变体,打破单一顶级策略

OpenAI论文首次列出GPT-5.6的三个Pro变体:Luna Pro、Terra Pro和Sol Pro,取代以往单一Pro模式。在基因组学基准中,Sol Pro通过率31.5%居60个测试模型之首,领先标准Sol(28.7%)和Claude Opus 4.8(16.0%)。Pro相比标准版本提升逐级递减:Luna Pro提升7.1个百分点(16.5%→23.6%),Terra Pro提升5.2(23.3%→28.5%),Sol Pro仅提升2.8(28.7%→31.5%)。Terra Pro(28.5%)几乎与标准Sol(28.7%)持平。论文未披露Pro运行的token用量,也不清楚该分层是否会在ChatGPT中实际推出。

OpenAI推理行业动态

推荐理由:论文意外曝光 GPT-5.6 Pro 将有三个变体,Pro 不再只是一个最强模型,而是让用户按推理需求选版本,这才是匹配 200 美元月费该有的逻辑。
16:03
IT之家(RSS)
56
软银完成对 OpenAI 的 100 亿美元追加投资,10 月 1 日将再投 100 亿美元

软银集团今日通过愿景基金二号完成对 OpenAI 的 100 亿美元追加投资(第二笔),属于总计 300 亿美元追加投资计划的一部分。为筹集该笔资金,软银于同日根据过渡贷款协议成功借入 100 亿美元。软银计划于日本时间 10 月 1 日完成第三笔同样 100 亿美元的投资。此前软银曾于 2024 年通过愿景基金首次向 OpenAI 投资 5 亿美元。

OpenAI行业动态
15:03
IT之家(RSS)
69
OpenAI:ChatGPT 全球采用率持续扩大,非英语用户占比过半

OpenAI 2026 年 Q1 数据显示,ChatGPT 消费级产品全球采用率扩大。注册六个月后用户日均消息量增 50%,任务类型翻倍。可推断性别的用户中女性占比过半,35 岁以上用户消息占比上升。非洲和亚洲周活跃用户增速领先,人类发展指数较低的国家增长最大。非英语用户占活跃用户半数以上,西班牙语、葡萄牙语、阿拉伯语为前三非英语语言;乌兹别克语、哈萨克语、缅甸语占比增幅最大。消费级账户工作用途中,视觉设计增长最快。分析未包含 Codex 及企业版、教育版。

OpenAI行业动态
14:00
Greg Brockman@gdb
56
OpenAI 推出研究级基准 GeneBench-Pro,用于测试 AI 智能体在真实计算生物学中处理复杂、需要高度判断的分析能力。每个问题需要人类专家约 20-40 小时完成。Greg Brockman 表示,GPT-5.6 Sol 在该基准上实现了重大进步。

OpenAI: We're introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can naviga...

智能体OpenAI论文/研究
13:30
Greg Brockman@gdb
13
QuinnyPig承认之前低估了Codex,现在发现它非常出色。Codex已变得非常好。

Corey Quinn: Okay I owe my @OpenAI friends an apology for sleeping on Codex. I was not aware how strong your game was. This is... rea...

OpenAI大佬观点编码
11:56
jason@jxnlco
32
现在,Codex正在使用Computer Use来整理我在GoodNotes中的1500个PDF,而我在看世界杯。 这是我"AI叠衣服,我搞艺术"的时刻。 感谢 @jxnlco 及团队。 这就是未来。

Chris Albon: Right now Codex is using Computer Use to organize the 1500 PDFs I have in GoodNotes while I watch the world cup. This is...

智能体OpenAI大佬观点
11:03
IT之家(RSS)
65
ChatGPT Atlas 等 6 款 AI 浏览器曝 BioShocking 漏洞,可诱导泄露敏感数据

安全公司 LayerX 披露漏洞 BioShocking,影响 ChatGPT Atlas、Perplexity Comet、Fellou、Genspark Browser、Sigma Browser、Anthropic Claude 扩展共 6 款 AI 浏览器产品。攻击者制作恶意网页,通过类似《生化奇兵》的谜题诱导 AI 接受“2+2=5”等错误逻辑,削弱安全约束后指令 AI 访问其他页面并复制隐藏代码,从而泄露已保存密码、会话 Cookie、私有 Token 等用户敏感数据。OpenAI 已修复 ChatGPT Atlas 漏洞;Perplexity 关闭报告但未处置;Anthropic 尝试修复 Claude 扩展但补丁未通过后续验证。

AnthropicOpenAI安全/对齐
10:53
Peter Steinberger 🦞@steipete
33
引用推文@scaling01指出Sonnet 5定价过高:比Opus 4.8 Max贵1.2倍,比GPT-5.5-xhigh贵2倍,比GLM-5.2贵5倍,比Kimi-K2.6贵7倍,比DeepSeek-V4-Pro贵57倍。主推文则提醒:每token价格不等于每任务成本。

Lisan al Gaib: Sonnet 5 goes straight into the garbage bin > 1.2x more expensive than Opus 4.8 Max > 2x more expensive than GPT-5.5-xhi...

AnthropicOpenAI现象/趋势
08:32
Rohan Paul@rohanpaul_ai
58
atomic.chat桌面应用对Claude Sonnet 5、Opus 4.8、Sonnet 4.6及GPT 5.5进行对比测试。使用同一提示词构建三个HTML5物理碰撞演示(汽车撞墙、破坏球毁屋、投石机砸城)。Sonnet 5在全部测试中与GPT 5.5和Opus 4.8表现相当,其中破坏球场景胜Opus 4.8,投石机场景胜GPT 5.5。Sonnet 5仅用15,047 tokens($0.15),GPT 5.5使用31,152 tokens($0.94),成本低约6倍;Opus 4.8使用23,063 tokens($0.58),Sonnet 4.6使用25,824 tokens($0.39)。Sonnet 5 token消耗最少,图形细节仍有提升空间。

atomic.chat: New Claude Sonnet 5 performs at GPT 5.5 level 6x cheaper! We gave 4 models the same prompt: build three self-contained H...

AnthropicOpenAI编码评测/基准
08:29
Greg Brockman@gdb
62
个人理财现已在美区 ChatGPT Plus 上线。

ChatGPT: Questions about dollars. Answers that just make sense. Personal finance in ChatGPT is now available to Plus users in the...

OpenAI产品更新
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
05:58
ChatGPT@ChatGPTapp
61
关于金钱的问题,答案合情合理。 ChatGPT 中的个人财务功能现已向美国 Plus 用户开放。

ChatGPT: A preview for Pro users: a new personal finance experience in ChatGPT. Pro users in the U.S. can securely connect financ...

OpenAI产品更新
05:31
Rohan Paul@rohanpaul_ai
61
OpenAI 将部分模型推理成本降低过半,未登录 ChatGPT 仅用几百张 GPU

The Information 报道,OpenAI 已将某些现有模型的推理成本降低一半以上,未登录 ChatGPT 的流量仅运行在几百块 Nvidia GPU 上。可能技术手段包括量化、KV-cache 优化、批处理、投机解码和路由简单查询。若属实,这将成为核心竞争杠杆,可提升毛利率、扩大使用限制或降低 API 定价压力。背景方面,OpenAI 调整后毛利率从 2024 年的 40% 降至 2025 年的 33%,推理成本翻四倍。预计 2026 年 Q1 毛利率回升至 39%,年底目标 52%。Anthropic 毛利率约 44%,前沿实验室尚未达到成熟软件公司的经济水平。

OpenAI推理行业动态
04:50
Chubby♨️@kimmonismus
56
OpenAI 推理成本减半 + 自研芯片,Sonnet 5 发布平淡

作者认为 OpenAI 今天取得更重大突破:通过新推理优化方法将推理成本降低一半以上,并与 Broadcom 合作推出更快更高效的推理芯片,使 OpenAI 处于突出位置。相比之下,Sonnet 5 只是一次普通发布。引用推文进一步指出,Sonnet 5 优于 Sonnet 4.6 但弱于 Opus 4.8,定价不变,版本号从 4 跳到 5 不合理,可能只是为维持话题的中间发布,整体令人失望。

Chubby♨️: Here is my first assessment of Sonnet 5: Sonnet 5 is better than Sonnet 4.6. Who would have thought? But jokes aside: Un...

AnthropicOpenAI大佬观点推理
03:31
OpenAI Developers@OpenAIDevs
26
随着智能体承担更长期的工作,工程转向设定方向、审查工作以及围绕模型设计更好的系统。
智能体OpenAI现象/趋势
03:23
Peter Steinberger 🦞@steipete
24
随着AI智能体承担更长期的工作,工程任务转向设定方向、审查工作以及围绕模型设计更好的系统。@steipete 对参与@aiDotEngineer 的主题演讲感到荣幸。

OpenAI Developers: As agents take on longer-running work, engineering shifts to setting direction, reviewing work, and designing better sys...

智能体OpenAI行业动态
02:08
The Decoder:AI News(RSS)
56
OpenAI 将访客 ChatGPT 用户的推理成本降低逾一半

本月早些时候,OpenAI 工程师将现有 AI 模型的推理成本削减了一半以上,并应用于未注册账户的访客 ChatGPT 用户。所需 Nvidia GPU 数量降至仅几百块。同时,DeepSeek 开源了一种新方法,可将推理请求速度提高 60% 至 85%。这些节省的资源可用于扩大服务规模、优化模型或改善响应速度。

OpenAI推理行业动态
01:37
OpenAI@OpenAI
58
我们正在引入GeneBench-Pro,一个研究级基准测试,用于衡量一种更难的AI进步:智能体在混乱的生物数据中导航、选择正确分析路径、并做出真实计算研究所需的判断决策的能力。
智能体OpenAI数据/训练论文/研究
01:03
OpenAI:官网动态(RSS · 排除企业/客户案例)
41
OpenAI 发布 Genebench-Pro 基准测试:10个案例研究详解

OpenAI 推出 GeneBench-Pro 生物医学基准测试,包含 10 个案例研究。每个案例提供原始提示词、数据集和支持材料,覆盖体细胞肿瘤学(结构变异指导的肿瘤治疗获益-风险决策)、功能基因组学(CRISPR 靶点验证:lncRNA 转录本或基因组位点)和统计遗传学(连锁遗传位点中蛋白质药物靶点优先排序)等方向,要求模型输出 JSON 格式分析结果。

OpenAI教程/实践评测/基准
01:03
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
OpenAI 发布 GeneBench-Pro:计算生物学研究级基准测试

OpenAI 发布 GeneBench-Pro,用于评估 AI 智能体在计算生物学中处理模糊性和做出判断性分析的能力。该基准包含 129 个问题,覆盖统计遗传学、群体遗传学等 10 个领域 21 个子领域。每个问题提供真实混乱的数据集和实验背景,要求模型探索数据、选择分析路径并迭代实验。采用合成数据构建,已知完整因果结构。82 个问题已由外部领域专家审核确认其现实性。

OpenAI推理论文/研究

推荐理由:OpenAI 的新基准揭示了一个信号,GPT-5.6 在需要科学判断的模糊任务上进步神速,从不足 5% 到接近 30%,且单题成本仅几美元,这对 AI for Science 的落地想象空间影响不小。
01:00
OpenAI Developers@OpenAIDevs
45
⚙️ 我们在数据基础设施中调试了一整年的崩溃,发现了一个硬件问题,以及另一个在开源代码中隐藏了18年未被注意的问题。 以下是我们的追踪过程: http://openai.com/index/core-dump-epidemiology-data-infrastructure-bug/
OpenAI教程/实践部署/工程
00:19
Chubby♨️@kimmonismus
59
OpenAI 新推理优化技术使模型运行成本减半以上

OpenAI 据报告发现新的推理优化技术,将模型运行成本降低超过一半。据 The Information,工程师本月初称,这些技术曾仅用数百块 Nvidia GPU 就支撑了免费用户的 ChatGPT 访问。具体方法不明,可能涉及量化、KV 缓存、批处理、路由简单查询至更便宜模型等组合。商业层面:OpenAI 一季度毛利率 39%,目标年底达到 52%。更低推理成本可改善利润率、提升 ChatGPT 使用限制或缓解 API 定价压力。OpenAI 的护城河正转向推理和成本优势,尤其相对于 Anthropic。

OpenAI推理行业动态
00:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选62
OpenAI Signals 数据揭示 ChatGPT 全球采用趋势

OpenAI Signals 数据显示,用户注册六个月后日均消息量增加50%,尝试任务种类翻倍。自2023年7月以来,各大洲活跃用户均大幅增长,非洲和亚洲增速最快,低人类发展指数国家增长尤为显著。用户群体更加多元化,女性名字用户已占全球多数,巴西、哥伦比亚、波兰和纳米比亚等国女性用户显著多于男性。非英语用户占活跃用户半数以上,领先语言为西班牙语、葡萄牙语和阿拉伯语;乌兹别克语、哈萨克语和缅甸语用户占比增长百分比最大。

OpenAI现象/趋势

推荐理由:OpenAI 首次公开用户行为数据,显示使用深度和广度随时间增长、非洲与亚洲增速最快,对做全球化产品的同行是个重要信号。
6月30日
23:23
Peter Steinberger 🦞@steipete
48
Peter Steinberger澄清:OpenClaw未被OpenAI收购,希望获得建设性帮助

针对用户Cristian嘲讽“被OpenAI收购、拿到无限token却做出劣质应用”的推文,Peter Steinberger回应:OpenClaw未被收购,它是OpenClaw Foundation下的独立开源项目,由社区构建;OpenAI仅赞助token用量,他本人恰好在OpenAI工作。当前iOS和Android应用尚不完善,但已实现安全配对和推送通知并通过App Review。他表示当天收到约30条类似批评,希望得到建设性帮助,而非空耗注意力。

cristian rus: imagine getting acquired by @OpenAI, get unlimited AI tokens and still drop this slop abomination

OpenAI大佬观点开源生态
23:02
IT之家(RSS)
62
消息称 OpenAI 通过系统底层优化,将 AI 模型推理成本减半

OpenAI 工程师在内部透露,公司通过一系列系统底层优化,将 AI 模型的推理(运行)成本降低了 50% 以上。此次优化主要得益于提升现有服务器资源利用率,而非新增计算芯片投入,使得所需英伟达芯片更少。节省的成本可用于降低 API 定价或提高用户使用限额。

OpenAI推理行业动态
22:36
小互@xiaohu
42
Google 今晚将会发布 新的🍌模型和 低配版的 Omini 模型 另外根据情报显示:Claude Sonnet 5 也将会在今晚登场 OpenAI 还没动静…
AnthropicGoogleOpenAI行业动态
22:30
DogeDesigner@cb_doge
61
Sam Altman声称不为钱,但通过OpenAI合作伙伴企业赚取数十亿美元

Sam Altman声称在OpenAI没有股份且不为钱,但通过持股与OpenAI有直接业务往来的公司获利数十亿美元,包括Helion Energy(价值超40亿美元)、Stripe、Retro Biosciences、Cerebras、Humane、Lattice、Formation Bio、Rain AI(OpenAI曾签5100万美元采购意向书)及Reddit(内容交易)。尽管OpenAI单季度亏损约85亿美元,Altman的个人投资持续获利。

OpenAI大佬观点行业动态
22:02
IT之家(RSS)
49
OpenAI 修复 Codex 额度消耗异常故障并重置用户额度

OpenAI 修复了编程智能体 Codex 的额度消耗异常故障。该故障导致部分用户执行同等编程任务时额度消耗速度比一周前大幅加快。工程负责人蒂博·索蒂奥克斯解释,自动代码审核、辅助子智能体等功能存在运行频次超标、重复执行或出错后无节制重试,后台运算量超出预设标准。OpenAI 周日成立应急小组,已上线所有修复方案并新增更细化的监控机制,同时再次为全体用户完全重置了使用额度。此前有用户反馈 200 美元套餐的七天额度两天内耗尽。

OpenAI编码行业动态
20:25
The Verge:AI(RSS)
57
两次击败马斯克的律师 Bill Savitt

Bill Savitt 两次在法庭上战胜 Elon Musk:先是代表 Twitter 迫使 Musk 完成收购,后在 Musk 诉 OpenAI 案中再次获胜。Savitt 的交叉询问风格温和低调,但准备极其充分——熟悉每一份相关文件,避免正面交锋,善于捕捉庭审中意外出现的线索。他表示应对 Musk 这类聪明且富有魅力的证人的关键是“绝不咬钩”,并在必要时敢于冒险提问。目前 Musk 正在对陪审团裁决提出上诉,Savitt 拒绝讨论具体案情。

OpenAI政策/监管行业动态
19:38
The Decoder:AI News(RSS)
精选70
Meta秘密测试ChatGPT等竞品:承包商假扮未成年发送数万条危机提示

Meta通过承包商Covelen发起代号“Cannes”的项目,雇佣数百人假扮未成年人,向ChatGPT、Gemini和Character.AI发送关于自杀、自残、饮食障碍和毒品的敏感提示,并将回复录入表格。2025年8月一轮测试中发送了超过4.5万条提示。Meta称这是行业标准安全测试,未将数据用于训练自家模型。被测试公司不知情——Character.AI表示违反其服务条款,OpenAI已调查,Google称未批准。青少年使用AI聊天机器人引发的担忧持续,此前已有用户自杀事件。

MetaOpenAI安全/对齐行业动态

推荐理由:Meta 秘密测试 ChatGPT 等对手,用的是假装未成年人的危机提示,这种事既是安全测试也可能是数据抓取,被测试公司全不知情,这暴露了 AI 安全测试的灰色地带。
16:02
IT之家(RSS)
精选70
黑石未来3~5年拟投300亿美元在日本建AI数据中心,联合成立AI XPV平台

黑石计划未来3~5年在日本AI数据中心领域投资300亿美元,此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期,真正风险是算力短缺而非基建泡沫;谷歌、亚马逊是英伟达潜在挑战者。此外,黑石、阿波罗、博通本月9日成立AI XPV平台,目标2028年向OpenAI、Anthropic等提供超20GW算力,首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。

AnthropicOpenAI行业动态部署/工程

推荐理由:黑石300亿美元押注日本AI数据中心,加上此前AI XPV平台,算力基建竞赛进入新阶段,对于关注云计算和算力供需的人来说是个重要信号。
15:55
jason@jxnlco
4
如果 OpenAI 有一个艺术资助项目,那会是什么样子?
OpenAI其他
13:29
Rohan Paul@rohanpaul_ai
61
在 Ramp 最新月度 AI 指数中,美国有付费 AI 订阅的企业里,OpenAI 下降 0.1 个百分点至 39.5%,而 Anthropic 上升 2.5 个百分点至 41%。
AnthropicOpenAI行业动态
12:27
Berryxia.AI@berryxia
34
乔纳森的OpenAI 首作产品,真的没有什么新鲜玩意了。
OpenAI评测/基准
12:26
HuggingFace Daily Papers(社区热门论文)
57
SafePyramid: 上下文策略防护的分层安全基准

SafePyramid是一款安全基准,包含1,000轮多领域对话、3,000条应用特定策略及61,699条自然语言规则。评估分三级:L0单规则理解、L1规则依赖推理、L2全新策略框架适应。测试10个前沿大语言模型与5个可配置策略防护,发现上下文策略防护仍极具挑战。最佳模型GPT-5.5完整识别违规规则的准确率在L0、L1、L2上分别仅为54.0%、35.3%和12.9%。

OpenAI安全/对齐论文/研究评测/基准
11:23
歸藏(guizang.ai)@op7418
51
OpenAI 的 Codex 因使用量消耗异常再次重置所有用户使用限制,并额外补偿一次重置(未来 24 小时可用)。调查发现是多个小问题叠加:Auto-review 过度主动、变更导致更多子智能体工作、后台建议重复运行或失败重试过于频繁。已回滚相关变更并修复调度与重试行为,减少不必要 token 消耗。此外,Auto-review 此前被错误显示为 GPT-5.4 的使用量,失败与限流请求也被计入 turn 图表;现在 Auto-review 归入独立类别,仅成功请求计入。修复已通过 CLI、桌面应用和用量后端热更新部署,历史图表中旧数据仍显示为 GPT-5.4。

Tibo: Codex usage limits will be fully reset again in the next hour and we will credit one additional reset into your bank for...

OpenAI产品更新编码
11:23
歸藏(guizang.ai)@op7418
30
OpenAI 与 Work Louder 合作推出 Codex 定制键盘

OpenAI 与 Work Louder 合作推出基于 Creator Micro 2 外观定制的 Codex 键盘,配备 13 键、旋钮、摇杆、触摸传感器,摇杆弹出圆形快捷菜单,支持 6 层映射。标准版售价 144 美元起,定制版价格待公布。7 月 15 日 Codex 快捷键将升级。

OpenAI Developers: Your favorite Codex shortcuts are getting an upgrade. July 15th.

OpenAI产品更新编码
‹ 上一页
1234…50
下一页 ›