6月26日

02:18

Tibo@thsottiaux

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体 OpenAI 现象/趋势

01:47

Greg Brockman@gdb

智能体正在被迅速采用，并加速工作进程。这在 OpenAI 内部的表现如下：

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体 OpenAI 大佬观点

01:25

OpenAI@OpenAI

OpenAI 的工作正在被智能体改变，在每个部门。整个公司里，人们正在使用 Codex

智能体 OpenAI 行业动态

01:12

jason@jxnlco

Codex 在 OpenAI 的使用为我们预览了未来智能体工作的可能面貌。在一篇新论文中，OpenAI 经济研究团队着眼于从聊天到委托的更广泛转变：人们使用 AI 智能体不仅为了获取答案，还要委托更长时间、更复杂的工作。 https://openai.com/index/how-agents-are-transforming-work

OpenAI Newsroom: Codex usage at OpenAI gives us a preview of what agentic work may look like in the future. In a new paper, the OpenAI Ec...

智能体 OpenAI 论文/研究

01:01

Hacker News 热门（buzzing.cc 中文翻译）

开放权重模型的难以忍受的廉价感

DeepSeek V4 定价极低，仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍，未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境，难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流，尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4，Meta Llama 无新版本，OpenAI 最后开放权重停留在 2025 年 GTP，Anthropic 从未发布。真正开源（含训练数据管道）模型正流行，但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。

Anthropic DeepSeek OpenAI 开源生态

00:19

Artificial Analysis@ArtificialAnlys

微软 MAI-Image-2.5 在 Artificial Analysis Image Arena 排行榜位列文本到图像第2、图像编辑第3

微软 MAI-Image-2.5 在 Artificial Analysis Image Arena 排行榜上位列文本到图像生成第2名、图像编辑第3名，仅次于 OpenAI 的图像模型。该模型支持文本到图像生成与图像编辑，最大输出分辨率约 1MP，支持灵活宽高比，上下文窗口 32K token。更快、更低成本的 MAI-Image-2.5-Flash 变体在文本到图像和图像编辑中分别排名第8和第6。API 定价：MAI-Image-2.5 为 $48/千图，Flash 版 $20/千图。模型已上线 Foundry API 和 MAI Playground，其中 MAI-Image-2.5 还可在 PowerPoint 和 OneDrive 中使用。

Microsoft OpenAI 图像生成多模态

00:15

Ethan Mollick@emollick

@daveholtz 以 OpenAI 访问经济学研究员身份，利用 Codex 数据记录 AI 向智能体（agentic）系统的快速转变。Ethan Mollick 评论称聊天机器人时代结束，智能体系统正扩展到工程之外的任务，而技能（skills）有望成为企业标准化 AI 使用的方式。

David Holtz: 🚨 New research alert! For the past few months, I've been a part-time visiting economics researcher at OpenAI. Excited t...

OpenAI 大佬观点现象/趋势

00:14

🚨 AI News | TestingCatalog@testingcatalog

OPENAI 🔥： GPT-5.6-Preview 已在 ChatGPT 代码中被发现。它可能也已向某些合作伙伴企业开放。这也意味着它可能会在有限预览状态下持续一段时间。不会很快？👀

Haider.: gpt-5.6-preview has been spotted in an internal model-access route

OpenAI 模型发布

00:08

The Decoder：AI News（RSS）

精选73

多数主流AI聊天机器人政治立场偏左，"反觉醒"模型也不例外

华盛顿邮报调查显示，多数主流AI聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5在80%回答中仅呈现左派论据；DeepSeek V4 Pro为70%；Anthropic Claude Opus 4.8有43%纯左、57%给出双方观点。xAI的Grok 4.3左倾回答仍多于右倾。右翼平台Gab的Arya左倾回答是右倾的12倍。Google Gemini 3.1 Pro是例外，93%回答同时呈现双方立场。特朗普推动的“反觉醒”AI未能改变这一格局。

Google OpenAI 安全/对齐评测/基准

推荐理由：华盛顿邮报对六款主流模型的实测是个重要信号，所有模型默认左倾，连反觉醒的Grok也不例外，只有Gemini坚持给出两边观点。做对齐和治理的人该好好看看这些数据。

6月25日

23:35

Chubby♨️@kimmonismus

Google重组AI编码突击队为"midtraining"小组，缩小与Anthropic差距

Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组，位于预训练与后训练之间，旨在提升Gemini编码能力，并延伸至创建演示文稿等商业任务。此前，Noam Shazeer因计算资源变动转投OpenAI，Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认，仅靠强大基座模型不够，编码已成为AI最明确的变现层，Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

Anthropic Google OpenAI 编码

22:24

gabriel@gabriel1

"嘿 Codex，给我这个页面做 20 个变体，每页一个按钮用来切换" "好，选变体 4" AI 模型很擅长头脑风暴，但不擅长做决定，所以这样用它们就好。

OpenAI 教程/实践编码

20:35

Chubby♨️@kimmonismus

AI数据中心扩张的真正瓶颈：电网接入

AI算力需求激增推动数据中心扩张，但真正的瓶颈可能并非芯片或能源生产，而是电网接入。OpenAI与SoftBank在德州的Stargate园区耗资超400亿美元，峰值负载约1.2吉瓦。然而美国电网并网等待时间中位数从2005年的不到20个月增至2023年的55个月。现行先到先得的审批机制导致严肃项目被投机项目阻塞。未来赢家可能不是拥有最佳模型或最多芯片的国家，而是能快速接入电网的国家。

OpenAI 现象/趋势部署/工程

19:35

Chubby♨️@kimmonismus

GPT-5.6 在内部模型访问路径中被发现。 GPT-5.6 即将到来已不是秘密。唯一的问题是它何时以及多快到来。我猜测，一切准备工作都是为了应对潜在的 Fable 5 重新发布，随后很快发布 GPT-5.6。鉴于围绕 Fable 5 的传闻越来越多，GPT-5.6 重新成为焦点并不意外。

Haider.: gpt-5.6-preview has been spotted in an internal model-access route

OpenAI 模型发布

17:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

OpenAI内部报告：智能体Codex如何改变工作

OpenAI 在2025年8月至2026年6月间观察到，智能体产品 Codex 取代 ChatGPT 成为主要工作工具，各部门输出 token 中 Codex 占比从不足10%升至99.8%。80.6%个体用户曾发起预计等效人类工作时间超30分钟的请求，70.2%超1小时，25.6%超8小时；99百分位用户每日生成超60小时 agent turns。非开发者用户增长迅猛：个体用户增长137倍，组织用户增长189倍。Legal、Finance、Recruiting 部门在2026年4月前后跨过 Codex 使用过半拐点，平均每位律师或招聘人员超85%输出 token 来自 Codex。

智能体 OpenAI 现象/趋势论文/研究

关联讨论 2 条

推荐理由：OpenAI 第一次用内部数据量化智能体如何改变工作，非开发者增速 137 倍比工程师还猛，Codex 已经吃掉内部 99.8% 的输出 token——这不是产品更新，但比大多数发布会都更值得做策略的人看一眼。

15:44

🚨 AI News | TestingCatalog@testingcatalog

OpenAI 推出新版本 GPT-5.5 Instant，号称是使用最多的模型。新版本能更好地理解问题意图并调整回答，更可靠地处理复杂约束，同时让购物和本地推荐更实用、更连贯。该模型已向付费用户推送，明天起免费用户也将陆续获得。

OpenAI: We have a new version of GPT-5.5 Instant for you, and it's much more fun to talk to. Our most-used model is now better a...

OpenAI 推理模型发布