AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2164 条
全部一手资讯X论文
标签「OpenAI」清除
ChatGPT@ChatGPTapp · 5月23日69

Paperwork is better when you can just talk through it. With Images in ChatGPT and voice mode, you can upload a form, say what to fill in, and get back a completed version.

译用对话处理文书工作更轻松。 借助ChatGPT的图像功能和语音模式,您可以上传表单,说出要填写的内容,即可获得填写完成的版本。

meng shao@shao__meng · 5月22日65

今天下午体验了一把 AI vs 传统专业工具的真实对比! 今天下午帮一位做打印设备的朋友调输入图像参数,他在做美甲甲片打印,我跟两位专业设计师配合工作,做效果展示。 我们从那种美甲成品批量展示的图里,找到我们要的图案,做图像超分、增强/饱和度等、甲片蒙层,再做打印。 两位专业设计师用的专业工具是 PhotoShop,他们非常熟练各种快捷键操作,处理一张图片大概 1-2 分钟。 我开着 ChatGPT,用 ChatGPT Image 2,一次性把超分分辨率、增强和饱和度的要求等、不同手指的甲片图片输入,让 ChatGPT 在后续操作中按照执行要求,和它对图片的理解来输出图像,处理一张图片大概 5-8 秒。 最终我们输出的效果是很接近的,本来拉开差距的地方在饱和度和对比度等设置这一步,不过专业设计师根据专业判断反复调整后,发现跟 ChatGPT 自己判断的结果很接近。

译在为美甲甲片打印处理图像时,作者对比了AI工具ChatGPT的Image 2与传统专业工具PhotoShop的性能。专业设计师使用PhotoShop处理单张图像需1-2分钟,而ChatGPT Image 2仅用5-8秒即可完成超分、增强等操作,速度优势显著。最终输出效果接近,尤其在饱和度和对比度等关键参数上,AI的自主判断与专业设计师反复调整的结果高度一致,凸显了AI在图像处理中的高效与潜力。

Greg Brockman@gdb · 5月22日75

try Appshots in the Codex app:

译OpenAI的Codex应用推出了名为Appshots的新功能。用户通过同时按下两个CMD键,即可将当前应用的完整上下文(包括可见与不可见的屏幕内容)发送给Codex,远超普通截图所能提供的信息。与此同时,OpenAI更新了远程Codex,使其在笔记本电脑锁屏状态下仍可正常运行,允许用户安全地将笔记本留在家中,通过手机进行远程编码。该应用集成了多项独特功能,提升了使用体验。

Chubby♨️@kimmonismus · 5月22日41

June will be huge. -Gemini 3.5 pro (confirmed) -GPT-5.6 (rumored but pretty confident for a release) Still waiting for annoucements Claude Sonnet 4.8 (Claude-Code-/Source-Map-Leak)

译六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)

Rohan Paul@rohanpaul_ai · 5月22日60

Google was not far from launching its own ChatGPT-like product back in 2022. Sundar Pichai talks about how Google had already built a almost equvalent product around LaMDA, but its raw behavior was too toxic for Google standards, and unreliable to ship broadly. Pichai: "I think as a company, you had this search quality bias, and so, you know, we had a higher bar, for what we thought was an acceptable product quality to go out." The LaMDA model of Google was not simply a case of brilliant research sitting on a shelf, because Google had already started turning the model into a product and even exposed a constrained version through AI Test Kitchen. Pichai is also saying hindsight makes the miss look cleaner than it felt at the time, because even OpenAI’s move was not instantly obvious as the winning form factor. --- From @collision podast with @sundarpichai (full video link in comment)

译谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。

Berryxia.AI@berryxia · 5月22日64

1美金100张图,属于0.07 RMB/张 GPT-image-2的图。 不为爱发电是为了谁发电啊? 不就是为你发电嘛哈哈哈

译推文强调GPT-image-2的性价比,指出其生成图片成本仅约0.07元/张(1美元100张),并鼓励用户充分利用此低成本服务。引用补充了使用建议,倡导用户进一步细化操作方法以优化个人体验。整体传达了“以低成本获取AI图像生成服务”的核心信息,突出其亲民价格和实用价值。

Rohan Paul@rohanpaul_ai · 5月22日35

"Existing high-power chips in China are still a fraction of the performance of NVIDIA's leading chips. And it's actually really, really hard to build up a scaled and complex semiconductor supply chain" Paulina McPadden, Inv Manager at Baillie Gifford

译中国现有的高性能芯片性能仍只是英伟达领先芯片的一小部分。 而且,建立规模化且复杂的半导体供应链实际上非常、非常困难。 ——Paulina McPadden,Baillie Gifford 投资经理

Greg Brockman@gdb · 5月22日17

trying to remember what it was like to code before codex

译试图回忆在Codex出现之前编程是什么感觉

Tibo@thsottiaux · 5月22日22

Codex is our WorkGPT

译Codex是我们的WorkGPT。

Ethan Mollick@emollick · 5月22日40

Its funny how much the whole "strawberry" thing, which turned out to be o1-preview, was dismissed as overhyped at launch when it is clear in retrospect that it was way underhyped. A direct line from models unable to do basic math to solving unresolved math problems in 18 months.

译有趣的是,整个“草莓”事件(后来证实是o1-preview)在发布时被斥为过度炒作,但事后看来,它其实被严重低估了。 从模型连基础数学都不会,到18个月内解决未解数学问题,这是一条清晰的进化路径。

歸藏(guizang.ai)@op7418 · 5月22日73

Codex 昨晚发布史诗级更新,体验爆炸提升! 其中快捷截图添加上下文和内置浏览器高级注释的功能太有用了。 你只需要同时按住左边和右边的 Command 键,它就会把你当前鼠标所在位置的窗口全部截下来,然后自动填入到 Codex 的输入框里。 它这个截图不只是你当前窗口的这个位置,而且它会把屏幕上没有的文本,也都填入到上下文里。 然后 /goal 这个功能已经正式上线到 Codex App 了。 这个功能更猛,你只要给它一个目标,它就会一直执行直到完成任务。这个过程可能持续几小时甚至几天时间。 而且你还可以:随时更改它的目标和引导、随时暂停,等你需要的时候继续执行。 如果你按下这个斜杠命令以后,没有出现这个可选项的话,你需要去它的 config 文件里改一下这个指令,它就能开启。 具体方式是:在 config.toml 中启用 features.goals goals = true 应用内浏览器也变得非常快和流畅。它有一个高级注释模式,可以让你在评论元素的同时去修改这些元素,甚至可以直接编辑。 这个可太爽了!你比如说用了我的 PPT Skills 以后,你觉得这个字太小或者里边的文字不对,你就可以直接编辑这个文字,而不用让 Codex 去帮你编辑。 还有一个是团队共享插件。在团队版本中,现在可以给你的团队成员批量安装插件了,目前该功能支持 Business 用户使用。

译Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。

宝玉@dotey · 5月22日76

如何在 Codex App 使用 /goal 的简单说明: 1. 升级 Codex App 到最新版本 2. 先在命令行运行一下下面的指令: > codex features enable goals 或者手动修改 ~/.codex/config.toml [features] goals = true 3. 开头输入 /goal,或者点 + 弹出菜单中选择 4. 开始后,输入框上方可以暂停、编辑、删除

译OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

Greg Brockman@gdb · 5月22日65

the model alone is no longer the product

译模型本身已不再是产品

Greg Brockman@gdb · 5月22日73

codex for using all apps on your computer from your phone

译Codex让你通过手机使用电脑上的所有应用 [引用 @AriX]:又一个:今天我们发布了Codex中的远程计算机使用功能! 这意味着你可以通过Codex Mobile使用Mac上的所有应用,即使你的电脑在家且处于锁定状态。 这有点神奇。

meng shao@shao__meng · 5月22日70

OpenAI Codex 「疯狂星期四」更新又来了 😄 玩笑,是 Codex 团队约定的每周四做一次更新,这也符合「不在周五」上线的潜规则。。一起看看 Codex 又有哪些实用的更新。 https://developers.openai.com/codex/app 1. 远程 Mac 控制(最重磅) Codex 现在能从手机安全控制你的 Mac,即使 Mac 处于锁屏 + 屏幕关闭状态也能运行。 实现真正“无人值守”操作。用户可在床上、路上通过手机下达指令,让 Mac 继续工作(代码、自动化任务等)。 官方演示:锁屏界面显示“Codex is Using Your Mac”,强调安全与权限控制。 2. Appshots(屏幕上下文直达) 将 Mac 屏幕内容直接捕捉并注入 Codex 上下文(App + 界面状态)。 极大提升任务连续性,无需反复描述当前界面或上传截图。AI 能“看见”你正在做什么,实现更自然的交互。 3. Goal Mode(目标模式) 支持长时间自主执行(数小时至数天)。用户设定明确目标,Codex 持续推进,直到完成或达到可验证标准。 可用范围:Codex App、IDE 插件、CLI 均支持。 使用建议: · 目标需具体、可衡量(如“完成 JavaScript 到 TypeScript 迁移 + 严格模式编译通过”)。 · 支持暂停/恢复、侧边聊天监控进度、实时纠偏。 从“即时响应”转向“长期智能体”,适合复杂工程任务。已验证单目标运行超 100 小时的案例。 4. Advanced Annotation Mode(高级标注模式) 在网页/App 上直接视觉调整样式,同时给出反馈,Codex 据此迭代。 设计/前端协作更直观,像“实时共同编辑”一样工作。

译OpenAI Codex推出周四常规更新,本次重点功能是远程Mac控制:用户可通过手机安全操作处于锁屏状态的Mac,实现“无人值守”执行任务。同时新增Appshots功能,可直接捕捉屏幕上下文注入对话。新增的Goal Mode支持数小时至数天的长期自主执行,标志着Codex从即时响应工具向长期智能体的转变。此外,高级标注模式提升了前端协作的直观性。

Berryxia.AI@berryxia · 5月22日68

牛马们的“终于PPT有救了”😂哈哈 ChatGPT 现在直接在 PowerPoint 里给你做 PPT 了。 虽然Google sliders 也可以差不多一样的功能,但是天然和我们的诸多使用习惯部贴切! 所以这个直接搞PPT的更符合大众的需求! 同时你再也不用对着空白幻灯片发呆了。 它可以直接在 PowerPoint 里: - 创建演示文稿 - 编辑内容 - 理解现有幻灯片 - 润色优化 而且全程保持幻灯片可编辑,不是导出死图。 顺便还能在 PPT 里直接生成图片。 这下可以实现PPT自由了✌️ 目前还在 beta,官方在征集反馈。 链接在这里(有兴趣的可以去试): https://chatgpt.com/apps/powerpoint/

译ChatGPT现已能在Microsoft PowerPoint中直接创建、编辑和优化演示文稿,无需切换应用或导出静态文件,保持全程可编辑。该功能可理解现有幻灯片内容,实现从生成到润色的全流程协助,并支持内置图片生成。此举旨在解决用户制作PPT时的痛点,更贴合国内使用习惯。目前该功能处于Beta测试阶段,官方正征集用户反馈。

Sam Altman@sama · 5月22日26

what problem do you most hope AI will solve in the future? maybe we can help!

译你最希望AI在未来解决什么问题? 也许我们能帮忙!

OpenAI@OpenAI · 5月22日62

Highlights from today’s Codex Thursday launches: 1️⃣ Codex can now securely use apps on your Mac from your phone, even when your Mac is locked and the screen is off. http://developers.openai.com/codex/app/computer-use#locked-use

译今日Codex周四发布亮点: 1️⃣ Codex现可通过手机安全使用Mac上的应用,即使Mac处于锁屏且屏幕关闭状态。

🚨 AI News | TestingCatalog@testingcatalog · 5月22日78

OPENAI 👀: ChatGPT is now available directly in PowerPoint, allowing users to create and edit slides. PowerGPT 💪🤖

译OPENAI 👀:ChatGPT现已直接集成到PowerPoint中,允许用户创建和编辑幻灯片。 PowerGPT 💪🤖 [引用 @ChatGPTapp]:https://chatgpt.com/apps/powerpoint/

ginobefun@hongming731 · 5月22日63

http://x.com/i/article/2057600777791913984 # BestBlogs 早报 · 05-22|Agent 记忆原语、Qwen3.7-Max、自动化与人类专家 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-22 ## 导语 今天的早报围绕一个核心问题:AI Agent 真正「成熟」意味着什么? Anthropic 工程师首次公开了两项平台级原语——Memory 与 Dreaming,把 Agent 的跨会话记忆问题从理论变成了工程事实,Rakuten 的 97% 错误率下降数据让所有人意外。与此同时,Qwen3.7-Max 在 35 小时连续压测中以 1158 次工具调用零中断,把国内大模型竞争的焦点彻底从问答分数拉向长程稳定性。Every 创始人 Dan Shipper 则提出了一个反直觉的论断:AI 越普及,能「评判对错」的人类专家反而越稀缺。 今天速览部分涵盖了 Daytona 与 Railway 两家 Agent 基础设施公司的产品哲学,以及腾讯 Hy-MT2 翻译模型开源、AMD 苏姿丰上海演讲、ZCube 组网架构突破等多个值得关注的进展。补充阅读部分包括 OpenAI 推翻 80 年数学猜想、多篇 Harness Engineering 工程实践,以及 Martin Fowler 关于 Agent 代码可维护性传感器的最新思考,内容横跨 AI 科学发现、工程化落地与系统架构多个维度,建议根据今日阅读路径选读。 ## 精讲一:用于自学习自主 Agents 的 Memory 与 Dreaming 来源: Claude(Anthropic 官方频道) 阅读链接: 在 BestBlogs 观看 背景:Agent 记忆的工程瓶颈 在 AI Agent 承担越来越复杂的企业任务时,最大的工程障碍之一是「历史执行上下文的管理」。没有持久化的记忆基础设施,Agent 每次收到新指令时几乎都是「空白状态」——频繁重复错误、重复工作,无法在多 Agent 团队之间共享领域知识。 Anthropic 的 Ravi 在一场公开演讲中首次披露了两项专为云端托管 Agent 设计的基础设施原语:Memory 与 Dreaming。这是 Anthropic 在「长程自主智能体」方向上迄今最具体的架构路径。 Memory:把经验建模为虚拟文件系统 Memory 系统的设计出发点很务实:不强迫模型使用限制性的内部 API,而是把知识显式建模为标准虚拟文件系统,暴露给 AI 模型。 现代大语言模型(如 Opus 4.7)在操作文件路径和目录结构方面具备相当强的原生能力。通过把过去的经验和共享知识表示为标准目录,Agent 可以使用熟悉的 bash、grep 等终端工具来检查、修改和组织历史记录。这消除了不必要的软件层,让模型自己决定哪些会话内容值得保存。 企业控制层级与并发控制: 在大型企业环境中部署共享记忆时,读写冲突是一个现实风险。Anthropic 通过三项架构约束来解决这个问题: 1. 作用域层级(Scoped Hierarchies): Agent 同时访问不同层次的记忆空间——包括只读的企业知识库(如 SLO 策略、运行指南)和可读写的本地任务存储。 1. 乐观并发控制(OCC): 防止多个并发 Agent 在同时写入时互相覆盖状态。 1. 独立 REST API: 使外部工程团队可以方便地执行 CRUD 操作、触发数据导出或进行合规删除。 Rakuten 的早期部署数据非常惊人:引入生产级 Memory 后,首次执行错误率下降了 97%。Wise Docs 也消除了文档验证流程中的跨会话处理瓶颈。 Dreaming:全局优化的异步整合 如果说 Memory 是 Agent 的「知识存储」,那么 Dreaming 就是 Agent 的「夜间整理」。 Dreaming 原语在后台异步运行,对碎片化的记忆进行整合与去重,消除多 Agent 团队的重复学习。它类似于人类睡眠中大脑对白天经验的整理与固化,帮助整个 Agent 组织在不中断任务的情况下持续优化共享知识库。 为什么这很重要 这两项原语的意义不只在于技术层面。它们标志着 Agent 基础设施从「单次任务工具」向「持续学习系统」的关键跃升。当 Rakuten 的数字从 97% 这个量级给出时,它提示了一件事:Agent 的真正价值边界,可能不在于单次任务的表现,而在于是否能从每次执行中积累并共享经验。 与今日其他内容的关联 Memory 与 Dreaming 这两项原语,和今天精讲二中 Qwen3.7-Max 的「长程策略连贯性」指向了同一个问题的两个层面:一个是在基础设施层解决 Agent 的跨会话记忆问题,另一个是在模型层解决长程执行中的策略稳定性问题。这两个方向的进展,共同构成了「AI Agent 从工具到协作者」这一演化的基础条件。 从今天精讲三 Dan Shipper 的视角来看,Memory 与 Dreaming 的意义还不止于此:当 Agent 具备了持久化学习能力,它们在特定领域的执行质量会随时间不断提升,这进一步强化了「人类评委」在整个系统中的战略价值——因为需要有人来判断 Agent 积累的「经验」是否正确、是否值得保留。 如果你正在构建企业级 Agent 或多 Agent 协作系统,这篇内容值得深读。 ## 精讲二:Qwen3.7-Max 重新定义 AI Agent 基座 来源: 通义大模型 阅读链接: 在 BestBlogs 阅 问题的起点:Demo 很惊艳,一上生产就崩溃 很多开发者对 AI Agent 的真实体验是:任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始「自我循环」。Qwen3.7-Max 试图正面回应这个痛点。 极限压力测试:35 小时、1158 次工具调用零中断 通义实验室为 Qwen3.7-Max 设计了一场极限压力测试:在训练期从未见过的硬件平台(平头哥真武 M890 PPUs)上,自主优化 SGLang 的 Extend Attention 生产级 Kernel。 没有硬件文档,没有性能分析数据,起点只有任务描述、官方 Triton 参考实现和一个评估脚本。 在约 35 小时的连续运行中,模型共产出 432 次 Kernel 评估,跨越 1158 次工具调用,完全自主地: - 编写、编译、性能分析并迭代推理算子 - 诊断编译报错、修复正确性 Bug - 通过运行时测量定位瓶颈,多次重构底层架构 最终,在多个工作负载上相对 Triton 参考实现几何平均加速 10.0x,而对比同期测试的其他模型最高仅 7.3x,且多数因连续 5 轮无行动而主动退出。 更关键的数据是:模型在 30 小时后仍在持续发现实质性改进点,证明了它的「长程策略连贯性」。 解耦训练架构:跨框架泛化的底层设计 Qwen3.7-Max 的训练架构采用了「任务 - 运行框架 - 验证器」正交解耦设计。在强化学习阶段,模型被强制在不同框架、不同验证器组合下处理同源任务,学到的是通用的解题策略与工具调用范式,而非「某个框架的快捷键」。 这意味着:无论使用 Claude Code、OpenClaw、Qwen Code,还是自研 Tool Use 框架,Qwen3.7-Max 都能即插即用,性能表现高度一致。在 QwenClawBench 与长链路 CoWorkBench 评测中,无论切换何种运行环境,性能均稳定领先上一代。 国内大模型竞争的焦点转移 这次发布的真正意义在于:它把国内大模型的竞争焦点,从「问答分数」拉向了「长程 Agent 稳定性」。在综合 Agent 评测中,Qwen3.7-Max 位列前三,性能逼近行业顶尖水平,在长程 Agentic 稳定性上超越了 Claude 3.7 Sonnet 与 GPT-4.1。 实际应用场景 Qwen3.7-Max 已经在三类真实场景中展示了能力: 编程 Agent — 从一条 prompt 生成包含 Three.js 3D 场景、Canvas 动画的交互式 Web 应用。 MCP 办公助手 — 通过 MCP 工具集成,读取高校学位论文格式规范,自动修复排版混乱的论文,包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式,全程通过 office-cli 工具自主完成。 多智能体协作 — 支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排,同时基于 Tool Use 可直接操控具身设备完成物理环境中的理解、规划与决策。 如果你需要在生产环境中部署长程 Agent,Qwen3.7-Max 即将通过阿里云百炼提供服务,完整兼容 OpenAI 与 Anthropic API 协议。 ## 精讲三:自动化之后 来源: Every 阅读链接: 在 BestBlogs 阅读 悖论的起点:自动化越多,人类工作越多 Every CEO Dan Shipper 在这篇文章里记录了一个令他本人也感到困惑的现象:公司已经把所有能自动化的工作都交给了 AI——用 Codex 和 Claude Code 写代码、设计、客服——但他们没有裁员,反而还在扩张。团队接近 30 人,人类工作似乎比以前更多了。 这和主流叙事截然相反。Dario Amodei 警告过 AI 可能消灭一半入门级白领工作,Meta 裁员 8000 人,GDPVal 评测显示前沿模型在真实经济任务上已经达到 85% 的人类水平。但 Shipper 的实地经验是:「越自动化,需要做的人类工作越多。」 核心机制:AI 商品化了人类专业知识的「遗留物」 Shipper 的解释是:AI 商品化的是人类专业知识中「能被显式表达并训练的部分」。一旦某个技能被大量自动化,这类技能的「默认产出」价值就崩塌了,但「与众不同」的需求反而上升了。 而「与众不同」的需求,本质上是对人类专家的需求——即使我们已经接近 AGI。 举个具体例子:Codex 可以写代码,但能评判「这段代码写得对不对」的工程师变得更值钱,因为 AI 产出了大量同质化的代码需要被审查。AI 批量制造内容,「评估哪篇更好」就成了新稀缺。 人类三明治:设定框架、AI 执行、人类评判 Kieran(Every 的作者)把这种新工作模式称为「人类三明治」:人类设定任务框架 → AI 执行任务 → 人类评判并延伸结果。在 Every 内部,AI 已经回复了 Shipper 95% 的工作邮件,但他仍然在审阅每一封。管理者开始写代码,工程师开始直接接触客户。 没有临界点,只有新常态 Shipper 的结论是反直觉但有据可查的:不会有一个「临界点」让所有工作都消失。真正的新常态是:自动化越多,对专家判断力的需求越高。自动化的终点不是消灭工作,而是把人类角色推向「评委与压舱石」这个最后被商品化的层级。 这和今天的其他内容有什么关联 Qwen3.7-Max 的极限测试,恰好印证了 Shipper 的逻辑:1158 次工具调用之后,仍然需要工程师来评判最终的 10x 加速是否真的「正确」——模型没有硬件文档、没有先验知识,但评估脚本由人类设计,验证标准由人类设定。AI 做了 35 小时的执行工作,而「定义什么是成功」的工作依然是人类的。 Memory 与 Dreaming 的案例同样如此:Rakuten 的 97% 错误率下降,需要人类来确认「错误」的定义、设计评估标准、判断哪些经验值得被 Dreaming 保留。专家判断力不是 AI 自动化的副产品,而是前提条件。 如果你在思考「AI 会不会取代我」,这篇文章提供了一个不同的分析框架,值得仔细阅读。 ## 速览 为智能体配备计算机 — Ivan Burazin,Daytona(来源:Latent Space) Daytona CEO Ivan Burazin 的核心论点是:AI 智能体需要的不仅仅是可丢弃的代码执行沙箱,而是可组合、有状态的「计算机」。他将公司从人类开发环境转型为 Agent 基础设施提供商的历程,以及「localhost 的终结」这一长期判断,对理解 Agent 基础设施赛道的产品逻辑很有帮助。Daytona 不是在构建另一个 sandbox,而是在重新定义 Agent 与计算环境之间的关系。开发者和基础设施产品经理适合阅读。 Railway:面向智能体的原生云平台 — Jake Cooper(来源:Latent Space) Railway 创始人 Jake Cooper 分享了从「零激活能量上线」的产品哲学,到构建裸金属数据中心、实现 70% 利润率的商业路径,再到为 AI Agent 时代重新设计基础设施的全过程。值得关注的是,Railway 在 2026 年 5 月经历了一次 GCP 大规模故障(即使采用了多 AZ、多 zone 架构),其事后复盘对理解 Agent 基础设施的高可用挑战很有参考价值。适合关注云基础设施和 Agent 平台建设的读者。 腾讯混元全新翻译模型 Hy-MT2 开源,小程序「腾讯 Hy 翻译」开放体验(来源:腾讯混元) Hy-MT2 支持 33 种语言互译,7B 和 30B-A3B 模型达到开源最佳效果,超越几十倍参数量的模型。最有意思的是 1.8B 轻量版:得益于 AngelSlim 1.25-bit 极端量化,仅需 440MB 存储空间,可在手机芯片上本地推理,比 Hy-MT1.5 推理速度提升 1.5 倍,同时翻译质量超越微软等主流商业 API。已上线「腾讯 Hy 翻译」小程序,iOS 和安卓 APP 即将发布。 选择正确模型:LLM Evals 与优化的数据驱动指南(来源:Claude) Anthropic 的 Lucas 分享了一套生产级 LLM 选型框架:核心包括自定义 eval 而非依赖公开 benchmark、过程级评分(不只看最终结果)、prompt caching、context hygiene,以及按「成功结果成本」而非「单次调用成本」来优化选型决策。对在生产环境做模型选型的工程师有直接参考价值。 Google 推出 Android CLI,让 Android 工具链对 AI 智能体更友好(来源:InfoQ) Google 重新设计了 Android CLI,引入了结构化 Skills(SKILL.md 格式的模块化指令集)和集成知识库,使 AI 智能体能够更高效地访问 Android 工具链。声称与 Android Studio 内的 Agent 相比,构建速度提升 3 倍,Token 使用量减少 70%。兼容 Claude Code、Codex 等第三方 Agent。这个设计思路与 BestBlogs 自身的 skill 体系颇为相似,值得关注。 下一代大模型推理网络架构:ZCube 如何有效破解网络瓶颈?(来源:智谱) 智谱、驭驯网络与清华大学联合提出的 ZCube 组网架构,在 GLM-5.1 coding 生产环境中实现了成本降低 33%、吞吐提升 15%、TTFT P99 降低 40.6%。核心思路是用全网扁平化拓扑 + 单/多轨混合接入,替代传统 ROFT 架构,从结构层面解决 PD 分离推理中的不对称流量拥塞问题。GPU、软件栈和应用均未改动,纯粹靠架构调优实现跨越。运行大规模推理集群的工程团队值得参考。 苏姿丰上海开讲:AI 正在重新定义计算的每一层(来源:量子位) AMD CEO 苏姿丰在 AMD AI 开发者大会上海站的核心判断:AI 竞争正从模型能力转向系统工程与全栈优化,Agent 时代的成本结构是指数级而非线性的,开发者需要的是「可落地、可优化、可持续演进的工程体系」。AMD 以开放生态和 ROCm 平台应对这一趋势。量子位现场报道,信息密度较高。 ## 补充阅读 OpenAI 模型推翻 80 年数学猜想,AI 首次实现科学发现(来源:Wes Roth) OpenAI 内部推理模型自主推翻了 Paul Erdős 于 1946 年提出的平面单位距离猜想,通过桥接代数数论与初等几何构造出完整的反例族。这是 AI 驱动原创科学发现的一个里程碑时刻。关注 AI 在数学研究领域能力边界的读者值得一看。 OpenAI 单位距离问题突破:完整技术报告(来源:OpenAI Blog) 上一条 Twitter 所对应的 OpenAI 官方完整技术报告。模型构造的点集配置在多项式级别上超越了此前最优的方格构造,顶级数学家 Noga Alon 参与了同行评审。想了解技术细节的读者可以直接读原报告。 QQ 音乐 Harness Engineering 实践(来源:腾讯云开发者) 把 AI 协作从不可控的对话式编码升级为可控、可审计、可复用工程化过程的实践分享。在大仓多服务场景下,如何让 AI 具备自主验证能力是核心挑战。配合下面两篇「Harness Engineering」相关内容一起读效果更好。 构建最强 Agentic Analytics Harness:由 Claude 驱动,用 Claude Code 打造(来源:Claude) Omni CTO 讲解如何构建 Blobby 智能分析系统,涵盖语义层设计、evals 框架、split-brain agent 与直接 SQL 生成等架构经验。关注 AI 数据分析 Agent 工程化落地的读者适合观看。 A²I² 的讽刺性悖论(来源:InfoQ) 探讨自动化和 AI 在事件响应中的结构性困境:AI 提供了自主性和权威性,但缺乏定向注意力、可重定向性和可互预测性——而这些恰恰是人类协调最关键的特质。在高压情境下,这种缺失可能导致严重失败。对 SRE 和运维工程师有现实意义。 提示工程还不够——我构建了一个可在生产环境中运行的控制层(来源:Towards Data Science) 作者在第三次调试同一个崩溃后意识到:问题不在模型,在系统。他构建了一个包含 InputGuard、TokenBudget、PromptBuilder、ResponseValidator、CircuitBreaker、RetryEngine、FallbackRouter、AuditLogger 八个组件的控制层,将结构化输出基准测试通过率从 0% 提升到 100%。69 个测试、5 个可运行 demo,有完整代码。 都是 AI Coding,为什么 Java 体验差了一个量级?五条方法论帮你构建自己的 Harness 环境(来源:阿里云开发者) 深入分析了 Java 微服务项目在 AI Coding 中体验差的根本原因(本地跑不起来,AI 无法自主验证),并提出了通过 Harness Engineering 构建本地可运行环境的五条方法论。有 Checklist 和具体工程方案,对 Java 后端开发者非常实用。 发布 ADK for Kotlin 和 ADK for Android 0.1.0(来源:Google Developers Blog) Google 发布 Agent Development Kit for Kotlin 和 ADK for Android,使开发者可以构建混合 AI Agent,在云端模型(如 Gemini)和设备端 LLM(如 Gemini Nano)之间协调任务。Android 开发者和移动端 AI 应用方向值得关注。 合成人格预训练:从零标记开始的对齐(来源:LessWrong) 通过在预训练文档中附加带有价值判断的道德反思,从训练伊始就植入所需的 AI 助手人格,实现了攻击成功率降低 63%。这是一项 AI 安全领域的早期研究,证明预训练阶段植入的价值观能够在后训练阶段泛化到未见过的安全场景。关注 AI 对齐研究的读者适合阅读。 编码智能体的可维护性传感器(来源:Martin Fowler) Martin Fowler 通过实验多种传感器——从静态分析到 AI 驱动的模块化审查——帮助编码 Agent 自我修正并维护代码库的可维护性。当 Agent 生成代码的速度越来越快时,如何确保长期可维护性是一个值得认真对待的工程问题。 来自 Codex 官方团队的分享:如何把 Codex 用到极致(来源:宝玉的分享) 系统介绍如何利用 Codex 的持久对话流、语音输入、任务干预、自动化、目标设定和侧边栏等高级功能,将其从编程助手升级为全能工作流引擎。Jason 原文的中文翻译版,内容实用。 Ramp 工程师如何借助 Codex 加速代码审查(来源:OpenAI Blog) Ramp 使用 GPT-5.5 驱动的 Codex 将 PR 代码审查时间从数小时缩短至数分钟,核心价值在于「能捕捉人类和其他 AI 工具都遗漏的问题」。配合上一条 Codex 使用指南一起看效果更佳。 当 Agent 真正走进复杂数据分析场景:DataClawBench(来源:AI 前线) 基于 492 个真实金融智库任务的数据分析评测基准,通过保留未清洗数据和隐藏数据源先验,对前沿大模型进行过程级评估。结论是:当前 Agent 在开放式真实数据分析场景中的能力边界,远比 demo 演示的要窄。 LLM 主题并非观察结果(来源:Towards Data Science) LLM 从文本中提取的主题是「生成的变量」而非直接观察结果。在因果分析中,若未解决选择偏差、测量误差等问题而直接用作协变量,会引入严重偏差。对做数据分析和因果推断的研究者有直接警示意义。 在 VS Code 中烹饪 Agents(来源:AI Engineer) Microsoft 的 Liam Hampton 讲解 VS Code 如何成为 local、background 和 cloud agents 的统一控制平面,把 multi-agent workflow、安全边界、MCP 上下文和开发者监督结合起来。VS Code 用户和 Agent 开发者适合观看。 会自动交易的交易信号:在系统化投资中规模化受治理的 AI(来源:Claude) Man Group 数据与 AI 负责人讲解一家管理超过 2000 亿美元资产的受监管投资机构,如何在系统化交易中构建可治理的 AI——包括生产级 AI 交易信号、skills 治理框架,以及「组织上下文作为 AI 护城河」的战略视角。高度监管行业的 AI 落地案例,视角独特。 ## 今日阅读路径 今天内容量偏大,如果你时间有限,建议按照以下路径选读: 第一优先:如果你只有 20 分钟 先读「精讲三:自动化之后」。Dan Shipper 的文章是今天最具思想冲击力的一篇,它提供了一个反直觉但有大量实地数据支撑的分析框架——关于 AI 与人类工作的关系,这是比大多数预测文章都更诚实的一个视角。 第二优先:如果你是 Agent 工程师 读「精讲一:Memory 与 Dreaming」,然后搭配速览中的 Daytona 和 ZCube 两篇。这三篇合在一起,覆盖了 Agent 的记忆层(Anthropic 原语)、计算环境层(Daytona)和网络基础设施层(ZCube),是一条完整的 Agent 基础设施视角。 第三优先:如果你关注国产大模型竞争 读「精讲二:Qwen3.7-Max」。35 小时 1158 次工具调用零中断这个数字,已经足够说明问题的性质——这不是 benchmark 刷分,而是真实硬件上的生产级验证,代表着国内大模型竞争正式进入了一个新的阶段。 补充:如果你是开发者,在用 AI Coding 工具 补充阅读中的 Java Harness Engineering、Codex 官方使用指南、QQ 音乐 Harness 实践这三篇可以组合成一个「AI Coding 工程化」专题,非常实用,适合在上下班通勤时集中阅读。

译本期早报聚焦AI Agent的成熟化。Anthropic首次发布Memory与Dreaming基础设施原语,将跨会话记忆工程化,Rakuten部署后首次执行错误率下降97%。通义实验室的Qwen3.7-Max通过35小时极限压力测试,在未知硬件平台上自主优化Kernel,实现1158次工具调用零中断,凸显长程稳定性,将国内大模型竞争焦点从问答分数转向Agent可靠性。与此同时,Every创始人观察到,随着AI自动化普及,能评判执行质量的人类专家价值反而凸显。这些进展共同指向Agent成熟的基础设施、模型基座与人类协作新范式。

Berryxia.AI@berryxia · 5月22日66

兄弟们,Codex 这个功能更新是非常实用了啊! 当你在Mac 上正在用 Codex 聊天的时候,你突然按两下 Command 键。 Codex 立刻截取了你当前应用窗口的画面,还把窗口里所有文字内容,包括没显示在屏幕上的部分,一起抓了过来。 这就是他们今天刚推的 Appshots。 更进一步的是 /goal 模式。 你直接扔给它一个明确目标,比如把某个功能完整跑通、写完测试、或者把页面改到符合要求。 它会自己干活,跨好几个小时甚至好几天都不停。 你想中途 看进度就看,想调整方向就调整,还能单独开个小聊天问它目前干了什么,完全不打断主任务。 可现实是,这些最能体现 agent 能力的更新,目前主要只在 Mac 上体验最好。 Windows 用户还在等最基础的远程控制和功能同步。

译Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

Tibo@thsottiaux · 5月22日66

Dark magic. Codex.

译黑魔法。Codex。 现在你的Mac无需解锁,Codex也能使用你的电脑。 通过手机,Codex可以安全地操作你Mac上的应用,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

Greg Brockman@gdb · 5月22日65

OpenAI for YC companies:

译OpenAI为YC公司提供支持: [引用 @ycombinator]:OpenAI将为春季和夏季批次的每家YC公司提供价值200万美元的代币额度。 我们将夏季批次的申请截止日期延长至5月25日,以便更多创始人能够参与。 http://ycombinator.com/apply

小互@xiaohu · 5月22日76

OpenAI 推出的"ChatGPT for PowerPoint"官方插件 装好之后,PowerPoint 右侧会出现一个 ChatGPT 对话框,你可以直接让它: · 用大白话从零生成新PPT · 让它读你的 PPT,改进现有的 PPT · 把会议记录、数据表整理成可展示的内容 · 总结整份 PPT 的故事线 · 输出在PPT里完全可编辑,不是死内容 另外还有配套的 ChatGPT for Excel(已正式发布) 所有 ChatGPT 用户都能用...

译OpenAI官方发布了“ChatGPT for PowerPoint”插件。用户安装后,可在PowerPoint侧边栏直接与ChatGPT对话,实现用自然语言从零生成新PPT、优化现有内容、将会议记录等素材转化为展示内容以及总结PPT故事线等功能。该插件的输出内容在PPT内完全可编辑。配套的“ChatGPT for Excel”插件也已正式发布,上述功能对所有ChatGPT用户开放。

🚨 AI News | TestingCatalog@testingcatalog · 5月22日71

OPENAI 🔥: Codex on macOS now supports Appshots, allowing users to quickly add context from any app directly to the prompt. Besides that, a new annotation editor is now available in the browser, the/goal command is enabled by default, and Plugins are now shareable.

译OpenAI宣布Codex在macOS平台推出重要更新,核心功能为“Appshots”。该功能允许用户通过快捷键快速将任何应用窗口的完整上下文(包括屏幕截图与可访问文本)附加至Codex对话线程,从而为AI提供更全面的工作背景信息。此外,本次更新还包括浏览器端的新版注释编辑器、默认启用的/goal命令,以及现已支持分享的插件功能。Appshots已向所有Mac端用户开放。

Greg Brockman@gdb · 5月22日34

Daybreak for helping cybersecurity at major banks:

译OpenAI的Daybreak项目为大型银行的网络安全防御带来曙光: [引用 @TheRealAdamG]:https://www.afr.com/companies/financial-services/major-banks-use-openai-s-daybreak-for-cybersecurity-defence-20260519-p5zyn9

Chubby♨️@kimmonismus · 5月22日63

OpenAI made $5.7B in Q1. Anthropic made ~$4.7B. But Anthropic's annualized revenue recently hit $45B. OpenAI's sits at $25B. The difference: annualized revenue extrapolates from the most recent month, and Anthropic's monthly revenue appears to have more than doubled between Q1 and now. That means Anthropic's growth rate flipped the entire ranking sometime in Q2 - while also projecting its first operating profit (~$600M). Meanwhile OpenAI is losing $1.22 for every dollar it earns, ChatGPT user growth has stalled below its 1B target, and it just raised $122B in new funding. One company is getting profitable. The other is raising capital faster than it's growing users. The AI race isn't being won by whoever ships models first. It's being won by whoever figured out unit economics.

译Anthropic在2026年Q1营收约47亿美元,虽低于OpenAI的57亿美元,但其年化收入近期已跃升至450亿美元,远超OpenAI的250亿美元。这得益于Anthropic在Q2的月度收入翻倍以上,并预计实现约6亿美元的首次运营利润。相比之下,OpenAI处于亏损状态,ChatGPT用户增长未达预期,同时仍在大规模融资。这表明AI竞争的关键已从模型发布速度转向谁能建立可持续的商业模式。

小互@xiaohu · 5月22日60

OpenAI 给 Codex 加了一个新的功能,叫 Appshots。 将任意窗口上下文传输给 Codex: 你在 Mac 上开发、设计、写文档、看网页时,可以直接把“当前正在操作的窗口上下文”发给 Codex。 操作方式: 在 Mac 上按两次 Command 键(⌘⌘),就能把当前应用窗口附加到 Codex 对话线程里。 重点不是单纯截图。 Codex 会同时获取: • 当前窗口的截图 • 窗口里的文本内容 • 甚至包括屏幕上没显示出来的部分内容 比如: 你现在在 VS Code 里写代码。 虽然屏幕只显示前 50 行,但整个文件其实有几百行。 Appshots 不只是拍一张图片,它还能读取编辑器里的文本上下文,所以 Codex 能理解完整代码结构。 再比如: 你在 Figma、Notion、浏览器、终端里工作。 按 ⌘⌘ 后,Codex 可以直接看到: • 当前 UI 长什么样 • 页面文字内容 • 控制台报错 • 文档说明 • 设计稿结构 这样你就不用: “复制粘贴代码 + 截图 + 手动解释半天”。 它更像: 把你的当前工作界面“共享”给 AI。

译OpenAI为Codex推出Appshots功能,允许用户将Mac上任意窗口的实时上下文传输至AI。通过双击Command键,Codex不仅能获取当前窗口截图,还可读取完整文本内容(包括未滚动显示的部分)。该功能旨在简化开发、设计等工作流,用户无需手动复制代码或截图,即可让AI直接理解如VS Code、Figma、Notion等界面的代码结构、页面内容或设计框架,实现工作界面的智能共享。

宝玉@dotey · 5月22日67

OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前窗口截屏后发送给 Codex。 不只是截图,它还能读取窗口里的文字内容,包括屏幕上没显示出来的部分。 这解决了一个很实际的痛点:你在浏览器里看到一个 bug、在设计稿里看到一个需要实现的界面,以前得自己截图粘贴,现在一个快捷键就把完整上下文带进去了。 所有付费计划都能用,企业版还在路上。 【2】桌面版正式支持/goal(Goal 模式) 之前还是实验功能,现在正式上线了。你给 Codex 一个目标,它会持续工作直到完成,哪怕跨越几小时甚至几天。中途可以随时查看进度、调整方向、暂停。还能开 side chat 来了解当前进展,不打断主任务。 适合那种拆解下来步骤很多、需要反复迭代的大任务。 【3】高级标注模式:设计师终于能直接指哪改哪了 在 Codex 内置浏览器里预览页面时,可以直接拖拽、调整页面元素,同时留批注,改完即时预览。多条修改可以攒一批一起提交。 这个功能明显是给设计师和前端协作场景准备的,不用再截图画圈写"这里往左移 10px"了。 【4】插件可以团队共享了 Business 用户现在可以把自定义插件分发给团队,统一管理工作区内可用的工具。企业版需要联系开通。 另外 Analytics 面板也做了升级,能看到活跃用户、Token 消耗、代码生成行数、插件使用情况这些细粒度数据,API 也同步更新了。 看起来 Codex 在从个人编程助手往团队协作平台的方向走。Appshots 和标注模式降低了非工程师参与开发流程的门槛,插件共享和 Analytics 则是典型的企业级功能。

译OpenAI 近日对 Codex 进行了一系列重要更新,旨在提升团队协作效率并降低开发门槛。核心功能包括:通过快捷键快速发送当前窗口上下文至 Codex,解决工作流中断问题;桌面版正式推出/goal 模式,支持长时间自主执行复杂任务;新增高级标注模式,方便设计师在页面预览中直接调整与批注;企业用户现可共享自定义插件,并通过升级的 Analytics 面板查看细粒度使用数据。这些更新标志着 Codex 正从个人编程助手向更强大的团队协作平台演进。

宝玉@dotey · 5月22日64

OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前窗口截屏后发送给 Codex。 不只是截图,它还能读取窗口里的文字内容,包括屏幕上没显示出来的部分。 这解决了一个很实际的痛点:你在浏览器里看到一个 bug、在设计稿里看到一个需要实现的界面,以前得自己截图粘贴,现在一个快捷键就把完整上下文带进去了。 所有付费计划都能用,企业版还在路上。 【2】桌面版正式支持/goal(Goal 模式) 之前还是实验功能,现在正式上线了。你给 Codex 一个目标,它会持续工作直到完成,哪怕跨越几小时甚至几天。中途可以随时查看进度、调整方向、暂停。还能开 side chat 来了解当前进展,不打断主任务。 适合那种拆解下来步骤很多、需要反复迭代的大任务。 需要运行一下下面的指令: > codex features enable goals 【3】高级标注模式:设计师终于能直接指哪改哪了 在 Codex 内置浏览器里预览页面时,可以直接拖拽、调整页面元素,同时留批注,改完即时预览。多条修改可以攒一批一起提交。 这个功能明显是给设计师和前端协作场景准备的,不用再截图画圈写"这里往左移 10px"了。 【4】插件可以团队共享了 Business 用户现在可以把自定义插件分发给团队,统一管理工作区内可用的工具。企业版需要联系开通。 另外 Analytics 面板也做了升级,能看到活跃用户、Token 消耗、代码生成行数、插件使用情况这些细粒度数据,API 也同步更新了。 看起来 Codex 在从个人编程助手往团队协作平台的方向走。Appshots 和标注模式降低了非工程师参与开发流程的门槛,插件共享和 Analytics 则是典型的企业级功能。

译OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

Sam Altman@sama · 5月22日73

new codex ships today!

译新版Codex今日发布! [引用 @OpenAIDevs]:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

ChatGPT@ChatGPTapp · 5月22日67

Have you ever thought to yourself: I really don't want to make this PowerPoint. Good news: ChatGPT can now create and edit presentations directly in PowerPoint. Build, update, understand, and polish presentations directly in PowerPoint while keeping slides editable. Now in beta, we’d love your feedback 👀

译你是否曾这样想过:我真的不想做这个PPT。 好消息:ChatGPT现在可以直接在PowerPoint中创建和编辑演示文稿。 在PowerPoint中直接构建、更新、理解和优化演示文稿,同时保持幻灯片可编辑。 目前处于测试阶段,我们期待您的反馈 👀

Greg Brockman@gdb · 5月22日82

ChatGPT for PowerPoint:

译ChatGPT for PowerPoint: [引用 @ryanbrewer]:很高兴宣布ChatGPT for PowerPoint!这是另一个非常有趣的构建。可以创建新幻灯片、在整个演示文稿中提问,并直接在PowerPoint中进行更新。https://chatgpt.com/apps/powerpoint/

小互@xiaohu · 5月22日58

OpenAI 给 Codex 加了一个新的功能,叫 Appshots。 将任意窗口上下文传输给 Codex: 你在 Mac 上开发、设计、写文档、看网页时,可以直接把“当前正在操作的窗口上下文”发给 Codex。 操作方式: 在 Mac 上按两次 Command 键(⌘⌘),就能把当前应用窗口附加到 Codex 对话线程里。 重点不是单纯截图。 Codex 会同时获取: • 当前窗口的截图 • 窗口里的文本内容 • 甚至包括屏幕上没显示出来的部分内容 比如: 你现在在 VS Code 里写代码。 虽然屏幕只显示前 50 行,但整个文件其实有几百行。 Appshots 不只是拍一张图片,它还能读取编辑器里的文本上下文,所以 Codex 能理解完整代码结构。 再比如: 你在 Figma、Notion、浏览器、终端里工作。 按 ⌘⌘ 后,Codex 可以直接看到: • 当前 UI 长什么样 • 页面文字内容 • 控制台报错 • 文档说明 • 设计稿结构 这样你就不用: “复制粘贴代码 + 截图 + 手动解释半天”。 它更像: 把你的当前工作界面“共享”给 AI。 https://x.com/OpenAIDevs/status/2057530207976989179/video/1

译OpenAI为Codex推出Appshots功能,用户可通过快捷键(连续按两次Command键)将当前操作窗口的完整上下文分享给AI。该功能不仅传输屏幕截图,还能提取窗口内的文本内容及未显示的隐藏信息,例如完整代码结构、设计稿内容或控制台报错等。这免去了开发者、设计师手动复制粘贴代码与截图的繁琐流程,实现了工作界面的直接共享。

Greg Brockman@gdb · 5月22日68

codex app continues to get extremely good, plus features for businesses and enterprise such as token analytics and plugin sharing

译OpenAI为Codex应用推出“Appshots”新功能,用户可通过快捷键(如Mac的Command-Command)将当前应用窗口的截图与文本内容直接附加到对话中,从而为AI提供更全面的上下文信息,包括屏幕外内容。该功能现已在Mac端全套餐开放,企业版访问权限也将很快推出。此外,Codex还新增了面向企业和商业场景的功能,如token使用分析和插件共享,以增强协作与数据分析能力。

OpenAI Developers@OpenAIDevs · 5月22日75

Codex anywhere and everywhere, all the time. Now your Mac doesn’t have to be unlocked for Codex to use your computer. From your phone, Codex can securely use apps on your Mac, even when the screen is off and locked. https://developers.openai.com/codex/app/computer-use#locked-use

译Codex随时随地,无处不在。 现在您的Mac无需解锁,Codex即可使用您的电脑。 通过手机,Codex可以安全地使用您Mac上的应用程序,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

Ethan Mollick@emollick · 5月22日61

Seems GPT-5.2 reaches expert level in peer review: 45 scientists took 469 hours evaluating human & AI reviews on 82 papers. "Surprisingly, current AI reviewers are competitive even with the top-rated reviewers in Nature’s official peer review..." though not without weaknesses.

译似乎GPT-5.2在同行评审中达到了专家水平:45位科学家花费469小时,评估了人类与AI对82篇论文的评审。 “令人惊讶的是,当前的AI评审甚至能与《自然》官方同行评审中的顶级评审人相媲美……”尽管并非没有弱点。

OpenAI Developers@OpenAIDevs · 5月22日64

It’s Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you’re working on into Codex. On your Mac, press Command-Command to attach your app window to a Codex thread. Codex gets both a screenshot and text from the window, including content beyond what’s visible onscreen. Appshots are available across plans on Mac, with enterprise access coming soon.

译又是Codex周四,我们带来了更新。 首先是Appshots,一种将你工作上下文引入Codex的新方式。 在Mac上,按Command-Command即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac各计划中推出,企业版访问权限即将上线。

Rohan Paul@rohanpaul_ai · 5月22日74

Greg Brockman talks about when OpenAI first realized that AGI can't be achieved with "Non-Profit" status and the decided to abandon its Non-Profit roots. "In 2017, we started to think very hard about, first of all, how do we really achieve the mission? How do we actually build an AGI? What will that look like? And we started to do the math on compute. You start to realize that it is going to take a big computer. We came across a company called Cerebras, which was building a unique piece of computing hardware. The kind of computer that they were promising, we realized, was going to be far advanced from where our compute calculations looked. As you start to realize, if we could buy a lot of those computers, we could actually probably succeed at building an AGI. If we could get exclusive access to Cerebras, that could give us an overwhelming advantage. If we could buy very large data centers, that could be something unique as well. The thing about nonprofit fundraising is that I think there is essentially a cap to what is possible there. And so Elon, Sam, Ilya, and I all agreed that the only path forward for OpenAI, and the only path to achieve the mission, was to create a for-profit entity associated with OpenAI in some form. And so, we were committed to that direction. That is something that we knew was the only way to achieve the mission." --- From "The Knowledge Project Podcast" YT Channel (link in comment)

译Greg Brockman 回忆 OpenAI 于 2017 年意识到实现 AGI 需要巨大的算力投入,例如 Cerebras 的硬件及大型数据中心。非营利性质的融资能力存在上限,无法满足这一需求。因此,Elon Musk、Sam Altman、Ilya Sutskever 和他一致认为,必须创建营利性实体才能确保获得足够资源,这是实现 AGI 使命的唯一途径。

宝玉@dotey · 5月21日67

codex 迭代很快,新增了很多功能在手机端: • 编译完成,推送到位:现在你可以接收代码轮次编译完成(turn completion)的实时通知了,不用盯着屏幕等。 • 断线重连更优雅:优化了网络重连的 UI,断网恢复更顺畅,体验不打断。 • 对话界面大变身:对话交互界面变得更紧凑、更精致,整体视觉风格全面向桌面端应用看齐。 • 解锁新命令 /fork:全新加入 /fork 命令。 • 代码差异对比(diff)更直观:代码差异对比功能大幅优化,并且新增了直接打开完整文件的选项,改了哪里一目了然。 • 其他

译Codex在ChatGPT iOS app上进行快速迭代,推出多项手机端功能更新。核心改进包括实现代码轮次编译完成的实时推送通知,优化断线重连UI以增强网络恢复顺畅性,对话界面设计更紧凑精致并向桌面端应用看齐。新增/fork命令,并大幅优化代码差异对比功能,支持直接打开完整文件查看差异。这些更新聚焦于提升移动端交互效率和视觉体验,体现了Codex在移动场景下的持续优化。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月23日
03:38
ChatGPT@ChatGPTapp
精选69
用对话处理文书工作更轻松。 借助ChatGPT的图像功能和语音模式,您可以上传表单,说出要填写的内容,即可获得填写完成的版本。
OpenAI产品更新多模态语音

推荐理由:填表终于不用打字了,上传表格对着说就行,ChatGPT 这个更新把语音和图像真正串起来,以后各种纸质表单直接扔进去就完事。
5月22日
22:18
meng shao@shao__meng
65
AI工具ChatGPT图像处理速度碾压Photoshop效果持平

在为美甲甲片打印处理图像时,作者对比了AI工具ChatGPT的Image 2与传统专业工具PhotoShop的性能。专业设计师使用PhotoShop处理单张图像需1-2分钟,而ChatGPT Image 2仅用5-8秒即可完成超分、增强等操作,速度优势显著。最终输出效果接近,尤其在饱和度和对比度等关键参数上,AI的自主判断与专业设计师反复调整的结果高度一致,凸显了AI在图像处理中的高效与潜力。

OpenAI图像生成教程/实践
20:35
Greg Brockman@gdb
75
OpenAI的Codex应用推出了名为Appshots的新功能。用户通过同时按下两个CMD键,即可将当前应用的完整上下文(包括可见与不可见的屏幕内容)发送给Codex,远超普通截图所能提供的信息。与此同时,OpenAI更新了远程Codex,使其在笔记本电脑锁屏状态下仍可正常运行,允许用户安全地将笔记本留在家中,通过手机进行远程编码。该应用集成了多项独特功能,提升了使用体验。

Anthony Kroeger: Codex just launched one of the coolest features - Appshots. by pressing both CMD keyboard buttons, context of whatever a...

OpenAI产品更新多模态编码
20:26
Chubby♨️@kimmonismus
41
六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)
GoogleOpenAI大佬观点模型发布
19:26
Rohan Paul@rohanpaul_ai
60
谷歌2022年曾接近推出类ChatGPT产品

谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。

GoogleOpenAI大佬观点行业动态
17:16
Berryxia.AI@berryxia
64
推文强调GPT-image-2的性价比,指出其生成图片成本仅约0.07元/张(1美元100张),并鼓励用户充分利用此低成本服务。引用补充了使用建议,倡导用户进一步细化操作方法以优化个人体验。整体传达了"以低成本获取AI图像生成服务"的核心信息,突出其亲民价格和实用价值。

Berryxia.AI: 你可以更加细化的使用个人用下来很不错!可以去试试~

OpenAI图像生成教程/实践
15:56
Rohan Paul@rohanpaul_ai
35
中国现有的高性能芯片性能仍只是英伟达领先芯片的一小部分。 而且,建立规模化且复杂的半导体供应链实际上非常、非常困难。 --Paulina McPadden,Baillie Gifford 投资经理
OpenAI行业动态
14:05
Greg Brockman@gdb
17
试图回忆在Codex出现之前编程是什么感觉
OpenAI大佬观点编码
13:43
Tibo@thsottiaux
22
Codex是我们的WorkGPT。
OpenAI大佬观点
13:19
Ethan Mollick@emollick
40
有趣的是,整个"草莓"事件(后来证实是o1-preview)在发布时被斥为过度炒作,但事后看来,它其实被严重低估了。 从模型连基础数学都不会,到18个月内解决未解数学问题,这是一条清晰的进化路径。
OpenAI大佬观点推理
12:30
歸藏(guizang.ai)@op7418
73
Codex 昨晚发布史诗级更新,体验爆炸提升!

Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
12:13
宝玉@dotey
精选76
OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

OpenAI Developers: 🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...

智能体OpenAI教程/实践编码

推荐理由:Codex的goal模式从实验毕业,意味着你可以真的放手让AI去跑长时间任务,做开发的不用再守在电脑前,这是agent落地的真信号。
12:05
Greg Brockman@gdb
65
模型本身已不再是产品
OpenAI大佬观点现象/趋势
10:35
Greg Brockman@gdb
73
Codex让你通过手机使用电脑上的所有应用 【引用 @AriX】:又一个:今天我们发布了Codex中的远程计算机使用功能! 这意味着你可以通过Codex Mobile使用Mac上的所有应用,即使你的电脑在家且处于锁定状态。 这有点神奇。

Ari Weinstein: Another one: today we released Remote Computer Use in Codex! This means you can use all the apps on your Mac from Codex ...

智能体OpenAI产品更新
10:13
meng shao@shao__meng
70
Codex周四更新:可远程控制锁屏Mac,支持长期自主执行

OpenAI Codex推出周四常规更新,本次重点功能是远程Mac控制:用户可通过手机安全操作处于锁屏状态的Mac,实现“无人值守”执行任务。同时新增Appshots功能,可直接捕捉屏幕上下文注入对话。新增的Goal Mode支持数小时至数天的长期自主执行,标志着Codex从即时响应工具向长期智能体的转变。此外,高级标注模式提升了前端协作的直观性。

OpenAI: Highlights from today's Codex Thursday launches: 1️⃣ Codex can now securely use apps on your Mac from your phone, even w...

智能体OpenAI产品更新
09:13
Berryxia.AI@berryxia
68
ChatGPT直接在PPT里做幻灯片,告别空白页发呆

ChatGPT现已能在Microsoft PowerPoint中直接创建、编辑和优化演示文稿,无需切换应用或导出静态文件,保持全程可编辑。该功能可理解现有幻灯片内容,实现从生成到润色的全流程协助,并支持内置图片生成。此举旨在解决用户制作PPT时的痛点,更贴合国内使用习惯。目前该功能处于Beta测试阶段,官方正征集用户反馈。

ChatGPT: Have you ever thought to yourself: I really don't want to make this PowerPoint. Good news: ChatGPT can now create and ed...

OpenAI产品更新图像生成
08:38
Sam Altman@sama
26
你最希望AI在未来解决什么问题? 也许我们能帮忙!
OpenAI其他
08:38
OpenAI@OpenAI
62
今日Codex周四发布亮点: 1️⃣ Codex现可通过手机安全使用Mac上的应用,即使Mac处于锁屏且屏幕关闭状态。
智能体OpenAI产品更新
关联讨论 4 条IT之家(RSS)X:OpenAI (@OpenAI)X:Berry Xia (@berryxia)X:OpenAI Developers (@OpenAIDevs)
08:06
🚨 AI News | TestingCatalog@testingcatalog
78
OPENAI 👀:ChatGPT现已直接集成到PowerPoint中,允许用户创建和编辑幻灯片。 PowerGPT 💪🤖 【引用 @ChatGPTapp】:https://chatgpt.com/apps/powerpoint/

ChatGPT: https://chatgpt.com/apps/powerpoint/

OpenAI产品更新
关联讨论 1 条IT之家(RSS)
07:30
ginobefun@hongming731
63
BestBlogs 早报 · 05-22|Agent 记忆原语、Qwen3.7-Max、自动化与人类专家

本期早报聚焦AI Agent的成熟化。Anthropic首次发布Memory与Dreaming基础设施原语,将跨会话记忆工程化,Rakuten部署后首次执行错误率下降97%。通义实验室的Qwen3.7-Max通过35小时极限压力测试,在未知硬件平台上自主优化Kernel,实现1158次工具调用零中断,凸显长程稳定性,将国内大模型竞争焦点从问答分数转向Agent可靠性。与此同时,Every创始人观察到,随着AI自动化普及,能评判执行质量的人类专家价值反而凸显。这些进展共同指向Agent成熟的基础设施、模型基座与人类协作新范式。

智能体AnthropicOpenAI推理
07:12
Berryxia.AI@berryxia
66
Codex新增应用截图抓取与长期目标执行功能

Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
06:08
Tibo@thsottiaux
66
黑魔法。Codex。 现在你的Mac无需解锁,Codex也能使用你的电脑。 通过手机,Codex可以安全地操作你Mac上的应用,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

OpenAI Developers: Codex anywhere and everywhere, all the time. Now your Mac doesn't have to be unlocked for Codex to use your computer. Fr...

智能体OpenAI产品更新
06:05
Greg Brockman@gdb
65
OpenAI为YC公司提供支持: 【引用 @ycombinator】:OpenAI将为春季和夏季批次的每家YC公司提供价值200万美元的代币额度。 我们将夏季批次的申请截止日期延长至5月25日,以便更多创始人能够参与。 http://ycombinator.com/apply

Y Combinator: OpenAI is offering $2M in tokens to every YC company in the spring and summer batches. We extended the summer deadline t...

OpenAI行业动态
05:08
小互@xiaohu
76
OpenAI发布PPT官方插件,可直接生成演示文稿

OpenAI官方发布了“ChatGPT for PowerPoint”插件。用户安装后,可在PowerPoint侧边栏直接与ChatGPT对话,实现用自然语言从零生成新PPT、优化现有内容、将会议记录等素材转化为展示内容以及总结PPT故事线等功能。该插件的输出内容在PPT内完全可编辑。配套的“ChatGPT for Excel”插件也已正式发布,上述功能对所有ChatGPT用户开放。

OpenAI产品更新
关联讨论 1 条IT之家(RSS)
05:05
🚨 AI News | TestingCatalog@testingcatalog
71
OpenAI宣布Codex在macOS平台推出重要更新,核心功能为"Appshots"。该功能允许用户通过快捷键快速将任何应用窗口的完整上下文(包括屏幕截图与可访问文本)附加至Codex对话线程,从而为AI提供更全面的工作背景信息。此外,本次更新还包括浏览器端的新版注释编辑器、默认启用的/goal命令,以及现已支持分享的插件功能。Appshots已向所有Mac端用户开放。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新多模态编码
05:05
Greg Brockman@gdb
34
OpenAI的Daybreak项目为大型银行的网络安全防御带来曙光: 【引用 @TheRealAdamG】:https://www.afr.com/companies/financial-services/major-banks-use-openai-s-daybreak-for-cybersecurity-defence-20260519-p5zyn9

Adam.GPT: https://www.afr.com/companies/financial-services/major-banks-use-openai-s-daybreak-for-cybersecurity-defence-20260519-p5...

OpenAI安全/对齐行业动态
04:56
Chubby♨️@kimmonismus
63
Anthropic营收反超OpenAI,AI竞赛转向盈利竞赛

Anthropic在2026年Q1营收约47亿美元,虽低于OpenAI的57亿美元,但其年化收入近期已跃升至450亿美元,远超OpenAI的250亿美元。这得益于Anthropic在Q2的月度收入翻倍以上,并预计实现约6亿美元的首次运营利润。相比之下,OpenAI处于亏损状态,ChatGPT用户增长未达预期,同时仍在大规模融资。这表明AI竞争的关键已从模型发布速度转向谁能建立可持续的商业模式。

AnthropicOpenAI大佬观点行业动态
04:38
小互@xiaohu
60
OpenAI Codex新增Appshots功能,窗口上下文一键传输

OpenAI为Codex推出Appshots功能,允许用户将Mac上任意窗口的实时上下文传输至AI。通过双击Command键,Codex不仅能获取当前窗口截图,还可读取完整文本内容(包括未滚动显示的部分)。该功能旨在简化开发、设计等工作流,用户无需手动复制代码或截图,即可让AI直接理解如VS Code、Figma、Notion等界面的代码结构、页面内容或设计框架,实现工作界面的智能共享。

智能体OpenAI产品更新多模态
04:38
宝玉@dotey
67
OpenAI Codex 更新:强化协作与自主执行能力

OpenAI 近日对 Codex 进行了一系列重要更新,旨在提升团队协作效率并降低开发门槛。核心功能包括:通过快捷键快速发送当前窗口上下文至 Codex,解决工作流中断问题;桌面版正式推出/goal 模式,支持长时间自主执行复杂任务;新增高级标注模式,方便设计师在页面预览中直接调整与批注;企业用户现可共享自定义插件,并通过升级的 Analytics 面板查看细粒度使用数据。这些更新标志着 Codex 正从个人编程助手向更强大的团队协作平台演进。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新编码
04:38
宝玉@dotey
64
OpenAI Codex 重大更新:推出多项协作新功能

OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
04:38
Sam Altman@sama
精选73
新版Codex今日发布! 【引用 @OpenAIDevs】:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码

推荐理由:Codex 这次更新的 Appshots 看似一个小功能,但把应用窗口上下文直接喂给 Agent 的思路是质的跳跃,Mac 开发者现在就能用,这个交互范式可能会被抄很久。
04:36
ChatGPT@ChatGPTapp
精选67
你是否曾这样想过:我真的不想做这个PPT。 好消息:ChatGPT现在可以直接在PowerPoint中创建和编辑演示文稿。 在PowerPoint中直接构建、更新、理解和优化演示文稿,同时保持幻灯片可编辑。 目前处于测试阶段,我们期待您的反馈 👀
OpenAI产品更新
关联讨论 1 条IT之家(RSS)
推荐理由:打工人苦PPT久矣,ChatGPT这次直接在PowerPoint里给你搭好框架还让你随时修改,是从「帮你写」走到了「帮你做」。
04:35
Greg Brockman@gdb
82
ChatGPT for PowerPoint: 【引用 @ryanbrewer】:很高兴宣布ChatGPT for PowerPoint!这是另一个非常有趣的构建。可以创建新幻灯片、在整个演示文稿中提问,并直接在PowerPoint中进行更新。https://chatgpt.com/apps/powerpoint/

Ryan Brewer: Excited to announce ChatGPT for Powerpoint! This was another super interesting build. Create new slides, ask questions a...

智能体OpenAI产品更新
关联讨论 1 条IT之家(RSS)
04:08
小互@xiaohu
58
Codex新功能Appshots:一键共享工作界面给AI

OpenAI为Codex推出Appshots功能,用户可通过快捷键(连续按两次Command键)将当前操作窗口的完整上下文分享给AI。该功能不仅传输屏幕截图,还能提取窗口内的文本内容及未显示的隐藏信息,例如完整代码结构、设计稿内容或控制台报错等。这免去了开发者、设计师手动复制粘贴代码与截图的繁琐流程,实现了工作界面的直接共享。

OpenAI产品更新编码
04:02
Greg Brockman@gdb
68
OpenAI为Codex应用推出"Appshots"新功能,用户可通过快捷键(如Mac的Command-Command)将当前应用窗口的截图与文本内容直接附加到对话中,从而为AI提供更全面的上下文信息,包括屏幕外内容。该功能现已在Mac端全套餐开放,企业版访问权限也将很快推出。此外,Codex还新增了面向企业和商业场景的功能,如token使用分析和插件共享,以增强协作与数据分析能力。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新多模态编码
03:03
OpenAI Developers@OpenAIDevs
同事件精选75
Codex随时随地,无处不在。 现在您的Mac无需解锁,Codex即可使用您的电脑。 通过手机,Codex可以安全地使用您Mac上的应用程序,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use
智能体MCP/工具OpenAI产品更新
同一事件,精选展示《ChatGPT移动端支持Codex,实现跨设备协作》
推荐理由:Codex 现在能在 Mac 锁屏甚至熄屏时远程操控应用,相当于给 AI Agent 装了个「开关机」,脚本和自动化任务终于不用等人在电脑前了。
02:43
Ethan Mollick@emollick
61
似乎GPT-5.2在同行评审中达到了专家水平:45位科学家花费469小时,评估了人类与AI对82篇论文的评审。 "令人惊讶的是,当前的AI评审甚至能与《自然》官方同行评审中的顶级评审人相媲美……"尽管并非没有弱点。
OpenAI推理论文/研究
02:33
OpenAI Developers@OpenAIDevs
64
又是Codex周四,我们带来了更新。 首先是Appshots,一种将你工作上下文引入Codex的新方式。 在Mac上,按Command-Command即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac各计划中推出,企业版访问权限即将上线。
OpenAI产品更新编码
01:26
Rohan Paul@rohanpaul_ai
74
OpenAI为何放弃非营利架构?算力需求成关键转折点

Greg Brockman 回忆 OpenAI 于 2017 年意识到实现 AGI 需要巨大的算力投入,例如 Cerebras 的硬件及大型数据中心。非营利性质的融资能力存在上限,无法满足这一需求。因此,Elon Musk、Sam Altman、Ilya Sutskever 和他一致认为,必须创建营利性实体才能确保获得足够资源,这是实现 AGI 使命的唯一途径。

OpenAI大佬观点
5月21日
22:37
宝玉@dotey
67
Codex手机端大更新:多项功能提升体验

Codex在ChatGPT iOS app上进行快速迭代,推出多项手机端功能更新。核心改进包括实现代码轮次编译完成的实时推送通知,优化断线重连UI以增强网络恢复顺畅性,对话界面设计更紧凑精致并向桌面端应用看齐。新增/fork命令,并大幅优化代码差异对比功能,支持直接打开完整文件查看差异。这些更新聚焦于提升移动端交互效率和视觉体验,体现了Codex在移动场景下的持续优化。

Thomas Ricouard: Codex in ChatGPT iOS app got better in latest update! - Receive turn completion push notifications - Better reconnection...

OpenAI产品更新编码
‹ 上一页
1…2425262728…50
下一页 ›