5月8日
14:09
11:22
歸藏(guizang.ai)@op7418
精选73
Codex 越来越猛了,昨天更新增加了内置的谷歌浏览器插件,可以直接控制你的谷歌浏览器执行任务。

Codex最新更新引入了内置谷歌浏览器插件,能直接控制基于Chromium的浏览器(如Chrome或Dia)执行任务。该插件支持后台跨浏览器页面并行工作,不干扰正常浏览;用户可启动多个SubAgent同时操作多个网页,实现高效并发。根据OpenAI官方信息,Codex现直接在macOS和Windows的Chrome中运行,能更好地与应用和网站交互,并在后台跨标签页并行处理任务,不接管浏览器。安装方法简单:在Codex插件库找到Chrome插件,点击添加并安装即可。安装后,用户可无缝下达指令,享受流畅的多任务操作体验。

智能体OpenAI产品更新编码
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 这次更新的精髓是并行控制浏览器 Tab,不抢鼠标不弹窗,后台就能帮你填表、搜信息,自动化体验又拉高了一截。
10:09
09:44
小互@xiaohu
精选73
OpenAI发布Codex for Chrome扩展,可操作已登录网站

OpenAI推出Chrome浏览器扩展“Codex for Chrome”,该工具能利用用户当前的浏览器登录状态,直接操作需账号访问的后台、CRM等受保护页面执行任务,无需额外提供密码。扩展在独立标签组中运行,不影响用户当前浏览,并在执行提交、下载等敏感操作前请求用户确认。典型应用包括跨网站查询信息、预填表单、读取仪表板并生成摘要等。

智能体MCP/工具OpenAI产品更新
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex这个扩展把AI从‘给你代码’推进到‘替你操作网页’,关键是用你已登录的Chrome,内部系统、后台都能直接干,Agent落地的最后一公里被踩平了一大截。
08:09
meng shao@shao__meng
精选79
OpenAI 为官方 REST API 发布 CLI 工具

OpenAI 发布了官方 REST API 的命令行界面工具(CLI),将平台端点映射为 `openai <资源> <命令>` 的子命令,便于在 Shell 脚本、CI/CD 及运维场景中直接调用。该工具旨在替代 `curl` 与 `jq` 的组合,简化对 Admin API(如用量、项目管理)的操作,并支持通过 `--format explore` 快速探索新端点。开发者可通过 CLI 调用所有云端工具(包括图像生成、转录等),获得 Unix 风格的结构化输出,同时管理项目和配置 API 密钥。该项目目前处于早期阶段,更多文档即将发布。

OpenAI产品更新部署/工程

推荐理由:OpenAI 官方出了 CLI,把所有 REST 端点映射成子命令,以后 shell 脚本里调 API 不用再写 curl+jq 胶水了,做 CI/CD 和运维的可以直接用。
08:06
07:43
07:21
Berryxia.AI@berryxia
65
SuperSplat将3D高斯泼溅变为大众创作平台

SuperSplat项目将3D Gaussian Splatting技术转化为大众可用的创作与分发平台。其核心功能是允许创作者一键开启文件下载,观众可直接获取Gaussian splat文件。平台支持附加多种CC 4.0许可证并自动生成署名,个人页面可集成社交链接,成为3D作品集。下载的文件能直接导入PlayCanvas引擎快速创建交互体验。该项目免费开源,旨在降低技术门槛,推动3DGS从实验室走向普通创作者的实际应用。

产品更新多模态开源/仓库
07:21
Berryxia.AI@berryxia
69
Cursor 3 推出全新一站式 PR 审阅体验

Cursor 3 推出了全新的 PR 审阅体验,旨在提供从创建到合并的一站式解决方案。用户可以在一个界面中查看评论、代码差异、提交记录和审阅状态,从而全面了解变更内容和后续步骤。新功能还引入了文件树和变更选择器,帮助开发者更高效地浏览和审查大型 PR,提升代码审查效率。

产品更新编码
07:13
Tibo@thsottiaux
精选75
你好Chrome,我是Codex 【引用 @OpenAI】:Codex现可直接在macOS和Windows的Chrome中运行。 它能更好地处理Chrome中的应用和网站,并可在后台跨标签页并行工作,而不会占用浏览器控制权。 请先在Codex应用中安装Chrome插件以开始使用。
智能体OpenAI产品更新编码
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 终于直接进 Chrome 了,支持后台并行操作还不抢浏览器,这对用浏览器做自动化的开发者是个实打实的好消息,装个插件就能用。
06:39
宝玉@dotey
精选74
OpenAI 上线官方命令行工具 openai-cli,终端直接调用 API

OpenAI 在 GitHub 开源了官方命令行工具 openai-cli,采用 Apache 2.0 协议,支持通过 Homebrew 或 Go 安装。该工具允许开发者直接在终端调用 OpenAI API,无需编写 SDK 代码。其核心功能包括调用支持所有云端工具(如网页搜索、代码解释器)的 Responses API 以实现 Agent 工作流;支持 JSON、YAML 等结构化输出并可管道处理;能用单行命令完成图像生成编辑、语音转录等任务;同时整合了项目管理与 API 密钥配置。工具采用资源化命令结构,旨在弥补官方此前仅提供语言 SDK 的不足,便于集成到自动化流程和服务器端环境中。

OpenAI产品更新

推荐理由:OpenAI 终于官方推出了命令行工具,一行命令就能调 API 还支持 agent 工具,比裸写 curl 爽太多,做自动化的可以直接装起来用。
06:21
Berryxia.AI@berryxia
精选76
Codex原生支持Chrome扩展,成为浏览器"原住民"智能体

OpenAI宣布Codex现已原生支持Chrome浏览器扩展,可在macOS和Windows上直接运行。此次升级使其能更高效地操作网页和应用,并能在后台并行处理多个标签页,无需占用浏览器窗口。这意味着Codex可自主编写并执行代码,自动化处理浏览器内的重复性任务,如页面导航、数据录入、仪表盘检查和CRM更新等。这标志着Codex从“聊天助手”转变为深度集成于浏览器的“原住民”智能体。用户可通过Codex应用安装Chrome插件,但目前欧盟和英国地区暂不支持。

智能体OpenAI产品更新
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex这波更新让它从「借道浏览器的访客」变成了后台多线程原住民,所有依赖浏览器重复操作的场景都会重构,值得立刻装插件试试。
06:21
Berryxia.AI@berryxia
66
Chrome版Codex结合子代理,可测试多人游戏功能

Chrome版Codex的一个关键实用功能在于其能与子代理结合使用。这一特性使得开发者能够利用该工具来测试像多人游戏之类的复杂功能。该工具兼容macOS和Windows系统,提升了跨平台开发的便利性。

智能体OpenAI产品更新编码
06:21
Berryxia.AI@berryxia
63
Claude全面集成微软Office套件,支持跨应用上下文保留

Anthropic的AI助手Claude现已全面集成微软Office生产力套件。Claude for Excel、PowerPoint和Word已正式上线,而Claude for Outlook也开启了公测。该集成的一个核心功能是,当用户在Microsoft的不同应用程序之间切换时,Claude能够完整保留并理解整个对话的所有上下文信息,实现了跨应用的无缝协作体验。

智能体Anthropic产品更新
05:35
Orange AI@oran_ge
精选74
开源AI Agent网盘NeuDrive,支持主流工具与自动同步

开发者开源了一款专为AI Agent设计的网盘NeuDrive,能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源,同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景,付费版在付款时输入优惠码“vivo50”可兑换三个月免费使用权。

智能体GitHubMCP/工具产品更新

推荐理由:给 Agent 用的开源网盘,自动同步记忆、skill 和文件,支持 Claude Code 和 Cursor 等主流工具,Agent 开发者的基础设施级工具,免费版已够日常用。
05:09
宝玉@dotey
精选74
OpenAI 为 Codex 发布 Chrome 扩展,使其能直接在浏览器中执行任务

OpenAI 为其编程助手 Codex 推出了 Chrome 浏览器扩展。该扩展现可供 macOS 和 Windows 用户在 Codex 应用中安装,使 Codex 能直接在浏览器后台并行处理多标签页任务,且不干扰用户当前界面。此举将 Codex 的能力从终端、IDE 和云端延伸至浏览器环境,使其能够处理需要登录的网页操作,例如访问内部后台、更新 CRM 记录或完成多步骤表单流程。它通过编写并运行代码来操作页面,并自动组合使用现有插件或通过 Chrome 处理登录任务。典型应用场景包括调试业务流程、进行调研和处理重复性数据录入。目前该功能已在 Codex 应用中提供,但欧盟和英国地区暂未开放。

智能体MCP/工具OpenAI产品更新
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 进了浏览器,不再是只会写代码的 agent,能帮你查后台、填表单、跑流程,这步一跨,很多人的日常重复工作可以交给它了。
04:42
TestingCatalog News 🗞@testingcatalog
精选71
OpenAI的Codex现已正式推出适用于macOS和Windows的Chrome浏览器扩展,用户需安装插件以开始测试。该扩展旨在提升Codex与浏览器内应用及网站的协作能力,能够在后台并行处理多个标签页任务而不占用浏览器控制权。用户可自主管理Codex可访问的网站权限。此前测试消息显示,此专用扩展将显著优化浏览器环境中的AI辅助工作流程。
智能体OpenAI产品更新
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex终于把触手伸进了Chrome,跨标签后台运行且不抢控制权,比很多'接管浏览器'的方案更克制也更实用。普通用户不用离开网页就能让AI干活,值得现在就装上试试。
04:42
04:39
宝玉@dotey
精选80
Anthropic将Claude全面集成至Microsoft 365,多款插件结束测试

Anthropic宣布,Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版,Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如,用户可在Outlook中处理邮件,随后在Word中编辑附件,再于Excel构建财务模型并最终生成PowerPoint演示文稿,全程无需重复提供材料。具体功能包括:在Excel中修改单元格而不破坏公式;按模板生成原生PowerPoint图表;在Word中以修订模式编辑文档;在Outlook中生成待发送的邮件草稿。

Anthropic产品更新
关联讨论 1Claude:Blog(网页)
推荐理由:Claude不再只是个聊天框,Excel里改模型、PPT里出图表还能跨应用带上下文,对天天做表写PPT的人,这比新模型发布更实在,而且不额外收费。
04:36
OpenAI Developers@OpenAIDevs
精选72
Codex 现在能承担更多浏览器开发工作。 通过 Codex 应用中的新 Chrome 插件,它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具,并保持结果井井有条而不占用你的浏览器。
OpenAI产品更新编码
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 从写代码扩展到了浏览器自动化测试,这个 Chrome 插件让它在 DevTools 并行操作上有了自己的想法,做前端自动化的可以试试。
04:36
04:35
Greg Brockman@gdb
精选76
自OpenAI创立以来,我一直对实时语音翻译这一AI应用感到兴奋。 现在看到它通过API向所有开发者开放,真是太酷了:

jason liu新しいリアルタイム翻訳モデルを発表できることをうれしく思います。ぜひ本日よりAPIでお試しください。

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:OpenAI 把实时语音翻译做成了 API,从 demo 到可开发只差一个调用,语音类产品这下有真正的实时翻译基建了。
04:10
OpenAI@OpenAI
精选75
Codex现可直接在macOS和Windows的Chrome中运行。 它在处理Chrome中的应用和网站时表现更佳,并能在后台跨标签页并行工作,而不会占用浏览器控制权。 要开始使用,请在Codex应用中安装Chrome插件。
智能体OpenAI产品更新编码
关联讨论 2IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 从终端跑进 Chrome,最大的变化不是平台迁移,而是能跨标签并行在后台干活不接管浏览器,这对前端开发和依赖网页工具的流程是实打实的效率提升。
02:11
Perplexity@perplexity_ai
精选68
Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。
智能体产品更新

推荐理由:Perplexity 把计算机使用能力做进了 Mac 原生应用,能跨本地文件、桌面程序和网络运行任务,对 Mac 用户而言 AI 助手真正开始接管操作系统层级的工作。
02:11
02:05
OpenRouter@OpenRouter
精选68
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Google产品更新多模态

推荐理由:OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token,这个定价让 Flash 系列不再是试验品,轻量级应用可以认真考虑它了。
01:38
宝玉@dotey
精选81
OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:GPT-5 级推理终于进了语音 API,Big Bench Audio 从 81 跳到 97,多工具调用还能念出来,做语音 agent 的可以直接上手试了。