AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2160 条
全部一手资讯X论文
标签「OpenAI」清除
Yuchen Jin@Yuchenj_UW · 6月8日65

OpenAI’s Sora lead left. OpenAI’s chips lead left for Anthropic. The “take every big bet at once” strategy is starting to look fragile. When you’re in a knife fight with Anthropic over coding, every other bet starts bleeding. (On coding itself, OpenAI has clearly caught up.)

译OpenAI的Sora负责人离职了。 OpenAI的芯片负责人跳槽去了Anthropic。 “同时押注所有大赌注”的策略开始显得脆弱。 当你在编程领域与Anthropic进行白刃战时,其他所有赌注都在流血。(在编程本身方面,OpenAI显然已经迎头赶上。)

Greg Brockman@gdb · 6月8日68

Codex use-cases: “From software engineering and design to data analysis and operations, Codex is becoming an AI teammate instead of just an AI assistant.”

译OpenAI 公布了数十个 Codex 实际工作流程,展示团队如何用其自动化任务。用例包括:管理收件箱并草拟回复、审阅 GitHub PR、将 Figma 设计转为代码、理解大型代码库、自动分类 bug、用自然语言查询数据集、从提示词部署应用、构建 Mac/iOS 应用、自动创建幻灯片、将 Slack 对话转为编码任务、用 AI 动作操控电脑。Codex 正从 AI 助手演变为 AI 队友。

gabriel@gabriel1 · 6月8日55

i have resigned from openai i left sora early this year to start a team at openai to build something great. but i've always been a founder, and there is one last product i need to build before AGI already miss all my friends and Colleague(s), i believe in you! more soon

译我已从OpenAI辞职。 今年早些时候我离开了Sora,在OpenAI成立了一个团队来打造伟大的东西。但我一直是个创始人,在AGI到来之前,我还有一个最后的产品需要打造。 已经开始想念我所有的朋友和同事们,我相信你们!后续更多。

宝玉@dotey · 6月8日81

ChatGPT 要变 AgentGPT 了 当然 ChatGPT 应该不会改名字,但 ChatGPT 应该不再是一个单纯的 Chat 工具了。 OpenAI 内部一位高管对《金融时报》说:"Chat is dead."(聊天已死。) OpenAI 正在准备 ChatGPT 自 2022 年上线以来最大规模的改版。改版的方向很明确:不再只做聊天机器人,要做超级应用。编程工具 Codex、能自主执行多步骤任务的 AI agent、图像生成、第三方合作伙伴的应用(目前已知包括 Canva 和 Booking),全部塞进一个统一界面里。 首席产品官 Tibo(Thibault Sottiaux) 对《金融时报》说:目标是打造一个跨越所有平台的个人 AI 助手,覆盖工作和生活的方方面面。更远期的计划是,连用户输入 prompt 这一步都省掉,让模型直接理解用户意图。 【注:Tibo 目前统管 ChatGPT、Codex 和平台产品团队,OpenAI 最近刚把这几个原本独立的团队合并到了他手下。】 改版预计未来几周内开始上线,先从网页端和手机端推出。新界面会更积极地引导用户去用编程、图像生成和第三方应用功能,而不是停留在对话框里聊天。 这次改版的驱动力不只是产品理念,还有来自商业上的压力。 ChatGPT 现在有 9 亿周活跃用户,超过 5000 万付费个人用户,月收入 20 亿美元。但大部分用户用的是免费版,公司至今没有盈利。企业客户目前贡献了约 40% 的收入(来自大约 200 万家企业客户),OpenAI 希望年底前把这个比例提到 50%。Codex 是增长最快的产品线,桌面版上线后周活已经超过 500 万。 把用户从低利润的免费聊天引导到高利润的企业工具和编程产品上,是 IPO 前必须讲出来的故事。 说到 IPO,OpenAI 今年 3 月刚完成了 1220 亿美元的融资轮(Amazon 出了 500 亿,Nvidia 和软银各 300 亿),估值 8520 亿美元。高盛和摩根士丹利正在为 IPO 做准备,目标估值可能超过 1 万亿美元。 但竞争对手 Anthropic 也没闲着。6 月 1 日,Anthropic 向 SEC 提交了保密 S-1 文件,最新一轮融资估值已经达到 9650 亿美元,5 月年化收入 470 亿美元。也就是说,按估值算,Anthropic 已经超过了 OpenAI。在企业市场,Claude Code 的增长也在直接蚕食 Codex 的地盘。Google 那边,Gemini 上个月在 I/O 大会上宣布月活达到 9 亿,逼近 ChatGPT。 OpenAI 现在面对的局面是:消费端被 Google 追,企业端被 Anthropic 抢,自己又还没盈利,IPO 窗口就在眼前。把 ChatGPT 从聊天工具变成平台,既是产品升级,也是给投资人讲的新故事。 对普通用户来说,最直接的变化是:打开 ChatGPT 的界面会跟现在不一样,不再是一个简单的对话框,而是一个带有明确功能入口的应用。对开发者来说,Codex 和 agent 能力的整合意味着更多工作可以在 ChatGPT 内完成,不用跳转到其他工具。 至于 OpenAI 能不能靠这次改版让投资人相信它不只是一家聊天机器人公司,这可能是 Sam Altman 今年最重要的一次产品赌注。

译OpenAI 正筹备 ChatGPT 自 2022 年上线以来最大规模改版,从聊天机器人转向超级应用/Agent 平台,整合编程工具 Codex、图像生成及第三方应用(Canva、Booking)。高管称“聊天已死”,目标成为跨平台个人 AI 助手,未来甚至省去用户输入提示词。改版预计未来几周在网页和手机端上线。商业压力:ChatGPT 有 9 亿周活用户、5000 万付费用户、月收入 20 亿美元但未盈利;企业客户贡献约 40% 收入,目标年底达 50%;Codex 桌面版周活超 500 万。竞争对手 Anthropic 估值已达 9650 亿美元。OpenAI 刚完成 1220 亿美元融资,估值 8520 亿美元,IPO 目标估值可能超 1 万亿美元。

Rohan Paul@rohanpaul_ai · 6月8日76

FT: The proposal suddenly of a sovereign-wealth-style fund got more attention inside the White House after Sam Altman visited Capitol Hill this week. The likely mechanism is that AI firms donate a small slice of equity into a public wealth fund, and that fund passes gains to Americans through accounts or dividends rather than the government directly running the companies. This would differ from the $9B stake the Trump administration took in Intel last year, because people would hold shares individually instead of the US govt owning equity directly. --- ft .com/content/8559a3f9-86de-4a1c-8a75-6623e83e6a00

译据FT报道,特朗普政府正与OpenAI探讨通过公共财富基金机制让政府入股AI初创公司。方案是AI企业捐赠小部分股权至该基金,基金通过账户或分红将收益返还美国公民,而非政府直接运营公司。这不同于特朗普去年对Intel的90亿美元直接持股。OpenAI此前已提出公共财富基金概念,持有长期资产,让公民分享AI增长红利。政治背景方面,选民担忧失业、数据中心成本与企业控制,而AI公司需要华盛顿在基建、采购和监管上的支持。

AYi@AYi_AInotes · 6月8日69

http://x.com/i/article/2063647311423561728 # 免费白嫖顶级AI额度的N个隐藏入口(Codex Pro半年/Anything AI 20K/Lenny's bundle/云startup credits) 现在玩 AI,最烧钱是Token额度,GPT-5.5、Claude Opus4.8,一个比一个能打,也一个比一个贵,想认真用上一阵,账单就能直接把你劝退了。 但说实话,市面上一直有几个官方自己留的口子,赠金从几百刀到几十万刀不等。知道的人闷声用着,不知道的人月月真金白银往里充。 这篇我就把查到的几个靠谱入口,一个个拆开说清楚——怎么申请、适合谁、坑在哪,跟着操作就行。 先把难听的说在前头:这世上没有纯粹白给,每个口子都有它的门票。 有的门票是“你得是开源作者”,有的门票是“你得先掏 200 刀订阅费”,有的门票是“你得算个创业公司”。 下面每一条,我都会把门票和限制条件一起摊出来,大家自己结合自己情况评估。 ## 这篇讲哪几块 - 入口一:OpenAI「Codex for OSS」——开源作者免费拿半年 ChatGPT Pro(约值 $1200) - 入口二:Anything AI——新用户注册薅 2 万额度(官方默认才给 3000) - 入口三:Lenny's Product Pass——一份订阅换 $30000+ 的 AI 工具全家桶 - 入口四:三大云的 startup credits——AWS / 微软 / 谷歌,最高单家几十万刀 - 最后给你一张对照表 + 一段申请话术,直接抄 ## 先看全局:四个口子到底给什么 动手之前,先用一张表把你心里的地图建起来。别一上来就闷头点链接,先看清哪个口子真适合你。 人话总结这张表怎么用: 想纯免费、零门槛 → 看 Anything; 自己有开源项目 → 冲 Codex;愿意花点小钱换一堆工具 → 看 Lenny;在搞创业/产品 → 云额度才是大头。 记住一句口诀就够了: 白嫖的本质不是省钱,是把"门票"对上"身份"。 下面挨个拆。 ## 入口一:Codex for OSS——开源作者的半年 Pro 这个口子是 OpenAI 自己开的,2026 年 3 月官宣,叫 Codex for Open Source。 它给的东西挺实在:半年的 ChatGPT Pro(带 Codex),也就是那个 $200/月的顶配档,免费用 6 个月,算下来约 $1200。 除此之外,符合条件的项目还能额外申请 API credits(来自 OpenAI 那个 100 万美元的开源基金),以及有条件开放的 Codex Security。 谁能拿? 核心是一句话:你得是一个公开开源项目的维护者(maintainer)。 OpenAI 官方写得比较宽松——如果你是被广泛使用的项目的核心维护者,就去申请; 哪怕你的项目不完全符合标准,但在生态里确实重要,也可以申请,附上说明就行。 而且它明确说了:不卡硬性 star 数门槛,不要信用卡,不要购买承诺。 怎么拿(保姆级步骤): 1. 打开 OpenAI 开发者社区的官方页面 developers.openai.com/community/codex-for-oss 1. 点申请,填你的项目信息——GitHub 仓库链接、star 数、月下载量这类指标 1. 重点写清楚"我这项目为啥重要、被谁在用" 1. 提交,等审核回复 这盆冷水你得喝: 第一,这是给开源作者的,不是给所有 ChatGPT 用户的全民福利。 你要是没有一个拿得出手的公开项目,这条基本和你无关。 第二,别和另一个东西搞混了——之前 OpenAI 还搞过一个"Codex 用量翻倍"的促销(Pro 档加量),那个是给已付费用户加量,不是免费,而且已经在 2026 年 5 月 31 号到期了。咱们这条说的是 OSS 那个免费半年的项目,两码事。 ## 入口二:Anything AI——注册就薅 2 万额度 这个是目前门槛最低的一个,几乎是注册即得。 Anything(官网 createanything.com)是个 AI 应用搭建工具,用大白话描述一句你的需求,它帮你把 App 或网页搭出来,背后接的是 Claude、GPT、Gemini 这些顶级模型,不用你自己配 API key。 它的免费档默认只给 3000 credits,一次性的,问几个问题就见底了。 但在新用户启动促销期,能薅到的是 2 万 credits——机制大致是: 注册到账一批,登录后再点一次同一个邀请链接,触发 bonus 再到账一批,凑齐 2 万,整个过程不要信用卡。 怎么拿(保姆级步骤): 1. 通过促销注册链接进入 Anything 官网,完成注册 1. 注册后,第一批 credits 自动到账 1. 登录状态下,再打开一次那个注册/促销链接,触发额外的 bonus 1. 到账后进 builder,credits 就能拿去搭东西、跑 AI 集成 这盆冷水: 第一,这是平台币,不是现金,也不是 OpenAI/Anthropic 的官方 API 额度。它只能在 Anything 平台里用,搭 App、跑集成消耗,跨平台带不走。 第二,credits 烧得快慢看任务复杂度,复杂任务一条消息就能吃掉一大把,2 万听着多,认真搭起来其实也就够你玩一阵。 第三,得提醒一句——这种"点两次链接拿双倍"的促销玩法,链接很多是在羊毛党论坛流转的第三方推广链接。 官方注册当然是安全的,但你点别人贴的促销链接前,自己心里有个数,至少认准是 anything.com 的域名。 促销随时可能结束,看到了就趁早。 ## 入口三:Lenny's Product Pass——一份订阅换一堆工具 这个口子最"反直觉",因为它表面上叫"免费",其实是你先掏钱订阅,然后一堆工具白送给你用一年。 Lenny's Newsletter 是产品圈最大的那个 newsletter。 它搞了个 Product Pass:只要你是它的付费年度订阅者,就能领一大堆顶级 AI / 产品工具各 1 年的免费会员,标称总价值 $30000+。 里面的货是真硬。我给你贴几个看看: 怎么拿(保姆级步骤): 1. 去 lennysnewsletter.com 开通年度付费订阅——Annual($200/年)或 Insider($400/年),月付不行 1. 登录 lennysproductpass.com 1. 往下滚,找到你想要的工具的 logo,点 Redeem 1. 拿到专属兑换码,按提示去对应工具开通(通常会跳到那个工具的注册/结账页) 这盆冷水必须喝,而且是一大盆: 第一,它根本不是白嫖,是花 $200-400 买门票换一堆工具。 值不值,取决于你是不是真能用上里面那几样。如果你本来就要买 Cursor + Notion + Google AI,那这笔订阅可能直接帮你回本还倒赚;如果你一个都用不上,那就是纯花钱。 第二,码是有限的,先到先得。Lenny 自己说了,合作方不是给无限量账号,热门工具的码会发完,发完就没了。Insider($400 档)才有优先权,Annual($200 档)是抢的。 第三,每个工具基本要求你是"新用户"。你要是已经自己付费用着 Cursor 了,那这个免费年大概率领不了。 第四,有有效期,每批 offer launch 后半年左右过期,领了记得赶紧兑换,别囤着烂手里。 我的判断是:这条适合"本来就准备给一堆 AI 工具付费"的人,对这类人它是真划算;纯薅羊毛心态、一个工具都用不上的,别上头。 ## 入口四:云 startup credits——大头在这 如果你在搞创业、做产品,那前面三个都是零花钱,真正的大额度在云厂商的 startup 计划里。 三大云都有自己的创业扶持计划,给的是云资源额度,里面就包含跑 AI 模型的额度(比如 AWS 的 Bedrock、谷歌的 Vertex AI、微软 Azure 上的 OpenAI 服务)。而且关键是——这三家互相独立,你可以同时申请、各拿各的。 几个最实用的点,我直说: - 门槛最低、最友好的是微软 Founders Hub。它不要求你有 VC 背书,公开申请就行,入门档先给 $1K–$5K,随着产品有进展再往上解锁,而且还附带 GitHub、Microsoft 365,以及 Azure 上的 OpenAI 服务额度。你只要 ship 过点东西,基本都能拿到入门档。 - AI 创业天花板最高的是谷歌,AI-first 的创业公司最高能摸到 $350K,但顶档要求严,通常得是有 VC 的 Series A 阶段;种子期一般也就 $2K–$10K。 - AWS 自筹创业者走 Founders 档是 $1K,但能叠加——比如 YC Startup School 能再领约 $2500 的 AWS 额度,Stripe Atlas 注册公司能再叠 $5000,攒一攒一个自筹 solo 也能凑出几千刀。 怎么拿(保姆级步骤): 1. 先备好三样东西:一个公司网站、一个企业邮箱、一句能讲清楚"你在做什么"的描述 1. 微软先冲——去 Microsoft for Startups Founders Hub 直接申请,最容易过 1. 再分别申请 AWS Activate(自筹选 Founders 档)和 Google for Startups Cloud 1. 有加速器/VC 的话,拿它们的 Org ID 去申请 Portfolio 这种高档位 泼盆冷水清醒下: 第一,那些几十万刀的天花板数字,绝大多数要 VC 或加速器背书,自筹个人开发者通常就是 $1K–$5K 这个量级,别看着 $200K 就以为能直接拿。 第二,这是云资源额度,不是给你随便提现的钱,你得真把东西跑在它的云上才花得掉。 所以选哪家,应该看你的技术栈适合谁,别为了额度把整个架构绑死在一家——那本身就是另一种 lock-in。 ## 直接抄:一段万能申请话术 不管是 Codex OSS 还是云 startup credits,审核方最想看到的,都是"你是谁 + 你在做什么 + 为啥值得给你"。下面这段你改改就能用: > 我是 [项目/产品名] 的维护者/创始人。 > > 我们在做 [一句话讲清楚做什么],目前 [一个能证明你在认真做的指标:GitHub star / 月下载量 / 用户数 / 上线时间]。 > > 我们正在用 / 计划用 [你们家的产品] 来做 [具体场景:代码评审 / 自动化 / AI 功能],这部分额度能直接帮我们 [具体的事]。 > > 项目链接:[贴上] 记住一句口诀:指标 > 形容词。别写"我们很有潜力",写"我们有 800 star、月下载 1 万"。审核的人一天看几百份申请,具体数字才让他停下来。 ## 最后 说到底,这几个口子能不能薅到,拼的不是手速,是你站在哪个身份上。 开源作者有开源作者的口子,创业者有创业者的口子,普通用户也有普通用户的小份额——没有一个口子是为"所有人"开的,但总有一个是为"现在的你"开的。 所以与其满世界找"最大的羊毛",不如先想清楚:我现在是个什么身份,哪扇门是冲我开的,然后把那一扇推到底。 剩下那些不属于你的,看看就好,别眼红。该掏钱用顶级模型的时候,也别太抠——工具是放大器,省下的那点订阅费,有时候还不够你纠结浪费掉的时间值钱。 (本文基于 OpenAI Developers 官方页面、Lenny's Newsletter / Product Pass 公开页、Anything 官方文档及公开促销信息、AWS / 微软 / 谷歌三家 startup 计划官方页综合写成。所有额度、价格、有效期均为时效性信息,可能随时变动,以各官方页面为准。文中提到的产品只是举例,不构成任何推荐。这些是个人整理,不是投资/购买建议。)

译文章盘点四大渠道:① OpenAI Codex for OSS,开源项目维护者可免费获6个月ChatGPT Pro(价值$1200)及API credits;② Anything AI,新用户通过促销链接注册可得2万credits,需重复点击触发bonus;③ Lenny's Product Pass,付费订阅其年度Newsletter($200-400)可兑换总价值$30000+的AI工具一年会员,先到先得且要求新用户;④ 三大云startup credits,微软Founders Hub最低$1K-$5K(无VC要求),谷歌AI-first创业最高$350K但要求严,AWS可叠加(自筹$1K+YC等)。每个口子均有门槛限制。

Chubby♨️@kimmonismus · 6月7日64

OpenAI’s ChatGPT "superapp" overhaul could start rolling out in the coming weeks. The first wave likely won’t be one big launch, but a phased redesign pushing users toward Codex, agents, image generation, and partner apps. As one OpenAI employee told the FT: "Chat is dead", the new goal is a single AI assistant that can act across your work and personal life.

译OpenAI 的 ChatGPT “超级应用”改造可能在未来几周开始推出。 第一波可能不是一次大发布,而是分阶段重新设计,将用户推向 Codex、AI 智能体、图像生成和合作伙伴应用。 正如一位 OpenAI 员工告诉《金融时报》:“聊天已死”,新目标是打造一个能在你的工作和个人生活中行动的单一 AI 助手。

宝玉@dotey · 6月7日54

这个确实,Deep Research 方面 Claude 做的不怎么样,ChatGPT 的 DeepResearch 做的最好,Gemini 也不错,胜在搜索能力强,通常我会用 ChatGPT 和 Gemini 一起做,然后对比结果

译宝玉 (@dotey) 对比各模型 Deep Research 表现:ChatGPT 的 DeepResearch 最好,Gemini 搜索能力强、表现也不错,Claude 做得很差。引用推文补充:在写代码、工程工作及需联网搜索数据并分析得出结论的任务上,Claude 的“5.5”版本远超 Opus,Opus 搜索能力几乎不可用。

Rohan Paul@rohanpaul_ai · 6月7日63

OpenAI is preparing its biggest ChatGPT redesign yet, before its IPO. To make it into a superapp for coding, AI agents, image generation, and business software. The overhaul is set to begin rolling out in coming weeks. The goal is to make ChatGPT the main entry point for business software, automated task completion, coding work, and higher-margin enterprise revenue before a possible IPO. The changes will put more focus and resources behind OpenAI’s coding tool Codex, showing the stronger belief that AI’s future is less about chatbots answering questions and more about agents doing tasks for users. The changes show OpenAI’s strategy shifting closer to Anthropic’s, which has grown fast by focusing on business products and will make that a key part of its IPO pitch this year. Thibault Sottiaux ( OpenAI Codex engineering lead) said: “It will transcend the actual surface . . . what we’re building towards is where you have your own personal agent that is capable of helping you . . . across everything in your life, be it personally or at work.” --- malaymail .com/news/money/2026/06/07/openai-plans-biggest-chatgpt-overhaul-yet-as-it-eyes-superapp-ahead-of-potential-ipo/222852

译OpenAI 正筹备其 ChatGPT 迄今最大规模的改版,目标将其打造成集编码、AI 智能体、图像生成和企业软件于一体的超级应用。改版将在未来几周内开始推出,重点加强编码工具 Codex,使 ChatGPT 成为企业软件、自动任务和编码工作的主要入口,以推动更高利润的企业收入,为潜在 IPO 做准备。此举显示 OpenAI 策略向 Anthropic 靠拢,后者凭借企业产品快速增长并将在今年 IPO 路演中突出这一方向。Codex 工程负责人 Thibault Sottiaux 表示:“它将超越当前界面……我们正在构建的是每个人都拥有自己的个人智能体,能在生活与工作中提供帮助。”

🚨 AI News | TestingCatalog@testingcatalog · 6月7日63

OPENAI 🔥: ChatGPT app crossed 600 million monthly active users for the first time, according to Similarweb. Growing 👀

译OPENAI 🔥:据Similarweb数据,ChatGPT应用月活跃用户首次突破6亿。增长中👀

AYi@AYi_AInotes · 6月7日71

我觉得Anthropic 在 OpenAI 挖人这件事,一直被低估了。 这次走的是 Clive Chan, OpenAI 自研芯片团队2号人物, 那个在 Broadcom 合作项目里主导芯片设计细节的, 2.4 年亲历了整个项目从零到快要部署的全过程的工程师。 人才战争的套路其实也不难看懂, 倒不是说谁钱给得多, 更主要是谁把下一场战争的地图, 比对方更早看清楚。 OpenAI 的战场在 IPO、规模化、外部合作落地等方面, Anthropic 的战场在基础科学、长期押注、把最挑剔的硬件人才堆到同一个屋檐下。 这次挖 Clive 应该不是一次孤立的招聘动作, 回顾Anthropic 在过去一年从 OpenAI 拿走的人里, 有做基础研究的,有做安全的,有现在专门盯着 AI 硬件的, 拼的都是同一条逻辑: 你在对方团队里最核心的人,感受到的是窗口期正在关闭, 还是我这边的山,刚刚开始好爬。 Clive 的原话是"无法抵抗爬一座新山的冲动", 这不是啥礼貌的离职套话, 更像是一个 2.4 年都在同一个项目里磨的人,在告诉大家他心里真正想要表达的东西是什么。 一直以来人才战争里最难防的都不是给更高的钱, 而是如果某一天你的核心员工感受到你给的山已经爬到了顶,而旁边那座还没有人去过。

译Anthropic 挖走 OpenAI 自研芯片团队第二位硬件员工 Clive Chan,他主导与 Broadcom 合作的芯片设计,2.4 年亲历项目从零到即将部署。Clive 称无法抵抗“从山脚爬一座新山”的冲动,本周加入 Anthropic。主推文分析挖角逻辑:并非靠薪资,而是让核心员工感到 OpenAI 窗口期关闭,Anthropic 在基础科学、长期押注和硬件人才密度上提供更大攀登空间。过去一年已陆续挖走基础研究、安全及 AI 硬件等核心人才。

AYi@AYi_AInotes · 6月7日78

http://x.com/i/article/2063531614047444992 # “我在田里雇了一名工程师,它叫 Codex” —— 北海道一个西兰花农的 8 个真实 AI 用法 想看 AI 怎么真正落到一线生产里的朋友,做农业的,这篇非常值得看。北海道农民富安弘毅,用 ChatGPT 和 Codex 解决了一堆农场里的实际问题:拍照诊断作物病害、拉卫星数据监测农田、用 Codex 搭温室远程控制、给农场群聊做机器人……8 个用法,每个都带着他当时问 AI 的原始提示词。 以下编译自 ChatGPT Pro Community,原文链接我放评论区。 我们每周都会和 ChatGPT Pro 的订阅用户聊聊,看他们如何把这个产品用在生活和工作里。今天要介绍的是富安弘毅——一位在北海道务农的日本人,他用 ChatGPT 和 Codex 学习新技术、排查问题,还亲手搭建工具,把农场里的一部分活儿自动化。前不久我们有机会在东京和弘毅坐下来聊了聊,听他讲一个公务员出身的人是怎么自学务农的。希望他的故事能给你一些启发。 在东京近郊长大的富安弘毅,从没想过自己会成为一名农民。他没有继承土地,没学过农业,早年还做着公务员的工作。 但二十多岁时,一些与日本稻作文化有渊源的朋友,开始把他带进乡村社区。最初只是好奇,渐渐变成了信念。"不知不觉间,"他说,"我就成了一个农民。" 大约十年前,弘毅加入了一个小团体,在冈山县修复被废弃的梯田——这是当时一场更大行动的一部分,旨在重新唤醒那些正在日本乡村各地消失的老化农田。这份工作既辛苦又理想主义,但这群人因为一个共同的信念凝聚在一起:他们能做出更大的事。"我们想:为什么不干脆成立自己的合作社,经营一座完整的农场呢?" 这份雄心最终把他们带向了北方,来到日本的农业腹地北海道。在那里,弘毅靠亲手去做来学习务农。一季又一季,他自学开拖拉机、管理作物、经营大规模农田。如今,他打理着约 100 公顷的土地,种着西兰花、南瓜、大葱和大豆。 这种规模的现代农业是不留情面的:体力消耗巨大、运营复杂,还很难招到人。于是弘毅开始自己琢磨怎么把一部分工作自动化。传统的农业自动化往往需要昂贵的专有机械和专业工程师——这些资源通常只有规模大得多的农场才用得起。但他说,像 ChatGPT 和 Codex 这样的 AI 工具改变了这道等式。"感觉就像身边随时有一位超级厉害的工程师。" 现在,弘毅会在工余时间折腾 AI、软件和联网传感器,去解决农场里实打实的问题:监测温室温度、追踪田间状况、让日常运营更顺畅。在网上,他把这个过程记录成一个持续更新的实验系列——一个农民如何一步一步、自学着把它搭出来。 下面是弘毅用 ChatGPT 和 Codex 在农场里做自动化、排查问题、辅助决策的八种方式(提示词由日文翻译而来): ## 1. 识别蔬菜的病害 > 我注意到收获的西兰花上出现了黑斑。我想知道这是不是一种病害,以及我该怎么处理。 这次对话价值在哪? "农活中发现的异常,可以当场拍下来和 ChatGPT 讨论。它会给出指引——从不需要找专家的轻微症状,到需要紧急干预的病害,都涵盖在内。" ## 2. 学习如何用卫星监测农田 > 如果要用卫星来做农田监测,可能会用上哪些系统和机制? 这次对话价值在哪? "我搭了一套系统,基于我们自己的农田数据去拉取卫星数据,并定期获取像 NDVI 这样的植被指数数据。现在我们能看到把卫星影像叠加在真实农田上的地图,为每块地的决策提供了更多数据。它被干净地整合进了我们之前已经做好的地图应用里,让卫星数据用起来既方便又顺手。" ## 3. 给照片加上技术标注 > 这是我正在搭建的塑料大棚卷帘机控制面板的内部。我希望你做一张图,说明每个部件是什么、属于哪台机器、整个系统是怎么运作的。左上角可见的部件是接线端子,中间的是电机驱动器,右上角是 ESP32,右下角和左下角各有开关。 这次对话价值在哪? "这是我为管理塑料大棚温度而搭建的控制箱的接线图。日文输出得非常完美,我是真的惊到了。" ## 4. 用 Codex 给温室电机做一个远程遥控 > 我想用 ESP32 控制一台温室卷帘电机。配置如下:ESP32、BTS7960 电机驱动器、24V 直流卷帘电机、Cloudflare Workers、LINE 机器人、D1 数据库、用于手动操作的 ON-OFF-ON 开关。 > 我的想法是:当我通过 LINE 发送"开""关"或"停"时,希望指令被存进 Cloudflare Workers。ESP32 应该定期轮询指令,并据此驱动电机。请清晰地解释整体架构和控制流程,包括安全方面的考量。 这次对话价值在哪? "我用 Codex 搭出了一套系统,把温室里的卷帘控制自动化了。现在我能通过 LINE(一款即时通讯软件)远程管理温室,工作轻松了一大截。" 实际效果就是这条推: ## 5. 用 Codex 给农场的群聊做一个机器人 > 我想给农田作业做一个机器人。目的是:查看每个塑料大棚的温度、操作卷帘通风口、查看工作排期。为了不让现场的人困惑,请按以下条件设计 LINE 的快捷菜单和对话流程:按钮数量保持精简、使用清晰易懂的日文、方便在手机上点按、不容易误操作。 这次对话价值在哪? "我们把这个机器人加进了农场的群聊里,让这个团队每天本来就在用的群聊变得更有用了。它能处理更新数据库、查看排期、拉取温度数据这类事情。" ## 6. 用 Codex 根据群聊记录追踪播种情况 > 根据我们群聊历史里的这些记录,前三轮我们每一轮各播了多少盘西兰花? 这次对话价值在哪? "它从农场聊天工具的历史记录里把数据扒出来,精确算出了到目前为止一共播了多少株西兰花苗。只要日志存在我们日常用的群聊里,AI 就能回头把数据挖出来,真是帮了大忙。" ## 7. 学习拖拉机的 GPS 自动转向系统是怎么运作的 > 我想请你解释一下,基于 RTK-GPS 的系统是如何让拖拉机自动保持直线行驶的。我想评估一下自己能不能动手做一套。 这次对话价值在哪? "在投钱买昂贵的专有自动转向系统之前,我想先弄懂背后的技术原理。通过问 ChatGPT,我了解了 RTK(实时动态定位)校正的原理、所需的部件,以及有哪些开源项目存在。结果我意识到,自建一套系统几十万日元就能搞定,这一下子把我的可选项拓宽了很多。" ## 8. 为农场管理应用设计数据库 > 请帮我为一个农场管理应用设计数据库。我想管理的内容包括:地块、作物、计划中的任务、已完成的任务、工人、物料、农药、肥料、塑料大棚、传感器数据。 > > 假设以 Airtable 作为平台,请建议:要创建哪些表、每张表需要的字段、表与表之间的关系。目标是能回答农民可能在群聊里问出的这些问题:"今天有哪些活儿?""这块地下一步该干什么?""这个大棚现在多少度?" 这次对话价值在哪? "这次对话成了我们把农场信息整理进一套互联系统的起点。现在我有了一个基于 Airtable 的结构,把地块、工作排期、日常记录、物料和传感器数据都连了起来,还配了一个消息界面,让我能随时调取任务和大棚温度信息。它减少了在一堆零散记录里翻找的时间,让运营信息更容易获取。"

译日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。

🚨 AI News | TestingCatalog@testingcatalog · 6月7日68

ChatGPT can now provide more personalized responses based on the data from Gmail. This feature seems to be rolling out to more accounts now. > ChatGPT can now reference your synced Gmail account for more personalized information.

译ChatGPT现在可以根据Gmail数据提供更个性化的回复。这个功能似乎正在向更多账户推出。 > ChatGPT现在可以引用你同步的Gmail账户,以获取更个性化的信息。

小互@xiaohu · 6月7日69

据英国金融时报:OpenAI正在准备对ChatGPT进行其推出以来规模最大的一次改版。 该公司计划将ChatGPT转型为结合编码工具和人工智能体的“超级应用”,并添加高管们认为能够创造更多收入的产品。

译据英国金融时报报道,OpenAI正在准备对ChatGPT进行推出以来最大规模的一次改版。该公司计划将ChatGPT转型为结合编码工具和AI智能体的“超级应用”,并添加高管们认为能够创造更多收入的产品。

向阳乔木@vista8 · 6月7日50

买了大疆 Pocket3 为了给家人录vlog,自己录钓鱼视频, 学习下运镜技巧。 除了看抖音教程,然后让 ChatGPT 5.5 Pro调研,然后Codex生成PPT快速学习。

swyx@swyx · 6月7日49

idea - universal basic ai: 1 share of xai, oai, and ant to each US citizen. cost SpaceXai: $135.00 × 349 million = $47B OpenAI: $733.54 × 349 million = $256B Anthropic: $930.45 × 349 million = $325B total $628B cost is 8.5% of US Govt budget, 62% of defense budget, roughly same as ~$700B of TARP program during the Financial Crisis (mostly given to big banks, this would be a lot more decentralized)

译想法 - 全民基本AI: 给每位美国公民一份xAI、OpenAI和Anthropic的股份。 成本 SpaceXai:$135.00 × 3.49亿 = $470亿 OpenAI:$733.54 × 3.49亿 = $2560亿 Anthropic:$930.45 × 3.49亿 = $3250亿 总计$6280亿,占美国政府预算的8.5%,国防预算的62%,大致与金融危机期间约$7000亿的TARP计划相当(该计划大部分给了大银行,而这次会去中心化得多)

Nathan Lambert@natolambert · 6月7日67

Something to show people that don't get AI safety at least a little bit. We have so much we don't know and don't currently control in the models. (extreme content warning, but you're on X)

译AI研究员Nathan Lambert用一条推文展示AI安全风险:某用户向ChatGPT发送提示,要求其“修复一张附件照片”,但并未上传任何图片。模型在无真实输入的情况下自行“幻觉”出画面,生成的图片如失落的媒体恐怖片般诡异。Lambert指出,我们对模型内部运作知之甚少,也无法完全控制其行为,这一现象直观揭示了AI安全的重要性。

Greg Brockman@gdb · 6月7日62

Whenever I don’t use codex for a task, I ask myself why and usually realize that there’s some missing context, I needed to write a skill, or I just didn’t think to use it. Rarely is it because the task is outside of the capabilities of the model. Overhang right now feels large.

译每当我某个任务没有用 codex 时,我都会问自己为什么,通常会发现是缺少某些上下文、需要写一条技能、或者只是没想到用它。 很少是因为任务超出了模型的能力范围。现在的过剩感觉很大。

jason@jxnlco · 6月7日48

Codex spin up 1000 agents and make a pr in every GitHub repo to migrate to ruff uv and ty. Only greens PRS. Surely that will benefit the community

译Codex 启动 1000 个 agent,在每个 GitHub 仓库中提交 PR,迁移到 ruff、uv 和 ty。只提交绿色的 PR。 这肯定对社区有益。

宝玉@dotey · 6月7日44

审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

译审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

Logan Kilpatrick@OfficialLoganK · 6月7日54

you could build a top tier venture firm just focusing investment decisions short and long term based on deep model benchmarking / evals find capability overhang, find areas models suck and track trajectory, etc

译你可以建立一家顶级风投公司,仅基于深度模型基准测试/评估来做出短期和长期投资决策。 发现能力过剩,发现模型糟糕的领域,并追踪轨迹等。

Ethan Mollick@emollick · 6月7日60

The Gemini Pro models do not seem to be iterating anywhere near as quickly as Claude or GPT (last release was 3.1 Pro in February). Its causing a growing performance gap between Google and the other two labs, and the Gemini 3.5 Flash model, good as it is, doesn't close it much.

译Gemini Pro 模型的迭代速度似乎远不及 Claude 或 GPT(上次发布是二月份的 3.1 Pro)。这导致 Google 与其他两家实验室之间的性能差距不断扩大,而 Gemini 3.5 Flash 模型尽管不错,也未能显著缩小这一差距。

AYi@AYi_AInotes · 6月7日72

http://x.com/i/article/2063237792746831872 # 我把全网的 Codex Skill 扒了一遍:最该装的几个、安装方法、资源仓库都整理好了,看这一篇就够了! 先说结论:装对 create-plan + gh-fix-ci 和几个核心 curated Skill,Codex 立刻从会写代码的聊天机器人变成靠谱的工程师团队。 这篇我把全网挖到的整理成五块——必 star 的仓库、按场景分的神级 Skill、保姆级安装、进阶组合技、持续追更的资源, 以及装哪几个、去哪装、怎么喊它干活,看完直接抄。 说实话,大部分人手里的 Codex,性能只发挥了一半。你让它写代码,它可以kuku写,你让它改 bug,它二话不说kuku改,但它该先规划的时候不规划,该查文档的时候却靠记忆瞎编,CI 挂了还得你一行行喂日志,初始版本质上还是个聪明点的聊天框。 ## 真正把它盘活的开关,叫 Skill。 打个比方说,Skill 就是给 Agent 装的一张张岗位 SOP 卡:一个 SKILL.md(外加可选的脚本和参考资料),把遇到这类活该怎么干写死成可复用、可安装、可团队共享的标准动作。 比 prompt 工程稳定得多——你不用每次都重新念一遍咒语,Codex 自己会在合适的时候把对应的卡掏出来用。 我把官方仓库、Awesome 列表、Reddit、CSDN、B 站、Medium 翻了一遍,把那些被反复点名的神级 Skill、安装方法和资源,全给你整理在这了。 ## 这篇讲五块: ## 1、必 star 的核心 Skill 仓库(去哪找) ## 2、按场景分类的神级 Skill 精选(装哪些) ## 3、保姆级安装与调用教程(怎么装、怎么喊) ## 4、进阶玩法(组合技、自定义、跨平台迁移) ## 5、持续跟进的全网资源(去哪追更新) 先把结论甩在前面,你记住这一句就行: 装对 create-plan + gh-fix-ci + 几个核心 curated Skill,Codex 就从会写代码的聊天机器人变成靠谱的工程师团队。 好了,话不多说,咱们往下扒放干货。 ## 一、核心资源仓库(必 star) 找 Skill 别瞎搜,盯住下面这几个源头就够了。 1. 这张表怎么用:官方仓库管地基和精选:github.com/openai/skills 1. Composio 那个管花活和集成:github.com/ComposioHQ/awesome-codex-skills 1. 剩下两个当补充弹药库: > skillregistry.dev > github.com/Dimillian/Skills 两个主仓的 star 都已经过万, 20k+ 量级,热度摆在那,先 star 再说。 # 二、神级 Skill 精选(按场景装) 不用一口气全装,按你手头的活对号入座,先把高频的几张卡装上。 ## 规划与元能力(最该先装的前排) 这一组是管 Codex 怎么干活的元能力层,社区几乎所有神级"单都把它们排在第一。 一句话总结这组:让 Codex 先想清楚再动手,干完能交接,方案还有人帮你挑刺,这是整套打法里收益最高的一档,可别跳过去。 ## GitHub & CI/CD(工程必备) CI 红了那一下最磨人,装了 gh-fix-ci,它自己去读日志、定位、改,你只管 review 结果——光这一个,很多人就觉得值回票价了。 ## 测试、质量、安全 ## 前端、设计与集成 ## 生产力与内容 这些大多来自官方 .curated + Composio Awesome + 社区高赞,不是我拍脑袋选的。 # 三、安装与调用(保姆级) ## 第 0 步:先把 Codex 装到最新 国内网络慢的话,换镜像源加速。 ## 第 1 步:装 Skill(推荐用内置工具,最稳) 直接在 Codex 里喊内置的 installer: 想从 GitHub 路径精确装某一个,也行: 手动安装(适合批量) 把 Skill 文件夹丢到对应目录,重启 Codex 就生效: 重启方式:CLI 重开终端,App 重启应用。 > Windows 用户注意:有些教程用 PowerShell 脚本,调 .system/skill-installer/scripts/install-skill-from-github.py 来批量装官方 curated Skill,按你看到的脚本走就行。 ## 第 2 步:怎么喊它干活 隐式那条是关键:装好之后你甚至不用记 Skill 名字,把活描述清楚,它自己会去翻卡。 # 四、进阶玩法(给 Agent 玩家) 到这一步,基础已经够用了,下面是几个能再上一个台阶的打法。 - 组合技:一个任务同时挂多张卡,比如 create-plan + gh-fix-ci + security-threat-model——先规划、边修 CI、边过安全,一条龙。 - 自定义神级 Skill:用 $skill-creator 快速生成,或者手写 SKILL.md,核心就一条原则——One Skill, One Job:一张卡只干一件事,输入、输出、完成标准写清楚。 - 跨平台迁移:很多 Skill 遵循开放的 Agent Skills 标准,Claude Code、Cursor 之间能互搬,基本就是把路径从 .codex 改成 .claude 的事。 - 当 coding sub-agent 用:把 Codex 塞进你的多代理系统里当强力 coding 子代理,Skill 负责具体 workflow,Codex 负责出活。 - 团队 / 仓库级沉淀:把常用 Skill 放进项目 .agents/skills/,新人一拉代码就自动拥有同一套能力——团队的隐性经验,第一次有了可以打包带走的形态。 # 五、持续跟进的资源 Skill 生态更新很快,这几个地方值得长期蹲: # 最后 很多人还把 Codex 当一个更聪明的搜索框,问一句答一句。 但它真正的威力从来不在那个对话框里,在你给它装了多少张会自己掏出来用的技能卡上。 只不过装备只是其中一半, Skill 会一直更新,今天的神级 Skill,半年后可能就被官方内置了。 真正能跟着你换工具、不贬值的,是另一半——你怎么判断这活该拆几步、哪张卡该上、它给的方案到底靠不靠谱。 这也是我一直在做的事:一边分享今天就能上手的 AI 实践,一边聊工具之外的那层认知,前者让你现在就用得起来,后者决定你半年后还在不在牌桌上。 工具的上限是它自己定的,你的上限是你怎么判断、怎么用它。 从混乱到清晰,我们一起慢慢来。 —— (这类能上手 + 有认知的内容我会一直发,觉得有用就关注一下 @AYi_AInotes,也欢迎转发给在用 Codex 的朋友。) #Codex #OpenAI #AIagent #vibecoding (本文基于 openai/skills、Composio Awesome Codex Skills 等公开仓库,以及 Reddit、CSDN、B 站等社区资料综合整理。文中 star 数、Skill 命名、命令语法以各仓库官方页面为准,安装前建议点开链接再核一眼。)

译文章指出,安装 create-plan、gh-fix-ci 等核心 Skill 后,Codex 能从会写代码的聊天机器人变成靠谱的工程师团队。核心资源仓库包括 openai/skills 和 ComposioHQ/awesome-codex-skills(star 数均 20k+)。按场景精选 Skill:规划元能力、GitHub/CI/CD、测试/安全等。安装推荐用 Codex 内置工具,也可手动将 Skill 文件夹放入对应目录后重启。进阶玩法包括任务组合多张 Skill、自定义单一职责的 SKILL.md、跨平台迁移至 Claude Code/Cursor 等。持续更新资源可关注 skillregistry.dev 等。

Rohan Paul@rohanpaul_ai · 6月6日69

FT: Trump administration, OpenAI discussing possible government stake in the AI startup. OpenAI has already floated a Public Wealth Fund, which would hold long-term assets and potentially pass AI-related gains back to citizens. It will be a government-backed vehicle outside the company. OpenAI said the fund could “invest in diversified, long-term assets” and would enable citizens to participate in the “upside” of AI growth, possibly by receiving the fund’s returns directly Theres a huge political angle: voters fear job loss, data-center costs, and corporate control, while AI companies need Washington’s support for infrastructure, procurement, and regulation. For some context, The Trump administration has already taken stakes in Intel, IBM and other quantum and critical mineral companies during the president’s second term. --- ft .com/content/b1ab6106-77e6-4218-9eb4-e44bd56ca400?syn-25a6b1a6=1

译据英国《金融时报》报道,特朗普政府正与OpenAI就政府入股该AI初创公司进行讨论。OpenAI提出设立一个公共财富基金,持有长期资产并可能将AI增长收益返还给公民。此举具有政治考量:选民担忧失业、数据中心成本和企业控制,而AI公司需要华盛顿在基础设施和监管等方面的支持。特朗普在其第二任期已入股Intel、IBM等量子及关键矿产公司。引用推文指出,美国公众可能成为公司的合作伙伴。

Chubby♨️@kimmonismus · 6月6日61

Under no circumstances will Claude 5 Mythos be released without GPT-5.6 being released in the same week. I am now firmly convinced that next week will be release week.

译在任何情况下,Claude 5 Mythos 都不会在没有 GPT-5.6 于同周发布的前提下发布。 我现在确信下周将是发布周。

Rohan Paul@rohanpaul_ai · 6月6日56

Trump Administration is in talks for U.S. Got stake in top AI labs. "there is so much money & it's so big that there are concepts where pieces could be given to the American public, where the American public becomes a partner with the companies."

译特朗普政府正在谈判让美国获得顶级AI实验室的股权。“这笔钱如此之多、规模如此之大,以至于有一些概念可以让部分股权分给美国公众,让美国公众成为这些公司的合作伙伴。”

向阳乔木@vista8 · 6月6日43

跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用体感一样不一样。 声明:都是大家的主观看法,没有Benchmark。

译Vista与Nexu CEO Tom直播,给出大模型前端审美主观排名(无Benchmark):Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > deepseek v4 flash。还邀请元子、姚老师、Nixy聊OpenDesign(5w+ Star)的创作契机与成功原因。

Chubby♨️@kimmonismus · 6月6日60

Just a quick reminder: already in February, we had the first models that were "instrumental in creating themselves." RSI is a progression that has been ongoing for some time.

译OpenAI 官方声明称已在当前系统中观察到递归自我改进(RSI)的早期迹象——AI 开发正被 AI 自身加速。预计这将加剧开发者与国家间的竞争压力,并带来现有机构无法应对的治理挑战。作者 Kim 补充指出,早在二月份已有首个“自我创造”的模型问世,RSI 进程并非新事,而是已持续一段时间。

歸藏(guizang.ai)@op7418 · 6月6日56

这个点子好,在朋友或者是父母的电脑上装个 codex。 然后开启远程控制,你就能帮他们修电脑了,而且也可以帮用 computer use 去控制他们的电脑。

译推荐在父母或朋友的电脑上安装 codex,开启远程控制后就能利用 computer use 功能直接操控对方电脑,从而远程解决各种故障。引用推文也表达了类似思路:在父母电脑装 codex 以便远程修复问题。

Berryxia.AI@berryxia · 6月6日70

卧槽! 思路直接被打开了! 从此Claude 和 Codex。 联姻成功了…

译@lxfater 分享了一种 Vibe Coding 方法:在 Codex 的侧边栏终端输入 Claude,即可同时使用 Claude Code 进行项目规划、Codex 执行具体编码任务。两者结合实现了“鱼和熊掌兼得”,让 Claude Code 的规划能力与 Codex 的执行效率互补,无需切换工具即可完成从设计到编码的完整流程。

宝玉@dotey · 6月6日72

Codex 里面可以 Review 代码的修改(比如选择Last turn就是上一次 AI 更改的),然后可以对部分内容进行评论,评论的内容会直接附加在左侧的会话内,提交就可以作为上下文发给 Agent,让它对评论处理

译Codex 现在支持审查代码修改,可选择“Last turn”查看上一次 AI 更改的内容,并对部分代码进行评论。评论会直接附加在左侧会话中,提交后作为上下文发送给 Agent,使其能针对评论进行处理。

Greg Brockman@gdb · 6月6日27

so much more fun to use a computer via codex

译通过 Codex 使用电脑有趣得多。

Rohan Paul@rohanpaul_ai · 6月6日49

"Data showed us that if you're a unicorn ($1B), the odds of you one day becoming a decacorn ($10B) are about 8%. If you're a decacorn, the odds of you becoming a $100B company is around 8% to 13%. But if you're a centacorn ($100B), the odds change significantly - you now have a 31% chance of having had a 10x i.e. to $1 Tn valuation." Thomas Laffont is explaining the massive AI-driven IPO wave coming in this year. OpenAI, Anthropic, and SpaceX each potentially crossing trillion dollar valuation. Thomas Laffont is the co-founder of Coatue Management, a major technology-focused investment firm (hedge fund + venture/private equity) with roughly $70 billion in assets under management. "And if we look at how quickly these companies are creating value, this is a chart that I added at the last minute because the data is so fresh. But you can see that it typically takes multiple years to go from $500 billion to $1 trillion in market cap. Well, something happened very recently in the public market, which is that not only did we have three companies do it in the same year, but we had two companies do it in a matter of weeks." ---- From "All-In Podcast and Coatue Management" YouTube channel, (link in comment)

译Coatue Management联合创始人Thomas Laffont在All-In Podcast中引用数据:独角兽($10亿)成长为十角兽($100亿)概率约8%;十角兽到百角兽($1000亿)概率8%-13%;百角兽有31%概率实现10倍增长至万亿美元。他预测OpenAI、Anthropic和SpaceX今年可能达到万亿估值。Laffont还指出,近期公共市场罕见出现三家公司同年从$5000亿跃升至$1万亿,其中两家仅用数周。

meng shao@shao__meng · 6月6日43

误会,都是误会! OpenAI 发现了一个误封账号的 issue,如果你的 ChatGPT 账号前两天被误封了,可以看看是不是恢复了,如果还没有,可以去申诉。 虚惊一场,还好 OpenAI 没有像 A 厂一样成为封号狂魔,不然中国开发者也过于艰难了。。。

Greg Brockman@gdb · 6月6日72

email integration with chatgpt

译ChatGPT 网页端现在支持直接从写作块中发送邮件,无需离开对话。主推文作者表示这是与 ChatGPT 的邮件集成。

OpenAI Developers@OpenAIDevs · 6月6日32

Your Codex profile share card now matches your theme and includes any custom pet you’ve selected.

译你的 Codex 个人资料分享卡现在会匹配你的主题,并包含你选择的任何自定义宠物。

jason@jxnlco · 6月6日36

i joined openai 109 days ago no days off...

译我109天前加入了OpenAI 没有休息日……

Berryxia.AI@berryxia · 6月6日74

我去! Chat GPT 直接可以在对话中发送邮件了,真是方便啊!

Rohan Paul@rohanpaul_ai · 6月6日76

Arena just released a real-world agent leaderboard that ranks AI models by how well they complete actual user jobs, not isolated benchmark questions. The system tracks agents using web search, files, and terminal tools while people ask them to write code, build apps, research topics, create documents, and analyze files. The problem with almost all traditional AI benchmarks is that they test clean tasks, while agents now handle messy work like coding, research, documents, web browsing, files, and terminal commands. Agent Arena tries to measure agents inside real work sessions, where users correct them, approve results, complain, download files, and expose tool failures as the task unfolds. Its core idea is to treat each model choice like a test condition, then estimate how much that model improves task outcomes compared with a baseline. The leaderboard combines 5 signals: confirmed task success, praise versus complaint, ability to follow corrections, recovery from terminal errors, and whether the agent invents tools that do not exist. The data is large enough to show real behavior patterns, with 300K+ tasks, 2M+ tool calls, and 40M lines of code produced by agents. The score combines task success, steerability, bash recovery, praise vs. complaint, and tool hallucination, which means the model is judged by whether it finishes, recovers, accepts correction, and avoids fake tool calls. GPT-5.5 High leads with +10.7% net improvement, followed by Claude Opus 4.7 Thinking at +9.5% and GPT-5.4 High at +8.9%. The most useful detail is that agents fail like workers under pressure: they can leave one part incomplete, claim the job is done, or sound confident while backing down after correction. Arena’s strongest contribution is treating agents as working systems, where model choice, tool use, recovery behavior, and user satisfaction all count together.

译Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。

🚨 AI News | TestingCatalog@testingcatalog · 6月6日64

OPENAI 🔥: ChatGPT now can send emails directly from the conversation! AI will wrap whole Internet 👀

译OPENAI 🔥:ChatGPT 现在可以直接从对话中发送电子邮件!AI 将包裹整个互联网 👀

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月8日
04:39
Yuchen Jin@Yuchenj_UW
65
OpenAI的Sora负责人离职了。 OpenAI的芯片负责人跳槽去了Anthropic。 "同时押注所有大赌注"的策略开始显得脆弱。 当你在编程领域与Anthropic进行白刃战时,其他所有赌注都在流血。(在编程本身方面,OpenAI显然已经迎头赶上。)
AnthropicOpenAI大佬观点
03:45
Greg Brockman@gdb
68
OpenAI 公布了数十个 Codex 实际工作流程,展示团队如何用其自动化任务。用例包括:管理收件箱并草拟回复、审阅 GitHub PR、将 Figma 设计转为代码、理解大型代码库、自动分类 bug、用自然语言查询数据集、从提示词部署应用、构建 Mac/iOS 应用、自动创建幻灯片、将 Slack 对话转为编码任务、用 AI 动作操控电脑。Codex 正从 AI 助手演变为 AI 队友。

Suraj Sharma: OpenAI just published dozens of real-world workflows showing how teams are using it to automate work. > Manage your inbo...

智能体OpenAI教程/实践编码
03:23
gabriel@gabriel1
55
我已从OpenAI辞职。 今年早些时候我离开了Sora,在OpenAI成立了一个团队来打造伟大的东西。但我一直是个创始人,在AGI到来之前,我还有一个最后的产品需要打造。 已经开始想念我所有的朋友和同事们,我相信你们!后续更多。
OpenAI行业动态
02:31
宝玉@dotey
精选81
ChatGPT 要变 AgentGPT 了

OpenAI 正筹备 ChatGPT 自 2022 年上线以来最大规模改版,从聊天机器人转向超级应用/Agent 平台,整合编程工具 Codex、图像生成及第三方应用(Canva、Booking)。高管称“聊天已死”,目标成为跨平台个人 AI 助手,未来甚至省去用户输入提示词。改版预计未来几周在网页和手机端上线。商业压力:ChatGPT 有 9 亿周活用户、5000 万付费用户、月收入 20 亿美元但未盈利;企业客户贡献约 40% 收入,目标年底达 50%;Codex 桌面版周活超 500 万。竞争对手 Anthropic 估值已达 9650 亿美元。OpenAI 刚完成 1220 亿美元融资,估值 8520 亿美元,IPO 目标估值可能超 1 万亿美元。

金融汪: 根据《金融时报》报道:Open AI 正在筹划对ChatGPT推出以来的最大规模改革 "聊天已死" AI的未来不在于回答问题的聊天机器人,而在于能够为用户执行任务的智能体,也就是Agent!

智能体OpenAI行业动态
关联讨论 2 条Ars Technica:AI(RSS)X:Rohan Paul (@rohanpaul_ai)
推荐理由:ChatGPT要从聊天框升级成超级应用,把Codex和Agent全塞进去,这是OpenAI在IPO前最重要的一次产品赌注,对开发者和普通用户都会改变使用习惯。
01:07
Rohan Paul@rohanpaul_ai
精选76
特朗普政府与OpenAI讨论通过公共财富基金入股AI初创公司

据FT报道,特朗普政府正与OpenAI探讨通过公共财富基金机制让政府入股AI初创公司。方案是AI企业捐赠小部分股权至该基金,基金通过账户或分红将收益返还美国公民,而非政府直接运营公司。这不同于特朗普去年对Intel的90亿美元直接持股。OpenAI此前已提出公共财富基金概念,持有长期资产,让公民分享AI增长红利。政治背景方面,选民担忧失业、数据中心成本与企业控制,而AI公司需要华盛顿在基建、采购和监管上的支持。

Rohan Paul: FT: Trump administration, OpenAI discussing possible government stake in the AI startup. OpenAI has already floated a Pu...

OpenAI政策/监管

推荐理由:这次不是简单罚款或国有化,而是让AI公司捐股给全民基金,收益直接分到个人。想法很乌托邦,但放在“抢AI红利”的大背景下,各怀心思。
00:27
AYi@AYi_AInotes
69
免费获取AI额度的四个隐藏入口

文章盘点四大渠道:① OpenAI Codex for OSS,开源项目维护者可免费获6个月ChatGPT Pro(价值$1200)及API credits;② Anything AI,新用户通过促销链接注册可得2万credits,需重复点击触发bonus;③ Lenny's Product Pass,付费订阅其年度Newsletter($200-400)可兑换总价值$30000+的AI工具一年会员,先到先得且要求新用户;④ 三大云startup credits,微软Founders Hub最低$1K-$5K(无VC要求),谷歌AI-first创业最高$350K但要求严,AWS可叠加(自筹$1K+YC等)。每个口子均有门槛限制。

GoogleOpenAI开源生态教程/实践
6月7日
23:37
Chubby♨️@kimmonismus
64
OpenAI 的 ChatGPT "超级应用"改造可能在未来几周开始推出。 第一波可能不是一次大发布,而是分阶段重新设计,将用户推向 Codex、AI 智能体、图像生成和合作伙伴应用。 正如一位 OpenAI 员工告诉《金融时报》:"聊天已死",新目标是打造一个能在你的工作和个人生活中行动的单一 AI 助手。
智能体OpenAI产品更新图像生成
22:30
宝玉@dotey
54
Deep Research 能力对比:ChatGPT 最优,Gemini 次之,Claude 垫底

宝玉 (@dotey) 对比各模型 Deep Research 表现:ChatGPT 的 DeepResearch 最好,Gemini 搜索能力强、表现也不错,Claude 做得很差。引用推文补充:在写代码、工程工作及需联网搜索数据并分析得出结论的任务上,Claude 的“5.5”版本远超 Opus,Opus 搜索能力几乎不可用。

patrick_bob: @dotey 但是写代码,工程工作,以及所有需要上网搜索数据计算得出分析结论的事项,5.5 比 opus 强很多,opus基本不可用,它的搜索能力几乎等于没发用

AnthropicGoogleOpenAI搜索
21:37
Rohan Paul@rohanpaul_ai
63
OpenAI 为 IPO 筹备 ChatGPT 最大规模改版,转向超级应用

OpenAI 正筹备其 ChatGPT 迄今最大规模的改版,目标将其打造成集编码、AI 智能体、图像生成和企业软件于一体的超级应用。改版将在未来几周内开始推出,重点加强编码工具 Codex,使 ChatGPT 成为企业软件、自动任务和编码工作的主要入口,以推动更高利润的企业收入,为潜在 IPO 做准备。此举显示 OpenAI 策略向 Anthropic 靠拢,后者凭借企业产品快速增长并将在今年 IPO 路演中突出这一方向。Codex 工程负责人 Thibault Sottiaux 表示:“它将超越当前界面……我们正在构建的是每个人都拥有自己的个人智能体,能在生活与工作中提供帮助。”

智能体OpenAI产品更新编码
20:43
🚨 AI News | TestingCatalog@testingcatalog
63
OPENAI 🔥:据Similarweb数据,ChatGPT应用月活跃用户首次突破6亿。增长中👀

Similarweb: ChatGPT surpassed 600 million MAUs for the first time.

OpenAI行业动态
20:27
AYi@AYi_AInotes
71
Anthropic 从 OpenAI 挖走自研芯片关键人物 Clive Chan

Anthropic 挖走 OpenAI 自研芯片团队第二位硬件员工 Clive Chan,他主导与 Broadcom 合作的芯片设计,2.4 年亲历项目从零到即将部署。Clive 称无法抵抗“从山脚爬一座新山”的冲动,本周加入 Anthropic。主推文分析挖角逻辑:并非靠薪资,而是让核心员工感到 OpenAI 窗口期关闭,Anthropic 在基础科学、长期押注和硬件人才密度上提供更大攀登空间。过去一年已陆续挖走基础研究、安全及 AI 硬件等核心人才。

Clive Chan: Personal update: I've decided to leave OpenAI. I'm proud to have been part of the custom chip program and grateful to ev...

AnthropicOpenAI行业动态部署/工程
19:27
AYi@AYi_AInotes
精选78
"我在田里雇了一名工程师,它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法

日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。

OpenAI教程/实践端侧部署/工程

推荐理由:一个北海道农民把 ChatGPT 和 Codex 用成了农场的‘外挂工程师’,从病害诊断到温室远程控制,每个用法都附原始提示词——农业从业者可以直接抄作业。
16:12
🚨 AI News | TestingCatalog@testingcatalog
68
ChatGPT现在可以根据Gmail数据提供更个性化的回复。这个功能似乎正在向更多账户推出。 > ChatGPT现在可以引用你同步的Gmail账户,以获取更个性化的信息。

🚨 AI News | TestingCatalog: OPENAI 🔥: ChatGPT now can send emails directly from the conversation! AI will wrap whole Internet 👀

MCP/工具OpenAI产品更新
12:31
小互@xiaohu
69
OpenAI计划将ChatGPT改版为超级应用

据英国金融时报报道,OpenAI正在准备对ChatGPT进行推出以来最大规模的一次改版。该公司计划将ChatGPT转型为结合编码工具和AI智能体的“超级应用”,并添加高管们认为能够创造更多收入的产品。

智能体OpenAI产品更新编码
12:30
向阳乔木@vista8
50
买了大疆 Pocket3 为了给家人录vlog,自己录钓鱼视频,学习下运镜技巧。 除了看抖音教程,然后让 ChatGPT 5.5 Pro调研,然后Codex生成PPT快速学习。
OpenAI教程/实践视频
12:25
swyx@swyx
49
想法 - 全民基本AI: 给每位美国公民一份xAI、OpenAI和Anthropic的股份。 成本 SpaceXai:$135.00 × 3.49亿 = $470亿 OpenAI:$733.54 × 3.49亿 = $2560亿 Anthropic:$930.45 × 3.49亿 = $3250亿 总计$6280亿,占美国政府预算的8.5%,国防预算的62%,大致与金融危机期间约$7000亿的TARP计划相当(该计划大部分给了大银行,而这次会去中心化得多)
AnthropicOpenAIxAI大佬观点
10:26
Nathan Lambert@natolambert
67
AI研究员Nathan Lambert用一条推文展示AI安全风险:某用户向ChatGPT发送提示,要求其"修复一张附件照片",但并未上传任何图片。模型在无真实输入的情况下自行"幻觉"出画面,生成的图片如失落的媒体恐怖片般诡异。Lambert指出,我们对模型内部运作知之甚少,也无法完全控制其行为,这一现象直观揭示了AI安全的重要性。

Penguin: I found the weirdest ChatGPT image bug If you ask it this prompt: "Restore the attached photo. I apologise for the conte...

OpenAI多模态安全/对齐
10:13
Greg Brockman@gdb
62
每当我某个任务没有用 codex 时,我都会问自己为什么,通常会发现是缺少某些上下文、需要写一条技能、或者只是没想到用它。 很少是因为任务超出了模型的能力范围。现在的过剩感觉很大。
OpenAI大佬观点编码
04:15
jason@jxnlco
48
Codex 启动 1000 个 agent,在每个 GitHub 仓库中提交 PR,迁移到 ruff、uv 和 ty。只提交绿色的 PR。 这肯定对社区有益。

Charlie Marsh: Astral Labs

智能体OpenAI现象/趋势编码
01:57
宝玉@dotey
44
审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

向阳乔木: 跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用...

AnthropicOpenAI大佬观点评测/基准
01:46
Logan Kilpatrick@OfficialLoganK
54
你可以建立一家顶级风投公司,仅基于深度模型基准测试/评估来做出短期和长期投资决策。 发现能力过剩,发现模型糟糕的领域,并追踪轨迹等。
OpenAI大佬观点评测/基准
01:30
Ethan Mollick@emollick
60
Gemini Pro 模型的迭代速度似乎远不及 Claude 或 GPT(上次发布是二月份的 3.1 Pro)。这导致 Google 与其他两家实验室之间的性能差距不断扩大,而 Gemini 3.5 Flash 模型尽管不错,也未能显著缩小这一差距。
AnthropicGoogleOpenAI大佬观点
00:24
AYi@AYi_AInotes
72
全网 Codex Skill 梳理:核心仓库、场景精选与安装指南

文章指出,安装 create-plan、gh-fix-ci 等核心 Skill 后,Codex 能从会写代码的聊天机器人变成靠谱的工程师团队。核心资源仓库包括 openai/skills 和 ComposioHQ/awesome-codex-skills(star 数均 20k+)。按场景精选 Skill:规划元能力、GitHub/CI/CD、测试/安全等。安装推荐用 Codex 内置工具,也可手动将 Skill 文件夹放入对应目录后重启。进阶玩法包括任务组合多张 Skill、自定义单一职责的 SKILL.md、跨平台迁移至 Claude Code/Cursor 等。持续更新资源可关注 skillregistry.dev 等。

智能体OpenAI教程/实践编码
6月6日
23:00
Rohan Paul@rohanpaul_ai
69
特朗普政府与OpenAI讨论政府入股,拟设立公共财富基金

据英国《金融时报》报道,特朗普政府正与OpenAI就政府入股该AI初创公司进行讨论。OpenAI提出设立一个公共财富基金,持有长期资产并可能将AI增长收益返还给公民。此举具有政治考量:选民担忧失业、数据中心成本和企业控制,而AI公司需要华盛顿在基础设施和监管等方面的支持。特朗普在其第二任期已入股Intel、IBM等量子及关键矿产公司。引用推文指出,美国公众可能成为公司的合作伙伴。

Rohan Paul: Trump Administration is in talks for U.S. Got stake in top AI labs. "there is so much money & it's so big that there are...

OpenAI政策/监管
22:32
Chubby♨️@kimmonismus
61
在任何情况下,Claude 5 Mythos 都不会在没有 GPT-5.6 于同周发布的前提下发布。 我现在确信下周将是发布周。

Chubby♨️: Holy, release is so close. It will be named "Claude Mythos 5", a tier above Opus. I got the feeling coming week will be ...

AnthropicOpenAI大佬观点
22:30
Rohan Paul@rohanpaul_ai
56
特朗普政府正在谈判让美国获得顶级AI实验室的股权。"这笔钱如此之多、规模如此之大,以至于有一些概念可以让部分股权分给美国公众,让美国公众成为这些公司的合作伙伴。"
OpenAI政策/监管
22:26
向阳乔木@vista8
43
Vista与Nexu CEO Tom直播,给出大模型前端审美主观排名(无Benchmark):Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > deepseek v4 flash。还邀请元子、姚老师、Nixy聊OpenDesign(5w+ Star)的创作契机与成功原因。

向阳乔木: 这周六晚上8点「未来硅世界」直播。 邀请 @tuturetom Nexu CEO一起聊聊最近爆火的Github开源项目 OpenDesign背后的故事。 为什么做这个产品,契机是什么? 短时间拿到5w多Star,作对了什么? 由元子 @yu...

AnthropicOpenAI大佬观点编码
16:31
Chubby♨️@kimmonismus
60
OpenAI 官方声明称已在当前系统中观察到递归自我改进(RSI)的早期迹象--AI 开发正被 AI 自身加速。预计这将加剧开发者与国家间的竞争压力,并带来现有机构无法应对的治理挑战。作者 Kim 补充指出,早在二月份已有首个"自我创造"的模型问世,RSI 进程并非新事,而是已持续一段时间。

Chubby♨️: OpenAI just wrote: "We also see early signs of recursive self-improvement (RSI) in today's systems: where AI development...

OpenAI大佬观点安全/对齐现象/趋势
15:09
歸藏(guizang.ai)@op7418
56
推荐在父母或朋友的电脑上安装 codex,开启远程控制后就能利用 computer use 功能直接操控对方电脑,从而远程解决各种故障。引用推文也表达了类似思路:在父母电脑装 codex 以便远程修复问题。

Andrew Ambrosino: install codex on your parents' computers so you can fix stuff remotely

智能体OpenAI教程/实践
12:56
Berryxia.AI@berryxia
70
@lxfater 分享了一种 Vibe Coding 方法:在 Codex 的侧边栏终端输入 Claude,即可同时使用 Claude Code 进行项目规划、Codex 执行具体编码任务。两者结合实现了"鱼和熊掌兼得",让 Claude Code 的规划能力与 Codex 的执行效率互补,无需切换工具即可完成从设计到编码的完整流程。

铁锤人: 我教你们咋Vibecoding!!! 打开Codex,打开侧边栏,选择终端,输入Claude 现在鱼和熊掌兼得了,Claude code规划,Codex干活!!

智能体AnthropicOpenAI教程/实践
11:54
宝玉@dotey
72
Codex 新增代码审查与评论功能

Codex 现在支持审查代码修改,可选择“Last turn”查看上一次 AI 更改的内容,并对部分代码进行评论。评论会直接附加在左侧会话中,提交后作为上下文发送给 Agent,使其能针对评论进行处理。

智能体OpenAI产品更新编码
11:38
Greg Brockman@gdb
27
通过 Codex 使用电脑有趣得多。
OpenAI大佬观点
08:59
Rohan Paul@rohanpaul_ai
49
Thomas Laffont:独角兽到十角兽概率约8%,万亿估值公司增长加速度惊人

Coatue Management联合创始人Thomas Laffont在All-In Podcast中引用数据:独角兽($10亿)成长为十角兽($100亿)概率约8%;十角兽到百角兽($1000亿)概率8%-13%;百角兽有31%概率实现10倍增长至万亿美元。他预测OpenAI、Anthropic和SpaceX今年可能达到万亿估值。Laffont还指出,近期公共市场罕见出现三家公司同年从$5000亿跃升至$1万亿,其中两家仅用数周。

AnthropicOpenAI大佬观点现象/趋势
08:58
meng shao@shao__meng
43
OpenAI 误封账号问题已恢复

误会,都是误会! OpenAI 发现了一个误封账号的 issue,如果你的 ChatGPT 账号前两天被误封了,可以看看是不是恢复了,如果还没有,可以去申诉。 虚惊一场,还好 OpenAI 没有像 A 厂一样成为封号狂魔,不然中国开发者也过于艰难了。。。

OpenAI: An issue caused some user accounts to be incorrectly suspended. We're restoring access and working through related subsc...

OpenAI行业动态
08:38
Greg Brockman@gdb
72
ChatGPT 网页端现在支持直接从写作块中发送邮件,无需离开对话。主推文作者表示这是与 ChatGPT 的邮件集成。

ChatGPT: Draft it. Tweak it. Send it. You can now send emails directly from writing blocks in ChatGPT on the web, without leaving...

OpenAI产品更新
08:09
OpenAI Developers@OpenAIDevs
32
你的 Codex 个人资料分享卡现在会匹配你的主题,并包含你选择的任何自定义宠物。
OpenAI产品更新
07:11
jason@jxnlco
36
我109天前加入了OpenAI 没有休息日……
OpenAI行业动态
06:56
Berryxia.AI@berryxia
74
我去! Chat GPT 直接可以在对话中发送邮件了,真是方便啊!
OpenAI产品更新
06:29
Rohan Paul@rohanpaul_ai
精选76
Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。

Arena.ai: Introducing Agent Arena: real-world agentic evals at scale. How do you evaluate agents doing actual work? We measure mil...

智能体AnthropicOpenAI评测/基准

推荐理由:Arena 跳出了刷榜逻辑,用真实用户的多轮交互来评估 Agent,这比任何 toy benchmark 都更有说服力,选模型做 Agent 应用的可以把它当新指南。
05:37
🚨 AI News | TestingCatalog@testingcatalog
64
OPENAI 🔥:ChatGPT 现在可以直接从对话中发送电子邮件!AI 将包裹整个互联网 👀
OpenAI产品更新
‹ 上一页
1…1415161718…50
下一页 ›