AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2159 条
全部一手资讯X论文
标签「OpenAI」清除
ginobefun@hongming731 · 5月2日63

http://x.com/i/article/2050470671755730944 # BestBlogs 周刊第 93 期 · AI 次方变革 > 本期主题:把 AI 放到指数位上,而不是加号边上 —— 用杨斌的「AI 次方变革」串起 Karpathy 的 Software 3.0、Demis 的 AGI 路径、国内三家大厂的 Harness 中文化、Anthropic 两份 Claude Code 工程心法、OpenAI 编排栈、企业生产实战,以及 OpenAI × 微软的关系新阶段。🎧 同步播客:BestBlogs 周刊第 93 期 · AI 次方变革(在小宇宙搜索 BestBlogs 周刊)📚 完整周刊:https://www.bestblogs.dev/newsletter/issue93 ## 导语:组织的中年撞上技术的青春期 清华经管学院杨斌教授本周提出 AI 次方变革 —— 把 AI 放到指数位上,而不是加号边上。 「+AI」的心智追求即期绩效、主流一致、线性稳进,但 AI 不是一种成熟工具,它每天都在变;底数(组织 / 心智 / 知识)如果没有先质变,幂位再怎么放大也没用。底数小于一时,幂位甚至会让结果塌陷。 这一期读完 20 篇内容,杨斌这个隐喻像一根串绳:Karpathy 在 Sequoia 给出 Software 3.0 的完整框架,Demis 在 Y Combinator 把 AGI 时间表压到 2030,国内三家大厂同周给出 Harness Engineering 的中文版第一性原理,Anthropic 把 Claude Code 的两份内部经验贴出来,OpenAI 把 Codex 编排栈打开,京东和 Java 阵营把企业实战补齐。这些动作放在一起看,像同一句话被翻译成不同口音在不同地方反复说。 回头看前两期周刊,第 91 期是基建周,第 92 期是模型周。这一期不再是单一爆发,而是大家集体在往同一个方向上汇拢 —— 从 +AI 走向 AI 次方。 ## 个人更新:BestBlogs 四月内测收官,五月进入早鸟期 四月份 BestBlogs 的内测正式收官。这一个月里我们做了挺多事情,挑用户能感知的几条说一下: 1. 开放能力发布(v2.0.7):上线 OpenAPI、命令行工具 @bestblogs/cli、还有给 Claude Code 这类智能体准备的 skills 套件,让外部开发者可以直接调用站内数据和功能。 1. 内建翻译升级到 v2(v2.1.0):同一篇内容只扣一次配额,中英双向,覆盖文章 / 播客 / 视频。文章和推文详情页可以直接读译文,不再需要跳转 wenrun.ai。 1. 每日回顾上线(v2.0.11 + v2.1.1):AI 根据你当天的阅读足迹提炼洞察,可邮件投递。Pro 内测用户每天会收到一封中英双语的 Daily Review。 1. 主题深度解读(v2.1.0 + v2.1.3):上线 Topic Pages,目前支持事件、领域、人物 / 组织、对比四种类型,编辑可以把最值得读的主题置顶。 1. Pro 早报双形态(v2.1.0):文字版(一句话总结 + 关键洞察 + 头条卡片)和播客版可以即时切换,喜欢扫读的有了文字版,喜欢通勤听的还是播客版。 此外还上线了公开 /docs 文档中心和 Mobile App 内测。完整更新日志在 bestblogs.dev/changelog。 五月开始,BestBlogs 正式进入早鸟期,欢迎大家订阅、使用,把反馈直接告诉我。 ## 一、三个理论框架:杨斌、Karpathy、Demis 同周给出三种语言 这一周最有意思的地方是,三个完全不同背景的人,几乎在同一周给出了同一种判断的不同版本。 杨斌:组织的中年撞上技术的青春期 杨斌教授的版本最直接。他说「+AI」是组织的中年心智,追求即期绩效、主流一致、线性稳进。这种心智把 AI 当成现有流程的一个有益补充,不挑战既有的权力分布,也不挑战既有的文化假设。 但 AI 不是一种成熟工具,它每天都在变。如果底数没有先发生质变,幂位再怎么放大都没有用。底数小于一时,幂位甚至会让结果塌陷。 正确的做法是把 AI 放到指数位上 —— 破执重构​,让组织从大写变小写,让主流让位给杨斌说的「流人和边域​」。他在演讲里点名 Claude Code 和 OpenClaw 这两个产品,说它们都是流人作品,都是在边缘环境里长出来的,不是被规划出来的。 这一点和涌现的本质相关:涌现不能被计划,但有规律。杨斌引用了两句英文:context not control,emerging not planning。情境而不是控制,涌现而不是计划。 → 阅读原文:杨斌:我为什么要提「AI 次方变革」 Karpathy: Software 3.0 + Vibe Coding + Agentic Engineering Karpathy 在 Sequoia 现场给硅谷版的「AI 次方」搭了一套完整语言。他把过去的程序员演化拆成三段: - Software 1.0:人类用代码显式写规则 - Software 2.0:用神经网络的权重学规则 - Software 3.0​:大语言模型变成计算机本身,上下文窗口变成新的接口。在这个范式里,编程不是写代码,是设计上下文 然后他给了两个新词。Vibe Coding 是抬高地板,让所有人都可以靠描述意图做出软件。Agentic Engineering 是给智能体保持质量和边界,因为这些智能体本质上是有锯齿(spiky)、有概率性的工程实体,需要被驯服。 Karpathy 在访谈里有一句话我印象很深:You can outsource your thinking, but you can't outsource your understanding。未来的程序员是 director,是导演,是那个决定 taste 和 systems design 的角色,那部分是不可被外包的。 → 阅读原文(中文整理):Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering → 视频原始版:Andrej Karpathy: Software 3.0 完整框架 Demis Hassabis:AGI 还差什么 + 创业者怎么办 Demis Hassabis 在 Y Combinator 现场,从科学家的角度回答 AGI 还差什么。他把 AGI 时间表压到大概 2030 年,并且明确指出还差三块「大想法」: 1. 持续学习(Continual Learning):模型要能在不忘旧知识的情况下持续吸收新知识 1. 长程推理(Long-term Reasoning):从简单的链式思考升级到能做计划和自省的更稳健推理 1. 类脑工作记忆(Brain-style Working Memory):从蛮力堆上下文窗口升级到更接近人脑的高效记忆 Demis 给创业者的建议很硬:假设 AGI 会在你公司生命周期的中段出现​。所以产品要去截击 AI 曲线​,去那些「暴力搜索失效但 AI 推理擅长」的组合空间,比如材料科学、医药、Isomorphic Labs 在做的虚拟细胞。不要去和「AGI + 一行 prompt」竞争,那条路是没有壁垒的。 → 阅读原文:How to Build the Future: Demis Hassabis 把这三个人的话叠在一起,会发现一个共同信号 —— 新范式的关键不是模型本身,是组织怎么改、人在哪里、产品打哪个空间。杨斌讲的是组织的底数得先质变,Karpathy 讲的是程序员要变成导演,Demis 讲的是产品要去截击曲线。三个人从三个层面回答同一个问题。 ## 二、Harness Engineering 中文化:四篇同周给出第一性原理 有了框架,看落地。这一周国内三家大厂几乎同步给出了 Harness Engineering 的中文版第一性原理,加上腾讯云开发者那篇挑衅式的「RAG 已死」,构成了本周最密集的一组中文 Agent 工程化讨论。 楼天城:开发主导权正在交给 AI 最让我意外的是小马智行 CTO 楼天城接受量子位的访谈。一个开发自动驾驶十年的人,公开承认开发的主导权正在交给 AI。原文里他用了一句话: > Harness 是这个时代最关键的能力之一。 他把今天的 AI 形容成一匹脱缰野马,能调用工具、能调用各种 skill,主动性和能量都在大幅提升。然后他抛出一个让人停下来想一下的判断:未来甚至连人类,都可能成为被「调用」的一环。 这一段听起来有点黑色幽默,但他的逻辑是直的 —— L4 级自动驾驶不能靠人类兜底,模仿学习的天花板就是人类本身。当 AI 司机的安全性全面超过人类,再让人类工程师手把手教 AI 开车,就像让业余棋手去辅导 AlphaGo。这是范式问题,不是态度问题。 → 阅读原文:量子位专访楼天城:AI 是匹脱缰野马,Harness 是这个时代最关键的能力 腾讯:Harness 不是目的,知识才是护城河 腾讯技术工程团队再上一层定义:Harness 不是目的,知识才是护城河。这个判断把抽象提了一级。 Harness 是工程实现,是 SOP 和 Skill 库的集合。但真正决定一个团队能不能持续受益的,是这套 Harness 背后能沉淀什么知识。腾讯给出的是一个从 SOP 到 Skill 库的工程交付路线,描述了一个团队怎么把每天踩的坑沉淀成可复用的能力。 → 阅读原文:Harness 不是目的,知识才是护城河 —— 一个 AI 工程交付团队的知识沉淀实践 阿里云:拆 OpenClaw 的 Agent 架构,三条反直觉结论 阿里云开发者用一篇长文系统拆 OpenClaw 的 Agent 架构。这篇文章值得做 Agent 的同学读,因为里面有几个反直觉结论: 1. 更贵的模型没你想象中那么有用,Harness 和验证测试的质量对成功率的影响更大 1. 调试 Agent 行为时,应该优先检查工具定义 —— 多数工具调用错误来自描述不准确,不是模型不够聪明 1. 评测系统本身的问题,往往比 Agent 的问题更难发现。如果一直在 Agent 代码上调,效果可能上不去 → 阅读原文:你不知道的 Agent:原理、架构与工程实践 腾讯云:RAG 已死?不,是 Grep 回归了 最后是腾讯云开发者那篇 RAG 已死?不,是 Grep 回归了! 标题挑衅,但论点扎实。 作者的判断是:高质量的 Skill 和工具描述比向量索引更值钱。当模型本身越来越强,长上下文越来越便宜的时候,传统 RAG 那套切片、向量化、相似度召回的复杂度就显得多余。直接用 Grep,用关键字搜索,加上准确的工具描述,效果反而更好。 这其实和阿里那篇结论是相通的,都指向同一件事 —— 工具描述和 Harness 比模型选型更重要。 → 阅读原文:RAG 已死?不,是 Grep 回归了! 把这四篇放在杨斌的框架下看,就是底数的质变。组织如果还在比谁的模型更贵,那就是把变革放在加号位上。组织如果开始研究 Harness、研究知识沉淀、研究工具描述,那就是开始把变革放在指数位上。 ## 三、Anthropic 两连发:Claude Code 心法 + 提示缓存 这一周 Anthropic 官方贴了两份 Claude Code 团队的内部经验,正好补上了 Karpathy 没回答的工程细节。 像带新人一样引导 Claude Code 第一篇用了一个真实案例。MacCoss Lab 是华盛顿大学的一个蛋白质分析实验室,他们的开源软件 Skyline 已经维护了 17 年,70 万行 C# 代码。主开发者 Brendan 一开始很怀疑 Claude Code 能不能搞定这种长寿命项目。 最后他想清楚了一件事:自己过去十几年带本科生、研究生、博士后进入这套代码库,那一整套 onboarding 方法论,可以原封不动地用在 Claude Code 上。先给「实验室手册」,再交工作任务。把 AI 当作一个新进研究员来带,而不是当成一个魔法盒子。 这一篇值得做工程的同学读。它没有讲什么新概念,但它把心法落到了具体场景。 → 阅读原文:像带新人一样引导 Claude Code:来自 17 年开发经验的启示 提示缓存对 Coding Agent 至关重要 第二篇是 Claude Code 团队自己的复盘:提示缓存对编程智能体是至关重要的,命中率直接决定了一个长程任务能不能跑稳。 这听起来很工程,但它其实是一个范式判断 —— 当智能体要持续可靠地干完长任务,关键变量不是模型本身的智能,而是它能不能稳定地保留上下文。提示缓存就是这个稳定性的最直接来源。 两篇加起来,把 Karpathy 留下的工程黑盒打开了。 → 阅读原文:构建 Claude Code 的经验教训:提示缓存至关重要 ## 四、OpenAI 编排栈 + Cloudflare:让 Agent 上手干活 聊完心法,看落地的几条路径。 OpenAI 把 Codex 编排栈打开 OpenAI 这一周三件事可以放在一起看: 1. Symphony:把 Codex 多智能体编排做成开源规范 → 阅读原文 1. AI Engineer 现场拆解 Codex 子智能体:把 OpenAI 的 AI 工程平台从 IDE 里拎出来 → 阅读原文 1. 长时间运行的智能体(Elevate):补另一面 —— 让 Agent 持续可靠干完长任务,要从持久化、子线程、检查点设计起 → 阅读原文 这一组三篇组合起来,像极了 Cloudflare 上一期做的「Agent 基建周」,只不过这次是 OpenAI 在做。 Cloudflare:Agent 自己开户、买域名、部署应用 这一期 Cloudflare 的代表作是一个干净的 one-shot 演示 —— AI Agent 能自己创建 Cloudflare 账户、买域名、把 Workers 部署上线。背后有 Managed OAuth + Mesh 撑起私有联网。 这件事小,但意义大。它把「Agent 上手干活」从 demo 推到了生产入口。Software 3.0 真正能跑的标志,不是 Agent 能写多少代码,而是 Agent 能不能从注册账户开始,把整个交付流水线走完。 → 阅读原文:AI 智能体现在可以创建 Cloudflare 账户、购买域名并部署应用 ## 五、企业生产实战:京东 GRAM + Java MCP 两篇值得说,是企业版的「AI 次方」基础设施。 京东 GRAM:50ms 端到端的生成式推荐 京东广告团队披露 GRAM 架构 —— 他们把生成式推荐做到了端到端 50 毫秒​。这是什么概念呢,50 毫秒是用户感知不到的延迟。在电商场景下,把「模型即推荐系统」这个判断打了第一个范本。 这背后涉及到训练侧的稀疏化、推理侧的工程化、还有大量的算子优化,是真正的工程硬功夫。 → 阅读原文:京东广告大模型实战:GRAM 架构如何在 50ms 内完成生成式推荐? Java 世界中的 MCP:把 LLM 集成提升到架构纪律 InfoQ 的长文,讲 Java MCP SDK​。这篇文章我推荐 Java 同学读一下。它的视角是把 MCP 看作架构纪律,不是 prompt 工程: - 显式契约:Models 只调用通过协议声明的工具 - 反腐败层:MCP Server 在 LLM 和核心系统之间隔一层,控制能力暴露范围 - 控制平面:把 LLM 集成放进 Spring 和 JVM 团队熟悉的服务边界、可观测性、资源管理体系里 它不是教你写 MCP 代码,是教你把 LLM 集成放进企业架构的那条线里。 → 阅读原文:Java 世界中的 MCP:为 LLM 集成带来架构策略 ## 六、范式思辨:Skill 蒸馏、Language Agent 60 年史、智能体失败案例 Skill 到底能蒸馏我们的几分之几? 腾讯科技的这篇文章,从 GitHub 上一批 skill 类项目的爆火谈起。三月底同时火起来的有「同事 skill」「老板 skill」「女娲 skill」 —— 同事 skill 把离职同事的飞书消息、钉钉文档、Slack 记录、微信聊天都喂给 Claude,自动生成一个 skill 文件。装上之后 AI 能「变成」那个同事,连说话语气都模仿。 然后 CMU 出了一篇论文,跑出来 SkillFoundry,一次扫一遍 GitHub 仓库、API 文档、Jupyter Notebook、学术论文,挖出 286 个 skill。BenchFlow 团队的 SkillsBench 测了 84 个任务,加 Skill 后平均通过率提升 16.2 个百分点。 但同一周还出现了一个反向项目 anti-distill​,帮你生成一份看起来完整、核心知识却被掏空的 skill 文件。作者追问的问题是:那层能被掏空的是什么,那层掏不空的又是什么? 这个问题没有答案,但值得每个内容工作者放在心里。 → 阅读原文:严肃聊聊,Skill 到底能蒸馏我们的几分之几? 张小珺 × 苏煜:Language Agent 60 年技术史 张小珺这一期访谈,嘉宾是俄亥俄州立大学的苏煜教授。两个小时的长对谈,把 Language Agent 60 年的技术史复盘了一遍 —— 从 1960 年代的逻辑代理,到神经代理、语义解析,再到今天的语言代理。 苏煜给出一个判断:OpenClaw Moment 像 ChatGPT Moment。意思是 OpenClaw 的出现,可能是 Agent 时代的那个分水岭。这一期我推荐五一假期听,节奏不快,信息密度大。 → 阅读原文:139.【Agent 综述】和苏煜聊 Agent 技术史、OpenClaw Moment、边界的消弭和社会的辐射 PostHog:LLM 代码生成的五条修法 PostHog 的 Danilo 在 AI Engineer 现场分享了一个智能体的失败案例。他们做的 Wizard 是一个一个月服务 15,000 用户的自动化集成助手,模型很容易因为静态训练数据过期而搞砸事情。 Danilo 给了五条修法: 1. 新鲜上下文:把最新的 Markdown 文档直接注入上下文(避开复杂 RAG) 1. 模型飞机:用简化版的真实应用做模板 1. 面包屑:把大任务拆成顺序步骤 1. 推理时审讯:每次跑完问 Agent「我应该怎么做才能让你成功?」 1. prose > scaffolding:纯文本散文比脚手架代码更值钱 最后一条留下一句话挺有力 —— 在 AI 时代,文档质量是面向未来的资产,硬编码的逻辑是在折旧。 → 阅读原文:LLM 代码生成为什么会失败,以及如何避免 ## 七、商业重构:OpenAI 与微软的新阶段 OpenAI 和微软这周宣布了一个重要的合作新阶段。新协议把双方关系从独占走向灵活。三件事可以注意: 1. OpenAI 产品仍然优先在 Azure 上发布,但现在可以服务任何云供应商 1. 微软对 OpenAI 知识产权的授权,从独占改成非独占,同时微软不再向 OpenAI 支付收入分成 1. 微软作为大股东继续参与 OpenAI 的增长,OpenAI 到 2030 年仍按比例向微软分成(有总额上限) 这是过去两年商业重构里最值得记下的一笔。OpenAI 走向「基础设施级」独立的关键一步迈出去了。 → 阅读原文:微软与 OpenAI 合作的新阶段 ## 写在最后:本周三条判断 整理一下我自己读完这一周内容的判断。 第一,杨斌的「AI 次方变革」不是又一个 buzz word,是给企业的一个很有用的提醒。如果你团队还在讨论怎么让大模型给现有流程加分,那就是把 AI 放在加号位上。如果你团队开始讨论 Harness、知识沉淀、工具描述,那就是开始把 AI 放在指数位上。 第二​,Karpathy 的 director 比喻和 Demis 的「截击 AI 曲线」建议,加上国内三家大厂的 Harness 中文化,这一组信号让我相信 Agentic Engineering 已经从概念阶段进入工程阶段。下一阶段比拼的不是谁的模型更强,而是谁的工程纪律更扎实。 第三,Anthropic 那篇「带新人」的故事我会推荐给所有团队的同学读一下。它没有讲什么 cutting edge 的东西,但它把心法落到了你今天就能用的实践里。 完整 20 篇精选:https://www.bestblogs.dev/newsletter/issue93 订阅 BestBlogs Pro,每天早上收到双语早报,五月起进入早鸟价:https://www.bestblogs.dev 保持好奇,我们下周见。

译本期核心观点是应将AI视为驱动根本性变革的“指数”,而非线性补充工具。杨斌教授指出,组织心智与知识底数需先质变,否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文,程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年,并指出持续学习与长程推理是关键缺口,建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调,驾驭AI(Harness)与知识沉淀是关键能力。

Sam Altman@sama · 5月2日15

we will plan bigger parties for future releases. a lot more people wanted to come than we expected. thank you! gonna try to think of a really good idea for the next one.

译我们计划为未来的版本发布举办更盛大的派对。 想来参加的人数远超我们的预期。谢谢! 会努力为下一次活动构思一个绝佳的点子。

Sam Altman@sama · 5月2日23

/hatch clippy

译孵化clippy

Tibo@thsottiaux · 5月2日44

It's also become super good after all the @steipete cooking over the last week or so. I've had the best experience with GPT-5.5 so far, it's night and day compared to two weeks ago.

译经过过去一周左右@steipete的精心调教,它也变得更棒了。到目前为止,我在GPT-5.5上获得了最佳体验,与两周前相比简直是天壤之别。 [引用 @sama]:你现在可以用chatgpt账户登录openclaw,并在那里使用你的订阅了! 捕龙虾快乐。

歸藏(guizang.ai)@op7418 · 5月2日44

Codex 也上了宠物功能 /pet 开启

swyx 🇸🇬@swyx · 5月2日48

small milestone: uninstalled the chatgpt app. codex is strict superset now! found something cool - among frontier models, @xai @grok 4.30 is the most intelligence per dollar you can get, beating even open models like MiMo, Kimi, and DeepSeek. numbers pulled from @ArtificialAnlys

译一个小里程碑:卸载了 chatgpt 应用。 codex 现在是严格的超集了! 发现一个很酷的事情——在前沿模型中,@xai @grok 4.30 是你能获得的每美元智能最高的,甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。 数据来自 @ArtificialAnlys

Peter Steinberger 🦞@steipete · 5月2日18

told codex I had to pay up to make @xai work again.

译我告诉codex我必须付钱才能让@xai重新工作。

OpenRouter@OpenRouter · 5月2日35

Notice: there’s a bug in this Azure data that we’re working on correcting, due to a change in their error shapes upstream. But gpt5.5 is seeing a lot of growth!

译注意:由于上游错误形状的变更,此 Azure 数据中存在一个我们正在修复的错误。 但 gpt5.5 正呈现显著增长!

meng shao@shao__meng · 5月2日57

OpenAI Codex 也有陪伴宠物 (Pets) 了,内置了 8 种宠物,支持自定义 启用与切换 Pet 的三种方式 · 在 Settings → Pets 中选择内置宠物,或从本地 Codex home 目录刷新加载自定义宠物 · 在输入框中输入 /pet · 按 Cmd+K / Ctrl+K 调出命令面板,运行 Wake Pet 唤出,或 Tuck Away Pet 收起 真正的价值:状态可视化的"环境感知" Pets 区别于普通装饰组件的关键。当你切换到其他应用时,宠物悬浮层会持续呈现: · 当前活跃线程是哪个; · Codex 现在处于运行中 / 等待输入 / 等待审阅的哪种状态; · 与状态对应的简短进度提示,让你不打开线程也能扫一眼知道进展。 换句话说,宠物承担了一个异步任务的环境指示器角色,让长耗时 agent 任务在后台依然"可见"。 创建自定义宠物:通过 hatch-pet skill skill 化的创作链路: $ skill-installer hatch-pet 安装完后需要在命令面板(Cmd+K / Ctrl+K)中执行 Force Reload Skills 重新加载 skill,然后调用: $ hatch-pet create a new pet inspired by my recent projects skill 会基于你最近项目的语境生成专属宠物。这意味着 Pets 不只是皮肤,而是接入了 Codex skill 体系的可扩展产物。

译OpenAI Codex 推出Pets功能,提供8种内置宠物并支持自定义。用户可通过设置、输入/pet或命令面板启用。其核心价值在于“环境感知”:宠物悬浮层能持续显示当前活跃线程、Codex运行状态(如运行中或等待输入)及进度提示,充当异步任务的环境指示器,使后台长耗时任务保持可见。自定义宠物通过hatch-pet skill实现,该skill能基于用户项目语境生成专属宠物,表明Pets是接入Codex skill体系的可扩展功能,而非简单装饰。官方推文确认该功能已集成,用户可使用/pet指令唤醒宠物。

Sam Altman@sama · 5月2日71

you can sign in to openclaw with your chatgpt account now and use your subscription there! happy lobstering.

译现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。

Nathan Lambert@natolambert · 5月2日68

Whether or not intentional this has collateral damage turning people against open models. Has been pretty obvious to see it playing out.

译无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

François Chollet@fchollet · 5月2日56

The latest crop of models remains below 1% on ARC-AGI-3 -- for now. Where will the scores be by the end of the year?

译最新一批模型在ARC-AGI-3上的得分目前仍低于1%。 到今年年底,得分会达到多少呢?

Tibo@thsottiaux · 5月2日22

Please don't pronounce Codex, COD-ex. We are also not a fish.

译请不要把 Codex 念成 COD-ex。我们也不是一条鱼。

Chubby♨️@kimmonismus · 5月2日18

I've never seen @sama tweet as much as in the last few days.

译我从未见过@sama像最近几天这样频繁发推。

Rohan Paul@rohanpaul_ai · 5月2日54

Sam Altman: "We're going to see 10 person billion-dollar companies pretty soon. In my little group chat with CEO-friends, there's this One-person billion-dollar company, which would have been unimaginable without AI, and now it'll happen."

译Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的“点子哥”现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Sam Altman@sama · 5月2日19

its weird how much i want to get something to run for the record longest

译很奇怪我有多想为了创纪录的最长时间而运行某个东西

Sam Altman@sama · 5月2日30

ok its not the most important thing we've ever done but i find it more useful than it seems on the surface. check out pets in codex! (and try hatching one)

译好吧,这虽然不是我们做过最重要的事,但我发现它比表面看起来更有用。 去看看 Codex 里的宠物吧! (试试孵化一个)

TestingCatalog News 🗞@testingcatalog · 5月2日40

OpenAI is working on a Custom Dictionary feature for Codex and ChatGPT. Users will be able to add their common phrases and abbreviations so they are properly recognized during voice dictation. As a heavy voice-dictation user, this is the main feature that made me pay for a separate AI voice-dictation app. Everything app 👀

译OpenAI正在为Codex和ChatGPT开发自定义词典功能。 用户将能够添加自己的常用短语和缩写,以便在语音听写时正确识别。 作为重度语音听写用户,这是让我愿意付费购买独立AI语音听写应用的主要功能。 万能应用👀

François Chollet@fchollet · 5月2日70

RL is a bit of a double edged sword: in known territory performance increases, but in unknown territory the model tends to hallucinate that it is performing a completely different task it was trained on

译强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

OpenAI Developers@OpenAIDevs · 5月2日60

To create your own pet, install the hatch-pet skill:

译要创建你自己的宠物,请安装hatch-pet技能:

TestingCatalog News 🗞@testingcatalog · 5月2日53

OpenAI made it easier to switch to Codex, as now you can import settings, plugins, agents, and project configuration from other tools. At launch, Codex will also automatically detect new configs and suggest importing them. ALLYOURCONFIGSBELONGTOUS 👀

译OpenAI 让切换到 Codex 变得更简单,因为现在你可以从其他工具导入设置、插件、代理和项目配置。 发布时,Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

OpenAI@OpenAI · 5月2日68

Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so you can keep working with fewer interruptions. Your move.

译只需点击几下,即可将您的工作流程带入Codex。 导入设置、插件、代理、项目配置等,以便您能更少中断地继续工作。 该您行动了。

OpenAI Developers@OpenAIDevs · 5月2日64

It’s really that easy.

译就是这么简单。

Tibo@thsottiaux · 5月2日47

Hatch a pet now in a codex app near you. It makes me actually more productive too by having the context follow me around as I multitask. Please no comments on us having too much fun, we are also working on capability maxing 👀

译立即在你附近的Codex应用中孵化一只宠物。它让我的工作效率更高,因为当我同时处理多项任务时,上下文会一直跟随我。 请不要评论我们玩得太开心,我们也在努力提升能力上限👀

Greg Brockman@gdb · 5月2日45

such a fun launch — try "/pet hi" in Codex app:

译真是个有趣的发布 — 在 Codex 应用中试试 "/pet hi":

TestingCatalog News 🗞@testingcatalog · 5月2日54

OPENAI 🚨: Codex now has Pets! Pets are overlay avatars that live on your desktop. 8 predefined pets are available, and users can also use skills to generate custom pets! Choose your pokemon 👀

译OPENAI 🚨:Codex 现在拥有宠物了!宠物是生活在您桌面上的叠加头像。 有 8 种预定义的宠物可供选择,用户也可以使用技能生成自定义宠物! 选择您的宝可梦 👀

Sam Altman@sama · 5月2日33

you know what all of these "which is better" polls are silly use codex or claude code, whatever works best for you i am grateful we live in a time with such amazing tools, and grateful there is a choice

译你知道吗 所有这些“哪个更好”的投票都很傻 用 Codex 或 Claude Code,哪个对你最有效就用哪个 我很感激我们生活在拥有如此神奇工具的时代,也很感激能有选择

Peter Steinberger 🦞@steipete · 5月2日49

The new /goal feature in codex slaps.

译codex 中的新 /goal 功能太棒了。

OpenAI Developers@OpenAIDevs · 5月2日39

Pets. Now in Codex. Use /pet to wake your pet.

译宠物。现已登陆Codex。 使用 /pet 唤醒你的宠物。

OpenAI Developers@OpenAIDevs · 5月2日42

Your pet can keep an eye on what Codex is doing while you keep working:

译你的宠物可以帮你留意Codex的动态,而你继续工作: [引用 @simpsoka]:周五来点小乐趣!和@Rjdleee合作这个项目超级开心。 宠物为Codex增添了些许奇趣,同时也很有用。它能在边缘位置提供更多关于Codex运行状态的信息。 我实在没忍住,必须做个Max Headroom宠物。:)

Tibo@thsottiaux · 5月2日10

Feeling codexy today (but in a fun way)

译今天感觉有点代码感(但是以一种有趣的方式)

OpenAI@OpenAI · 5月2日76

One week since the launch of GPT-5.5, and it’s already our strongest model launch yet. API revenue is growing more than 2x faster than any prior release, while Codex doubled revenue in under seven days as enterprise demand for agentic coding tools keeps climbing.

译GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。

Chubby♨️@kimmonismus · 5月2日41

I think Sam Altman's point is quite accurate in this respect. There will be disruption, social changes brought about by AI, and this isn't being discussed enough. It's something I'd like to research further. The social transformation is already underway. The question is how (!) we can ensure and guarantee a good life for everyone.

译作者赞同Sam Altman的观点,认为AI带来的社会变革与冲击尚未被充分讨论,且转型已在进行中。核心问题在于如何确保每个人在未来都能拥有良好的生活。引用推文补充指出,尽管转型期会出现岗位更替与工作形态剧变,但长期来看,人们可能比以往更忙碌且充实,对就业的悲观预测可能是错误的。

Greg Brockman@gdb · 5月1日28

Codex as the everything productivity app

译Codex 作为全能生产力应用 [引用 @TinaDebove]:Codex 重新定义了我的工作流程,以至于我可能需要买一台新机器 去年我买了一台36GB M4 Pro MBP,以为它是个火箭船。 现在我可以使用 Codex 在4个应用之间来回工作,而不是在它构建或思考时刷 Twitter(🤡) 随着 visionOS 模拟器运行多个应用、2个 Xcode 项目、2个 Reality Composer Pro 项目、Docker 构建和数十个标签页,Mac 已经跪了 疯狂的时代

elvis@omarsar0 · 5月1日41

I often don't agree with Sam Altman, but I appreciate this tweet. You can believe it. But it's important to also say it. So many of the AI narratives are around job doomerism, which I find outright lazy and dishonest. Let's all try to build AI and tooling to elevate and augment us. I feel like it's the more challenging path, but it feels right. Most of the AI models and harnesses are not built like that today. But it doesn't mean we can't mold it to help augment the work we do. Wrote more about this here: https://x.com/omarsar0/status/2043771925621572089?s=20 Terence Tao's "Copernican view of intelligence" feels right, and it's totally achievable with proper alignment and effort.

译作者赞赏Sam Altman的推文,其中强调“构建工具以增强和提升人们,而非取代他们”。作者批评当前AI叙事中常见的工作毁灭论是懒惰且不诚实的,主张应努力构建AI和工具来提升和增强人类,这虽更具挑战性但方向正确。尽管目前大多数AI模型和工具并非如此设计,但通过适当的对齐和努力,可以将其塑造为辅助人类工作的力量。Terence Tao的“Copernican view of intelligence”支持这一愿景,并认为其完全可实现。

Sam Altman@sama · 5月1日36

we want to build tools to augment and elevate people, not entities to replace them.

译我们想要构建的是增强和提升人类的工具,而非取代他们的实体。

Berryxia.AI@berryxia · 5月1日50

“ChatGPT,你陪我段时间了,我想看看你的样子。请成一张类似你iPhone随拍的照:没有明确主题、没有刻意构图,只是很普通、甚至有点失败的快照。照略带运动模糊,光线不均、轻微曝光过度,角度尴尬,构图混乱,整体呈现出一种“过于真实的随手一拍感",就像是从口袋里拿出手机不小心按到的自拍。”

译用户在与ChatGPT互动后,提出生成一张照片的请求,要求模拟iPhone随拍风格。照片需无明确主题和刻意构图,呈现普通甚至失败的外观,包括运动模糊、光线不均、轻微曝光过度、角度尴尬和构图混乱。整体追求一种“过于真实的随手一拍感”,类似于意外拍摄的快照,以探索ChatGPT的图像生成能力。

向阳乔木@vista8 · 5月1日62

如果你用Codex,很多人都提到: 同一个Session同时做"生成设计图"和"开发应用"两件事,效果会打折扣。 GPT-5.5 有时候会把生成的设计图当成"参考灵感",而不是"严格设计规范",最终实现的界面和设计图会有偏差。 推荐做法是分两个会话来做: 先在一个会话里生成设计图,拿到满意的结果之后,开一个新会话。 把图片作为输入,明确要求"像素级还原"。

译使用Codex等AI工具时,在同一会话中同时处理“生成设计图”和“开发应用”两项任务可能导致效果下降。例如,GPT-5.5有时仅将生成的设计图视为“参考灵感”,而非“严格设计规范”,致使最终实现界面与设计图存在偏差。推荐的优化方法是采用两个独立会话:首先在一个会话中生成并确认满意的设计图;随后开启新会话,将图片作为输入,并明确要求“像素级还原”设计,以此确保开发结果与设计意图高度一致。

Ethan Mollick@emollick · 5月1日62

New paper (on an old AI) tests o1 against doctors on medical benchmarks & real ER cases: “across a variety of scenarios and applications, the large language model outperformed both human physicians and older models” The potential suggests an “urgent need for prospective trials.”

译新论文(关于旧式人工智能)在医学基准测试和真实急诊病例中将o1与医生进行对比:"在各种场景和应用中,大型语言模型的表现均优于人类医生和旧版模型" 该潜力表明"迫切需要前瞻性试验"。

Greg Brockman@gdb · 5月1日51

codex for the little things that you would otherwise spend lots of time on

译用户分享使用Codex的Computer Use功能处理家庭日程管理的实际体验。与常见的点餐、购物等代理任务不同,该功能能高效解析并录入复杂日程信息,例如将儿子数月的小联盟赛程和女儿游泳比赛截图中的日期、时间、地点等信息自动添加到Apple Calendar中。这一应用虽非革命性,但切实节省了数小时的手动录入时间,体现了AI在自动化琐碎事务上的实用价值。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月2日
15:11
ginobefun@hongming731
63
BestBlogs 周刊第 93 期 · AI 次方变革

本期核心观点是应将AI视为驱动根本性变革的“指数”,而非线性补充工具。杨斌教授指出,组织心智与知识底数需先质变,否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文,程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年,并指出持续学习与长程推理是关键缺口,建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调,驾驭AI(Harness)与知识沉淀是关键能力。

智能体AnthropicOpenAI推理
12:19
Sam Altman@sama
15
我们计划为未来的版本发布举办更盛大的派对。 想来参加的人数远超我们的预期。谢谢! 会努力为下一次活动构思一个绝佳的点子。
OpenAI大佬观点
10:48
Sam Altman@sama
23
孵化clippy
OpenAI产品更新
10:19
Tibo@thsottiaux
44
经过过去一周左右@steipete的精心调教,它也变得更棒了。到目前为止,我在GPT-5.5上获得了最佳体验,与两周前相比简直是天壤之别。 【引用 @sama】:你现在可以用chatgpt账户登录openclaw,并在那里使用你的订阅了! 捕龙虾快乐。

Sam Altman: you can sign in to openclaw with your chatgpt account now and use your subscription there! happy lobstering.

OpenAI现象/趋势
10:13
歸藏(guizang.ai)@op7418
44
Codex 也上了宠物功能 /pet 开启
OpenAI产品更新
09:49
swyx 🇸🇬@swyx
48
一个小里程碑:卸载了 chatgpt 应用。 codex 现在是严格的超集了! 发现一个很酷的事情--在前沿模型中,@xai @grok 4.30 是你能获得的每美元智能最高的,甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。 数据来自 @ArtificialAnlys
OpenAIxAI大佬观点编码
09:48
Peter Steinberger 🦞@steipete
18
我告诉codex我必须付钱才能让@xai重新工作。
OpenAIxAI其他
09:48
OpenRouter@OpenRouter
35
注意:由于上游错误形状的变更,此 Azure 数据中存在一个我们正在修复的错误。 但 gpt5.5 正呈现显著增长!

Matías: @theo 1. What

OpenAI行业动态
08:18
meng shao@shao__meng
57
OpenAI Codex 也有陪伴宠物 (Pets) 了,内置了 8 种宠物,支持自定义

OpenAI Codex 推出Pets功能,提供8种内置宠物并支持自定义。用户可通过设置、输入/pet或命令面板启用。其核心价值在于“环境感知”:宠物悬浮层能持续显示当前活跃线程、Codex运行状态(如运行中或等待输入)及进度提示,充当异步任务的环境指示器,使后台长耗时任务保持可见。自定义宠物通过hatch-pet skill实现,该skill能基于用户项目语境生成专属宠物,表明Pets是接入Codex skill体系的可扩展功能,而非简单装饰。官方推文确认该功能已集成,用户可使用/pet指令唤醒宠物。

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

智能体OpenAI产品更新
07:48
Sam Altman@sama
精选71
现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。
OpenAI产品更新

推荐理由:Sam Altman用一条推文轻描淡写地扔出了OpenAI的新产品OpenClaw,ChatGPT用户可以直接登录用订阅,没发布会没博客,但既然是他亲自发的,大概率是个值得试试的新玩具。
05:48
Nathan Lambert@natolambert
68
无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

Taylor Lorenz: SCOOP: A pro-AI dark money group backed by a powerful super PAC funded by execs tied to Palantir and OpenAI, has been se...

OpenAI大佬观点安全/对齐现象/趋势
05:47
François Chollet@fchollet
56
最新一批模型在ARC-AGI-3上的得分目前仍低于1%。 到今年年底,得分会达到多少呢?

ARC Prize: GPT-5.5 & Opus 4.7 on ARC-AGI-3 - GPT-5.5: 0.43% - Opus 4.7: 0.18% We found 3 failure modes: - True local effect, false ...

AnthropicOpenAI推理评测/基准
05:18
Tibo@thsottiaux
22
请不要把 Codex 念成 COD-ex。我们也不是一条鱼。
OpenAI其他
04:44
Chubby♨️@kimmonismus
18
我从未见过@sama像最近几天这样频繁发推。
OpenAI现象/趋势
04:41
Rohan Paul@rohanpaul_ai
54
Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的"点子哥"现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Rohan Paul: Sam Altman: "There was a time when we used to make fun of the "idea guy," who only had an idea and needed someone techni...

OpenAI大佬观点现象/趋势
04:18
Sam Altman@sama
19
很奇怪我有多想为了创纪录的最长时间而运行某个东西

Peter Steinberger 🦞: The new /goal feature in codex slaps.

智能体OpenAI大佬观点编码
04:18
Sam Altman@sama
30
好吧,这虽然不是我们做过最重要的事,但我发现它比表面看起来更有用。 去看看 Codex 里的宠物吧! (试试孵化一个)
OpenAI产品更新
03:48
TestingCatalog News 🗞@testingcatalog
40
OpenAI正在为Codex和ChatGPT开发自定义词典功能。 用户将能够添加自己的常用短语和缩写,以便在语音听写时正确识别。 作为重度语音听写用户,这是让我愿意付费购买独立AI语音听写应用的主要功能。 万能应用👀

Tibor Blaho: Small but useful new feature in the works in ChatGPT web app - "Custom dictionary" ("Add names or terms you want dictati...

OpenAI产品更新语音
03:47
François Chollet@fchollet
精选70
强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

Chris: GPT-5.5 Scores .43% on ARC AGI 3! - GPT-5.5: 0.43% - Opus 4.7: 0.18% - GPT-5.4: 0.20% - Claude 4.6: 0.45% - Gemini 3.1: ...

OpenAI大佬观点推理评测/基准

推荐理由:Chollet 用 ARC AGI 3 冷冰冰的数字撕开了 RL 的局限,GPT-5.5 0.43% 的得分说明在未知领域模型会做完全不相干的事,比任何安全论文都来得更直击要害。
03:46
OpenAI Developers@OpenAIDevs
60
要创建你自己的宠物,请安装hatch-pet技能:
MCP/工具OpenAI教程/实践
03:18
TestingCatalog News 🗞@testingcatalog
53
OpenAI 让切换到 Codex 变得更简单,因为现在你可以从其他工具导入设置、插件、代理和项目配置。 发布时,Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

OpenAI: Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so ...

OpenAI产品更新编码
03:18
OpenAI@OpenAI
精选68
只需点击几下,即可将您的工作流程带入Codex。 导入设置、插件、代理、项目配置等,以便您能更少中断地继续工作。 该您行动了。
OpenAI产品更新编码

推荐理由:Codex 这个导入功能,把迁移成本降到了最低,对已经在用其他 IDE 的开发者算是个贴心的零门槛入口,虽然不算重大更新,但够实用。
03:16
OpenAI Developers@OpenAIDevs
64
就是这么简单。

OpenAI: Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so ...

智能体OpenAI产品更新编码
02:48
Tibo@thsottiaux
47
立即在你附近的Codex应用中孵化一只宠物。它让我的工作效率更高,因为当我同时处理多项任务时,上下文会一直跟随我。 请不要评论我们玩得太开心,我们也在努力提升能力上限👀

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI产品更新编码
02:47
Greg Brockman@gdb
45
真是个有趣的发布 - 在 Codex 应用中试试 "/pet hi":

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI产品更新
02:18
TestingCatalog News 🗞@testingcatalog
54
OPENAI 🚨:Codex 现在拥有宠物了!宠物是生活在您桌面上的叠加头像。 有 8 种预定义的宠物可供选择,用户也可以使用技能生成自定义宠物! 选择您的宝可梦 👀

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI产品更新
02:18
Sam Altman@sama
33
你知道吗 所有这些"哪个更好"的投票都很傻 用 Codex 或 Claude Code,哪个对你最有效就用哪个 我很感激我们生活在拥有如此神奇工具的时代,也很感激能有选择
AnthropicOpenAI大佬观点编码
02:18
Peter Steinberger 🦞@steipete
49
codex 中的新 /goal 功能太棒了。
OpenAI产品更新编码
02:16
OpenAI Developers@OpenAIDevs
39
宠物。现已登陆Codex。 使用 /pet 唤醒你的宠物。
OpenAI产品更新编码
02:16
OpenAI Developers@OpenAIDevs
42
你的宠物可以帮你留意Codex的动态,而你继续工作: 【引用 @simpsoka】:周五来点小乐趣!和@Rjdleee合作这个项目超级开心。 宠物为Codex增添了些许奇趣,同时也很有用。它能在边缘位置提供更多关于Codex运行状态的信息。 我实在没忍住,必须做个Max Headroom宠物。:)

Kath Korevec: Something a little fun for Friday! This was super fun to work on with @Rjdleee. Pets adds a little more whimsy to Codex,...

OpenAI产品更新编码
01:18
Tibo@thsottiaux
10
今天感觉有点代码感(但是以一种有趣的方式)
OpenAI其他
00:47
OpenAI@OpenAI
精选76
GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。
OpenAI行业动态

推荐理由:GPT-5.5首周收入增速超以往两倍,Codex七天翻番,这是企业市场对agentic coding的真实投票,比benchmark更有说服力。
00:14
Chubby♨️@kimmonismus
41
作者赞同Sam Altman的观点,认为AI带来的社会变革与冲击尚未被充分讨论,且转型已在进行中。核心问题在于如何确保每个人在未来都能拥有良好的生活。引用推文补充指出,尽管转型期会出现岗位更替与工作形态剧变,但长期来看,人们可能比以往更忙碌且充实,对就业的悲观预测可能是错误的。

Sam Altman: i think a lot of people are going to be busier (and hopefully more fulfilled) than ever, and jobs doomerism is likely lo...

OpenAI大佬观点现象/趋势
5月1日
23:46
Greg Brockman@gdb
28
Codex 作为全能生产力应用 【引用 @TinaDebove】:Codex 重新定义了我的工作流程,以至于我可能需要买一台新机器 去年我买了一台36GB M4 Pro MBP,以为它是个火箭船。 现在我可以使用 Codex 在4个应用之间来回工作,而不是在它构建或思考时刷 Twitter(🤡) 随着 visionOS 模拟器运行多个应用、2个 Xcode 项目、2个 Reality Composer Pro 项目、Docker 构建和数十个标签页,Mac 已经跪了 疯狂的时代

Tina Debove ᯅ: Codex redefines my workflow to the point where I should probably buy a new machine Last year I bought a 36GB M4 Pro MBP ...

OpenAI编码行业动态
23:46
elvis@omarsar0
41
反对AI工作毁灭论,倡导增强人类工具

作者赞赏Sam Altman的推文,其中强调“构建工具以增强和提升人们,而非取代他们”。作者批评当前AI叙事中常见的工作毁灭论是懒惰且不诚实的,主张应努力构建AI和工具来提升和增强人类,这虽更具挑战性但方向正确。尽管目前大多数AI模型和工具并非如此设计,但通过适当的对齐和努力,可以将其塑造为辅助人类工作的力量。Terence Tao的“Copernican view of intelligence”支持这一愿景,并认为其完全可实现。

Sam Altman: we want to build tools to augment and elevate people, not entities to replace them.

OpenAI大佬观点现象/趋势
23:17
Sam Altman@sama
36
我们想要构建的是增强和提升人类的工具,而非取代他们的实体。
OpenAI大佬观点
23:11
Berryxia.AI@berryxia
50
用户请求ChatGPT生成真实iPhone随拍照

用户在与ChatGPT互动后,提出生成一张照片的请求,要求模拟iPhone随拍风格。照片需无明确主题和刻意构图,呈现普通甚至失败的外观,包括运动模糊、光线不均、轻微曝光过度、角度尴尬和构图混乱。整体追求一种“过于真实的随手一拍感”,类似于意外拍摄的快照,以探索ChatGPT的图像生成能力。

OpenAI图像生成教程/实践
22:17
向阳乔木@vista8
62
分会话操作提升AI代码生成与设计还原精度

使用Codex等AI工具时,在同一会话中同时处理“生成设计图”和“开发应用”两项任务可能导致效果下降。例如,GPT-5.5有时仅将生成的设计图视为“参考灵感”,而非“严格设计规范”,致使最终实现界面与设计图存在偏差。推荐的优化方法是采用两个独立会话:首先在一个会话中生成并确认满意的设计图;随后开启新会话,将图片作为输入,并明确要求“像素级还原”设计,以此确保开发结果与设计意图高度一致。

OpenAI图像生成教程/实践
21:17
Ethan Mollick@emollick
62
新论文(关于旧式人工智能)在医学基准测试和真实急诊病例中将o1与医生进行对比:"在各种场景和应用中,大型语言模型的表现均优于人类医生和旧版模型" 该潜力表明"迫切需要前瞻性试验"。
OpenAI论文/研究
20:46
Greg Brockman@gdb
51
用户分享使用Codex的Computer Use功能处理家庭日程管理的实际体验。与常见的点餐、购物等代理任务不同,该功能能高效解析并录入复杂日程信息,例如将儿子数月的小联盟赛程和女儿游泳比赛截图中的日期、时间、地点等信息自动添加到Apple Calendar中。这一应用虽非革命性,但切实节省了数小时的手动录入时间,体现了AI在自动化琐碎事务上的实用价值。

Simon Smith: I've never used an agent for the cliches of ordering food, grocery shopping, or booking travel. But I repeatedly use Com...

智能体MCP/工具OpenAI教程/实践
‹ 上一页
1…3839404142…50
下一页 ›