5月30日

04:09

宝玉@dotey

有用户分享使用体验：通过 Codex 调用新的 Claude 4.8 模型并开启最高思考模式查找代码 bug，效果不佳，仅发现一些不重要的问题；而 GPT 5.5 则成功定位了问题。基于此，主推文提出，在面对复杂任务时，最优解法或许不是依赖单一模型，而是让多个模型协同工作。

akazwz: codex 牛逼,我用新的 claude 4.8 找 bug,开了最高的 think, 找了半天搞出来一些不痛不痒的问题。还是 gpt 5.5 比较厉害,真让他找到了。

Anthropic OpenAI 大佬观点

04:08

OpenAI@OpenAI

AI能赋予研究者追求"更疯狂"想法的自由。对陶哲轩而言，AI创造了更多空间去实验、测试意想不到的路径，并发现那些原本可能无法触及的东西。

OpenAI 大佬观点

03:39

宝玉@dotey

我就不理解为什么 Codex 在普通模式下一直不支持 ask__user_question tool，有时候回复 Agent 的问题要手动去写就很烦！

jason: did you wish codex ask__user_question tool was available outside of plan mode

智能体 OpenAI 大佬观点编码

03:38

swyx@swyx

各位，Opus 4.8在编写智能体代码方面非常非常出色（零依赖，全部使用大语言模型第一方SDK，不仅仅是Claude，抱歉了智能体框架们）你们应该试试。我觉得他们把@ErikSchluntz和@barry_zyj的《Building Effective Agents》训练进了这个模型里

智能体 Anthropic 大佬观点

03:34

AYi@AYi_AInotes

Greg Isenberg：模型迭代已进入边际收益递减阶段

Greg Isenberg 认为，Claude Opus 4.8 的发布并未带来比 GPT-5.5 更有意义的提升，模型迭代（如4.6到4.7再到4.8）已进入类似 iPhone 常规升级的边际收益递减阶段。他指出，当前真正的创新发生在模型外围工具，例如 Claude Code 上线的 Dynamic Workflows 和 Codex 发布的带内置浏览器的桌面应用。他预测，模型正变得像“电”或 Uber 发动机一样可互换，未来用户将不再关心具体使用哪个模型。

GREG ISENBERG: I didn't cover Claude Opus 4.8 on my pod because I don't think it's MEANINGFULLY better than GPT 5.5 as of May 29th. We'...

Anthropic OpenAI 大佬观点现象/趋势

03:15

Yuchen Jin@Yuchenj_UW

我问 Opus 4.8 Anthropic 是如何实现这个的。它告诉我 @ClaudeDevs 不是 Anthropic 的官方账号。真正的 AGI。😂

ClaudeDevs: With Opus 4.8, you can add system instructions mid-conversation without breaking the prompt cache. More cache hits means...

Anthropic 大佬观点推理

02:15

François Chollet@fchollet

爱因斯坦谈（不）用自然语言进行发明："书面或口头的语言文字，在我的思维机制中似乎不起任何作用"

大佬观点推理

02:12

Gary Marcus：The Road to AI We Can Trust（RSS）

Token至上时代结束之后会怎样？

文章简要指出，在“Token至上”的时代可能告一段落之后，对于人工智能（AI）的未来，存在两组截然不同的预测。

大佬观点现象/趋势

02:09

宝玉@dotey

对Notion"杠铃结构"工程组织模式的质疑

该推文质疑了Notion创始人Ivan Zhao提出的“杠铃结构”工程组织模式。该模式主张在团队两端配置大量初级工程师和少数顶尖架构师，刻意压缩中层。推文指出其两大问题：一是缺少中层衔接，导致初级工程师产出需高级工程师花费大量精力引导和验证，成本可能高于自己完成；二是结构不具可持续性，初级员工在1-3年内会成长为中层，导致“杠铃”退化为三角形。推文还认为此理论更适合应用于指挥AI智能体，而非人类工程师，并质疑Notion在AI时代缺乏惊艳的产品创新。

小盖: Notion 创始人这期分享确实很精彩。大家千万别错过 Notion CEO Ivan Zhao 在红杉聊的这期播客,观点特别有见地。甚至我觉得,这是近半年来所有创业者都应该认真精读的一期内容。相当解惑。Ivan 把 AI 时代里一个...

大佬观点现象/趋势

02:03

Steve Yegge：Medium（RSS）

技术面试的终结

作者基于超过35年的技术面试经验指出，该流程存在根本性缺陷。面试结果极不可靠，面试官意见高度不一致，且评分无法有效预测候选人实际表现。亚马逊的“Bar Raiser”和谷歌的“Hiring Committee”等补救机制并未从本质上解决问题。作者认为，当前的人才评估方式亟需一场根本性的变革。

大佬观点现象/趋势

01:15

Rohan Paul@rohanpaul_ai

精选76

亲测为实：难以置信的推理速度

Kog团队在标准数据中心GPU上实现了极高的单用户推理速度，在8× AMD MI300X GPUs上达到3,000 tokens/s，在8× NVIDIA H200上达到2,100 tokens/s。相比常规推理速度（约100-300 tokens/s），实现了10-30倍提升。其核心思路是将LLM解码视为内存流问题，通过协同设计monokernel、重建同步机制、针对性内存访问映射及采用延迟张量并行的Laneformer模型架构，消除了传统流程的阻塞点。

大佬观点推理部署/工程

推荐理由：Rohan亲自测完Kog AI的3000 token/s，把单用户推理速度拉高了10-30倍，这套monokernel设计可能改写低延迟推理的玩法，做实时AI产品的团队必须盯紧。

01:15

Yuchen Jin@Yuchenj_UW

Google正在同时对抗所有最终Boss：在模型领域对抗OpenAI和Anthropic，在芯片领域对抗Nvidia，在云服务领域对抗AWS和Microsoft，在广告领域对抗Meta，在自动驾驶领域对抗Tesla，在手机和操作系统领域对抗Apple。市值4.6万亿美元，却感觉被奇怪地低估了。

Google 大佬观点现象/趋势

00:33

Tomer Tunguz 博客（VC 分析）

精选65

技能提炼

“技能提炼”是一种知识转移方法，由前沿大模型（如 Opus 4.7、GPT-5.1、Gemini 3 Pro）负责撰写并优化标准化的 SKILL.md 流程文件。然后，本地运行的小模型（如 Qwen 35B、Gemma 26B）直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG，其核心是提取并转移操作流程，让小模型按步骤执行，从而形成前沿模型作教师、小模型作执行者的循环。

智能体 MCP/工具大佬观点

推荐理由：Tomer 把个人代理的完整工作流摆了出来，用大模型写 skill 小模型执行，这条蒸馏思路比调 prompt 高级，想认真跑本地代理的人该盯一下。

00:15

TechCrunch：AI（RSS）

Cognition的Scott Wu表示：AI编程智能体不应取代人类

Cognition公司开发了Devvin，这是一个号称首个且最成功的AI编程智能体。其著名程序员创始人Scott Wu明确表示，该智能体并非旨在取代人类程序员。

智能体大佬观点编码

00:07

Google AI@GoogleAI

聆听Gemini的架构师们回顾他们持续推动AI前沿的旅程，本期Release Notes节目。 @JeffDean、@koraykv、@OriolVinyalsML和@NoamShazeer一同出镜，分享模型背后团队的幕后故事，以及他们如何见证愿景的实现。

Google 多模态大佬观点

5月29日

23:26

Orange AI@oran_ge

推文探讨了AI带来时间节省后的悖论效应：当人们终于获得所追求的自由时间时，反而感到手足无措。引用@fortelabs的观点指出，AI节省时间后暴露出许多人生活的核心问题--缺乏深厚的业余爱好、社群联系和文化积累，生活完全以工作为中心。面对意外获得的自由，人们非但无法有效利用，反而更可能将自己更深地埋头于工作中，形成循环。最终，"自由"本身成了最令人无所适从的东西。

Tiago Forte: I think the main thing AI has taught me, through all the time savings it brings, is that I'm not a very interesting pers...

大佬观点

22:56

Orange AI@oran_ge

也许会有一种新的软件商业模式第一版免费后续更新每次都收费毕竟 AI Coding 第一版是最简单的… 维护是很费心力的… 或者 agent 自己迭代的版本免费人类迭代的版本收费

大佬观点行业动态

22:49

Peter Steinberger 🦞@steipete

"clanker"不是贬义词。"vibe coding"才是。

Armin Ronacher ⇌: More musings after some people got upset about the word clanker. https://lucumr.pocoo.org/2026/5/26/clankers/

大佬观点编码

22:45

Chubby♨️@kimmonismus

o3 本该被命名为 GPT-5。是时候说再见了。很棒的模型。

Tibor Blaho: OpenAI is retiring o3 from ChatGPT on August 26, 2026 and GPT-4.5 on June 27, 2026 (these changes apply only to ChatGPT,...

OpenAI 大佬观点

22:34

AYi@AYi_AInotes

AI让认知变廉价，关键在能否用它造新东西

红杉资本举办闭门会议，聚集150位AI领域创始人与OpenAI、Google、英伟达的核心高管。与会者将AI对认知工作的影响，比作电解法让铝价暴跌99.5%，使铝从比黄金贵的建筑材料变为廉价的铝箔。这隐喻写代码、写文案等长期练就的认知能力正迅速贬值。但观点强调，认知能力变便宜并非危机，真正的挑战是：当思考变得像铝箔一样随手可得时，能否用这些“白菜价”的脑力，去创造以前根本造不起的新事物。

AYi: http://x.com/i/article/2057668634579714048

大佬观点现象/趋势

22:19

Peter Steinberger 🦞@steipete

多个知名开源项目正在全面禁止AI/大语言模型相关的代码贡献。QEMU的政策是拒绝任何被认为包含或源自AI生成内容的贡献；NetBSD将AI生成的代码推定为污点代码，不得提交；Zig对AI实施完全禁令，明确禁止使用大语言模型生成内容、翻译、查找bug，甚至禁止讨论使用聊天机器人/大语言模型服务；OBS Studio则要求代码必须由人类编写。

The Lunduke Journal: While the Linux Kernel is quickly becoming "Vibe Coded", many other Open Source projects are outright banning all AI / L...

大佬观点开源生态编码

22:14

Ethan Mollick@emollick

围绕AI重构软件工程仍需努力（即使AI的编码能力正以极快的速度增长）。理想情况下，组织应将token用于两件事： 1）构建产品 2）探索最佳实践的实验（这必然包含失败）

大佬观点编码

21:45

Chubby♨️@kimmonismus

推文主推文将教皇方济各（Pontifex）的言论比作"随机鹦鹉"论调的2026年新版，意指此类质疑在当下重新流行。引用的核心观点强调，AI不具备人类的亲身经历、身体感知、情感（如喜悦与痛苦）、道德意识，也无法真正理解爱、工作或责任，因其缺乏人类成长所需的感知、关系与精神视角。推文认为，尽管形式更新，这类对AI本质的否定性判断本质未变。

Pope Leo XIV: Artificial intelligences do not undergo experiences, do not possess a body, do not feel joy or pain, do not mature throu...

大佬观点推理

20:34

AYi@AYi_AInotes

今天，把一件关于 AI 很底层的事，彻底想透了。

本文探讨了使用AI的两种核心路径：以Claude Code、Codex为代表的AI智能体型工具，可自主执行任务；以及以Cursor为代表的实习生型工具，需用户监督判断，后者是磨练判断力（以术入道）的关键。但Cursor依赖本地运行，限制了使用场景。作者通过UU远程（网易出品，免费）解决了这一问题，其手机端可实现4K 144帧低延迟连接，并原生支持完整终端，方便在移动端操作Cursor，实现了与AI实习生的随时连接。核心观点是AI工具的尽头是磨练我们成为值得被认真回答的提问者。

智能体大佬观点编码

16:42

歸藏(guizang.ai)@op7418

此推文用3D打印机比喻AI智能体（Agent），Token是其"打印材料"。这一比喻旨在说明软件正从功能固定、彼此隔绝的"应用房间"，转变为用户可塑造、组合的"可编程材料"。旧模式是选择工具，新模式是表达意图并与系统协作。界面（UI）也随之变化，从固定菜单变为响应意图的"黏土"。最终，软件不再仅由程序员创造，而成为人人可塑造的媒介，如同"可执行的纸张"。

Ryo Lu: from apps to material software used to be something you opened an app was a room with walls: calendar here, notes there,...

智能体大佬观点现象/趋势

16:15

Rohan Paul@rohanpaul_ai

更强的智能体将不仅来自更大的模型，而是来自其周围更好的系统

推文指出，AI智能体的强弱不只取决于模型，更依赖于模型周围的系统约束（harness）。该系统决定了模型的输入、可用工具、记忆及操作验证。核心进步应来自扩展此系统，尤其要提升上下文控制、记忆可信度以及工具或子智能体的路由能力。文中强调，长上下文不等于可用上下文，记忆多不等于可信，工具多不等于会用。这使得当前仅凭单次benchmark分数的评估方式显得薄弱。未来前沿在于扩展围绕智能体的系统约束，而不仅仅是扩展模型本身。相关论文标题为《From Model Scaling to System Scaling: Scaling the Harness in Agentic AI》。

智能体大佬观点部署/工程

15:21

IT之家（RSS）

精选70

谷歌 DeepMind CEO 哈萨比斯：AGI 最快三年内到来，研发速度远超预期

谷歌 DeepMind 首席执行官德米斯·哈萨比斯预测，AGI 研发速度远超预期，最快可能在 2029 年至 2030 年前后出现。作为 AlphaGo、AlphaFold 的主导者，他认为当前 AI 智能体是未来更强智能的预演，随着多模态和自主决策能力成熟，三年内迎来 AGI 关键突破已非科幻。但他同时警示，全球社会对 AGI 到来的准备严重不足，必须提前建立规则与防护机制。

DeepMind Google 大佬观点

推荐理由：哈萨比斯作为造出 AlphaFold 的诺贝尔奖得主，三年内 AGI 的判断不是空话，他同时强调社会完全没准备好，这种紧迫感比单纯的时间表更值得看。

15:15

Rohan Paul@rohanpaul_ai

Google omni确实被低估了。

Google 多模态大佬观点

13:21

IT之家（RSS）

赛力斯张正萍回应特斯拉 FSD 入华：优劣交给市场评判

在未来汽车先行者大会上，赛力斯董事长张正萍就华为乾崑智驾与特斯拉 FSD 的对比表示，两者孰优孰劣应交由市场评判。他以全新一代问界 M9 为例，指出其搭载 6 颗激光雷达及 40 个传感器，在硬件方面“不输给 FSD”。技术上，他认为 FSD 模拟人类视觉逻辑，而华为乾崑智驾则能超越人眼视觉范围。此外，张正萍透露问界品牌用 46 个月达成第 100 万辆交付，其辅助驾驶累计里程已超 77 亿公里。

大佬观点现象/趋势行业动态

12:21

IT之家（RSS）

莫言：人工智能无法取代作家的创作，AI 是靠一代又一代作家写出来的东西"喂"出来的

作家莫言强调，人工智能无法取代文学创作，因为AI是靠一代又一代作家写出来的作品“喂”出来的。他认为作家最宝贵的是原创能力，即创作前所未有的作品。假设所有创作者都停止原创，AI的水平也会停滞。AI可作为辅助工具介入翻译、影视制作等领域，但原创作品依然是根本。

其他大佬观点

11:42

歸藏(guizang.ai)@op7418

已经刷到好几个拿藏师傅的 PPT Skills 和小红书配图 Skills 做出千赞内容的小红书的博主了说明这玩意儿确实有用。你们再发的话可以艾特一下我，我还得给你们点点赞

MCP/工具大佬观点

10:21

IT之家（RSS）

英伟达黄仁勋谈 AI 应用、Token 消耗：浪费一点钱没关系，千万别浪费时间

英伟达CEO黄仁勋在员工大会回应AI消耗Token的担忧，称“浪费一点钱没关系，但千万不要浪费时间”。他要求同事积极拥抱AI，指出不使用AI才会被裁员，“你不会被AI取代，但会被懂得使用AI的人取代”。黄仁勋强调AI绝非裁员借口，而是避免裁员的良方，并认为这是缩小科技鸿沟的最佳时机。

大佬观点现象/趋势

10:09

宝玉@dotey

我赌codex明天会重置额度

Tibo: Codex Thursday has exceptionally moved to another day. Friday it is.

OpenAI 大佬观点

09:55

Orange AI@oran_ge

Opus 还是等 5.0 吧 4.7 4.8 都是小更新甚至负更新

Anthropic 大佬观点模型发布

09:43

Ethan Mollick@emollick

Claude Opus 4.8 在 Claude Code 中基于匿名研究数据自主撰写学术论文，经由 GPT-5.5 Pro 担任审稿人并指出错误后，Claude 对论文质量进行了量化自评：在1-10的识别度量表上，其稳健性检验后的评分从之前的3.5分提升至4.5分，但认为仍未达到准实验水平（约7分）。因此，Claude 将论文定性为"条件关联一致"的谨慎表述，而非声称因果识别。

Ethan Mollick: I had Opus 4.8 in Claude Code write a sophisticated, if minor, academic paper from a archive of hundreds of de-identifie...

Anthropic OpenAI 大佬观点论文/研究

09:39

meng shao@shao__meng

人类开发者的注意力是AI编程系统的核心瓶颈

AI编程系统中，人类开发者的注意力是不可并行的稀缺资源。智能体可并行工作，但其结果必须由人审查、判断和决策，这一过程无法并行，被称为“编排成本”，类比于Python的GIL。盲目增加智能体数量不会提升最终质量，反而因大量上下文切换增加审查负担。成熟的AI编程能力在于合理分配注意力：按自身审查能力控制智能体数量，将深度思考时间留给最关键的架构与决策环节。

Addy Osmani: http://x.com/i/article/2059839454370828288

智能体大佬观点编码

09:12

Ethan Mollick@emollick

有趣的是，自去年夏天以来，GPT-5 Pro系列模型在单次尝试解决最难问题方面一直是最强的模型。这段时间内没有真正的竞争。

OpenAI 大佬观点评测/基准

08:54

Orange AI@oran_ge

从飞行顿悟到人类意识的本质

作者由北京至上海的飞行激发灵感，撰文《顿悟》并录制播客。内容探讨人类争吵与意见分歧的根源，追问是否存在客观真相与理性判断。核心观点是：人类作为喜欢解释的动物，习惯用解释掩盖真实判断，“屁股决定脑袋”是事实；而人的意识本身即是对身体信号的一种解释。由此引申至AI无法取代人的论述，并提及尼采精神三变与实践是获得真理的唯一方法。

大佬观点现象/趋势

08:32

Berryxia.AI@berryxia

Hugging Face的创始人Victor M使用Opus 4.8，通过three.js构建并通过了这个波音747飞机的测试，我一会试试能不能复刻一个类似的场景，试试Opus的能力如何！

Victor M: wow... 6 months later, Opus 4.8 nails the boeing747-using-THREEJS-primitives benchmark. Single prompt (in ultracode effo...

Anthropic Hugging Face 大佬观点编码

08:21

IT之家（RSS）

美国造车新势力 Rivian 称 AI 重塑车机交互，讨论整合苹果 CarPlay 变得过时

Rivian 软件负责人表示，随着智能体 AI 加速落地，汽车正从“软件定义”走向“AI 定义”，传统的“屏幕镜像”车联方案（如苹果 CarPlay）将变得“过时”。该公司希望为用户打造一体化的导航、控制与 AI 助手服务，而非将中控主导权交给 iPhone。内部数据显示，要求支持 CarPlay 的用户比例已从交付初期的“超过 70%”降至最近一次调查的“不到 25%”。

智能体大佬观点现象/趋势