5月17日

10:42

SemiAnalysis@SemiAnalysis_

在斯坦福CS153前沿系统课程中，Jensen Huang逐字表示他"希望始终保持低MFU"，其给出的理由是：他希望系统足够智能，以至于超额配置了如浮点运算、网络、内存等工作负载。或许@xai的内核团队也在遵循这一理念。

大佬观点数据/训练

10:40

Orange AI@oran_ge

我的奥德赛时期

“奥德赛时期”指年轻人毕业后的迷茫状态，源于旧有清晰路径在互联网时代结束后失效。作者认为，即便在过去，这条路径也少有人走通。问题的核心在于是否承担真实风险与创造价值。在大厂打工常感无意义，因为个人决策无真实后果，高薪可能成为诅咒。真正的成长来自“风险共担”，进化需要筛选力量。AI时代，执行力可交给模型，稀缺的是想象力、判断力与改变世界的冲动。AI无法替人承担风险，人的选择因生命有限而真实。真正的安全垫并非稳定工作，而是自身的快速成长与“创造-验证”循环。人的一生皆是奥德赛时期，需持续在真实世界中冒险进化。

大佬观点现象/趋势

10:40

Rohan Paul@rohanpaul_ai

Satya Nadella的能量在此彰显。🔥 "每瓦特每美元的Token数" 这是每个公司、行业或国家在AI时代的新公式。 "这意味着基础设施、基础设施，还是基础设施。"

Microsoft 大佬观点现象/趋势

10:23

meng shao@shao__meng

新模型或撼动代码助手格局

Antigravity 要崛起了？不太能想象到，唯一的可能，是 Gemini 4 真的断档的强？全面内置 Nano Banana Pro 和 Veo 4？不过即便这样，也很难再动摇 Codex 和 Claude Code 了吧？

Logan Kilpatrick: Very excited for all the stuff the @antigravity team has been cooking :)

大佬观点编码

10:08

Ethan Mollick@emollick

这就解释了这家初创公司。【引用 @deepfates】：旧金山的新潮流不再是参谋长或MTS，而是巫师。每家公司都必须有位巫师。如果你的公司没有巫师和万年宇宙计划，那就注定失败。在某些顶级初创公司，每位高管都配有专属巫师。

🎭: The new thing in San Francisco is no longer chief of staff or MTS. It's wizards. Everybody's got to have a wizard. If yo...

大佬观点现象/趋势

09:54

Berryxia.AI@berryxia

陶哲轩点破AI核心矛盾：简单数学与不可预测的行为

菲尔兹奖得主陶哲轩指出，当前大语言模型（LLM）的数学基础（线性代数、矩阵乘法、微积分）其实很简单，本科生即可掌握。我们清楚如何构建和运行这些模型。真正的核心谜题在于，我们无法可靠预测它们为何在某些任务上表现出色，却在另一些任务上失败。关键在于现实世界的数据（如自然语言）处于“中间地带”——既非纯噪声，也非完全结构化，而是部分有序、部分随机。目前数学界对此类中间状态的理论非常薄弱，导致我们能描述模型机制，却无法解释其能力跃升或给出可靠的任务级预测。这种“简单机制”与“难以预测的行为”之间的矛盾，是当前AI领域的核心难题。

Rohan Paul: Terence Tao says the math behind today's LLMs is actually simple. Training and running them mostly uses linear algebra, ...

大佬观点推理

08:54

ginobefun@hongming731

当软件容易被创作，新时代的产品长什么样？

AI创业当前的核心挑战并非技术实现，而是功能同质化导致产品发布门槛提高。随着大模型降低开发成本，功能稀缺性已消失，价值转向独特的情感触点与用户连接。模型厂商正直接涉足垂直领域，挤压中间层生存空间，正面竞争模型能力难以取胜。未来或涌现众多“小而美”产品，像泡泡玛特一样，依靠独特品味、社群认同和世界观吸引付费用户，重新定义好产品的标准。

大佬观点现象/趋势

08:54

ginobefun@hongming731

Box CEO Aaron Levie：现在是创立AI公司的最佳时机

Box CEO Aaron Levie认为，AI是继大型机、PC、互联网和云之后又一次十年一遇的平台迁移，目前仍处早期，存在约三年的黄金创业窗口。成功关键在于在此期间建立起数据和工作流的优势，以构建结构性护城河。他反驳了“AI将取代软件工程师”的观点，指出部署、集成和问责仍需人类，并提出了“问责差距”概念。看好的方向包括垂直AI、Agent基础设施及AI能显著提升效率的专业服务公司。

智能体大佬观点现象/趋势

08:53

meng shao@shao__meng

Atomic Bot发布Qwen 35B任务视频对比，引发OpenClaw与Hermes创始人性能辩论

Atomic Bot发布基于本地模型Qwen 35B的真实任务对比视频，显示OpenClaw在任务完成时间（12分01秒）和token效率上优于Hermes Agent（33分01秒）。OpenClaw创始人@steipete转发结果并强调性能策略见效。Hermes联创@Teknium反驳基准不科学，指出单次运行、模型随机性等问题，并引用公开质量基准及真实用户数据证明Hermes领先，如用户日token量已达OpenClaw的2.5倍。双方各执己见，凸显了AI代理评估标准的争议。

Peter Steinberger 🦞: Looks like our focus on performance paid off.

智能体大佬观点现象/趋势

08:08

Ethan Mollick@emollick

将ChatGPT用于个人理财很有趣，但你需要知道该问什么问题，并有足够的经验来验证假设。它确实需要内置一些预设功能，来引导人们实现高效用例，并为AI提供更好的指令。

OpenAI 大佬观点

07:35

Greg Brockman@gdb

tokens 正迅速成为解决问题的通用输入

OpenAI 大佬观点

06:46

宝玉@dotey

吐槽一下 Claude Code Desktop 的设计

用户集中批评了Claude Code Desktop的几项设计缺陷：会话模式缺乏智能记忆，默认沿用上次的Plan模式；项目管理混乱，所有项目混杂在侧边栏；右侧面板并排布局，多开时相互挤占空间；此外，用户认为将Cowork和Code拆分为两个独立产品并无必要。

Anthropic 大佬观点编码

06:43

Emad@EMostaque

谁在建造纳米机器人？这似乎是库兹韦尔预测的最后一步

其他大佬观点

06:03

Chubby♨️@kimmonismus

Claude Mythos惊现Google Cloud控制台引困惑

Claude Mythos模型近日意外出现在Google Cloud控制台，且其预览标签已消失，观察者据此猜测Anthropic可能正准备公开发布该模型，类似此前Opus 4.7发布前的先例。然而，Anthropic曾多次公开表示，出于风险考虑不会发布Mythos，且该模型已被证实能力极强，因此部分观点认为该公司此刻进行彻底转向并发布该模型的可能性极低，这也会使其显得不够专业。用户对此表示困惑，强调无法想象任何发布场景，并引用推文示例佐证模型实力。整体上，事件引发猜测，但基于官方立场，实际发布概率被认为较小。

AiBattle: Claude Mythos now appears in the Google Cloud console, which was not the case yesterday The preview label is also gone. ...

Anthropic 大佬观点推理

05:08

elvis@omarsar0

工具使用代理认知与行动脱节机制研究

该可解释性论文聚焦工具使用代理，通过探测隐藏状态发现模型常能识别应调用工具，但实际调用失败，不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段，而非认知本身。内部探测方向可解码，但后期层的最后令牌机制使信号旋转，几乎与产生的行动正交。研究旨在预测干预措施效果，指出常见归因如提示或训练不足可能忽略后期层几何结构，这为工具使用提示A/B测试中的性能上限提供了合理解释。

智能体 MCP/工具大佬观点

04:41

Peter Steinberger 🦞@steipete

如果你还没有切换到 Codex，就开发你的 Claude 代码。

Chris Baker: Yeah that was a lot lol. Lots more to fix. Nice work @steipete https://clawpatch.ai/

大佬观点编码

03:16

宝玉@dotey

每次 Codex 一重置就后悔之前没多用一点

Tibo: Codex usage limits have now been reset across all paid plans. Enjoy the weekend!

OpenAI 大佬观点

02:43

AYi@AYi_AInotes

AI工具将十年开发经验压缩成一行命令

Greg Brockman转发的Codex Skill "Complexity Optimizer"通过一行npx命令安装，能在几秒内扫描代码库，精准定位O(n²)、N+1查询等性能问题，并提供文件、行号、优化建议和风险等级。其核心设计是仅报告问题而不自动修改，将决策权留给开发者。这标志着AI的关注点正从“更快地写代码”转向“发现人类难以察觉的复杂问题”，将十年项目经验才能积累的诊断能力封装成可一键调用的技能。未来，类似的安全审计、架构检测等工具将大量涌现。资深开发者的护城河因此被重新定义：从依靠个人眼力发现问题，转向依靠业务判断力来评估和落地AI提供的解决方案。

Greg Brockman: codex for improving computational complexity

MCP/工具大佬观点编码

02:35

Greg Brockman@gdb

在ChatGPT应用中使用Codex是如此自由的体验让你意识到平时被电脑束缚得有多深

OpenAI 大佬观点

01:58

Yann LeCun@ylecun

厌倦了胜利【引用 @DrCatharineY】：美国科学正面临巨大风险。

Dr. Catharine Young: American science is at extraordinary risk. NIH has awarded less than half as many grants as it has compared to the past ...

Meta 大佬观点政策/监管

01:05

Greg Brockman@gdb

Codex应用独树一帜。 "Mac端的智能Excel"是个有趣的描述。

swyx 🇸🇬 AIE Singapore!: gotta say Codex is completely unrecognizable from 3 months ago. guys went extreme founder mode on this thing @gabrielchu...

智能体 OpenAI 大佬观点

00:54

Berryxia.AI@berryxia

重复造轮子的人不是傻子，有没有一种可能只是真的是在拿AI练手和提升「熟练度」！😊

大佬观点

5月16日

23:33

Chubby♨️@kimmonismus

这就是你要面对的竞争。 30天130万token。燃烧更多token，否则你将无法成功。【引用 @steipete】：The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

Peter Steinberger 🦞: The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

大佬观点部署/工程

22:08

Ethan Mollick@emollick

关于AI与政治的讨论似乎奇怪地缺失了一个环节：（a）假设极高能力的AI即将实现，（b）坚信如何根据其信仰的政治计划运用该技术改善人类生活。此刻正是行动之时。

大佬观点安全/对齐

21:33

Chubby♨️@kimmonismus

Veo 4 可能比 Gemini 3.5 更令人兴奋。 Seedance 2.0 能长期保持领先地位实在令人惊讶。对了，或许还有谷歌世界模型 Genie 的更新。谷歌 I/O 大会快点到来吧。

Google 大佬观点

20:38

Rohan Paul@rohanpaul_ai

陶哲轩论大型语言模型：简单数学与不可预测行为之谜

陶哲轩指出，大型语言模型（LLMs）的训练和运行主要基于线性代数、矩阵乘法和微积分等简单数学，本科生即可掌握。然而，核心谜团在于LLMs为何在某些任务上表现卓越，却在其他任务上失败，且无法提前预测。这源于现实世界数据的性质：它介于完全噪声和完全结构化之间，而数学对此中间状态的理解薄弱，类似于物理学在原子和连续介质之间的介观尺度困境。因此，尽管我们能描述LLMs的机制，却无法解释其能力跳跃或提供可靠的任务级预测。简单机制与难以预测行为之间的不匹配，构成了当前研究的核心难题。

大佬观点推理现象/趋势

19:03

Chubby♨️@kimmonismus

Claude有些懒散，但具备品味和语境理解力（不谈4.7版本） Codex则充满热情，但仍欠缺一些品味和语境理解力。一旦Codex两者兼备，游戏就结束了。

Anthropic OpenAI 大佬观点编码

18:38

Orange AI@oran_ge

智力公式揭示AI瓶颈：速度易得，正确性难求

推文引用控制论对智力的定义：智力=速度x正确，即单位时间内做出正确选择的能力。作者指出，AI能极大提升速度（如编程），但无法保证“正确性”，尤其体现在无法做出能直接创造商业价值的核心战略选择（如决定开发何种产品）。作者认为，当AI能告知“做什么能直接赚钱”时，才意味着在智力上达到了AGI水平。

大佬观点现象/趋势

17:38

Rohan Paul@rohanpaul_ai

Google的《Attention is All You Need》论文源于试图让Google Translate提升3%的性能。创新是生产的产物。"如果你不去创造，就放弃了在该事物上创新的机会。" ~ Palantir首席技术官 @ssankar

大佬观点现象/趋势

15:38

Rohan Paul@rohanpaul_ai

Fei-Fei Li警告，人工智能可能过度专注于语言模型。世界不仅仅是屏幕上的文字。它是物理的、视觉的、空间的，并且始终在变化。大部分经济活动依赖于看见、移动、互动和具身智能。

具身智能大佬观点现象/趋势

11:47

swyx 🇸🇬 AIE Singapore!@swyx

不得不说Codex和三个月前相比已经完全认不出来了。团队在这件事上开启了极限创始人模式 @gabrielchua 演示时我就在想"你们居然做出了代理式Excel for Mac"

swyx 🇸🇬 AIE Singapore!: @Gavriel_Cohen and @thsottiaux casually dropping some hints on the Codex roadmap in his keynote! https://x.com/angadsg/s...

智能体产品更新大佬观点

10:15

宝玉@dotey

开发者回归Sublime Text，轻量高效替代内存占用量大的VSCode

一位开发者重新使用Sublime Text，因其内存占用仅300多MB，远低于动辄占用10GB以上的VSCode。转变的主要原因是其工作流发生变化：现在基本无需手写代码，导致VSCode的许多高级功能变得不再必要。相比之下，Sublime Text提供的语法高亮和基础文件编辑功能已完全满足其当前需求，突显了在AI辅助编程时代，轻量级编辑器因其资源效率而重新获得青睐的趋势。

大佬观点编码

09:17

swyx 🇸🇬 AIE Singapore!@swyx

新加坡内阁部长Vivian Balakrishnan作为NanoClaw的重度用户，正实际运用该AI工具处理国家外交政策与议会事务。他公开分享了如何利用技术栈破解WhatsApp限制，并在SQLite上实现图记忆的具体方法。这一实践案例在AI工程师社区活动中引发关注，该活动汇聚了来自OpenAI、Cursor AI、Vercel、ElevenLabs等公司的众多AI领域专家，共同探讨前沿AI应用。

AI Engineer: All @aiDotEngineer SG talks kick off in 22 mins! Tune in live: https://www.youtube.com/watch?v=_xQnSNlBP_w - @VivianBala...

智能体大佬观点

08:54

Berryxia.AI@berryxia

关于AI智能体发展的关键观察与影响

AI智能体通过记忆功能形成使用先发优势，预计12个月内将出现能自主学习并替代人类工作的智能体。本地模型使AI产品可在终端设备运行，为医疗、法律等受监管行业提供无数据隐私风险的解决方案。企业需将内部流程与知识转化为AI可读的“第二大脑”，而代理成本正逐步取代传统人力成本。智能体可能引发部门间无意识的竞争，公司结构可通过YAML配置文件定义和版本化。输入数据质量直接决定输出效果，技能文件比传统SaaS更具价值，而人类审批环节成为工作流中的主要瓶颈。

GREG ISENBERG: More AI agent observations below (I keep adding to the list): 1. Hermes agents write to their own memory after every tas...

智能体大佬观点

08:54

ginobefun@hongming731

#BestBlogs 早报 2026-05-16：AI作为深度协作的"思考伙伴"

本期早报探讨了AI从编程助理向“思考伙伴”的演进。案例包括Google工程师在多语言客户端开发中与AI协同理解与设计系统；Abridge公司利用海量问诊数据构建医疗智能理解层；以及OpenAI复盘Imagen 2.0在文本渲染和多语言支持上的进展，并展望“创意智能体”的未来。这些实践展示了AI正以更深入、融合的方式参与专业协作。

Google OpenAI 多模态大佬观点

08:05

Greg Brockman@gdb

在"tokens成本无关紧要"的未来设想下，项目通过云端持续运行约100个Codex实例，实现软件开发全流程自动化。系统自动化审查每次代码提交以发现安全问题，处理所有PR和issue：自动关联并关闭陈旧issue、去重问题并聚类报告、监控新issue并自动创建PR。智能代理能复现复杂环境、进行演示、监听会议并主动启动工作（如创建PR），同时扫描评论垃圾、验证性能基准。结合clawpatch.ai进行功能单元拆分和Vercel deepsec安全审计，最终达成极精简的自动化运营。

Peter Steinberger 🦞: People freaking out over my AI spend. What nobody sees: Part of what excites me so much about working on OpenClaw is tha...

智能体 OpenAI 大佬观点编码

07:09

SemiAnalysis@SemiAnalysis_

正如我们对DeepSeek发布的期待，DeepSeek V4带来了更多炫目的ML系统优化。这次是MegaMoE，一个1400行融合CUDA内核，可计算整个MoE前向传播。让我们看看它是如何工作的（1/4）🧵

DeepSeek 大佬观点数据/训练部署/工程

06:07

Orange AI@oran_ge

推文以英伟达黄仁勋早年押注CUDA为例，指出后人热衷于为此决策寻找因果证据，实则反映了人类决策的普遍模式：决策主要由压力环境下的激素驱动，而非纯粹依靠理智。人们往往先做决定，再事后寻找证据证明其正确性。决策者必须亲身承担决策失误的风险与损失（即skin in the game），才能在真实压力下驱动激素，做出更正确的决定。

Orange AI: 人只有在真实的环境里才能做出正确的决定。人类学研究表明,人类的决策过程主要是由激素推动的,知识,经验,理智在这个过程中所起的作用并不大。我们往往是做出决定之后,再用智慧去寻找证据以便证明自己的决定是正确的。如果决策者本人不承担决策失误...

大佬观点现象/趋势

06:02

Chubby♨️@kimmonismus

英伟达CEO称技工前景优于计算机科学毕业生

英伟达CEO Jensen Huang在卡内基梅隆大学告诉2026届计算机科学毕业生，电工、水管工等技工比他们更有前景。数据支持这一观点：Randstad分析显示技工需求增长是白领职位的三倍，机器人技术员职位增长107%，而斯坦福研究发现AI相关职位早期就业下降16%。顶级电工年薪超10.6万美元，无需学位负债。科技公司今年投资7000亿美元建设数据中心，全球到2030年预计达7万亿美元，这些基础设施依赖人力完成，但制造业面临劳动力短缺，每100名新工人进入就有102人离开。AI时代最大赢家是能建设数据中心的技工，而非提示工程师。

大佬观点现象/趋势行业动态

05:42

Emad@EMostaque

人形机器人的总可寻址市场规模很可能超过人类劳动力的总可寻址市场【引用 @EMostaque】：本周花时间研究了人形机器人的经济影响，其规模远超数字AI

Emad: Spent some time this week looking at the economic impact of humanoid robots and its so much bigger than digital AI The n...

具身智能大佬观点