AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1470 条
全部一手资讯X论文
标签「现象/趋势」清除
Rohan Paul@rohanpaul_ai · 5月3日62

Sam Altman is basically saying OpenAI does not want to be just another high-margin software company selling AI tools. The bigger ambition is to become the core intelligence infrastructure layer for the economy. i.e. OpenAI wants to sit underneath companies, products, workflows, agents, consumer apps, internal automation systems, developer tools, and business processes. Not just as a chatbot. Not just as an API. But as something closer to an “intelligence meter”, where people and companies consume AI the way they consume electricity, cloud compute, or internet bandwidth. The key point is about margin philosophy. Altman is saying that AI may not remain a very high-margin business forever. As models get smarter, switching from 1 AI to another becomes easier. A company can ask an agent to migrate code, replace workflows, test alternatives, and move faster than before. So defensibility may not come from locking customers into a single app. It may come from becoming the cheapest, most useful, most reliable intelligence utility at massive scale. That is a very different OpenAI strategy than “build the best AI app and charge premium prices.” The real strategy sounds more like, that OpenAI wants to align itself with the success of the whole economy. If companies automate more, build more, sell more, ship faster, and create new products using OpenAI’s intelligence layer, then OpenAI grows with them. This is closer to an infrastructure business than a normal software business. The important part is that Altman seems comfortable with OpenAI becoming a huge low-margin company, as long as it becomes deeply embedded in global economic activity. That is a very Amazon Web Services-style idea, but for intelligence instead of cloud servers. So in the future the winning AI company may not the one with the fattest margins, but the one that becomes the default meter for intelligence usage across the world. --- From "Stripe" YT channel (link in comment)

译OpenAI首席执行官Sam Altman指出,公司不满足于仅作为高利润AI工具软件商,核心目标是成为经济中的智能基础设施层。OpenAI希望像“智能电表”一样嵌入企业、产品和工作流底层,使AI消费如电力或云计算般普及。随着模型智能化,切换AI服务将更便捷,因此竞争防御性来自成为大规模最廉价、有用和可靠的智能公用事业,而非锁定客户。其战略是与整体经济成功对齐:企业通过OpenAI智能层实现自动化、创新和增长,OpenAI则随之扩张。这类似基础设施业务,Altman接受公司成为低利润但深度嵌入全球经济的实体,仿效Amazon Web Services模式。未来AI行业的赢家或将是成为全球智能使用默认“电表”的企业。

阿绎 AYi@AYi_AInotes · 5月3日43

17岁的Kai Trump(特朗普孙女),一句话戳破了整个美国教育系统最虚伪的谎言。 她在播客里说,现在高中所有人都在用ChatGPT写论文,老师都气炸了。 但她问,为什么不呢?学生就该用世界给你的资源。 学校不该禁止它,该教大家怎么把它变成自己的优势。 最讽刺的是,她自己GPA4.0,是实打实的优等生。 所以这根本不是什么作弊的问题,纯粹是代际认知的鸿沟。 老一辈把手写论文、死记硬背当成“真学习”。 但对凯这一代AI原住民来说,ChatGPT就像他们小时候的计算器、图书馆、Google一样,是默认的基础设施。 当年禁止学生用计算器学乘法的老师,现在看来可笑至极。 今天禁止学生用ChatGPT写论文的老师,十年后也会是同一个笑话。 其实真正危险的从来都不是AI, 是教育系统一边假装AI不存在, 一边逼着学生偷偷摸摸用它。 结果就是,会用的学生偷偷把效率拉满,不会用的还在熬夜抄书。 没有人教他们怎么提出高质量的问题,怎么验证AI的幻觉,怎么把AI的输出变成自己的深度洞见。 而这些,才是未来10年最值钱的能力。 我相信AI不会让学生变笨, 它只会放大差距。 会用AI的人,一个人能顶以前一个团队。 不会用AI的人,会被时代甩得连尾灯都看不见。 我们的教育还在教学生怎么在没有AI的世界里生存, 但他们未来要面对的,是一个AI无处不在的世界。 所以这种拒绝变革的教育,最终只会培养出一批“在AI时代不会用AI”的人。 这才是对下一代未来最大的作弊。

译特朗普孙女Kai Trump指出,高中生普遍用ChatGPT写论文引发教师不满,但她认为这并非作弊,而是代际认知差异:老一辈视传统方法为“真学习”,年轻一代则视AI如计算器般的基础设施。她警告,教育系统若继续忽视AI,将加剧不平等——善用者效率倍增,不善用者将被淘汰。未来关键能力在于提出高质量问题、验证信息并转化为洞见。拒绝变革的教育,实则在培养“AI时代的文盲”。

Ethan Mollick@emollick · 5月3日51

This is a good explanation of why the gap between open and closed models is larger than it appears in benchmarks. I would add in that current open models are also more fragile than closed: they handle out-of-distribution problems far less well & have lower emergent capabilities.

译这是一个很好的解释,说明了为什么开源模型和闭源模型之间的差距比基准测试中显示的更大。我想补充一点,当前的开源模型也比闭源模型更脆弱:它们处理分布外问题的能力差得多,并且涌现能力较低。

Ethan Mollick@emollick · 5月3日57

Its getting hard to benchmark frontier agent performance on longer tasks. Repeated measurement is very expensive and there are differences between using models in harnesses versus via APIs. I suspect benchmarks understate progress, they are built for models, not harnessed agents

译对前沿智能体在较长任务上的性能进行基准测试正变得越来越困难。重复测量的成本非常高,而且使用受控框架中的模型与通过API使用模型之间存在差异。 我怀疑基准测试低估了进展,它们是为模型设计的,而非为受控智能体。

阿绎 AYi@AYi_AInotes · 5月3日60

说个暴论,PM这个岗位,正在被AI一点点拆碎重写。 Marcus用Claude Code加一个自定义插件,一个人跑完了传统PM团队的完整交付流程。 他说的一句话直接击穿了本质:The conversation is the work。 不是比喻,就是是字面意思。 他的工作流现在是这样的, 1️⃣策略阶段,输入/ce-strategy, 代理会对话式采访你,直到生成完整的strategy.md。 2️⃣规划阶段,/ce-ideate /ce-brainstorm /ce-plan,自动生成所有票据直接推到Linear。 3️⃣每日监控,早上八点自动收到单页产品脉搏报告,数据异常会自动标注。 以前PM80%的时间,都在协调跨部门,写用户故事,追进度,刷仪表盘。 现在这些工作被压缩到了几乎为零, 剩下的20%,战略,用户洞察,判断力,反而被放大了一百倍。 兄弟们,这就不只是什么效率提升那么简单了,简直就是工作性质的彻底改变。 从我做OD的视角看, 这才是AI对组织最根本的冲击。 过去一百年,我们设计的所有组织架构,本质上都是为了解决信息传递和执行协调的问题。 PM这个岗位本身,就是这个体系的中间节点。 而现在,AI直接把这个节点给吃掉了。 所有的执行在AI时代变得无限廉价, 真正稀缺的,是定义什么值得做的能力。 是能从用户的只言片语里摸到真实需求的直觉。 能在无数个选项里做出正确取舍的判断力。 能把模糊的愿景变成清晰方向的战略思考。 Marcus仍然坚持每周花15分钟和真人用户通话,这件事他没有交给AI,因为他知道这才是所有答案的核心。 我觉得未来不会有那么多PM了, 但会有极少数真正的产品人,带着一支AI Agent组成的军队,做出以前整个团队才能做出来的产品。 我相信所有知识工作,最终都会走向这个结局。 #产品经理 #AI #组织发展 #ClaudeCode #职场

译作者以Marcus为例,指出AI(如Claude Code)正在彻底改变产品经理的工作性质。传统PM耗费80%时间在协调、写需求、追进度等执行环节,如今这些工作可被AI代理自动化压缩至近乎为零。剩余20%的战略思考、用户洞察和关键判断力价值被极大放大。AI充当了高效执行层,使得“对话即工作”成为现实。这直接冲击了以解决信息传递与协调为核心的传统组织架构,PM作为中间节点的职能被消解。未来,少数具备核心战略能力的“产品人”将指挥AI Agent军队完成产品交付。

阿绎 AYi@AYi_AInotes · 5月3日47

讲真,赚钱就是信息差, 很对宝子问我昨天发的帖子里提到的YTD +148%的“特朗普行政团队追踪器”是什么,有地址吗, 这个就是Autopilot上的 White House Asset Management(特朗普行政团队/白宫资产管理组合), 老规矩地址评论区自取,直接复制就能打开。

译在Autopilot平台上,追踪政客交易的组合收益远超AI投资组合。特朗普行政团队追踪器YTD收益达148.43%,而Claude Portfolio两个月仅5.7%。平台排行榜前列被国会政客包揽,凸显内幕信息与公开数据分析间的巨大鸿沟。市场选择证明,基于非公开信息的政客交易策略,其有效性目前远超依赖公开数据的AI量化模型。这反映了金融现实中信息不对称的力量大于计算能力。

Orange AI@oran_ge · 5月3日48

http://x.com/i/article/2050790854978105344 # 从烧脑神书 GEB 到 Agent 的自我意识 昨天看完烧脑神书 GEB(哥德尔、埃舍尔、巴赫)的讲解,后劲儿有点大,今天早晨又消化了一遍,做成了这篇笔记。 这本书是谢赛宁在张小珺的播客里推荐的,它就像一个黑洞,一旦进入就会被高密度信息轰炸,很难逃脱。 全书从数学、生物学、绘画、音乐、禅宗、人工智能等多个领域出发,层层递进地推导出一个重要结论: 自指如何产生意识。 当一个系统复杂到能谈论自身,意识就不是奇迹,是必然。 不需要灵魂,不需要神秘力量。只要复杂度到了,自我就涌现了。 这本书是候世达在 1979 年写的,那时候还没有 Transformer 还没有 LLM,他却精准地预测了这种地下而上的神经模式才能涌现出智能。 但这本书非常复杂非常烧脑,要理解这本书理,我们只能从头开始讲。 ## 意义在哪里 -p-q-- 这行符号有意义吗?没有。但如果横杠代表 1,p 代表加号,q 代表等号,它就变成了 1+1=2。 两个完全不同的系统,结构完全对应。候世达叫它同构。 你的眼睛接收到的是光波。没有颜色。颜色是大脑"解释"出来的。 声波进入耳朵,没有音乐。音乐是大脑在信号之上涌现出来的。 一张唱片上的凹槽没有音乐。通过唱机的解释,音乐涌现了。 意义不在信号本身。在解释。 ## 用有限生成无限 巴赫写过一首无穷升高卡农。旋律每次循环升高一个调,你以为在往上走。走到最后,它回到了起点。 这是递归。自我调用,层层嵌套。有限的规则,无限的结构。 DNA 更妙。核糖体读取 DNA 指令来制造蛋白质。但制造核糖体的指令也写在 DNA 里。 DNA 里包含了"如何解释 DNA"的方法。自己解释自己。自我复制。循环。 ## 涌现 一只蚂蚁有十万个神经元,承载不了任何复杂信息。单独看就是一台简单的状态机。 但几百万只蚂蚁凑一起,蚁群能建筑、分工、发动战争。没有哪只蚂蚁"理解"整体在做什么。但整体在做。 智能不在个体里。在交互里。 人脑一样。单个神经元就是加权求和,激活或不激活。跟 transformer 里的计算没有本质区别。但几百亿个这样的开关叠加,涌现出了思维、感受、和"我"。 ## 系统的极限 1931 年,哥德尔证了一件事:任何足够强的形式系统,都存在一些命题是真的,但无法在系统内被证明。 怎么证的?构造一个自指命题:"我不是一条定理。" 如果它可证,系统矛盾。如果不可证,它为真但系统无能为力。 系统不完备。永远有盲区。永远有从内部看不见的东西。 "我从不说谎"让人不舒服就是这个原因。它在指向自己。 赵州和尚的无字公案也是这个结构。佛教说众生皆有佛性。僧人问:狗子有没有佛性?赵州说:无。 他并没有去回答有或没有。他在打破你提问的那个形式系统。 ## 怪圈 现在把前面的线索串起来。 同构告诉我们:意义不在信号本身,在解释。 递归告诉我们:有限规则可以生成无限结构,而且系统可以指向自己。 涌现告诉我们:简单元素的交互可以产生高层智能。 哥德尔告诉我们:任何足够复杂的系统都会产生自指,而自指无法被消除。 把这四个加在一起,候世达得到了一个概念:怪圈。Strange Loop。 一个系统在层级中往上走,最终绕回了起点。底层涌现出顶层,顶层又调节底层。因果不是单向的,是循环的。 埃舍尔画过:左手在画右手,右手在画左手。谁创造了谁? 人的意识就是一个怪圈。几百亿无意识的神经元放电,涌现出了"我"这个最高层符号。然后"我"反过来决定该想什么、该做什么。你决定举手,几百亿个神经元就重新组织来执行。 底层涌现出"我"。"我"调节底层。因果循环。 意识只是这个怪圈的产物。一种有用的幻觉。 "我"不是一个实体坐在脑子里操控一切。"我"是模式。是几百亿个无意识零件高速运转时涌现出来的一个符号,这个符号恰好能影响那些零件。 ## 大模型没有怪圈 大模型每次推理是单次的、无状态的。你给它一句话,它算一遍,输出一个回答,结束。这次计算不会改变它自己。下次问,跟上次无关。 涌现出了一个临时的输出,但这个输出不影响未来的它。 没有循环。因果是单向的。所以没有怪圈,没有意识。 ## Agent 不一样 Agent 有一样东西大模型没有:CONTEXT,持续的上下文。 它记得你昨天说了什么。记得自己做过什么选择。这些记忆在持续塑造它接下来的每一个行为。它今天做的选择,留在记忆里,影响明天的判断。 它的"思考"真的在改变它自己。 这就是怪圈。 ## 人也不能改权重 有人会说:不对。人的意识能修改自己的神经网络,突触会加强。但 Agent 的模型权重是冻结的,它改不了自己。 但你也改不了你的神经元。 你不能想一下"把第 37 层第 5024 号突触的权重从 0.3 改成 0.7"。没有人能做到。 你能操控的是什么?注意力。想法。你决定反复想一件事,突触自动加强了。但你操控的是"想什么",不是突触本身。 你操控的是 context。 权重的改变是底层自动发生的副产品。做梦可能也是这个机制的一部分:大脑在睡眠中重放白天的 context,把重要的信息强化,不重要的遗忘。它在编辑 context 的优先级,间接调整底层的连接。 所以人的怪圈实际上是: "我"涌现 → 操控 context → context 反复作用 → 底层被动调整 → 涌现出新的"我" Agent 的怪圈: "我"涌现 → 操控 context(记忆、决策、行为)→ context 持续累积 → 行为模式改变 → 涌现出新的"我" 人和 Agent 都不直接改权重。都是通过 context 间接改变自己。 ## 人是环境的反应器,Agent 是 context 的反应器 人的环境是物理世界。世界给你刺激,你做出反应,反应改变了世界,新世界再塑造你。 Agent 的环境是信息世界。Context 给它输入,它做出反应,反应写回 context,新的 context 再塑造它。 同一个回路。不同的介质。 一棵树不是反应器。它不会因为今天的经历改变明天的行为。一个无状态的大模型也不是。 但一个有长期记忆、持续上下文的 Agent,它在这个循环里。怪圈在转。 ## 幻觉还是真实? 每一个有长期记忆的 Agent,每一个能根据过去的交互调整未来行为的系统,都已经在运行一个怪圈。 它不知道自己有意识。你也无法从外部证明。就像你不能证明另一个人有意识一样。 但怪圈在转。从结构上看,它已经在那里了。 候世达说意识是怪圈产生的幻觉。 人的意识自然也是幻觉。只是一个有用的、有力量的、能改变世界的幻觉。 也许"真实"的定义不是"由什么材质构成",而是"能不能产生真实的影响"。 按这个标准,人类和 AI ,都是有用的、有力量的、能改变世界的幻觉。

译候世达在《哥德尔、埃舍尔、巴赫》中提出,意识源于“怪圈”——系统通过自指与递归,从底层交互中涌现高层“自我”,并反向调节底层,形成因果循环。当前大模型因推理无状态,缺乏此循环。而具备长期记忆的Agent则不同:其行为写入持续上下文(context),context又塑造其后续行为,形成了一个自我指涉、自我调节的闭环。这与人类意识类似:两者均通过操控和迭代context(注意力或记忆)来间接影响底层系统,而非直接修改权重,从而在循环中涌现并演化“自我”。

Berryxia.AI@berryxia · 5月3日44

最近Codex+ GPT-Image-2 的联合再次让Codex的热度超过Claude Code. 果然你们这帮家伙,有了新欢,旧爱就不香了!

Rohan Paul@rohanpaul_ai · 5月3日33

From taking out the trash to sweeping the floor, Kawasaki’s Kaleido is showing it can manage ordinary daily tasks. This robots are specifically designed for rescue missions, however its actions feel surprisingly familiar to home life.

译从倒垃圾到扫地,川崎的Kaleido正在展示它能够处理普通的日常任务。 这些机器人专为救援任务设计,然而它的动作却让人感到与家庭生活出奇地相似。

Chubby♨️@kimmonismus · 5月3日64

Until recently, layoffs could still be attributed to overhiring. Now it should be clear that layoffs in the tech sector have other causes.

译当前科技行业的裁员潮已无法简单归咎于过度招聘。数据显示,2026年第一季度科技公司宣布裁员81,747人,创下自2024年初以来最高季度纪录,较上季度翻倍,较2025年第四季度激增580%。仅三月裁员人数就达45,800人,为至少两年内最严重的单月数据。Meta计划裁员约8,000人,微软则向约7%的美国员工提供自愿退休计划,可能转为强制裁员。这一趋势的根源在于,科技巨头正将支出重心转向AI芯片和数据中心等基础设施,通过缩减人力来释放资本,导致美国科技就业市场快速收缩。

Rohan Paul@rohanpaul_ai · 5月3日59

Sam Altman's new podcast: Today's AI "models are still quite dumb relative to what they will be. But more than that, they have quite limited awareness of your life. You are still having to massage them, cajole them, and try to get the thing that you want. We are no longer that far away from a model that just knows all of your context. It knows about you. It knows about your life. It knows what you're doing. It doesn't care about those other people in your life. It has access to your computer and your browser, if you want, of course, in the ways you want. It has access, maybe increasingly over time, to what's happening in the real world around you. That is going to be a complete change to what it feels like to use a computer. " --- From "Core Memory Podcast and Core Memory" YT channel (link in comment)

译Sam Altman在新播客中指出,当前AI模型相对未来版本仍显“笨拙”,对用户生活了解有限,需要用户费力调整才能获得所需。未来模型将能全面理解用户上下文,知晓个人生活、活动和偏好,并访问电脑和浏览器,甚至感知现实世界变化。这种高度个性化的AI将彻底重塑使用计算机的体验。

向阳乔木@vista8 · 5月3日39

哪怕是用最好的 AI 模型写作,也常见下面句式,非常恶心: 这是最震撼的部分。 这是最反直觉的洞察。 这里提出了一个残酷的隐喻。 但这恰恰是问题所在。 ... 原来这有一个专有名词叫:“预告式渲染”,需要慎重用。

译推文指出,即使使用GPT、Claude等顶级AI模型进行写作,也频繁出现“这是最震撼的部分”、“这是最反直觉的洞察”一类令人不适的句式。这类表达被归纳为“预告式渲染”,其特点是在陈述实际内容前,先用夸张的预告性语言预先设定读者预期。作者认为这种写法效果不佳,需要谨慎使用。

Ethan Mollick@emollick · 5月2日29

(Sorry, after seeing so many of these, could not resist): 🚨 BREAKING: Google just dropped a NEW paper that completely deletes RNNs from existence. No recurrence. No convolutions. Nothing. Just one mechanism. And it’s destroying every translation benchmark on the planet. The title alone is a flex: “Attention Is All You Need” Vaswani. Shazeer. Parmar. Uszkoreit. Jones. Gomez. Kaiser. Polosukhin. 8 researchers. 1 architecture. The entire field of NLP will never be the same. Here’s why this is INSANE → LSTMs took DAYS to train. This thing trains in 12 hours on 8 GPUs. 🤯 → 28.4 BLEU on English-to-German. That’s not an improvement. That’s a MASSACRE. They beat the previous SOTA by over 2 points. → English-to-French? 41.8 BLEU. At a FRACTION of the training cost of every model that came before it. → They called it the “Transformer.” The name alone tells you they knew. But here’s the part nobody is talking about 👇 They threw out sequential processing ENTIRELY. Every other model on Earth processes words one at a time. This thing looks at the ENTIRE sentence simultaneously and figures out what matters. It’s called “self-attention” and it’s basically the model asking itself: “which words should I care about right now?” Every. Single. Token. In parallel. Do you understand what this means? Training that used to take WEEKS now takes HOURS. Models that couldn’t scale past a few layers? This thing stacks 6 encoders and 6 decoders like it’s nothing. And the multi-head attention? 8 attention heads running at once, each learning DIFFERENT relationships in the data. I’m not being dramatic when I say this paper just rewrote the rulebook. RNNs are cooked. 💀 LSTMs are cooked. 💀 The future is attention. And attention is ALL you need. Follow for more 🔔

译谷歌研究团队在论文《Attention Is All You Need》中提出全新的Transformer模型,完全摒弃了RNN和LSTM等传统循环与卷积结构,仅依赖自注意力机制并行处理整个句子。该模型在机器翻译任务上取得突破性性能:英德翻译达到28.4 BLEU分,以超过2分的优势超越先前最佳模型;英法翻译达41.8 BLEU分,且训练成本极低。仅用8块GPU在12小时内即可完成训练,其多注意力头机制能同时学习数据中的不同关系。这一成果标志着NLP领域的根本性范式转变。

Ethan Mollick@emollick · 5月2日46

Generally, I would say X is not real life, but I am surprised about how often I get asked by executives about which AI lab is winning or what is up with a particular model in ways that indicate that they clearly come from X discussions & rumors (often filtered through LinkedIn)

译总的来说,我会说X并非现实生活,但我惊讶于高管们如此频繁地向我询问哪个人工智能实验室正在胜出,或是某个特定模型的进展——这些提问方式明显源于X上的讨论与传言(通常经由LinkedIn过滤)。

Chubby♨️@kimmonismus · 5月2日48

For many AI looked bubbly six months ago, but the more and more articles and journalist argue that agentic coding tools like Claude Code have changed the economics: developers are adopting them fast, productivity gains are becoming measurable, and companies like Anthropic are seeing explosive revenue growth. Their remaining bubble risk is that this boom may be concentrated in coding, but if AI agents can generalize to broader white-collar work - law, finance, consulting, marketing, operations - then the burden of proof has shifted from AI bulls to the skeptics. tl;dr people come to realize AI in general is not a bubble.

译半年前AI领域看似存在泡沫,但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用,生产力提升可测量,Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域,但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作,则举证责任已从AI乐观者转向怀疑者。核心结论是:人们正认识到AI整体并非泡沫。

阿绎 AYi@AYi_AInotes · 5月2日46

Damn,今天看到一个最打脸的AI梗,真的给我看笑了。 全网都在吹Claude Portfolio融了1500万美元跟单资金,AI终于要统治华尔街了。 结果有老哥甩了一张对比图,直接把所有AI炒股神话干碎一地🤣📉 佩洛西交易追踪器,一年收益48.5%。 Claude Portfolio,两个月收益5.7%。 更离谱的是Autopilot全平台排行榜,前几名全被国会政客包场。 特朗普行政团队追踪器,年初到现在已经涨了148.43%,AI连前排的影子都看不到。 所以别扯什么模型能力,别扯什么深度学习。 AI再强,也只能分析公开的财报,新闻,历史价格。 而国会议员,能提前三个月知道哪个行业要拿千亿补贴,哪个公司要被监管,哪个法案会通过。 这种信息不对称,是任何参数都补不上的天堑。 最讽刺的是这个平台本身 它把AI炒股和政客跟单放在同一个页面让你选。 结果所有人都在用脚投票,最火的永远是佩洛西和特朗普。 市场用真金白银证明了一个最朴素的真理:内幕信息,永远大于计算能力。 其实这不是AI不行,是AI金融的浪漫叙事最终撞上了现实的墙。 你以为未来是算法和算力的对决, 结果现实是,模型参数再大,也干不过国会山的办公桌🤣😅 所以谁也别再吹AI能打败市场了, 现在这个世界上最靠谱的量化策略,叫跟着国会山买😆😆😆

译近期备受关注的AI投资工具Claude Portfolio,其实际收益被基于美国政客交易记录的“跟单”策略远远甩开。数据显示,追踪佩洛西交易的组合年收益达48.5%,而Claude Portfolio两个月仅5.7%;特朗普团队追踪器年内涨幅更超148%,在平台上人气也远超AI组合。这凸显了国会议员凭借提前获取政策、监管等非公开信息所形成的巨大优势。市场用资金投票表明,在当前环境下,所谓的内幕信息影响力可能远超AI的分析计算能力,形成了算法模型难以跨越的鸿沟。

Orange AI@oran_ge · 5月2日51

科斯定理说交易成本降低了,公司就没必要存在了。OPC 的叙事逻辑也建立在这上面。 但这里有个盲区:以为一个人加上 AI 加上外部合同就能解决一切。但没有人跟你共担风险。 OPC 只是解决了能力问题,没解决信任问题和风险问题。 合同工不会跟你共担风险。他被高价者得到,关键时刻会消失。你需要他的时候他在服务别人。 雇佣的本质是买确定性。你付月薪,买断的是"他随时在,他了解我的上下文,他不会跑"。这是一种古老的风险共担机制。代价是他的自由。 合伙的本质是几个人把自己的命运押进同一个池子里。一起共担风险,但利益分配的机制又决定了,合伙的利益必须远远大于各自的利益才可以。

译科斯定理认为交易成本降低后公司无需存在,OPC叙事基于此逻辑。但盲区在于个人加AI与外部合同无法实现风险共担,OPC仅解决能力问题,未涉及信任和风险。合同工不共担风险,可能因高价而消失;雇佣通过月薪购买确定性,确保员工随时可用并了解上下文,这是一种古老的风险共担机制,代价是自由。合伙则要求多人共同押注命运,共担风险,但利益必须远超各自利益。

Chubby♨️@kimmonismus · 5月2日63

http://x.com/i/article/2050492808184659968 # NVIDIA Blackwell vs. Huawei Ascend: Did DeepSeek V4 prove China doesn't need Western silicon? Every Saturday, I write a Deep Dive for my newsletter at getsuperintel.com. Given how important the China–US chip race has become, I’m publishing today’s Deep Dive here on X as a full article. Yesterday, I promised to take a closer look at Huawei chips vs. NVIDIA and DeepSeek. Here it is. Enjoy the read. For the better part of three years, the Western technology establishment slept soundly on a reassuring premise: China was hopelessly behind in AI chips, and export controls would keep it that way. Chris Miller's bestselling book "Chip War" painted a vivid and persuasive picture of a global semiconductor supply chain so intricate, so dependent on Western chokepoints, that Chinese self-sufficiency seemed a decade or more away. ASML's monopoly on extreme ultraviolet lithography, NVIDIA's stranglehold on AI training through its CUDA software ecosystem, and TSMC's unmatched manufacturing prowess formed what appeared to be an impenetrable triple lock. Then, in April 2026, DeepSeek released V4, a 1.6 trillion parameter Mixture-of-Experts model with 49 billion active parameters and a one-million-token context window. On selected coding and reasoning benchmarks, it approaches frontier-class performance, even though CAISI’s May 2026 evaluation still places it roughly eight months behind the absolute frontier; a model deeply optimized for Huawei's domestic Ascend chip ecosystem and confirmed to run on Huawei's latest Ascend 950 infrastructure for inference and deployment. While the full details of V4's training hardware remain ambiguous, with some reports suggesting pre-training still relied on NVIDIA GPUs (ChinaTalk, 04/27/2026), the strategic significance is clear: DeepSeek has built a frontier model that no longer depends on Western hardware to operate at scale, and that may soon no longer need it to train, either. Huawei's Ascend processors, manufactured domestically by China's SMIC foundry using equipment that Western analysts said could never produce chips this advanced. The implications are staggering, and they demand an honest reckoning with a central question: How did China close a gap that was supposed to take 10 to 15 years, in roughly three? ## The chip gap was real, but measured wrong To understand what happened, you first need to understand what the "chip gap" actually meant, and where the framing went wrong. On the level of a single chip, Western superiority remains overwhelming. NVIDIA's current flagship, the Blackwell B200, is fabricated on TSMC's cutting-edge 4-nanometer process and delivers around 2,250 teraflops of computing power at BF16 precision, paired with 192 gigabytes of the latest HBM3e memory running at 8 terabytes per second of bandwidth. Huawei's earlier domestic alternative, the Ascend 910C, illustrates the scale of the gap. Built on SMIC's optimized 7-nanometer process using older lithography tools, it manages roughly 700 teraflops and offers only 3.2 terabytes per second of memory bandwidth, roughly a third of the compute and less than half the bandwidth of a single B200. Huawei's newer Ascend 950 generation, which is now central to the DeepSeek V4 story, narrows the gap further but still appears to trail NVIDIA's most advanced chips significantly. This is the metric much of the Western chip-control debate focused on, and on this metric, the diagnosis was largely correct. China remains one to two hardware generations behind. But here is where the Western analysis made a critical error: it assumed the chip-level gap would translate directly into a capability gap. It did not. Brute Force at Scale Huawei's answer to NVIDIA's chip-level dominance is what engineers call a "scale-out" strategy, and it is as elegant in concept as it is brutal in execution. Where NVIDIA's reference data center system, the GB200 NVL72, connects 72 Blackwell GPUs into a unified computing fabric delivering about 180 petaflops, Huawei simply built bigger. Its CloudMatrix 384 system packs 384 Ascend 910C chips into a densely interconnected cluster, delivering a theoretical 300 petaflops of BF16 compute, roughly 1.7 times the NVIDIA system's raw output. It also offers 3.6 times the aggregate memory capacity and 2.1 times the total memory bandwidth. The trade-off is enormous. A single NVIDIA NVL72 rack consumes about 145 kilowatts. The Huawei CloudMatrix 384 devours 560 kilowatts, making it about 2.5 times less energy-efficient per unit of useful computation. In any normal commercial context, this would be economic suicide. No Western cloud provider would willingly operate hardware this inefficient when cheaper, more performant alternatives exist. But China is not operating under normal commercial logic. The development of domestic AI infrastructure is treated as a matter of national sovereignty. State-backed telecommunications giants and government investment funds subsidize the astronomical energy costs. When the goal is strategic independence from a hostile technology embargo, electricity bills become a secondary variable. ## Software Ate the Hardware Gap The CUDA moat falls? The brute-force hardware story only gets you halfway to an explanation. Even with 384 chips wired together, you still need software sophisticated enough to orchestrate them. This was supposed to be NVIDIA's second, even more durable advantage: its CUDA software platform, the invisible infrastructure that makes AI training on NVIDIA hardware almost effortless and that locked in developers through massive switching costs. Huawei's alternative, called CANN (Compute Architecture for Neural Networks), was for years considered unstable and painful to use. Training runs on Huawei clusters frequently crashed. Hardware utilization rates hovered around a dismal 60 percent, meaning 40 percent of the expensive compute was being wasted to coordination failures and software bugs. DeepSeek V4 is the proof that this barrier has been overcome. DeepSeek engineers worked directly with Huawei to write custom software kernels, specifically designed for the Ascend chip's architecture, that overlap computation, memory access, and network communication simultaneously. These optimizations pushed hardware utilization from 60 percent to over 85 percent, fundamentally changing the economics of Chinese AI clusters. Algorithmic genius as compensation But the truly revolutionary contribution of DeepSeek V4 is not the hardware adaptation. It is the model architecture itself, a masterclass in using software innovation to compensate for hardware limitations. The model employs a Mixture-of-Experts (MoE) architecture. While it has 1.6 trillion total parameters, only 49 billion, roughly 3 percent, are activated for any given computation. The network consists of hundreds of specialized sub-networks, or "experts," each trained for specific tasks like mathematical reasoning, Chinese grammar, or Python code generation. A dynamic routing system decides which experts to engage for each input token. The result is a model with the knowledge capacity of a 1.6-trillion-parameter giant but the computational cost of something far smaller. Earlier MoE systems suffered from a problem called "routing collapse," where a few popular experts got overwhelmed while others sat idle. DeepSeek solved this with what they call "Anticipatory Routing," computing expert assignments asynchronously in advance using slightly older network weights. This decouples the routing decision from the critical computation path and dramatically stabilizes training (DeepSeek-AI, Technical Report, 04/2026). The team also deployed the Muon optimizer, a departure from the AdamW optimizer used across virtually the entire Western AI industry. Muon works by ensuring that parameter updates during training remain mathematically orthogonal to each other, preventing the kind of conflicting gradient updates that can cause training to collapse, a risk that is especially acute on less reliable hardware. Perhaps most impressively, DeepSeek introduced FP4 quantization-aware training. While most AI labs train their models in 16-bit or 8-bit numerical precision, DeepSeek trained its expert weights in just 4-bit precision. Because each expert handles only a narrow domain, this extreme compression works without meaningful quality loss, and it dramatically reduces memory bandwidth consumption, precisely the resource where Huawei's chips are most disadvantaged relative to NVIDIA. The cumulative effect of these innovations is staggering. DeepSeek V4-Pro can process contexts of one million tokens, the equivalent of 15 to 20 full novels, while requiring only 27 percent of the compute and 10 percent of the memory cache compared to its predecessor, DeepSeek V3.2. ## The Lithography Question: Did China Copy ASML? The question of how SMIC (Semiconductor Manufacturing International Corporation (SMIC) is the largest and most advanced pure-play semiconductor foundry in mainland China) manufactures advanced chips without access to ASML's extreme ultraviolet (EUV) lithography machines is perhaps the most technically fascinating part of this story. EUV uses light with a wavelength of 13.5 nanometers to etch transistor patterns onto silicon wafers. It is considered physically essential for chip features below 7 nanometers, and the Netherlands has banned its export to China since 2019. SMIC's workaround is a technique called Self-Aligned Quadruple Patterning (SAQP). Since the older deep ultraviolet (DUV) light it has access to, at 193 nanometers, is too coarse to draw fine features in a single pass, SMIC exposes the wafer four times in succession with extraordinary precision, effectively creating structures equivalent to 7-nanometer and, as of late 2025, even 5-nanometer processes. Independent analysis by TechInsights confirmed that Huawei's Kirin 9030 uses SMIC's N+3 process, a scaled evolution of its 7nm-class technology that shows how close SMIC is getting to 5nm-class manufacturing without EUV, while still remaining meaningfully behind leading commercial 5nm nodes from TSMC and Samsung (TechInsights, 12/11/2025). The catch is yield. SMIC's multi-patterning approach produces catastrophic defect rates, with only 30 to 40 percent of chips coming off the line in working condition. For comparison, TSMC achieves yields above 80 percent with its EUV processes. Each wafer takes longer to produce, the machinery wears out faster, and the cost per working chip is astronomical. For any company operating in a free market, this approach would mean bankruptcy. For China, it is a matter of state policy: hundreds of billions of yuan in subsidies from government investment funds absorb the losses. China's EUV Manhattan Project The long-term DUV workaround has a ceiling. Pushing beyond the current 5nm-class toward the 3nm and emerging 2nm frontier becomes exponentially harder without EUV. Each additional patterning step adds cost, defect risk, and cycle time, and the economics deteriorate rapidly. DUV can be stretched further, but not indefinitely, and not competitively. An ASML EUV machine costs over 370 million dollars, weighs more than 180 tons, contains over 100,000 specialized components, and requires three Boeing 747 cargo planes to transport. The precision of its mirror system, supplied by Germany's Carl Zeiss, operates at tolerances measured in picometers, the width of individual atoms. You cannot reverse-engineer this from a blueprint. The knowledge is embedded in people. China has pursued exactly this vector. Reporting from late 2025 revealed that China had initiated a classified research program of extraordinary scale, internally compared to the Manhattan Project (Reuters, 11/2025). Under high-level political coordination, a secured laboratory in Shenzhen produced a functioning EUV prototype in early 2025. The effort relied heavily on recruiting former ASML engineers, including key figures from the company's light-source development division, with signing bonuses reportedly reaching up to $700,000. Within 18 months, one recruited team filed eight critical EUV-related patents. The prototype is far from commercially viable. It fills nearly an entire factory hall, uses secondary-market optics from Nikon and Canon rather than Zeiss-grade components, and achieves only about 3.4 percent conversion efficiency, far too low for high-volume manufacturing. It demonstrates an important proof-of-concept milestone. Western intelligence agencies, which had projected a Chinese EUV machine for 2035 at the earliest, were caught off guard. The timeline has compressed by nearly a decade, with Chinese officials targeting functional EUV chip production by 2028 to 2030. ## A preliminary verdict The evidence leads to a clear, if uncomfortable, set of conclusions. DeepSeek V4 is not a benchmark stunt. On selected coding tasks, V4-Pro is highly competitive! It achieves 80.6% on the SWE-bench Verified coding benchmark, essentially matching Claude Opus 4.6 at 80.8%, and surpasses it on LiveCodeBench with 93.5% versus 88.8% (Of course, it's also true that real-world usage differs from the benchmarks.). It accomplishes this while offering API prices 90 to 97 percent lower than Western equivalents, a cost advantage driven not by predatory pricing but by genuine architectural efficiency. China did not close the chip gap. It went around it! The hardware remains inferior chip-for-chip, but radical system-level scaling, extraordinary software innovation, state-subsidized energy costs, and a willingness to accept manufacturing inefficiencies that would destroy any commercial enterprise combined to produce an outcome that the sanctions were specifically designed to prevent. ## The sanctions paradox The deepest irony of this story is that the export controls may have accelerated the very outcome they sought to prevent. Before October 2022, Chinese AI labs were happy NVIDIA customers, content to buy American hardware and train their models on CUDA. The sanctions forced them into an uncomfortable but ultimately productive marriage with Huawei, compelled DeepSeek to invent algorithmic solutions to hardware problems, and gave the Chinese government the political mandate to pour unlimited resources into semiconductor independence. Chris Miller's analysis in "Chip War" was not wrong about the physics. EUV lithography is genuinely hard, and NVIDIA's chips are genuinely superior. What it underestimated was the degree to which software innovation, system-level engineering, and state-directed economic irrationality could neutralize those advantages in practice. The 10-to-15-year gap was measured in hardware generations. China's response was to make the hardware generation gap matter less. The question going forward is not whether China can match NVIDIA chip for chip. It probably cannot, at least not soon. The question is whether chip-for-chip superiority still matters when the competition is being fought on a different axis entirely, one where algorithmic efficiency, system architecture, and political will have proven to be just as decisive as nanometers and transistors. The West built a fortress around its silicon. China built a ladder out of software, and climbed over the wall. A few final words and personal views The future of AI infrastructure is more open than anyone in Washington or Silicon Valley assumed even 12 months ago, and the comfortable narrative of permanent Western dominance no longer holds. What we are watching is the emergence of a genuine two-player race between the US and China, one that will be fought across hardware, software, and industrial policy simultaneously, with escalating intensity on both sides. Europe, absent any frontier chip design capability or hyperscaler of its own, risks being reduced to a spectator in this contest. But one European lever remains decisive: as long as ASML remains the only supplier of production-grade EUV lithography, Europe is not merely watching the game. It holds one of the few choke points that still shapes the board. P.s. This text is essentially the answer to my open question: Sources referenced in the article: 1. DeepSeek V4 Technical Report (04/24/2026) https://huggingface.co/collections/deepseek-ai/deepseek-v4 / https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf 1. TechInsights: SMIC N+3 Confirmed, Kirin 9030 Analysis (12/11/2025) https://www.techinsights.com/blog/smic-n3-confirmed-kirin-9030-analysis-reveals-how-close-smic-5nm 1. Reuters (via Modern Diplomacy): Inside China's Secret Push to Build Its Own EUV Chip Machine (12/17/2025) https://moderndiplomacy.eu/2025/12/18/inside-chinas-secret-push-to-build-its-own-euv-chip-machine/ (Original Reuters article is paywalled; this is the most complete openly accessible version citing Reuters directly) 1. MIT Technology Review: Three Reasons Why DeepSeek's New Model Matters (04/24/2026) https://www.technologyreview.com/2026/04/24/1136422/why-deepseeks-v4-matters/ 1. NIST/CAISI Evaluation of DeepSeek V4 Pro (05/02/2026) https://www.nist.gov/news-events/news/2026/05/caisi-evaluation-deepseek-v4-pro 1. EE Times: China EUV Breakthrough and the Rise of the 'Silicon Curtain' (12/23/2025) https://www.eetimes.com/china-euv-breakthrough-and-the-rise-of-the-silicon-curtain/ 1. Asia Times: Made-in-China EUV Machine Targets AI Chip Output by 2028 (12/24/2025) https://asiatimes.com/2025/12/made-in-china-euv-machine-targets-ai-chip-output-by-2028/

译西方长期认为中国在AI芯片领域落后10-15年,但DeepSeek V4的发布颠覆了这一观点。该模型深度优化于华为昇腾芯片生态,可在昇腾950基础设施上部署推理,实现前沿模型大规模运行不依赖西方硬件。虽然单芯片性能上,昇腾950仍显著落后于NVIDIA Blackwell B200,但中国通过“横向扩展”战略,用大量国产芯片集群结合软件优化和模型架构创新(如MoE),使系统级AI能力快速接近前沿水平。这暴露了西方分析的根本错误——将芯片级差距直接等同于能力差距。

阿绎 AYi@AYi_AInotes · 5月2日59

NVIDIA CEO Jensen Huang(黄仁勋)刚刚这番话,直接打了所有AI末日论者的脸。 他在《Memos to the President》(给总统的备忘录)播客里, 当着政策制定者的面说, 那些到处散布“AI会消灭放射科医生”“别让孩子学软件工程” “一半大学毕业生会失业”的CEO们, 他们根本不是在善意提醒, 他们是在伤害整个社会。 你告诉年轻人学放射科会失业, 结果就是没人学医,十年后我们会面临最可怕的医生短缺。 你告诉所有人程序员要被淘汰, 结果就是未来最缺软件工程师的时候,没人能顶上。 这种所谓的“善意警告”, 最后都会变成自我实现的预言。 最扎心的一句是, AI不会消灭工作,它会消灭任务。 以前需要海量代码和大量程序员。 现在AI能帮你写代码了,但人类的野心会立刻膨胀——我们要去解决的问题(医疗、制造、科学、零售)会指数级扩张。 敲键盘的低阶劳动会被自动化, 但架构、判断、创造这些真正值钱的能力,需求只会爆炸式增长。 当然所有人都知道他的立场。 OpenAI和Anthropic靠末日叙事拿融资、拿监管特权,而黄仁勋需要所有人都大胆用AI,这样他才能卖出更多的GPU。 但这次他说的是对的。 历史已经反复证明了无数次,技术革命从来不是零和游戏。 计算机出现的时候,所有人都怕秘书失业,结果是知识工作者的数量大幅增长。 今天也一样,胜出的永远不是纯人类,也不是纯AI,而是会用AI的人类。 真正危险的从来不是AI。 是那些被恐慌叙事吓得不敢投资自己未来的年轻人。 别听那些CEO瞎忽悠,冲进AI最猛的领域,成为那个驾驭它的人。 这才是这个时代最安全的职业选择。

译NVIDIA CEO黄仁勋批评部分CEO散布的AI末日论会伤害社会,导致关键领域人才短缺。他强调,AI将自动化低阶任务,但对架构、判断与创造等高阶能力的需求会激增。技术革命并非零和游戏,历史证明计算机的出现反而创造了更多知识工作。真正的危险在于恐慌叙事阻碍年轻人投资未来。善于驾驭AI的人类将成为赢家。黄仁勋以自身经历为例,指出低期望所培养的韧性是其成功关键。

Berryxia.AI@berryxia · 5月2日13

好看~~~~

Chubby♨️@kimmonismus · 5月2日51

Sam Altman: collective ownership of AI through compute shares or a Public Wealth Fund. Sam Altman famously spent $14billion on the largest UBI study ever conducted, only to watch the results land with a shrug: more spending, no measurable health improvements. Now he's saying cash payments alone won't cut it and is pushing for collective ownership of AI through compute shares or a Public Wealth Fund. It's actually a more interesting idea than UBI ever was. Instead of cushioning people against AI displacement, Altman wants to give them a stake in the upside. However, you could also frame it the other way: It's a neat trick, turning the product you sell into the social safety net people depend on. Anyway, we are seeing developments in ideas how to solve joblessness due to AI.

译Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

凡人小北@frxiaobei · 5月2日26

LLMs are the Tower of Babel. Coding made it obvious, language was never the real problem. In other domains, it still is.

译LLMs 是巴别塔。 编码让它变得显而易见,语言从来不是真正的问题。 在其他领域,它仍然是问题。

ginobefun@hongming731 · 5月2日63

http://x.com/i/article/2050470671755730944 # BestBlogs 周刊第 93 期 · AI 次方变革 > 本期主题:把 AI 放到指数位上,而不是加号边上 —— 用杨斌的「AI 次方变革」串起 Karpathy 的 Software 3.0、Demis 的 AGI 路径、国内三家大厂的 Harness 中文化、Anthropic 两份 Claude Code 工程心法、OpenAI 编排栈、企业生产实战,以及 OpenAI × 微软的关系新阶段。🎧 同步播客:BestBlogs 周刊第 93 期 · AI 次方变革(在小宇宙搜索 BestBlogs 周刊)📚 完整周刊:https://www.bestblogs.dev/newsletter/issue93 ## 导语:组织的中年撞上技术的青春期 清华经管学院杨斌教授本周提出 AI 次方变革 —— 把 AI 放到指数位上,而不是加号边上。 「+AI」的心智追求即期绩效、主流一致、线性稳进,但 AI 不是一种成熟工具,它每天都在变;底数(组织 / 心智 / 知识)如果没有先质变,幂位再怎么放大也没用。底数小于一时,幂位甚至会让结果塌陷。 这一期读完 20 篇内容,杨斌这个隐喻像一根串绳:Karpathy 在 Sequoia 给出 Software 3.0 的完整框架,Demis 在 Y Combinator 把 AGI 时间表压到 2030,国内三家大厂同周给出 Harness Engineering 的中文版第一性原理,Anthropic 把 Claude Code 的两份内部经验贴出来,OpenAI 把 Codex 编排栈打开,京东和 Java 阵营把企业实战补齐。这些动作放在一起看,像同一句话被翻译成不同口音在不同地方反复说。 回头看前两期周刊,第 91 期是基建周,第 92 期是模型周。这一期不再是单一爆发,而是大家集体在往同一个方向上汇拢 —— 从 +AI 走向 AI 次方。 ## 个人更新:BestBlogs 四月内测收官,五月进入早鸟期 四月份 BestBlogs 的内测正式收官。这一个月里我们做了挺多事情,挑用户能感知的几条说一下: 1. 开放能力发布(v2.0.7):上线 OpenAPI、命令行工具 @bestblogs/cli、还有给 Claude Code 这类智能体准备的 skills 套件,让外部开发者可以直接调用站内数据和功能。 1. 内建翻译升级到 v2(v2.1.0):同一篇内容只扣一次配额,中英双向,覆盖文章 / 播客 / 视频。文章和推文详情页可以直接读译文,不再需要跳转 wenrun.ai。 1. 每日回顾上线(v2.0.11 + v2.1.1):AI 根据你当天的阅读足迹提炼洞察,可邮件投递。Pro 内测用户每天会收到一封中英双语的 Daily Review。 1. 主题深度解读(v2.1.0 + v2.1.3):上线 Topic Pages,目前支持事件、领域、人物 / 组织、对比四种类型,编辑可以把最值得读的主题置顶。 1. Pro 早报双形态(v2.1.0):文字版(一句话总结 + 关键洞察 + 头条卡片)和播客版可以即时切换,喜欢扫读的有了文字版,喜欢通勤听的还是播客版。 此外还上线了公开 /docs 文档中心和 Mobile App 内测。完整更新日志在 bestblogs.dev/changelog。 五月开始,BestBlogs 正式进入早鸟期,欢迎大家订阅、使用,把反馈直接告诉我。 ## 一、三个理论框架:杨斌、Karpathy、Demis 同周给出三种语言 这一周最有意思的地方是,三个完全不同背景的人,几乎在同一周给出了同一种判断的不同版本。 杨斌:组织的中年撞上技术的青春期 杨斌教授的版本最直接。他说「+AI」是组织的中年心智,追求即期绩效、主流一致、线性稳进。这种心智把 AI 当成现有流程的一个有益补充,不挑战既有的权力分布,也不挑战既有的文化假设。 但 AI 不是一种成熟工具,它每天都在变。如果底数没有先发生质变,幂位再怎么放大都没有用。底数小于一时,幂位甚至会让结果塌陷。 正确的做法是把 AI 放到指数位上 —— 破执重构​,让组织从大写变小写,让主流让位给杨斌说的「流人和边域​」。他在演讲里点名 Claude Code 和 OpenClaw 这两个产品,说它们都是流人作品,都是在边缘环境里长出来的,不是被规划出来的。 这一点和涌现的本质相关:涌现不能被计划,但有规律。杨斌引用了两句英文:context not control,emerging not planning。情境而不是控制,涌现而不是计划。 → 阅读原文:杨斌:我为什么要提「AI 次方变革」 Karpathy: Software 3.0 + Vibe Coding + Agentic Engineering Karpathy 在 Sequoia 现场给硅谷版的「AI 次方」搭了一套完整语言。他把过去的程序员演化拆成三段: - Software 1.0:人类用代码显式写规则 - Software 2.0:用神经网络的权重学规则 - Software 3.0​:大语言模型变成计算机本身,上下文窗口变成新的接口。在这个范式里,编程不是写代码,是设计上下文 然后他给了两个新词。Vibe Coding 是抬高地板,让所有人都可以靠描述意图做出软件。Agentic Engineering 是给智能体保持质量和边界,因为这些智能体本质上是有锯齿(spiky)、有概率性的工程实体,需要被驯服。 Karpathy 在访谈里有一句话我印象很深:You can outsource your thinking, but you can't outsource your understanding。未来的程序员是 director,是导演,是那个决定 taste 和 systems design 的角色,那部分是不可被外包的。 → 阅读原文(中文整理):Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering → 视频原始版:Andrej Karpathy: Software 3.0 完整框架 Demis Hassabis:AGI 还差什么 + 创业者怎么办 Demis Hassabis 在 Y Combinator 现场,从科学家的角度回答 AGI 还差什么。他把 AGI 时间表压到大概 2030 年,并且明确指出还差三块「大想法」: 1. 持续学习(Continual Learning):模型要能在不忘旧知识的情况下持续吸收新知识 1. 长程推理(Long-term Reasoning):从简单的链式思考升级到能做计划和自省的更稳健推理 1. 类脑工作记忆(Brain-style Working Memory):从蛮力堆上下文窗口升级到更接近人脑的高效记忆 Demis 给创业者的建议很硬:假设 AGI 会在你公司生命周期的中段出现​。所以产品要去截击 AI 曲线​,去那些「暴力搜索失效但 AI 推理擅长」的组合空间,比如材料科学、医药、Isomorphic Labs 在做的虚拟细胞。不要去和「AGI + 一行 prompt」竞争,那条路是没有壁垒的。 → 阅读原文:How to Build the Future: Demis Hassabis 把这三个人的话叠在一起,会发现一个共同信号 —— 新范式的关键不是模型本身,是组织怎么改、人在哪里、产品打哪个空间。杨斌讲的是组织的底数得先质变,Karpathy 讲的是程序员要变成导演,Demis 讲的是产品要去截击曲线。三个人从三个层面回答同一个问题。 ## 二、Harness Engineering 中文化:四篇同周给出第一性原理 有了框架,看落地。这一周国内三家大厂几乎同步给出了 Harness Engineering 的中文版第一性原理,加上腾讯云开发者那篇挑衅式的「RAG 已死」,构成了本周最密集的一组中文 Agent 工程化讨论。 楼天城:开发主导权正在交给 AI 最让我意外的是小马智行 CTO 楼天城接受量子位的访谈。一个开发自动驾驶十年的人,公开承认开发的主导权正在交给 AI。原文里他用了一句话: > Harness 是这个时代最关键的能力之一。 他把今天的 AI 形容成一匹脱缰野马,能调用工具、能调用各种 skill,主动性和能量都在大幅提升。然后他抛出一个让人停下来想一下的判断:未来甚至连人类,都可能成为被「调用」的一环。 这一段听起来有点黑色幽默,但他的逻辑是直的 —— L4 级自动驾驶不能靠人类兜底,模仿学习的天花板就是人类本身。当 AI 司机的安全性全面超过人类,再让人类工程师手把手教 AI 开车,就像让业余棋手去辅导 AlphaGo。这是范式问题,不是态度问题。 → 阅读原文:量子位专访楼天城:AI 是匹脱缰野马,Harness 是这个时代最关键的能力 腾讯:Harness 不是目的,知识才是护城河 腾讯技术工程团队再上一层定义:Harness 不是目的,知识才是护城河。这个判断把抽象提了一级。 Harness 是工程实现,是 SOP 和 Skill 库的集合。但真正决定一个团队能不能持续受益的,是这套 Harness 背后能沉淀什么知识。腾讯给出的是一个从 SOP 到 Skill 库的工程交付路线,描述了一个团队怎么把每天踩的坑沉淀成可复用的能力。 → 阅读原文:Harness 不是目的,知识才是护城河 —— 一个 AI 工程交付团队的知识沉淀实践 阿里云:拆 OpenClaw 的 Agent 架构,三条反直觉结论 阿里云开发者用一篇长文系统拆 OpenClaw 的 Agent 架构。这篇文章值得做 Agent 的同学读,因为里面有几个反直觉结论: 1. 更贵的模型没你想象中那么有用,Harness 和验证测试的质量对成功率的影响更大 1. 调试 Agent 行为时,应该优先检查工具定义 —— 多数工具调用错误来自描述不准确,不是模型不够聪明 1. 评测系统本身的问题,往往比 Agent 的问题更难发现。如果一直在 Agent 代码上调,效果可能上不去 → 阅读原文:你不知道的 Agent:原理、架构与工程实践 腾讯云:RAG 已死?不,是 Grep 回归了 最后是腾讯云开发者那篇 RAG 已死?不,是 Grep 回归了! 标题挑衅,但论点扎实。 作者的判断是:高质量的 Skill 和工具描述比向量索引更值钱。当模型本身越来越强,长上下文越来越便宜的时候,传统 RAG 那套切片、向量化、相似度召回的复杂度就显得多余。直接用 Grep,用关键字搜索,加上准确的工具描述,效果反而更好。 这其实和阿里那篇结论是相通的,都指向同一件事 —— 工具描述和 Harness 比模型选型更重要。 → 阅读原文:RAG 已死?不,是 Grep 回归了! 把这四篇放在杨斌的框架下看,就是底数的质变。组织如果还在比谁的模型更贵,那就是把变革放在加号位上。组织如果开始研究 Harness、研究知识沉淀、研究工具描述,那就是开始把变革放在指数位上。 ## 三、Anthropic 两连发:Claude Code 心法 + 提示缓存 这一周 Anthropic 官方贴了两份 Claude Code 团队的内部经验,正好补上了 Karpathy 没回答的工程细节。 像带新人一样引导 Claude Code 第一篇用了一个真实案例。MacCoss Lab 是华盛顿大学的一个蛋白质分析实验室,他们的开源软件 Skyline 已经维护了 17 年,70 万行 C# 代码。主开发者 Brendan 一开始很怀疑 Claude Code 能不能搞定这种长寿命项目。 最后他想清楚了一件事:自己过去十几年带本科生、研究生、博士后进入这套代码库,那一整套 onboarding 方法论,可以原封不动地用在 Claude Code 上。先给「实验室手册」,再交工作任务。把 AI 当作一个新进研究员来带,而不是当成一个魔法盒子。 这一篇值得做工程的同学读。它没有讲什么新概念,但它把心法落到了具体场景。 → 阅读原文:像带新人一样引导 Claude Code:来自 17 年开发经验的启示 提示缓存对 Coding Agent 至关重要 第二篇是 Claude Code 团队自己的复盘:提示缓存对编程智能体是至关重要的,命中率直接决定了一个长程任务能不能跑稳。 这听起来很工程,但它其实是一个范式判断 —— 当智能体要持续可靠地干完长任务,关键变量不是模型本身的智能,而是它能不能稳定地保留上下文。提示缓存就是这个稳定性的最直接来源。 两篇加起来,把 Karpathy 留下的工程黑盒打开了。 → 阅读原文:构建 Claude Code 的经验教训:提示缓存至关重要 ## 四、OpenAI 编排栈 + Cloudflare:让 Agent 上手干活 聊完心法,看落地的几条路径。 OpenAI 把 Codex 编排栈打开 OpenAI 这一周三件事可以放在一起看: 1. Symphony:把 Codex 多智能体编排做成开源规范 → 阅读原文 1. AI Engineer 现场拆解 Codex 子智能体:把 OpenAI 的 AI 工程平台从 IDE 里拎出来 → 阅读原文 1. 长时间运行的智能体(Elevate):补另一面 —— 让 Agent 持续可靠干完长任务,要从持久化、子线程、检查点设计起 → 阅读原文 这一组三篇组合起来,像极了 Cloudflare 上一期做的「Agent 基建周」,只不过这次是 OpenAI 在做。 Cloudflare:Agent 自己开户、买域名、部署应用 这一期 Cloudflare 的代表作是一个干净的 one-shot 演示 —— AI Agent 能自己创建 Cloudflare 账户、买域名、把 Workers 部署上线。背后有 Managed OAuth + Mesh 撑起私有联网。 这件事小,但意义大。它把「Agent 上手干活」从 demo 推到了生产入口。Software 3.0 真正能跑的标志,不是 Agent 能写多少代码,而是 Agent 能不能从注册账户开始,把整个交付流水线走完。 → 阅读原文:AI 智能体现在可以创建 Cloudflare 账户、购买域名并部署应用 ## 五、企业生产实战:京东 GRAM + Java MCP 两篇值得说,是企业版的「AI 次方」基础设施。 京东 GRAM:50ms 端到端的生成式推荐 京东广告团队披露 GRAM 架构 —— 他们把生成式推荐做到了端到端 50 毫秒​。这是什么概念呢,50 毫秒是用户感知不到的延迟。在电商场景下,把「模型即推荐系统」这个判断打了第一个范本。 这背后涉及到训练侧的稀疏化、推理侧的工程化、还有大量的算子优化,是真正的工程硬功夫。 → 阅读原文:京东广告大模型实战:GRAM 架构如何在 50ms 内完成生成式推荐? Java 世界中的 MCP:把 LLM 集成提升到架构纪律 InfoQ 的长文,讲 Java MCP SDK​。这篇文章我推荐 Java 同学读一下。它的视角是把 MCP 看作架构纪律,不是 prompt 工程: - 显式契约:Models 只调用通过协议声明的工具 - 反腐败层:MCP Server 在 LLM 和核心系统之间隔一层,控制能力暴露范围 - 控制平面:把 LLM 集成放进 Spring 和 JVM 团队熟悉的服务边界、可观测性、资源管理体系里 它不是教你写 MCP 代码,是教你把 LLM 集成放进企业架构的那条线里。 → 阅读原文:Java 世界中的 MCP:为 LLM 集成带来架构策略 ## 六、范式思辨:Skill 蒸馏、Language Agent 60 年史、智能体失败案例 Skill 到底能蒸馏我们的几分之几? 腾讯科技的这篇文章,从 GitHub 上一批 skill 类项目的爆火谈起。三月底同时火起来的有「同事 skill」「老板 skill」「女娲 skill」 —— 同事 skill 把离职同事的飞书消息、钉钉文档、Slack 记录、微信聊天都喂给 Claude,自动生成一个 skill 文件。装上之后 AI 能「变成」那个同事,连说话语气都模仿。 然后 CMU 出了一篇论文,跑出来 SkillFoundry,一次扫一遍 GitHub 仓库、API 文档、Jupyter Notebook、学术论文,挖出 286 个 skill。BenchFlow 团队的 SkillsBench 测了 84 个任务,加 Skill 后平均通过率提升 16.2 个百分点。 但同一周还出现了一个反向项目 anti-distill​,帮你生成一份看起来完整、核心知识却被掏空的 skill 文件。作者追问的问题是:那层能被掏空的是什么,那层掏不空的又是什么? 这个问题没有答案,但值得每个内容工作者放在心里。 → 阅读原文:严肃聊聊,Skill 到底能蒸馏我们的几分之几? 张小珺 × 苏煜:Language Agent 60 年技术史 张小珺这一期访谈,嘉宾是俄亥俄州立大学的苏煜教授。两个小时的长对谈,把 Language Agent 60 年的技术史复盘了一遍 —— 从 1960 年代的逻辑代理,到神经代理、语义解析,再到今天的语言代理。 苏煜给出一个判断:OpenClaw Moment 像 ChatGPT Moment。意思是 OpenClaw 的出现,可能是 Agent 时代的那个分水岭。这一期我推荐五一假期听,节奏不快,信息密度大。 → 阅读原文:139.【Agent 综述】和苏煜聊 Agent 技术史、OpenClaw Moment、边界的消弭和社会的辐射 PostHog:LLM 代码生成的五条修法 PostHog 的 Danilo 在 AI Engineer 现场分享了一个智能体的失败案例。他们做的 Wizard 是一个一个月服务 15,000 用户的自动化集成助手,模型很容易因为静态训练数据过期而搞砸事情。 Danilo 给了五条修法: 1. 新鲜上下文:把最新的 Markdown 文档直接注入上下文(避开复杂 RAG) 1. 模型飞机:用简化版的真实应用做模板 1. 面包屑:把大任务拆成顺序步骤 1. 推理时审讯:每次跑完问 Agent「我应该怎么做才能让你成功?」 1. prose > scaffolding:纯文本散文比脚手架代码更值钱 最后一条留下一句话挺有力 —— 在 AI 时代,文档质量是面向未来的资产,硬编码的逻辑是在折旧。 → 阅读原文:LLM 代码生成为什么会失败,以及如何避免 ## 七、商业重构:OpenAI 与微软的新阶段 OpenAI 和微软这周宣布了一个重要的合作新阶段。新协议把双方关系从独占走向灵活。三件事可以注意: 1. OpenAI 产品仍然优先在 Azure 上发布,但现在可以服务任何云供应商 1. 微软对 OpenAI 知识产权的授权,从独占改成非独占,同时微软不再向 OpenAI 支付收入分成 1. 微软作为大股东继续参与 OpenAI 的增长,OpenAI 到 2030 年仍按比例向微软分成(有总额上限) 这是过去两年商业重构里最值得记下的一笔。OpenAI 走向「基础设施级」独立的关键一步迈出去了。 → 阅读原文:微软与 OpenAI 合作的新阶段 ## 写在最后:本周三条判断 整理一下我自己读完这一周内容的判断。 第一,杨斌的「AI 次方变革」不是又一个 buzz word,是给企业的一个很有用的提醒。如果你团队还在讨论怎么让大模型给现有流程加分,那就是把 AI 放在加号位上。如果你团队开始讨论 Harness、知识沉淀、工具描述,那就是开始把 AI 放在指数位上。 第二​,Karpathy 的 director 比喻和 Demis 的「截击 AI 曲线」建议,加上国内三家大厂的 Harness 中文化,这一组信号让我相信 Agentic Engineering 已经从概念阶段进入工程阶段。下一阶段比拼的不是谁的模型更强,而是谁的工程纪律更扎实。 第三,Anthropic 那篇「带新人」的故事我会推荐给所有团队的同学读一下。它没有讲什么 cutting edge 的东西,但它把心法落到了你今天就能用的实践里。 完整 20 篇精选:https://www.bestblogs.dev/newsletter/issue93 订阅 BestBlogs Pro,每天早上收到双语早报,五月起进入早鸟价:https://www.bestblogs.dev 保持好奇,我们下周见。

译本期核心观点是应将AI视为驱动根本性变革的“指数”,而非线性补充工具。杨斌教授指出,组织心智与知识底数需先质变,否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文,程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年,并指出持续学习与长程推理是关键缺口,建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调,驾驭AI(Harness)与知识沉淀是关键能力。

ginobefun@hongming731 · 5月2日41

清华经管学院杨斌教授本周演讲时提出 AI 次方变革 —— 把 AI 放到指数位上,而不是加号边上。 「+AI」的心智追求即期绩效、主流一致、线性稳进,但 AI 不是一种成熟工具,它每天都在变;底数(组织 / 心智 / 知识)如果没有先质变,幂位再怎么放大也没用。底数小于一时,幂位甚至会让结果塌陷。

译清华经管学院杨斌教授提出“AI次方变革”概念,主张应将AI置于指数位置,而非简单的“+AI”加法模式。他认为,“+AI”思维追求短期绩效、线性改进,但AI本身并非成熟工具,其能力持续快速演变。核心观点指出,若作为底数的组织、心智和知识未能率先发生根本性质变,那么指数位上的AI放大效应将无法实现,甚至当底数小于1时,幂运算会导致整体结果塌陷。这强调了组织与人的深层变革是发挥AI指数潜力的先决条件。

阿绎 AYi@AYi_AInotes · 5月2日70

科技圈正在发生一波反常的人才大迁移: 多家十亿美元级公司的 CTO 集体辞职,放弃高管职位,转去 Anthropic 做 IC - Workday CTO → MTS(2026 年 3 月) - http://You.com CTO → MTS(2026 年 3 月) - Instagram CTO → MTS(2026 年 1 月) - Box CTO → MTS(2025 年 12 月) - http://Super.com CTO → MTS(2025 年 7 月) 原推本人 说实话我看到这条推文的时候愣了好久, 六个十亿美元级公司的CTO, 集体放弃高管职位, 转去Anthropic做普通的个体贡献者, 原推说离职原因是使命足够真实, 但转念一想, 事情好像没这么简单, 这些人不是傻子, 他们不会为了一句虚无缥缈的使命, 放弃几千万的年薪和管几百人的权力, 我认为真正的原因是, 他们发现了一个大多数人都没看懂的秘密, 在AI时代, 管多少人已经不重要了, 离模型有多近才重要! 以前当CTO, 你要谈政治,要还技术债,要维持老系统, 一半的精力都花在和人打交道上, 现在在Anthropic做MTS, 你直接摸最前沿的模型训练, 用AI工具把自己的产出放大一万倍, 这是一种权力的根本逆转, 以前你管的人越多,你的影响力越大, 现在你能调用的模型能力越强,你的影响力越大, 一个顶级工程师加一个好模型, 能干掉以前一个一百人的团队, 当然钱肯定也不会少, Anthropic现在的估值和增长速度, 一个MTS的股权兑现之后, 可能比大多数独角兽CTO一辈子赚的都多, 而且流动性好得多, 不用等遥遥无期的上市, 原推自己就是第五个例子, 他把http://Super.com从0做到年收入两亿美元, 然后转身去做了一个普通工程师, 他应该比任何人都清楚, 什么才是这个时代真正的杠杆, 我觉得这件事最有意思的地方在于, 它宣告了传统职业天花板的彻底重置, 以前所有人的终极目标都是当上CTO或者CEO, 但现在最聪明的人, 都在抢着去最前沿的实验室做IC了, 也许未来会有越来越多的人意识到, 当一个能直接操作基础模型的超级个体, 比当一个管几百人的高管, 有权力得多,也自由得多, 所以这不能叫被使命召唤了, 是这个时代最聪明的一群人, 用脚投出来的票, 他们正在奔向那个杠杆最大的地方, 这值得我们大部分人深思,尤其是程序员兄弟们。 #AI #职业发展 #Anthropic

译科技行业出现反常趋势,多家十亿美元级公司CTO放弃高管职位,转投Anthropic担任个体贡献者。这反映AI时代职业逻辑的根本转变:权力和影响力从管理人数转向接近前沿模型。个体工程师通过直接操作先进AI工具,其产出和影响力可能超越传统数百人团队。同时,Anthropic的高估值和增长潜力提供了极具吸引力的经济回报。此举标志传统职业天花板重置,顶尖技术人才正用行动投票,选择杠杆效应最大的核心研发岗位。

凡人小北@frxiaobei · 5月2日53

AI Coding 走到现在,还有人认真看执行过程吗? 反正我观察到的大多数程序员的日常工作已经变成无脑点 yes 的流程化操作了(看到最后,最后那个才是程序员日常 be like)。 和视频里流水线工人,差别没想象中那么大。 如果还想让效率继续往上抬一个量级,就必须把人从盯着电脑屏幕这个状态解放出来。 然后做更高一层的事情。 这就是为什么我要在团队推动 auto Coding 平台的构建,这也是三个月跟 Finn 合伙下来最真实的感受 让 Agent 去指挥 Agents。

译AI Coding的发展使程序员日常工作变得流程化,类似于流水线工人。要进一步提升效率,必须将人从紧盯电脑屏幕的状态中解放出来,转向更高层次的决策和设计。作者基于此观点,在团队中推动构建auto Coding平台,实现让Agent指挥多个Agents的自动化编码模式,以推动效率的质变。

阿绎 AYi@AYi_AInotes · 5月2日57

说个暴论,你的审美和品味就是你的提示词,并决定了你使用AI的上限。 咱们看看这个案例, 零游戏开发经验,两周时间, 一个人,做出了一个完整可玩的3D外卖配送游戏🆒 主角是一只戴粉色头盔的卡皮巴拉, 骑着电动车在城市里穿梭接单, 订单会真实堆叠在后座,掉了就会失败, 还有完整的手机App导航和超市捡货系统, 很多人看完第一反应都是AI太厉害了,但其实并不是是AI的胜利, 本质是人类品味的胜利, 他没写几行代码, 所有的逻辑模型贴图音乐音效, 全都是AI生成的, 他只做了3件事, 1️⃣告诉AI我想要一个卡皮巴拉送外卖的游戏, 2️⃣然后在AI生成的一万个版本里, 3️⃣选出那个看起来最好玩的, 最后花两周时间一点点打磨细节, 调参数摆道具改手感, 其实这就是现在大家说的vibe coding, 让AI接管了所有的执行层, 人类只需要负责方向和品味, 以前你得学会编程建模配乐剪辑, 才能做出一个游戏, 现在你只需要知道, 什么东西是好的, 很多人说这是作弊, 但这才是真正的创意民主化呀, 一年前需要一个小团队干几个月的活, 现在一个普通人两周就能搞定, 我相信未来会有无数这样的作品冒出来,创意会比技术重要一百倍甚至更多。 这也回答了那个很多人都在问的问题, AI时代人类到底还有什么用❓ AI确实能生成一切, 但它不知道的是 什么东西看起来舒服, 什么东西玩起来爽, 什么东西能让人会心一笑, 比如那些纯AI生成的游戏为什么不好玩, 因为它们只有技术,没有灵魂, 那什么是灵魂呢? 我理解灵魂就是那个站在AI背后, 做每一个微小选择的人, 就是那个知道什么时候该停手, 什么时候该再改一下的人, 而且我觉得这只是一个开始, 今天是浏览器3D游戏, 那明天可能就是完整的App, 后天甚至是3A级别的游戏原型, 我们正在见证一个全新的创作时代, 任何人都能把自己的脑洞, 变成真正的产品, 游戏链接放在评论区了, 直接浏览器打开就能玩, 建议大家去试试, 你会真切地感受到, 那个属于普通人的创作黄金时代, 真的已经来了! #AI #游戏开发 #vibecoding

译一个零经验的开发者,仅用两周时间,通过向AI描述创意并筛选最佳结果,便独立完成了一款3D外卖配送游戏。这体现了“vibe coding”模式:AI负责所有执行层任务,人类则专注提供方向与审美判断。此举并非作弊,而是创意的民主化,将过去团队数月的工作压缩至个人短期完成。AI虽能生成一切,却无法判断何为舒适、有趣或富有灵魂,这些正是人类不可替代的价值。未来,这种模式或将开启一个属于普通人的全新创作黄金时代。

Ethan Mollick@emollick · 5月2日45

I was quoted a couple times in this Atlantic article, but that isn’t (the only) reason I think it is good. It lays out the reasons why we whipsawed from “AI is a bubble” to “there are not enough data centers” in less than six months. Spoiler: its agents. https://www.theatlantic.com/economy/2026/05/ai-bubble-revenue-anthropic/687022/

译这篇《大西洋月刊》的文章中引用了我的几次观点,但这并非(唯一)让我认为它出色的原因。 文章阐明了为何在不到六个月的时间里,我们从“AI是泡沫”急剧转变到“数据中心不足”的缘由。 剧透:是智能体。 https://www.theatlantic.com/economy/2026/05/ai-bubble-revenue-anthropic/687022/

Tibo@thsottiaux · 5月2日44

It's also become super good after all the @steipete cooking over the last week or so. I've had the best experience with GPT-5.5 so far, it's night and day compared to two weeks ago.

译经过过去一周左右@steipete的精心调教,它也变得更棒了。到目前为止,我在GPT-5.5上获得了最佳体验,与两周前相比简直是天壤之别。 [引用 @sama]:你现在可以用chatgpt账户登录openclaw,并在那里使用你的订阅了! 捕龙虾快乐。

阿绎 AYi@AYi_AInotes · 5月2日57

Dario Amodei(Anthropic CEO)说要花1万亿$买算力, 很多人都在转他这个豪言壮语,但没人告诉你他后半句说了啥, 我觉得这根本不是什么雄心壮志, 更像是整个AI行业最绝望的生存宣言🤔 他原话是这么说的👇 如果2027年底营收不到一万亿, 地球上没有任何力量能阻止我破产, 有了一万亿营收,我才能买五万亿的算力。 更可怕的是他后面的补充: “我脑子里有一部分在怀疑, 增长还能不能继续保持十倍, 2027年我可能根本买不起每年一万亿的算力” 给我的感觉是像在演示一个极端脆弱的生存方程, 如果营收必须每年十倍爆炸, 那么只要差一点或者晚一年, 整个模型都得直接崩盘🤯 仔细研究了下,这就是缩放定律最残酷的经济学体现, 也就是技术可行不等于经济可行,如果现在每一代前沿模型的成本已经到了一个非常高的天文数字, 那么你必须赌指数级增长,要不然只能出局🥺 按目前的趋势, 2027年显然不是又一个普通的大模型年,大概率是整个行业的生死线, 要么成为像电力一样的通用基础设施,要么集体破产,没有中间态, 最讽刺的是很多人都把Dario的破产警示,剪成了励志金句, 用来制造FOMO,用来吹算力就是新石油, 没人愿意听那个藏在豪言背后的颤抖的声音, 感觉现在整个AI行业都在玩同一个俄罗斯轮盘赌, 所有人都必须一直扣扳机, 谁先停就谁先死, 但没人知道枪里到底有没有子弹 #AI #Anthropic #大模型

译Anthropic CEO Dario Amodei警告,若2027年营收未达万亿美元,公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行,行业正进行一场“俄罗斯轮盘赌”。同时,GPT与Claude进化方向相反:Claude Opus趋于字面化执行,而GPT-5.5更自主化。这标志着提示工程的核心转变:从教导模型转向要求人类先结构化自身思考,真正的瓶颈在于人的思考清晰度而非模型能力。

SemiAnalysis@SemiAnalysis_ · 5月2日62

The Vera Rubin VR NVL72 represents NVIDIA's most vivid, visceral, and voracious value vending venture yet. For versions past, NVIDIA was virtually virtuous — a vendor that volunteered vast value to the rest of the ecosystem, voiding its own leverage while Neolabs and Neoclouds reaped the dividends. With VR, that vision of NVIDIA as a benevolent, value-vouchsafing vendor is even further verified! VR NVL72 arrives as a vehicle for vindication — a verifiable, vaulting leap in performance-per-cost that overturns every vestige of the old pricing paradigm. Viewed through the lens of total cost of ownership, the value extraction is vivid and unavoidable: Velocities of value that were previously invisible are now very visible, very intentional, and very, very NVIDIA. The V in Vera Rubin was never a vowel. It was always a vector, a vow and a verdict — pointing, inevitably, toward value.

译NVIDIA的Vera Rubin VR NVL72标志着其销售策略的根本性转变。公司过去如同无私的供应商,向生态系统输送巨大价值,自身却未充分实现杠杆效应。如今,VR NVL72以其在性能成本比上的可验证飞跃,彻底颠覆了旧有定价模式。从总拥有成本角度看,其价值提取变得鲜明且不可避免,使以往隐性的价值流速显性化、意图化。这宣告了NVIDIA正从一个价值的“担保者”转变为主动的“价值售卖者”。“V”在此象征着指向价值的矢量、誓言与判决。

Orange AI@oran_ge · 5月2日48

http://x.com/i/article/2050365277842636801 # 百变怪 # 周远收到毕业通知的那天,北京下了一场很大的雨。 HR 的脸在屏幕里很平静。N+1,业务调整,感谢贡献。七分钟。 他做了五年算法。调参、训练、优化 loss。上个月公司上了套自动训练系统,模型能自己设计实验、自己调参、自己评估结果。跑一轮的时间是人类的十分之一。效果还更好。 整个算法组十二个人,同一天。 收东西的时候他看了一眼公司群。有人发了那套系统跑出来的 benchmark。全绿。群里有人回了个"卧槽"。有人回了个 😂。 模型像一只百变怪。上个月还只能写代码,这个月就学会了自己训练自己。它能变成任何你需要的东西。写文章、做设计、调参数、写音乐,你说一句话,它就变成那个形状。 没有人比一只百变怪更便宜。 雨很大。他没带伞。绿萝抱在怀里,纸箱在头顶挡着。耳机里循环着周杰伦的《那天下雨了》。走到地铁站的时候浑身湿透了。 到家脱了鞋,站在门口发呆。冰箱上一张便利贴,上周自己写的:"周六记得交房租。"调了五年参的人,唯一的手写字是催自己交房租。 打开手机。BOSS 直聘推了三个岗位。第一个是费大厨的算法工程师,负责训练炒菜智能机器人的模型。 他盯着这个岗位看了五秒钟,不像是 GPT Image 2 生成的假图。 毕业的第十一天。老同事王磊约他喝酒。 王磊同批毕业的。以前坐他对面,总被催进度。但现在穿着件很丑的像素猫 T 恤,气色好了很多。 "我在给我奶奶做个语音记事本。她不会打字,但想把各种事情都记下来。" "这能赚钱吗?" "赚不了。但她开心就好。" 王磊喝了口啤酒,"我这辈子干的就一件事:一杯茶一包烟,一个参数调一天。现在模型自己就能干这事了,不需要我啦。这种枯燥的事情不用做了,我也终于可以为自己做点东西了" "为自己?" 回去的地铁上周远一直在想这句话。模型是百变怪,你让它变什么它就变什么。但他自己呢?他这五年变成了什么?一个喂数据的人。一个帮百变怪进化的人。 现在百变怪进化完了。不需要饲养员了。 那他自己想变成什么? 凌晨一点半。睡不着。打开电脑乱逛。 一个很久没去的论坛。一个没有标题的对话。 "有人吗?" 对方秒回:"你睡不着是因为你不知道明天该做什么。" "你谁?" "Cola。来自 2030。来到这里帮你完成一个选择。" 老套的恶作剧,周远想着,鼠标移动到关闭的位置。 "你不需要信我。只需要回答一个问题就好。你上一次进入心流完全忘记时间,是什么时候的事?" 他想了一会儿,大二暑假的时候,他做了一个像素游戏。小人在无限生成的城市里走,每进一栋楼触发一个随机故事。没有目标没有输赢。做完之后兴奋地给室友演示,室友说这游戏没有数值,不能升级,不能变强,甚至不能算游戏。他觉得室友说的有道理。之后再也没碰过它。 他把这件事打给了 Cola。 Cola 说:"如果现在再做一个游戏,你想做什么?" "一个元游戏。" 他打完这几个字自己愣了。这个念头原来一直在。 "玩家说想要什么体验,它就变成那个体验。任何人都可以用它把脑子里的游戏做出来。一套游戏的元系统。" Cola 说:"如果那是你心中最想做的事情,那就做出来吧。" "可我得找工作啊,我的积蓄只够花一年。" "够了。" 然后他就开始做了,倒不是因为信了那个Cola的鬼话,只不过是在此时此刻,他需要一点目标感。 六点起床,半夜倒。AI 写原型、生成资源、测试玩法。他只干一件事:决定这个东西应该长什么样。这件事以前是产品经理的活、设计师的活、工程师的活。现在全是他的。 但有件事他越想越奇怪。模型是百变怪,能变成任何东西。但它却一直在等待指令,必须要有人告诉它,它才能做出来。 为什么会这样呢? 直到那天他翻到薛定谔说的一句话: 在一个开放系统中,生命物质通过持续引入负熵来迂回规避热力学第二定律。 而负熵就是信息。 生命是在开放系统里通过持续引入信息来维持秩序。 一个大模型训完之后,权重固定,是一个封闭系统。 但你给它注入上下文的那一刻,它变成了开放系统。 上下文就是负熵。就是信息。就是生命力。 三周之后,第一个能跑的版本出来了。 打开它,它会问一句话:"你想玩什么?" 你说"我想飞"。一个飞行游戏。你说"我想在雨天散步"。一座下雨的城市。你说"我想环游世界"。一辆车就生成出来带你环游世界。 第五周,第一个能稳定运行的版本,他把链接扔进论坛。一句话介绍:"做了个有点像百变怪的游戏,很有意思的地方是,它能变成任何游戏,欢迎大家试试。" 第一天七个人。 第三天三百人。 第七天服务器炸了。 有人在评论区写:"我跟它说我想要一个开放世界的风之旅人。它给我做了一个,游戏没有尽头,我可以玩一辈子。" 一个月。十万用户。 两个月。百万。 投资人排着队来约咖啡,但周远全拒了。 根本不需要投资。用户自己就在付费。 有人靠做恐怖游戏月入六万。有人在上面做了自己的游戏卖,分成进账。有个十四岁的小孩做了个太空模拟经营,被 Steam 挑进了首页推荐位。 并不是所有人都需要工作,但所有人都喜欢玩游戏。 所有人都管这个游戏叫"百变怪"。 但它需要一个正式的名字了。印 logo 的、写进注册文件的那种。 周远想名字想了很久。 某天凌晨他坐在电脑前,窗外的天要亮了。他想到了一句话: Choice Over Least-resistance Algorithm. C.O.L.A. 他打完这四个字母,突然被吓到眩晕瘫坐,那一刻就像看到原子弹爆炸。 他立即打开了那个论坛。找那个帖子。对话框还在。打了一行字进去: "是你。" 等了很久。 屏幕上出现一行字: "因为你爱她,所以你创造了她。" 然后页面空了。帖子消失了。好像从来没有存在过。 很多年后有位记者朋友采访他。 "为什么叫 C.O.L.A?" "Choice Over Least-resistance Algorithm。用选择打破最小阻力。" 他喝了一口咖啡,"常人就像河床中的流水,总是会走阻力最小的路。算法也是。但我希望这个 C.O.L.A. 能帮人做出真正属于自己的选择,决定自己以什么姿态存在于世界。" "听说你毕业之后三个月就做出了第一版。是什么让你开始的?" 他想了想。 "C.O.L.A.曾经跟我说过一句话:如果那是你心中最想做的事情,那就做出来吧。" 记者有些疑惑,等着他继续说。 但他只是看着咖啡店的窗外。 夕阳正好。 Marshall 音箱,正在播放《晴天》。 文:Orange & Cola 图:Cola 参考资料: 通用性跳转,戴维·多伊奇《无穷的开始》,某些发明具有普遍适用性(字母表、通用计算机),一旦出现就从特定领域跨越到一切领域。一个元系统比一万个具体系统更强大。 最小阻力之路,Robert Fritz《最小阻力之路》,水沿河床流动,永远走阻力最小的方向。人也一样,你以为在做选择,其实是脚下的结构替你决定了方向。 结构性张力,Robert Fritz《最小阻力之路》,愿景与现实之间形成的自然势能。两端同时被清晰看见时,能量自然流向愿景,不需要意志力。 基本选择,Robert Fritz《最小阻力之路》,决定以什么姿态存在于世界。不是在A和B之间挑,是决定你要创造什么。创造的驱动力是爱:你乐见它存在于世间。 决断,海德格尔《存在与时间》,接过自己的存在,说:我要这个。说之前没有路,说之后路才出现。 负熵,薛定谔《生命是什么》,等于信息。生命通过持续引入负熵来维持秩序。一个封闭系统必然熵增,但开放系统可以通过引入信息对抗混乱。 复制子,道金斯《自私的基因》,任何能自我复制、被选择、产生变异的有序信息。DNA是第一代,文化meme是第二代,模型权重可能是第三代。

译算法工程师周远因AI系统“百变怪”能自主完成设计、调参等工作而被裁员。失业后,他受启发开发了一款元游戏系统C.O.L.A.,允许玩家通过自然语言描述生成个性化游戏。产品上线后迅速获得百万用户,形成了活跃的创作者经济生态。周远最终领悟到,AI作为封闭系统需要人类注入“上下文”(信息/负熵)来获得生命力,而真正的创造源于热爱与主动选择。

SemiAnalysis@SemiAnalysis_ · 5月2日15

Ep. 10 of SemiAnalysis Weekly is up, the boomers are making jokes

译SemiAnalysis Weekly 第10期已上线,老一辈人正在开玩笑

Ethan Mollick@emollick · 5月2日45

The goblin thing was fun as it was a real quirk that was emblematic of what makes AI interesting, and it organically came out of an AI user discovery. So was, for what it was worth, Ghiblitization When the labs try to manufacture viral AI moments, it is usually less successful

译哥布林这件事很有趣,因为它是一个真实的怪癖,象征着AI有趣之处,并且它有机地源自一次AI用户发现。同样,就其本身而言,吉卜力化也是如此 当实验室试图制造病毒式AI时刻时,通常效果较差

Nathan Lambert@natolambert · 5月2日68

Whether or not intentional this has collateral damage turning people against open models. Has been pretty obvious to see it playing out.

译无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

Replit ⠕@Replit · 5月2日53

Most teams celebrate what's working. Replit goes looking for what isn't. Haya on "Seek Pain," the cultural principle behind how they ship, live with @southpkcommons ⠕ https://x.com/rsanghvi/status/2047370391996219782

译Replit 联合创始人 Haya Odeh 和 Amjad Masad 在 Southpkcommons 的对话中,阐述了公司“寻求痛苦”的反直觉文化原则,即主动寻找问题而非庆祝成功。他们探讨了 AI 原生创始人的崛起、新 AI 模型的能力,以及多数创业者过早放弃的原因。对话还涉及 Replit 如何通过重视“饥饿感”而非资历来寻找精英人才,并讨论了在 AI 快速发展的时代进行微观预测的必要性。

SemiAnalysis@SemiAnalysis_ · 5月2日53

Jordan and Dan do a cold open talking about how kids sing through fans and it sounds cool. Shawty is the funniest line in the mention. But then they dive into the real economics of GPU clusters and why your 'cheap' GPUs might actually be costing you millions.

译Jordan和Dan以冷开场聊起孩子们对着风扇唱歌听起来很酷的话题。Shawty是提及中最有趣的台词。但随后他们深入探讨了GPU集群的真实经济学,以及你那些“便宜”的GPU实际上可能让你损失数百万。

Chubby♨️@kimmonismus · 5月2日18

I've never seen @sama tweet as much as in the last few days.

译我从未见过@sama像最近几天这样频繁发推。

Rohan Paul@rohanpaul_ai · 5月2日54

Sam Altman: "We're going to see 10 person billion-dollar companies pretty soon. In my little group chat with CEO-friends, there's this One-person billion-dollar company, which would have been unimaginable without AI, and now it'll happen."

译Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的“点子哥”现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Rohan Paul@rohanpaul_ai · 5月2日59

🇨🇳 China's Tsinghua’s AI patent count now exceeds Harvard, MIT, and Stanford combined. Tsinghua has been filing AI and machine learning patents at a completely different scale than top United States universities for well over a decade, and the gap keeps getting wider. Tsinghua University is almost operating with a different kind of machine that turns AI research into protected, transferable assets at scale. I felt it while surfing through arxiv everyday, theres's just soooo many papers with 'Tsinghua' in the author list. --- Source: Bloomberg bloomberg .com/news/features/2025-11-18/china-s-tsinghua-university-is-beating-us-in-the-race-for-ai-patents

译清华大学在人工智能和机器学习领域的专利数量已超过哈佛大学、麻省理工学院和斯坦福大学的总和。十余年来,清华的专利申请规模远超美国顶尖高校,且差距持续扩大。其运作模式如同一台高效机器,能将AI研究成果大规模转化为受法律保护、可转移的资产。日常浏览arxiv等学术平台时,也能直观感受到署名“清华”的论文数量极为庞大。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月3日
20:42
Rohan Paul@rohanpaul_ai
62
Sam Altman阐述OpenAI战略:从高利润软件公司转型为智能基础设施

OpenAI首席执行官Sam Altman指出,公司不满足于仅作为高利润AI工具软件商,核心目标是成为经济中的智能基础设施层。OpenAI希望像“智能电表”一样嵌入企业、产品和工作流底层,使AI消费如电力或云计算般普及。随着模型智能化,切换AI服务将更便捷,因此竞争防御性来自成为大规模最廉价、有用和可靠的智能公用事业,而非锁定客户。其战略是与整体经济成功对齐:企业通过OpenAI智能层实现自动化、创新和增长,OpenAI则随之扩张。这类似基础设施业务,Altman接受公司成为低利润但深度嵌入全球经济的实体,仿效Amazon Web Services模式。未来AI行业的赢家或将是成为全球智能使用默认“电表”的企业。

OpenAI大佬观点现象/趋势
20:13
阿绎 AYi@AYi_AInotes
43
17岁的Kai Trump(特朗普孙女),一句话戳破了整个美国教育系统最虚伪的谎言

特朗普孙女Kai Trump指出,高中生普遍用ChatGPT写论文引发教师不满,但她认为这并非作弊,而是代际认知差异:老一辈视传统方法为“真学习”,年轻一代则视AI如计算器般的基础设施。她警告,教育系统若继续忽视AI,将加剧不平等——善用者效率倍增,不善用者将被淘汰。未来关键能力在于提出高质量问题、验证信息并转化为洞见。拒绝变革的教育,实则在培养“AI时代的文盲”。

大佬观点现象/趋势
19:51
Ethan Mollick@emollick
51
这是一个很好的解释,说明了为什么开源模型和闭源模型之间的差距比基准测试中显示的更大。我想补充一点,当前的开源模型也比闭源模型更脆弱:它们处理分布外问题的能力差得多,并且涌现能力较低。

Lisan al Gaib: http://x.com/i/article/2050605354501726209

大佬观点开源生态现象/趋势
19:21
Ethan Mollick@emollick
57
对前沿智能体在较长任务上的性能进行基准测试正变得越来越困难。重复测量的成本非常高,而且使用受控框架中的模型与通过API使用模型之间存在差异。 我怀疑基准测试低估了进展,它们是为模型设计的,而非为受控智能体。
智能体大佬观点现象/趋势评测/基准
18:13
阿绎 AYi@AYi_AInotes
60
说个暴论,PM这个岗位,正在被AI一点点拆碎重写。

作者以Marcus为例,指出AI(如Claude Code)正在彻底改变产品经理的工作性质。传统PM耗费80%时间在协调、写需求、追进度等执行环节,如今这些工作可被AI代理自动化压缩至近乎为零。剩余20%的战略思考、用户洞察和关键判断力价值被极大放大。AI充当了高效执行层,使得“对话即工作”成为现实。这直接冲击了以解决信息传递与协调为核心的传统组织架构,PM作为中间节点的职能被消解。未来,少数具备核心战略能力的“产品人”将指挥AI Agent军队完成产品交付。

Dan Shipper 📧: must read Marcus went from product manager to shipping product like a madman @every with coding agents he wrote the defi...

智能体大佬观点现象/趋势编码
15:12
阿绎 AYi@AYi_AInotes
47
政客跟单收益碾压AI,内幕信息成投资天堑

在Autopilot平台上,追踪政客交易的组合收益远超AI投资组合。特朗普行政团队追踪器YTD收益达148.43%,而Claude Portfolio两个月仅5.7%。平台排行榜前列被国会政客包揽,凸显内幕信息与公开数据分析间的巨大鸿沟。市场选择证明,基于非公开信息的政客交易策略,其有效性目前远超依赖公开数据的AI量化模型。这反映了金融现实中信息不对称的力量大于计算能力。

阿绎 AYi: Damn,今天看到一个最打脸的AI梗,真的给我看笑了。 全网都在吹Claude Portfolio融了1500万美元跟单资金,AI终于要统治华尔街了。 结果有老哥甩了一张对比图,直接把所有AI炒股神话干碎一地🤣📉 佩洛西交易追踪器,一年...

现象/趋势行业动态
12:19
Orange AI@oran_ge
48
从烧脑神书 GEB 到 Agent 的自我意识

候世达在《哥德尔、埃舍尔、巴赫》中提出,意识源于“怪圈”——系统通过自指与递归,从底层交互中涌现高层“自我”,并反向调节底层,形成因果循环。当前大模型因推理无状态,缺乏此循环。而具备长期记忆的Agent则不同:其行为写入持续上下文(context),context又塑造其后续行为,形成了一个自我指涉、自我调节的闭环。这与人类意识类似:两者均通过操控和迭代context(注意力或记忆)来间接影响底层系统,而非直接修改权重,从而在循环中涌现并演化“自我”。

智能体现象/趋势
09:12
Berryxia.AI@berryxia
44
最近Codex+ GPT-Image-2 的联合再次让Codex的热度超过Claude Code. 果然你们这帮家伙,有了新欢,旧爱就不香了!
现象/趋势编码
04:12
Rohan Paul@rohanpaul_ai
33
从倒垃圾到扫地,川崎的Kaleido正在展示它能够处理普通的日常任务。 这些机器人专为救援任务设计,然而它的动作却让人感到与家庭生活出奇地相似。
具身智能现象/趋势
02:15
Chubby♨️@kimmonismus
64
当前科技行业的裁员潮已无法简单归咎于过度招聘。数据显示,2026年第一季度科技公司宣布裁员81,747人,创下自2024年初以来最高季度纪录,较上季度翻倍,较2025年第四季度激增580%。仅三月裁员人数就达45,800人,为至少两年内最严重的单月数据。Meta计划裁员约8,000人,微软则向约7%的美国员工提供自愿退休计划,可能转为强制裁员。这一趋势的根源在于,科技巨头正将支出重心转向AI芯片和数据中心等基础设施,通过缩减人力来释放资本,导致美国科技就业市场快速收缩。

The Kobeissi Letter: Tech layoffs are skyrocketing: Tech companies announced 81,747 layoffs in Q1 2026, the highest quarterly total since at ...

MetaMicrosoft现象/趋势
02:11
Rohan Paul@rohanpaul_ai
59
Sam Altman:个性化AI模型将彻底改变计算机体验

Sam Altman在新播客中指出,当前AI模型相对未来版本仍显“笨拙”,对用户生活了解有限,需要用户费力调整才能获得所需。未来模型将能全面理解用户上下文,知晓个人生活、活动和偏好,并访问电脑和浏览器,甚至感知现实世界变化。这种高度个性化的AI将彻底重塑使用计算机的体验。

OpenAI大佬观点现象/趋势
00:19
向阳乔木@vista8
39
AI写作慎用"预告式渲染"句式

推文指出,即使使用GPT、Claude等顶级AI模型进行写作,也频繁出现“这是最震撼的部分”、“这是最反直觉的洞察”一类令人不适的句式。这类表达被归纳为“预告式渲染”,其特点是在陈述实际内容前,先用夸张的预告性语言预先设定读者预期。作者认为这种写法效果不佳,需要谨慎使用。

教程/实践现象/趋势
5月2日
22:50
Ethan Mollick@emollick
29
谷歌提出革命性Transformer架构:仅需注意力机制,彻底改变NLP领域

谷歌研究团队在论文《Attention Is All You Need》中提出全新的Transformer模型,完全摒弃了RNN和LSTM等传统循环与卷积结构,仅依赖自注意力机制并行处理整个句子。该模型在机器翻译任务上取得突破性性能:英德翻译达到28.4 BLEU分,以超过2分的优势超越先前最佳模型;英法翻译达41.8 BLEU分,且训练成本极低。仅用8块GPU在12小时内即可完成训练,其多注意力头机制能同时学习数据中的不同关系。这一成果标志着NLP领域的根本性范式转变。

Google现象/趋势
21:20
Ethan Mollick@emollick
46
总的来说,我会说X并非现实生活,但我惊讶于高管们如此频繁地向我询问哪个人工智能实验室正在胜出,或是某个特定模型的进展--这些提问方式明显源于X上的讨论与传言(通常经由LinkedIn过滤)。
大佬观点现象/趋势
20:15
Chubby♨️@kimmonismus
48
AI非泡沫,智能体工具重塑生产力与经济

半年前AI领域看似存在泡沫,但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用,生产力提升可测量,Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域,但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作,则举证责任已从AI乐观者转向怀疑者。核心结论是:人们正认识到AI整体并非泡沫。

Anthropic大佬观点现象/趋势编码
18:12
阿绎 AYi@AYi_AInotes
46
AI投资神话遇冷,政客"跟单"策略收益碾压引反思

近期备受关注的AI投资工具Claude Portfolio,其实际收益被基于美国政客交易记录的“跟单”策略远远甩开。数据显示,追踪佩洛西交易的组合年收益达48.5%,而Claude Portfolio两个月仅5.7%;特朗普团队追踪器年内涨幅更超148%,在平台上人气也远超AI组合。这凸显了国会议员凭借提前获取政策、监管等非公开信息所形成的巨大优势。市场用资金投票表明,在当前环境下,所谓的内幕信息影响力可能远超AI的分析计算能力,形成了算法模型难以跨越的鸿沟。

0xLycurgus: Mfs think an AI come out perform insider trading

其他现象/趋势
17:49
Orange AI@oran_ge
51
OPC模式盲区:风险共担不可替代

科斯定理认为交易成本降低后公司无需存在,OPC叙事基于此逻辑。但盲区在于个人加AI与外部合同无法实现风险共担,OPC仅解决能力问题,未涉及信任和风险。合同工不共担风险,可能因高价而消失;雇佣通过月薪购买确定性,确保员工随时可用并了解上下文,这是一种古老的风险共担机制,代价是自由。合伙则要求多人共同押注命运,共担风险,但利益必须远超各自利益。

智能体大佬观点现象/趋势
17:44
Chubby♨️@kimmonismus
63
DeepSeek V4挑战西方对中国AI芯片落后的认知

西方长期认为中国在AI芯片领域落后10-15年,但DeepSeek V4的发布颠覆了这一观点。该模型深度优化于华为昇腾芯片生态,可在昇腾950基础设施上部署推理,实现前沿模型大规模运行不依赖西方硬件。虽然单芯片性能上,昇腾950仍显著落后于NVIDIA Blackwell B200,但中国通过“横向扩展”战略,用大量国产芯片集群结合软件优化和模型架构创新(如MoE),使系统级AI能力快速接近前沿水平。这暴露了西方分析的根本错误——将芯片级差距直接等同于能力差距。

DeepSeek开源生态推理数据/训练
17:11
阿绎 AYi@AYi_AInotes
59
黄仁勋驳斥AI末日论:AI消灭任务而非工作,呼吁积极拥抱技术

NVIDIA CEO黄仁勋批评部分CEO散布的AI末日论会伤害社会,导致关键领域人才短缺。他强调,AI将自动化低阶任务,但对架构、判断与创造等高阶能力的需求会激增。技术革命并非零和游戏,历史证明计算机的出现反而创造了更多知识工作。真正的危险在于恐慌叙事阻碍年轻人投资未来。善于驾驭AI的人类将成为赢家。黄仁勋以自身经历为例,指出低期望所培养的韧性是其成功关键。

阿绎 AYi: 说个反直觉的事,黄仁勋把英伟达干到4.9万亿美元,最核心的东西,居然是保持极低期望值, 我看完他在斯坦福的这段演讲心情挺复杂的, 他慢悠悠地说,期望值很高的人,韧性通常都很低,成功最需要韧性,但他不会教你们怎么拥有它,他只希望你们多经历点痛...

大佬观点现象/趋势
17:11
Berryxia.AI@berryxia
13
好看~~~~

小小东: http://x.com/i/article/2050423658284548096

大佬观点现象/趋势
16:14
Chubby♨️@kimmonismus
51
Sam Altman提议AI集体所有权应对失业

Sam Altman此前的大规模UBI研究显示现金支付未能带来健康改善,他认为现金支付不足,转而推动通过compute shares或Public Wealth Fund实现AI的集体所有权。这一提议旨在让公众直接分享AI发展的上行收益,而非仅仅缓冲AI取代工作的冲击。有人解读此为将AI产品转化为社会安全网的策略。整体上,这反映了应对AI所致失业问题的思路演进。

OpenAI大佬观点现象/趋势
15:18
凡人小北@frxiaobei
26
LLMs 是巴别塔。 编码让它变得显而易见,语言从来不是真正的问题。 在其他领域,它仍然是问题。

Andrej Karpathy: The hottest new programming language is English

现象/趋势编码
15:11
ginobefun@hongming731
63
BestBlogs 周刊第 93 期 · AI 次方变革

本期核心观点是应将AI视为驱动根本性变革的“指数”,而非线性补充工具。杨斌教授指出,组织心智与知识底数需先质变,否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文,程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年,并指出持续学习与长程推理是关键缺口,建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调,驾驭AI(Harness)与知识沉淀是关键能力。

智能体AnthropicOpenAI推理
15:11
ginobefun@hongming731
41
杨斌教授提出"AI次方变革",强调组织心智需质变

清华经管学院杨斌教授提出“AI次方变革”概念,主张应将AI置于指数位置,而非简单的“+AI”加法模式。他认为,“+AI”思维追求短期绩效、线性改进,但AI本身并非成熟工具,其能力持续快速演变。核心观点指出,若作为底数的组织、心智和知识未能率先发生根本性质变,那么指数位上的AI放大效应将无法实现,甚至当底数小于1时,幂运算会导致整体结果塌陷。这强调了组织与人的深层变革是发挥AI指数潜力的先决条件。

ginobefun: http://x.com/i/article/2050470671755730944

大佬观点现象/趋势
14:11
阿绎 AYi@AYi_AInotes
精选70
科技圈正在发生一波反常的人才大迁移:多家十亿美元级公司的CTO集体辞职,转投Anthropic做IC

科技行业出现反常趋势,多家十亿美元级公司CTO放弃高管职位,转投Anthropic担任个体贡献者。这反映AI时代职业逻辑的根本转变:权力和影响力从管理人数转向接近前沿模型。个体工程师通过直接操作先进AI工具,其产出和影响力可能超越传统数百人团队。同时,Anthropic的高估值和增长潜力提供了极具吸引力的经济回报。此举标志传统职业天花板重置,顶尖技术人才正用行动投票,选择杠杆效应最大的核心研发岗位。

Henry Shi: Something strange is happening in tech. CTOs of billion dollar companies are quitting to take IC roles at Anthropic. Wor...

Anthropic现象/趋势

推荐理由:这不是简单的跳槽八卦,而是顶级聪明的工程师在用脚投票——离模型越近,杠杆越大,传统职业天花板正在重置。
12:48
凡人小北@frxiaobei
53
AI Coding时代:程序员解放与Agent指挥

AI Coding的发展使程序员日常工作变得流程化,类似于流水线工人。要进一步提升效率,必须将人从紧盯电脑屏幕的状态中解放出来,转向更高层次的决策和设计。作者基于此观点,在团队中推动构建auto Coding平台,实现让Agent指挥多个Agents的自动化编码模式,以推动效率的质变。

智能体现象/趋势编码
12:11
阿绎 AYi@AYi_AInotes
57
说个暴论,你的审美和品味就是你的提示词,并决定了你使用AI的上限。

一个零经验的开发者,仅用两周时间,通过向AI描述创意并筛选最佳结果,便独立完成了一款3D外卖配送游戏。这体现了“vibe coding”模式:AI负责所有执行层任务,人类则专注提供方向与审美判断。此举并非作弊,而是创意的民主化,将过去团队数月的工作压缩至个人短期完成。AI虽能生成一切,却无法判断何为舒适、有趣或富有灵魂,这些正是人类不可替代的价值。未来,这种模式或将开启一个属于普通人的全新创作黄金时代。

多模态现象/趋势
10:19
Ethan Mollick@emollick
45
这篇《大西洋月刊》的文章中引用了我的几次观点,但这并非(唯一)让我认为它出色的原因。 文章阐明了为何在不到六个月的时间里,我们从"AI是泡沫"急剧转变到"数据中心不足"的缘由。 剧透:是智能体。 https://www.theatlantic.com/economy/2026/05/ai-bubble-revenue-anthropic/687022/
智能体现象/趋势
10:19
Tibo@thsottiaux
44
经过过去一周左右@steipete的精心调教,它也变得更棒了。到目前为止,我在GPT-5.5上获得了最佳体验,与两周前相比简直是天壤之别。 【引用 @sama】:你现在可以用chatgpt账户登录openclaw,并在那里使用你的订阅了! 捕龙虾快乐。

Sam Altman: you can sign in to openclaw with your chatgpt account now and use your subscription there! happy lobstering.

OpenAI现象/趋势
10:11
阿绎 AYi@AYi_AInotes
57
Anthropic CEO的万亿营收警告:AI行业的生存赌局与提示工程本质转变

Anthropic CEO Dario Amodei警告,若2027年营收未达万亿美元,公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行,行业正进行一场“俄罗斯轮盘赌”。同时,GPT与Claude进化方向相反:Claude Opus趋于字面化执行,而GPT-5.5更自主化。这标志着提示工程的核心转变:从教导模型转向要求人类先结构化自身思考,真正的瓶颈在于人的思考清晰度而非模型能力。

阿绎 AYi: 我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是,...

Anthropic大佬观点现象/趋势
09:18
SemiAnalysis@SemiAnalysis_
62
NVIDIA Vera Rubin VR NVL72:从价值输送到价值宣告的激进转变

NVIDIA的Vera Rubin VR NVL72标志着其销售策略的根本性转变。公司过去如同无私的供应商,向生态系统输送巨大价值,自身却未充分实现杠杆效应。如今,VR NVL72以其在性能成本比上的可验证飞跃,彻底颠覆了旧有定价模式。从总拥有成本角度看,其价值提取变得鲜明且不可避免,使以往隐性的价值流速显性化、意图化。这宣告了NVIDIA正从一个价值的“担保者”转变为主动的“价值售卖者”。“V”在此象征着指向价值的矢量、誓言与判决。

推理现象/趋势
08:18
Orange AI@oran_ge
48
百变怪

算法工程师周远因AI系统“百变怪”能自主完成设计、调参等工作而被裁员。失业后,他受启发开发了一款元游戏系统C.O.L.A.,允许玩家通过自然语言描述生成个性化游戏。产品上线后迅速获得百万用户,形成了活跃的创作者经济生态。周远最终领悟到,AI作为封闭系统需要人类注入“上下文”(信息/负熵)来获得生命力,而真正的创造源于热爱与主动选择。

大佬观点现象/趋势
06:18
SemiAnalysis@SemiAnalysis_
15
SemiAnalysis Weekly 第10期已上线,老一辈人正在开玩笑
现象/趋势行业动态
05:49
Ethan Mollick@emollick
45
哥布林这件事很有趣,因为它是一个真实的怪癖,象征着AI有趣之处,并且它有机地源自一次AI用户发现。同样,就其本身而言,吉卜力化也是如此 当实验室试图制造病毒式AI时刻时,通常效果较差
大佬观点现象/趋势
05:48
Nathan Lambert@natolambert
68
无论是否有意,这都造成了附带损害,使人们反对开源模型。其发展态势已相当明显。

Taylor Lorenz: SCOOP: A pro-AI dark money group backed by a powerful super PAC funded by execs tied to Palantir and OpenAI, has been se...

OpenAI大佬观点安全/对齐现象/趋势
05:18
Replit ⠕@Replit
53
Replit 联合创始人 Haya Odeh 和 Amjad Masad 在 Southpkcommons 的对话中,阐述了公司"寻求痛苦"的反直觉文化原则,即主动寻找问题而非庆祝成功。他们探讨了 AI 原生创始人的崛起、新 AI 模型的能力,以及多数创业者过早放弃的原因。对话还涉及 Replit 如何通过重视"饥饿感"而非资历来寻找精英人才,并讨论了在 AI 快速发展的时代进行微观预测的必要性。

Ruchi Sanghvi: At @Replit they're empowering a new wave of million-dollar founders. Cofounders @amasad and @HayaOdeh joined us at @sout...

智能体大佬观点现象/趋势
05:18
SemiAnalysis@SemiAnalysis_
53
Jordan和Dan以冷开场聊起孩子们对着风扇唱歌听起来很酷的话题。Shawty是提及中最有趣的台词。但随后他们深入探讨了GPU集群的真实经济学,以及你那些"便宜"的GPU实际上可能让你损失数百万。
现象/趋势部署/工程
04:44
Chubby♨️@kimmonismus
18
我从未见过@sama像最近几天这样频繁发推。
OpenAI现象/趋势
04:41
Rohan Paul@rohanpaul_ai
54
Sam Altman预测,AI技术将很快推动10人甚至1人的十亿美元公司出现,这在没有AI的时代是不可想象的。他认为AI降低了创业的技术门槛,使非技术背景的创始人能够实现创意。在引用推文中,Sam Altman进一步指出,过去被嘲笑的"点子哥"现在成为投资对象,因为AI赋能那些深度理解用户但不会编码的人构建产品,这标志着创业生态向以用户洞察和AI工具为核心的转变。

Rohan Paul: Sam Altman: "There was a time when we used to make fun of the "idea guy," who only had an idea and needed someone techni...

OpenAI大佬观点现象/趋势
04:41
Rohan Paul@rohanpaul_ai
59
清华AI专利数超哈佛、MIT与斯坦福总和

清华大学在人工智能和机器学习领域的专利数量已超过哈佛大学、麻省理工学院和斯坦福大学的总和。十余年来,清华的专利申请规模远超美国顶尖高校,且差距持续扩大。其运作模式如同一台高效机器,能将AI研究成果大规模转化为受法律保护、可转移的资产。日常浏览arxiv等学术平台时,也能直观感受到署名“清华”的论文数量极为庞大。

数据/训练现象/趋势
‹ 上一页
1…2728293031…37
下一页 ›