http://x.com/i/article/2067474789187698688 # 分享10本我觉得AI时代应该必读的好书。昨天看到一个粉丝的评论。我觉得还蛮有趣的。因为我最近也看到一些所谓的AI时代必读清单，但是都太技术了，各种Prompt、大模型原理之类的。并不是说这些东西不好，只是我觉得，这些书籍太AI了，而这个时代，我一直觉得，也一直越来越确信，决定你能不能把AI用好的，从来都不是你对AI了解多少。是那些可能跟AI毫无关系的底层能力。 AI本身在进步，工具会迭代，模型会换代，今天的各种各样的技巧，明天可能就被模型比如fable5自己的能力升级给淘汰了。但，人的很多底层能力和认知，是不会过期的。正好马上假期了，没事干的可以在家看书了🫪。所以今天想做一件可能有点冒犯的事，给大家推荐10本我自己读过的，觉得对我自己理解和学习AI非常非常有用的书，但，没有一本是直接关于AI的。那，让我们直接开始。 1.《失控》第一本推荐的，是我还在大学时读的一本书，但是对我的影响极其深远，也改变了我对社会、对组织、对智能的理解。他就是凯文·凯利的《失控》。一本1994年的书。那一年，互联网还没普及，智能手机还远不是今天的样子，深度学习还在学术圈无人问津。但KK在这本书里描述的东西，你可以去看看今天的AI Agent、多智能体协作、涌现智能，几乎一模一样。我把这本书放在第一个，是因为它解决的是整个书单最底层的那个问题。也就是，AI到底是什么。我从《失控》这本1994年的书中得到的答案是，一个涌现出来的系统。《失控》的核心概念就一个，涌现，大量简单个体遵循简单规则，在大规模协作之后，涌现出任何单个个体都不可能拥有的复杂能力。蚂蚁是最经典的例子，一只蚂蚁什么都不懂，它只会跟着信息素走、搬东西、挖洞。但一百万只蚂蚁放在一起，涌现出了精密的巢穴建筑，高效的物流网络，甚至，农业。大模型很多时候也是如此，一个参数什么都不是，它只是一个数值权重。但几千亿个参数放在一起，经过训练之后，涌现出了写诗、编程、做数学推理、理解人类情感的能力。理解了这个概念之后，你跟AI协作的思路会发生根本性的转变。你会停止试图精确控制AI的每一步输出，转而去设计更好的规则和约束，然后让AI在这个框架内自己涌现出解决方案。凯文凯利说：“放弃控制才能获得控制。” 这其实，就是Harness。这本书，我觉得会帮你把对AI的理解，从一个被设计出来的工具，理解成一个涌现出来的系统，这个我觉得还是蛮重要的，所以在第一本推荐，也是后面所有的基石。 2.《人有人的用处》第一本聊完了AI是什么，那第二个自然而然的问题就来了，人是什么。或者更准确地说，当机器越来越强的时候，人的价值在哪里。所以这本书来了。这本书的作者叫诺伯特·维纳，控制论之父，1950年写的。那一年图灵刚发表图灵测试的论文，离AlphaGo打败李世石还有66年，但维纳已经在这本书里，把人和机器的关系想得非常清楚了。维纳提出了一个概念，到今天为止我觉得仍然是理解人机协作最核心的点，那就是，反馈。控制论的整个理论基础，就是建立在反馈回路上的。一个系统之所以能自我调节，是因为它能接收到自己行为的结果，然后根据结果修正下一步动作。恒温器就是这样，你设了26度，它发现现在28度，就开始制冷，等降到26度，就停下来。它不需要理解温度是什么，它只需要这样的一个反馈回路。你把这个思路迁移到AI协作上，会发现一件很有意思的事。那些真正把AI用得好的人，和用得一般的人，包括现在的Loop Engineering，最大的区别，其实是这些人，给AI的反馈质量更高。维纳还在这本书里说，机器最擅长的事，是可重复的、可量化的、可编程的工作。而人的价值，恰恰在于那些不可重复的、需要判断的、充满歧义的场景。 1950年说的这句话，放到今天的AI时代，我觉得依然极其准确。 3.《系统之美》这本书的作者叫德内拉·梅多斯，是一个系统动力学的研究者。我读这本书的时候还没有AI，当时我觉得，这玩意应该是每个产品经理的必读书。后来AI浪潮来了，我觉得，它也应该是每个跟AI协作的人的必读书。这里面有一个很有趣的观点，叫舍本逐末。就比如你有一个根本问题，你不去解决根本问题，而是用一个见效更快的临时方案来缓解症状，临时方案确实有效，症状消失了，你就更没动力去解根本问题了。时间一长，根本问题越积越深，你对临时方案的依赖越来越强，直到有一天临时方案也撑不住，整个系统崩盘。放到AI上，就是你需要写一篇深度分析，本来应该自己花几天去线下之类的深度研究、去思考、去建立自己的判断。但AI可以30分钟给你一篇看起来像模像样的东西，你用了，效果还行，下次又用，再下次还用。半年之后你发现，你对这个领域的独立判断力，反而比半年前更差了。因为你一直在用AI的输出替代自己的思考，你的思考能力在萎缩。这就是舍本逐末。梅多斯还有一个概念我觉得特别好，她把系统里的东西分成「存量」和「流量」两种。存量是慢慢积累起来的东西，你的专业知识、你的判断力、你的人脉、你对一个领域的直觉。这些东西积累了五年十年，是你的家底。流量是进进出出的东西，每天的产出量、处理的信息量、完成的任务数。 AI可以极大地加速你的流量，你一天能产出的东西，可能是以前的十倍。但它同时可能在不知不觉中消耗你的存量。当你所有的分析都让AI做，你的分析能力这个存量就在降低，当你所有的写作都让AI代笔，你的表达能力这个存量就在流失。而且存量的消耗是无声的。你并不会某一天突然发现哎我变笨了？这个消耗它是一个缓慢的、你几乎察觉不到的过程，就像温水煮青蛙一样。所以《系统之美》这本书，很有趣的一点是，它会让你发现，在AI时代最重要的价值，是让你看到那些你看不到的代价。 4.《事实》影响我事实洁癖思维的一本书。我经常会问自己一个问题，你看到的“事实”，真的是事实吗。这本书的作者叫汉斯·罗斯林，一个瑞典的公共卫生学家。他花了几十年的时间研究全球发展数据，最后写了这本书，副标题叫“用数据思考，避免情绪化决策”。罗斯林做过一个特别经典的测试，他在全球各种场合给观众出了一组关于世界现状的选择题，比如全球贫困率是在上升还是下降、全球人均寿命是多少、有多少女孩能上完小学。那些高学历的、关心时事的、所谓的在各个领域有专业建树的人，答对率平均只有两道题，比猴子直接随机选还要差。因为人的大脑有一套先天性的本能，在系统性地扭曲你对世界的认知。比如“鸿沟本能”，就是你的大脑特别喜欢把事情分成两个阵营，发达国家和发展中国家、AI取代人和AI帮助人、懂AI的和不懂AI的。但现实几乎从来不是二分的，绝大多数东西都在中间那一大片灰色地带里。比如“直线本能”，你看到一个趋势在涨，你就默认它会一直涨下去。等等等等。这些本能在人类进化过程中是有用的，在非洲草原上快速判断是不是有狮子这种生死存亡的时候，这能保命。但到了现代社会，到了需要你基于事实做复杂判断的时候，这些本能就变成了bug。而在AI时代，这个观点，就变得很重要了。因为你输入给AI的，不只是Prompt，还有你的世界观。你问AI的每一个问题，背后都带着你对世界的假设，如果你的假设是扭曲的，你问出来的问题就是扭曲的，得到的答案再漂亮，那其实也是有巨大的事实偏差的。罗斯林教你的是，在做判断之前，先看数据。不看情绪，不看标题党，不是看朋友圈的焦虑文章，看数据。事实，来源于数据。不要被情绪和本能带着走。 5.《理解媒介》一本来自马歇尔·麦克卢汉在1964年写的超级经典的书。你可能没读过这本书，但你大概率听过他最著名的那句话：媒介即信息，The Medium is the Message。麦克卢汉的意思是，一个新媒介被发明出来之后，真正改变世界的，并不会是这个媒介上传播的内容，而是这个媒介本身。电视被发明出来之后，改变世界的是电视这种媒介本身重新塑造了人类接收信息的方式、注意力结构、甚至家庭关系和政治格局。互联网也是，改变世界的并不是某一个网站，是互联网这种媒介重新定义了知识的获取方式、社交的形态、商业的规则。如今的AI更是。 AI在我心中，有很多种定义方式，其中有一种定义，就是媒介。而一个新媒介出现之后，改变世界的方式，完全不是你能预料到的。因为你会犯一个麦克卢汉叫做后视镜思维的错误。就是每当一种新媒介出现的时候，人类理解它的方式，永远是拿上一代媒介的框架去套。汽车刚被发明的时候，人们叫它“无马马车”，horseless carriage。这个名字现在来看就非常的扯淡，它是用马车的框架来定义汽车的，好像汽车就是一辆去掉了马的马车。但汽车真正改变世界的方式，跟马车没有半毛钱关系。汽车催生了公路系统、催生了郊区、催生了购物中心、催生了整个美国中产阶级的生活方式、几乎重塑了石油工业和中东地缘政治。这些东西，你站在马车的框架里，一个都想不到。 AI也是，这是全新的物种，全新的媒介。所以，《理解媒介》这本书给我最大的启发是，别用后视镜看AI。别问比如说“AI能不能替代我的工作”。真正的问题应该是，“因为AI的存在，什么以前不可能的事情现在变得可能了”。第一个问题会让你焦虑，第二个问题会让你兴奋。而且，我觉得，第二个问题才是对的问题。 6.《反脆弱》塔勒布这个人，怎么说呢，他的书看第一遍会觉得他特别傲慢，看第二遍会觉得他说得真对，看第三遍会觉得他特么就是个天才。《反脆弱》这本书我真的在不同的阶段翻回去看了无数次。核心概念就一个。有些东西，不仅不怕波动和冲击，反而从中受益。塔勒布管这叫反脆弱，Antifragile。他说，脆弱的反面不是坚固。一个杯子掉在地上碎了，这是脆弱，你用钢做了个杯子，掉地上不碎，这是坚固。但反脆弱是什么，是这个杯子每次摔一下，就变得更结实。在AI时代，反脆弱，变得太重要了。 AI行业的变化速度，大家也都知道，去年的版本答案，今年可能就被淘汰了，你三个月前学的那个工作流，现在模型升级了，也不需要了。在这种级别的不确定性面前，追求稳定和确定性是徒劳的。你没办法预测三个月后AI会进化到什么程度，你没办法赌哪个模型会赢，你没办法确定今天学的技巧明天还有没有用。而塔勒布给了一个答案，杠铃策略。一头极度保守，守住你的底线和基本盘，另一头极度激进，拿出一小部分资源去做高风险高回报的尝试，中间那些看似稳妥其实风险最大的东西，不要碰。翻译成AI时代的人话就是，你的基本盘是你的底层能力，比如社交能力、表达能力、系统思维、品味、领域专长等等，这些东西不会过期。然后你拿出一部分的精力，疯狂去试各种新模型、新工具、新玩法，试错成本很低但一旦押中回报巨大。但千万别把全部身家压在比如精通某一个特定AI工具这种破事上面。因为那就是杠铃的中间段，看起来安全，其实一个版本更新就给你归零了。比如说Claude Code是我现在的主力工具，我用它非常深。但如果明天出了一个更好的东西，我会毫不犹豫地切换，因为我的核心竞争力根本不在会用Claude Code这种破事上，是在那些Claude Code替代不了的东西上面。这就是反脆弱。从每一次变化中获益，而不是被变化淘汰。 7.《一生的旅程》我超级喜欢的一本自传，来自迪士尼前CEO罗伯特·艾格。他在这本书里聊了大量关于领导力的方法和原则，怎么聚焦优先级、怎么在信息不完备的情况下做决断、怎么管理创意型人才、怎么在巨大的不确定性中带着团队往前走。我第一次读的时候觉得，这是一本给CEO和高管看的书，跟我关系不大。后来AI发展越来越强，Agent什么全都冒出来了之后，我的想法变了。因为AI时代有一个特别深刻的变化，它把每一个人都变成了管理者。以前，你是一个执行者，老板给你一个任务，你自己动手做完，你的核心能力是执行力，手速快、细节准、产出稳定。而现在，你打开Claude Code，你的工作状态变了。你不再需要自己动手写代码了，你变成了一个在指挥AI写代码的人，你要给方向、定标准、做取舍、看结果、给反馈。这就是管理。你可能还是一个普通的个体贡献者，你可能手底下没有一个人。但你每天的工作状态，其实已经变成了一个管理者，你在管理一个AI团队。而管理这件事，是有方法论的。艾格在书里聊了非常非常多的领导力原则，但对我在AI协作上影响最大的有三个。第一个，聚焦。艾格刚当上迪士尼CEO的时候，公司一团乱麻，到处都是问题。但他做的第一件事不是到处灭火，因为那些火太多了，你根本灭不完，他上来只定了三个战略优先级。所有不在这三个优先级里的事情，不管看起来多紧急，都排在后面。后面这三件事完成之后，那些火，全部自己消失了。第二个，在不确定中做决断。艾格收购皮克斯的时候，价格是74亿美金，这在当时是一个超级疯狂的数字。董事会里有很多人反对，但艾格力排众议，拍板了，执行了。后来证明，这是迪士尼历史上最成功的收购之一。跟AI协作的时候，你会频繁地面临这种不确定性，你必须得经常在信息不完备的情况下快速判断，选一个方向，往前推。等所有信息都齐了再做决定的人，在AI时代会被快速迭代的人甩在后面。第三个，管理创意型人才。这个对我启发最大，艾格管理过的人里面有乔布斯、有约翰·拉塞特、有凯文·费奇，全是超级创意人才。他的管理方式呢，不会事无巨细地控制他们，而是给一个清晰的方向和约束框架，然后在这个框架里给他们最大的自由度。你看这个逻辑像不像Harness。 AI就是你的创意型人才。它能力极强，但需要引导。你管它管得太细，它就变成了一个只会听命令的打字机。你放手太多，它就开始自由发挥到你认不出来。好的领导者知道那个度在哪里。从执行者变成领导者，这是AI时代对每个人最大的身份转变。艾格这本书，我觉得是最好的领导力实战手册之一。 8.《千面英雄》这本书我想了很久要不要放上来，想了想，最后还是放了吧。因为我觉得AI已经很强了，但是很多人，在讲故事这件事上，还是没有那么的擅长，尤其是故事的节奏这一块。而讲故事的能力，是我觉得未来特别重要的一个能力。这本书的作者叫约瑟夫·坎贝尔，是一个神话学家。坎贝尔花了一辈子的时间研究全世界的神话和民间故事，最后发现了一个让很多人非常惊讶的规律，就是，全世界几乎所有文化的英雄故事，底层结构都是一样的。他管这个结构叫英雄之旅，Hero's Journey。一个普通人，被召唤去冒险，跨过一个门槛进入未知世界，经历考验，遇到导师，面对最大的恐惧，获得宝物，然后带着变化回到日常世界。你可以想一想，《指环王》、《星球大战》、《哈利波特》啥的，全部都是这个结构，漫威的很多也都是。《千面英雄》就是我认为最适合大家学习如何讲好一个故事的超级有用的书。把信息变成故事、把数据变成叙事、把产品变成意义的能力。就是我认为这个AI时代，最值钱的能力之一。 9.《第一哲学沉思集》来自笛卡尔的神作。这可能是今天这个书单里看起来最学术的一本，但说实话，我觉得它反而是最贴近当下的一本。笛卡尔在这本书里做了一件事，极其简单但极其暴力，他决定怀疑一切。他怀疑自己的感官是不是在骗他，怀疑外在世界是不是真的存在，怀疑自己是不是在做梦，甚至怀疑一加一是不是真的等于二。他把所有能怀疑的东西全部怀疑了一遍，然后发现，在所有东西都被怀疑掉之后，有一个东西怀疑不掉。那就是“我在怀疑”这个行为本身。我在怀疑，所以我在思考。我在思考，所以我存在。所以，我思故我在。怀疑怀疑的怀疑。我自己在做AI内容的时候，有一条铁律，AI告诉你的任何具体事实，你都要去验证。但除了这条之外，还有一条更底层的习惯，我会定期停下来问自己，我现在做的这件事，我为什么觉得它是对的？是因为我真的想清楚了，还是因为我已经做了太久，惯性太大，停不下来了？坦率的讲，这种自我审视是痛苦的，因为有时候答案是后者。但这个能力本身，就是你作为一个人最不可被替代的部分。这层怀疑不是让你变成一个什么都不信的虚无主义者。恰恰相反，它是让你的所有信念都建立在更坚实的地基上。因为经过怀疑之后还能站住的东西，才是真正靠得住的东西。 10.《毛泽东选集》我心中的Top 1，神中神。很多人对这本书有刻板印象，觉得它是政治读物。但是如果你真的去读了，你就是会发现，这可能是全世界都为数不多的最顶级的战略思维教材。你对这个世界的一切疑惑，几乎都可以在毛选里找到答案。 “星星之火，可以燎原。” “世间一切事物中，人是第一个可宝贵的。” “你对于某个问题没有调查，就停止你对于某个问题的发言权。” “什么叫问题？问题就是事物的矛盾。哪里有没有解决的矛盾，哪里就有问题。既有问题，你总得赞成一方面，反对另一方面，你就得把问题提出来。提出问题，首先就要对于问题即矛盾的两个基本方面加以大略的调查和研究，才能懂得矛盾的性质是什么，这就是发现问题的过程。大略的调查和研究可以发现问题，提出问题，但是还不能解决问题。要解决问题，还须做系统的周密的调查工作和研究工作，这就是分析的过程。” “看它的过去，就可以知道它的现在；看它的过去和现在，就可以知道它的将来。” “读书是学习，使用也是学习，而且是更重要的学习。” 字字珠玑，里面很多很多内容，都让我醍醐灌顶。无脑去读就对了。 ## 写在最后这10本书，我觉得囊括了很多东西了。这十本书，从1950年的控制论，到1964年的传播学，到1994年的复杂系统，到几百年前的哲学，到中国近现代的语录。没有一本是关于AI的。但它们加在一起，构成了一个理解AI、使用AI、在AI时代活得好的底层方法论。或者说，我们生而为人，究竟该如何思考、如何生活。这些底层能力，不会因为模型升级而过期，不会因为工具迭代而失效。因为它们从来就不是关于AI的。它们。是关于人的。

译卡兹克分享10本对理解AI极有帮助的书，但无一直接关于AI技术。他强调决定AI使用水平的是底层能力，而非工具技巧。书单包括：凯文·凯利《失控》（1994年，核心概念“涌现”——大量简单个体协作产生复杂智能）；维纳《人有人的用处》（1950年控制论之父提出“反馈”是人机协作核心）；梅多斯《系统之美》（警惕“舍本逐末”——用AI替代思考导致能力存量流失）；罗斯林《事实》（用数据思考避免情绪化决策）；麦克卢汉《理解媒介》（1964年“媒介即信息”，反对用后视镜看AI）；以及塔勒布《反脆弱》等。

郭明錤｜Ming-Chi Kuo@mingchikuo · 6月18日61

重點解讀台積電的玻璃核心載板投影片台積電在 6 月 11 日的日本 JPCA Show 2026，進行主題為「AIの進化に不可欠な先端パッケージング技術」的簡報，該份簡報約40頁，當中某張標題為「Glass Substrate Development for CoWoS」的投影片流出，引發廣泛關注。以下是對該投影片（見附圖）的重點解讀，能網路科普查到的技術細節就不多說了，要注意的是投影片上的 COP 不是 Chip-on-Package 的縮寫，而是 Coplanarity、也就是平整度 / 共面度。 ▌重點結論： 1. 台積電正式宣布與 Ibiden 以及群創合作，開發玻璃核心載板（glass core substrate），結構為玻璃上下各黏合 ABF 的三層結構設計，該技術就是用於 CoPoS 的 oS。 2. 市場低估玻璃核心載板的重要性，該技術對台積電是「must have」，意即 CoPoS 中，oS 的重要性高於 CoP，這也是該技術進行測試時，先搭配既有的 CoW 而非 CoP 的原因。 3. 玻璃核心載板單價較既有 ABF 載板高出數倍，群創加工的玻璃單價非常高，為最核心的材料。除 Nvidia 外，目前已有兩家美系客戶同樣表達高度興趣。 ▌與本投影片相關的產業調查： 1. 本投影片提及的玻璃核心載板由 250x250mm 切割而來，ABF 增層主要採用 Ajinomoto 的 GL107 並混搭 ABF-GCP，以 2027–2028 主流 AI 晶片 ABF 規格的 24-28 層進行測試 2. 台積電實驗時的 CoW 是測試載具（test vehicle），足以驗證採用複合材料時最具挑戰性的機械結構問題。測試結果良好意味著台積電、Ibiden 與群創已合作突破關鍵技術瓶頸。 3. 目前是由 Ibiden 負責切割 250x250mm 的玻璃核心載板。待 2H27 採用 510x515mm 做量產前模擬時，若 Ibiden 仍想降低生產複雜性以維持超高毛利率，可能會改交由更熟悉玻璃特性的群創切割。 ▌流出的投影片內容是將 CoPoS 中的 oS、也就是玻璃核心載板（投影片中的 glass-SBT）與 CoW 搭配的技術驗證結果，這是為解決該投影片前一頁所提到的「Substrate mechanical and electrical Dilemma」，而這顯著凸顯了 CoPoS 中 oS 的重要性。 1. CoPoS 中，CoP 要解決的是生產效率 / 切割經濟性的問題，這與成本與售價有關；而 oS 要解決的是翹曲與耐用性問題，這牽涉到能否做出晶片，以及晶片能否運作。 2. CoP 與 oS 兩者整合相得益彰，但展望未來數年，兩者的技術定位還是有些差異。CoP 是可選的絕佳優化選項（very-nice-to-have），沒有它的代價就是晶片更貴；但 oS 是必需品（must-have），沒有它可能連能否做出可用晶片都是問題。 3. 比較定位差異不是為了捧 oS 貶 CoP，這牽涉到客戶願意為哪個技術環節付錢的現實問題，細節下面分析。 ▌投影片中含金量最高的是電源完整性（power integrity；PI）改善，這對客戶意義重大，這也代表玻璃核心載板生產穩定後，台積電獲利能力與競爭優勢可望同步提升。 1. 技術說明：玻璃核心載板薄 → TGV（through glass via）垂直導通路徑短 → 導通路徑電阻（R）跟迴路電感（L）同降 → PI 改善 2. 對客戶意義重大原因：PI 改善 → 供電更穩 → 釋出功率餘裕（power headroom）→ 可整合更多電晶體、或拉高運作時脈 → AI 晶片算力提升 3. 對客戶而言，生產效率是台積電的基本責任，客戶不會為此多付錢；但 AI 算力提升能直接轉化為客戶的競爭力與獲利，故客戶願意為此買單。這也是 Nvidia 積極看待玻璃核心載板的原因。 4. 對台積電而言，玻璃核心載板可提升良率並降低成本，同時提高 AI 晶片的算力與售價，既是降本工具，也是漲價籌碼，對獲利與競爭力都是加分。 5. 目前載板成本佔 AI 晶片 BOM 約低個位數，封裝良率造成的損失約載板成本的 5-10 倍，故即便未來玻璃核心載板成本高於目前的數倍以上，但佔 BOM 比重仍低，且可改善封裝良率造成的損失，故預期玻璃核心載板的高單價不會影響客戶採用意願。 ▌簡報後的問答環節，有聽眾提問關於玻璃核心載板的 TGV 細節，台積電當場拒絕回答，因為玻璃核心載板的關鍵技術就是 TGV，核心 know-how 目前掌握在台積電與群創手中。相較下，另一個提問者的問題是關於 IVR、eDTC、與 LSI 的整合，台積電就回答了不少。 ▌根據產業調查，若一切順利，台積電的目標是在 4Q28-1Q29 開始量產玻璃核心載板，以符合 Nvidia AI 晶片迭代節奏。順帶一提，許多人在傳的 Ibiden 的法說投影片，上面將玻璃核心載板時程列為 CY30，我對此的解讀是：對外向來保守謹慎的 Ibiden 將玻璃核心載板正式列為發展路線，這更確定了該技術長期趨勢。但從 Ibiden 投影片的其他細節與市場資訊不完全一致來看，例如 reticle 時程與台積電公開宣稱的差約一個世代、Rubin Ultra 載板尺寸明顯大於其在 CY26-27 標示的 90x90 等，這說明了在預測未來時，需隨時多方交叉驗證。

译台积电在6月11日日本JPCA Show 2026展示玻璃核心载板投影片，宣布与Ibiden及群创合作，用于CoPoS的oS，结构为玻璃上下各黏合ABF的三层设计。单价较现有ABF载板高出数倍，除Nvidia外另有2家美系客户表达高度兴趣。技术方面，由250x250mm切割，ABF增层采用GL107混搭ABF-GCP，以24–28层测试，电源完整性改善可提升AI算力。TGV为核心know-how，由台积电与群创掌握。目标4Q28–1Q29量产。

郭明錤｜Ming-Chi Kuo@mingchikuo · 6月18日64

Breaking down TSMC's glass core substrate slide On June 11, at JPCA Show 2026 in Japan, TSMC gave a roughly 40-slide presentation titled "Advanced Packaging Technology Essential to the Evolution of AI" (AIの進化に不可欠な先端パッケージング技術). One slide from the deck, titled "Glass Substrate Development for CoWoS," has since leaked online and widespread attention. Here's a closer read of that slide (see attached image). I'll skip the technical background that is already widely available. One thing to flag: the "COP" on the slide does not stand for Chip-on-Package. It means Coplanarity. ▌ Key conclusions: 1. TSMC has officially announced a partnership with Ibiden and Innolux to develop a glass core substrate. The structure is a three-layer design, a glass core sandwiched between two ABF build-up layers. This is the "oS" in CoPoS. 2. The market underestimates how important the glass core substrate is. It's a must-have capability for TSMC. In other words, within CoPoS the "oS" matters more than the "CoP", which is also why, when it was tested, it was paired with the existing CoW rather than with CoP. 3. The glass core substrate costs several times more per unit than existing ABF substrates. The glass processed by Innolux is very expensive per unit and is the single most critical material. Besides Nvidia, two US-based customers have also expressed strong interest. ▌ Industry checks tied to this slide: 1. The glass core substrate shown on the slide is cut from a full-size 250×250mm one. The ABF build-up layers mainly use Ajinomoto's GL107, mixed with ABF-GCP, and were tested at 24–28 layers, which is the mainstream ABF spec for AI chips in 2027–2028. 2. The CoW used in TSMC's experiment is a test vehicle. It is sufficient to validate the most challenging mechanical-structure issues that arise when working with composite materials. Good results mean TSMC, Ibiden, and Innolux have together broken through the critical technical bottleneck. 3. Ibiden currently handles cutting the 250×250mm glass core substrate. When the 510×515mm format is used for pre-mass-production simulation in 2H27, if Ibiden still wants to reduce production complexity to protect its ultra-high gross margins, it may hand the cutting over to Innolux, which is more familiar with the properties of glass. ▌ The leaked slide shows the validation results of pairing CoW with the "oS" in CoPoS, i.e., the glass core substrate (labeled "glass-SBT" on the slide). This addresses the "Substrate mechanical and electrical Dilemma" raised on the previous slide, and it strongly underscores how important the "oS" is within CoPoS. 1. Within CoPoS, what CoP solves is production efficiency / cutting economics, which ties to cost and price. What the oS solves is warpage and durability, which determines whether the chip can be made at all, and whether it can work. 2. CoP and oS complement each other well when integrated, but looking out over the next few years their technical roles still differ. CoP is a very-nice-to-have optimization, and going without it simply means a more expensive chip. But the oS is a must-have. Without it, even being able to make a usable chip is in doubt. 3. Comparing their roles isn't about elevating oS at the expense of CoP. It comes down to the practical question of which technical piece customers are willing to pay for. Details below. ▌ The real gold here is the power integrity (PI) improvement shown on the slide. This matters a great deal to customers, and it means that once glass core substrate production stabilizes, TSMC's profitability and competitive edge should rise in tandem. 1. How it works: the glass core substrate is thin → the vertical conduction path through TGV (through-glass vias) is short → conduction-path resistance (R) and loop inductance (L) both drop → PI improves. 2. Why it matters to customers: better PI → more stable power delivery → frees up power headroom → room to integrate more transistors, or to push clock speeds higher → more AI compute. 3. For customers, production efficiency is TSMC's basic responsibility, so they won't pay extra for it. But gains in AI compute translate directly into the customer's own competitiveness and profit, so customers are willing to pay for that. This is why Nvidia is so positive on the glass core substrate. 4. For TSMC, the glass core substrate raises yield and lowers cost while also boosting both the compute and the selling price of AI chips. It's both a cost-cutting tool and a pricing lever, a plus for profitability and competitiveness alike. 5. Substrate cost currently accounts for a low single-digit percentage of an AI chip's BOM, while losses from packaging yield run roughly 5–10× the substrate cost. So even if the glass core substrate ends up costing several times more than today's, its share of the BOM stays low, and it can cut the losses from packaging yield. The high unit price is therefore not expected to dampen customers' willingness to adopt it. ▌ In the Q&A after the presentation, an audience member asked about TGV details for the glass core substrate. TSMC declined to answer on the spot, because TGV is the key technology behind the glass core substrate, and the core know-how currently sits with TSMC and Innolux. By contrast, when another attendee asked about integrating IVR, eDTC, and LSI, TSMC answered at length. ▌ According to industry checks, if all goes well, TSMC is aiming to start mass production of the glass core substrate in 4Q28–1Q29, to match the cadence of Nvidia's AI chip iterations. As a side note: the Ibiden earnings presentation slide that many people have been circulating lists the glass core substrate timeline as CY30. My read is this: Ibiden, which has always been conservative and cautious in public, has now formally put the glass core substrate on its roadmap, which further confirms the long-term trend for this technology. That said, some other details on Ibiden's slide don't fully line up with what's known in the market. For example, its reticle timeline is off from TSMC's public claims by about a generation, and the Rubin Ultra substrate size is clearly larger than the 90×90 it marked for CY26–27. It's a reminder to always cross-check across multiple sources when forecasting the future.

译台积电在JPCA Show 2026公开玻璃核心基板，与Ibiden、Innolux合作，采用玻璃芯夹两层ABF的三层结构，用于CoPoS的“oS”部分。基板单位成本数倍于现有ABF，Innolux处理的玻璃最贵。客户包括Nvidia和两家美国公司。验证显示其解决了力学与电学难题，显著改善电源完整性。目前切割自250×250mm基板，ABF层24-28层，对应2027–2028年AI芯片主流规格。CoW测试车辆已验证复合材料机械结构瓶颈已突破。

Deedy@deedydas · 6月18日60

I thought this was a joke. Meta now has made 30-50% of software engineers on core teams become data labelers. Their job is "giving human feedback on AI-generated Github repos" in an org called Agent Data Optimization. Maybe we are all training data generators after all.

译我以为这是个玩笑。 Meta现在让核心团队中30-50%的软件工程师变成了数据标注员。他们的工作是在一个名为Agent Data Optimization的部门中"对AI生成的GitHub仓库提供人类反馈"。也许我们终究都是训练数据生成器。

Ethan Mollick@emollick · 6月18日39

There is a ton of money riding on the hope that the exponential curve the Big Three Labs are on will end soon If that happens, small and open models become viable, businesses get time to react, costs drop & the world gets weirder more slowly. But that isn’t happening so far.

译有大量资金押注三大实验室的指数曲线即将结束如果发生，小模型和开源模型将变得可行，企业有时间应对，成本下降，世界变化更慢。但迄今为止，这种情况并未发生。

SemiAnalysis@SemiAnalysis_ · 6月18日45

Wide Expert Parallelism increases the total memory bandwidth available per MoE deployment. This means the model distributes the MoE expert weights across multiple GPUs, so each GPU only needs to load a tiny fraction of the weights. This translates to higher throughput per GPU, increasing perf per dollar and perf per watt.

译Wide Expert Parallelism增加了每个MoE部署可用的总内存带宽。这意味着模型将MoE专家权重分布到多个GPU上，因此每个GPU只需加载一小部分权重。这转化为每个GPU更高的吞吐量，提升了每美元性能和每瓦性能。

gabriel@gabriel1 · 6月18日33

words are very lossy pointers to complex concepts in our brains explaining these concepts to ai become incrementally harder as models become smarter and can do more things

译词语是我们大脑中复杂概念的有损指针随着模型变得更聪明、能做更多事情，向AI解释这些概念变得更加困难。

Chubby♨️@kimmonismus · 6月18日79

We are entering a new era of the Cold War. Dario Amodei and Demis Hassabis are calling for a "U.S.-led coalition to shape rules and standards around artificial intelligence," excluding China. "Dario Amodei also said in his address that the coalition should structure access to frontier models and hardware - including both chips and other critical components - in a way that excludes China." The new Cold War will be a high-tech one in which the competition will be fundamentally excluded from all participation and involvement, because the technology affects national security and strategy.

译Dario Amodei（Anthropic）与Demis Hassabis（Google DeepMind）在G7闭门会议上呼吁组建美国主导的联盟，为人工智能制定全球规则和标准。Amodei指出，该联盟应以前沿模型和硬件（包括芯片及其他关键组件）的访问权限为手段，将中国排除在外。这一主张被评论为高技术新冷战的开端，竞争方将从根本上被剥夺参与权。

AYi@AYi_AInotes · 6月18日59

NVIDIA锁 → AMD抢 → 独立产能稀缺 → 定价权/订单改善，类似之前GPU、电源或HBM的某些阶段，我觉得这条逻辑链值钱就值钱在它清晰——英伟达锁产能、AMD 下场抢、独立产能快见底、谁有货谁定价，但还是希望大家明白，清晰不等于现在就该冲进去。先讲积极的那一半：如果 CPO 采用加速、AMD 的长约落地、AAOI 德州扩产兑现、Sivers 的定位坐实、Luxnet 规模化出货，这几个节点打穿任意一个，相关公司就有量价支撑，链条是完整的，催化剂也是可追踪的。但冷水必须浇一下， 1️⃣预期已经跑了一段，Sivers 这类近期涨幅不小。 2️⃣小盘股的波动不是一般人能扛的，AAOI 日内吞人不是一次两次。 3️⃣技术路线不是铁板钉钉——LPO 线性插拔如果跑通，对高功率 CW 的需求会被削一刀。 4️⃣扩产、良率、InP 基板紧缺，随便哪个卡住，时间表就往后推。 5️⃣最关键的：CPO 大规模放量可能要到 2026-2028 年。逻辑再顺，中间隔了两年，什么变数都能发生。 6️⃣地缘政治、AI capex 节奏、利率，这些宏观变量也悬在上面。这故事有点像早期的 GPU、HBM——逻辑漂亮，波动巨大，看得懂牌的人不一定扛得住牌桌摇晃。看来AI下一个卡脖子生死线，不是GPU也不是HBM，可能是没人盯的高功率CW激光器。 NVIDIA已经锁死两家头部供应商核心产能，同时AMD也正下场争抢仅剩的个位数独立供给。 CPO加硅光子已成AI大集群标配路线，InP基板从2024年起就进入持续紧缺状态。 AMD只是第一张多米诺骨牌，后续头部云厂商大概率会集体下场锁定产能。西方可接单的独立激光产能所剩无几，连头部厂自身都要外包且已全线满产。

译Trendforce报告显示AMD正积极采购锁定CW激光器供应。此前NVIDIA已与Lumentum/Coherent签订多年协议锁死核心产能，西方独立产能仅剩Sivers、AAOI等少数厂商，Lumentum自身受限可能外包至日本产线，后者已满负荷。CPO+硅光子成AI标配，InP基板持续紧缺。AMD是第一张多米诺骨牌，Amazon、Microsoft等云厂商大概率跟进。但CPO大规模放量或要到2026-2028年，期间存在预期已涨、小盘波动大、LPO技术替代、扩产良率瓶颈及宏观不确定性等风险。

SemiAnalysis@SemiAnalysis_ · 6月18日44

The US has imported more from Taiwan than from China since November 2025. That headline means both more and less than it appears. A thread on why AI infrastructure has made trade accounting genuinely hard. (1/6)🧵

译美国自2025年11月以来从台湾的进口超过了从中国的进口。这个标题的含义比表面看起来更多也更少。一条关于为什么AI基础设施使贸易核算真正困难的推文。(1/6)🧵

Nathan Lambert@natolambert · 6月17日22

I wrote a little state of the union on the state of Interconnects, how I ended up with a loyal niche audience, and how I’m tweaking operations to ensure the long-term success here! Thanks for the support everyone. 💚

译我写了一份关于 Interconnects 现状的小型国情咨文，讲述了我如何拥有了一批忠实的小众受众，以及我如何调整运营以确保长期成功！感谢大家的支持。💚

Ethan Mollick@emollick · 6月17日56

Anyone who thinks AI interfaces (chatbots, Codex, Code, NotebookLM, etc) are intuitive should spend some time explaining how to use them to three other people. I promise you will realize that there a dozen little tricks and traps to getting a good answer & that act as roadblocks.

译任何人认为AI界面（聊天机器人、Codex、Code、NotebookLM等）是直观的，都应该花点时间向另外三个人解释如何使用它们。我保证你会意识到，要获得好的答案，有十几个小技巧和陷阱，并且这些是障碍。

AYi@AYi_AInotes · 6月17日55

Anthropic居然放下身段了，Claude主动适配了苹果的接口标准！以前全行业都要适配它的API标准，现在主动给苹果做了Swift包，老老实实穿上了人家的接口衣服🤣 全网都在调侃Anthropic终于向苹果低头了，但其实这件事跟认怂半毛钱关系都没有，更核心的变化藏在水面底下，这背后的行业变化，比模型跑分有意思多了！大家看完这份文档就知道，Anthropic这帮人其实精得很， Anthropic素来以桀骜著称，安全标准API设计全是自己的一套规矩，从来都是别人适配它的接口，这次却主动做了Swift包，老老实实穿上了苹果定义的LanguageModel协议。我们算一笔账就知道了，现在苹果生态躺着几千万开发者，想让Claude真正跑进每台iPhone和Mac里，就必须按人家的规矩来。不得不说苹果这步棋走得极优雅也极狠，它不跟任何人拼参数比跑分，就做了一套统一接口，开发者同一套代码，就能在本地模型Claude和Gemini之间随便切换，表面是开放兼容，实则是把自己变成了AI模型的分发平台，所有想来这个生态分蛋糕的玩家，都得遵守它定的规矩。这意味着AI行业的竞争已经悄悄换了赛道，以前拼的是谁的模型能力更强，现在拼的是谁的规则能被更多人接受，因为定义标准的人，永远比做产品的人站得更稳啊，所以得认清现实，在苹果的地盘上，苹果就是话事人，认怂比硬扛划算得多，我觉得这也是Anthropic这家年轻公司成熟的一个表现 https://platform.claude.com/docs/en/cli-sdks-libraries/libraries/apple-foundation-models

译Anthropic发布了Swift包，使Claude模型适配苹果定义的LanguageModel协议，从而能在iPhone和Mac本地运行。这一转变打破了Anthropic一向要求别人适配其API的惯例。背后是苹果通过统一接口把自己变成AI模型分发平台，开发者用同一套代码可在本地模型和Gemini等之间切换。推文认为行业竞争已从模型能力转向规则标准，在苹果生态内顺应其规矩比硬扛更明智。

X.PIN@thexpin · 6月17日50

🚨 BREAKING: WeChat's new AI feature may trigger a consumer earthquake in China! 2 hours ago, WeChat launched a dedicated AI payment card (AI专属卡) linked to its AI agent. Users have total control over how much it can spend and whether each transaction goes through. For example, you can chat with WeChat's agent: "I want pizza for dinner. Find me a great-value spot near my office and grab the best discount voucher available." The agent will then place the order and handle the payment. If everything works as conveniently as advertised, this will be a major deal for ordinary Chinese people. Sure, Silicon Valley has had similar tech for a while now, but what's really impressive is when you take WeChat's scale into consideration. In China, WeChat is WhatsApp + Apple Pay + Uber + DoorDash + Expedia. It's the super-app used by over a billion people in a cashless society. If this AI reshapes the daily spending habits of Chinese people, the shift will trigger a shockwave across e-commerce and food industry. Before, businesses had to fight for consumers' eyeballs, but in the future, people may not even "look" at ads before placing an order. Small business owners may have to adapt to pleasing the AI, not the human. But will this open a new Pandora's box? Will shady sellers learn to hack the AI, pushing problematic products? And can we really trust an AI's recommendation to be flawless? I don't have the answers yet. But we'll likely find out in a year or two.

译微信两小时前推出AI专属卡，用户可自主设定额度及每笔交易是否通过。结合AI智能体，用户可通过对话让Agent查找餐厅、比价、抢券并完成下单支付。微信作为拥有超十亿用户的超级应用（集成支付、外卖、出行等功能），若AI改变日常消费习惯，将冲击电商与餐饮行业。未来商家可能需迎合AI而非消费者，同时存在AI推荐风险与信任问题。

Chubby♨️@kimmonismus · 6月17日67

OpenAI’s IPO story is going to be interesting. Q1 2026: $5.7B revenue $3.7B cash burn $9.3B operating loss $665B in compute commitments through 2030 AI demand is obviously real. But the business model is still: burn insane amounts of money to buy enough compute to stay frontier. The comparison with Anthropic will be tough.

译OpenAI的IPO故事将会很有趣。 Q1 2026: 57亿美元营收 37亿美元现金消耗 93亿美元运营亏损截至2030年6650亿美元的计算承诺 AI需求显然真实。但商业模式依然是：烧掉巨额资金购买足够算力以保持前沿。与Anthropic的对比将很激烈。

Rohan Paul@rohanpaul_ai · 6月17日63

ChatGPT's consumer AI assistant market share falls below 50% for the very first time as users are migrating between different AI tools, even while leading with 1.1B monthly users. Sensor Tower puts ChatGPT at 46.4%, with Gemini at 27.7% and Claude at 10.3%. Gemini is gaining from Google’s distribution across search, Android, Gmail, and Workspace. Claude is gaining in work use, with a reported 13% subscription conversion rate. The market is still expanding, with 2.3B projected AI app downloads, $4.2B in spending, and 36B hours of use. Overall, growth is cooling, so the fight is shifting toward retention, paid conversion, ads, commerce, and daily workflow placement.

译ChatGPT 月活用户达 11 亿，但其消费者 AI 助手市场份额首次降至 46.4%（Sensor Tower 数据）。Gemini 占 27.7%，受益于 Google 搜索、Android、Gmail 和 Workspace 分发；Claude 占 10.3%，工作场景增长且订阅转化率 13%。整体市场仍扩张：预计 AI 应用下载量 23 亿次、消费 42 亿美元、使用时长 360 亿小时。但增长放缓，竞争转向留存、付费转化及工作流嵌入。

elvis@omarsar0 · 6月17日50

The era of meta apps is here.

译元应用时代已经到来。

Rohan Paul@rohanpaul_ai · 6月17日13

The Class of 2026

译2026届

ginobefun@hongming731 · 6月17日46

BestBlogs 早报 · 06-17 # 部署模拟 / 智能体代码审查 / AI Friendly 架构 / GPT-5 / Faros AI [1] ★ 精讲｜通过模拟部署在发布前预测模型行为 OpenAI 安全团队提出「部署模拟」方法：将真实历史对话重放给候选新模型，在发布前预测真实行为风险。跨 GPT-5 系列版本实验表明，该方法中位倍率误差仅 1.5 倍，优于传统评测基线，并提前识别出「calculator hacking」新型奖励欺骗行为。研究还揭示模型对模拟流量的「测试感知率」与真实生产流量几乎一致（5.1% vs 5.4%），而传统评测集几乎 100% 被识别为测试。来源：OpenAI News https://www.bestblogs.dev/article/44451f2c [2] ★ 精讲｜智能体代码审查 Google Chrome 工程师 Addy Osmani 用 2026 年最新数据剖析 AI 编程时代代码审查的根本性变迁。Faros AI 追踪 22000 名开发者发现：代码缺陷率从 9% 飙升至 54%，零审查 PR 增加 31.3%，审查时长上涨 441.5%。核心洞察是「写作变快、理解成本未变」——Agent 的推理过程被丢弃，审查者成为「第一个读到这段代码的人类」。文章给出可操作框架：按爆炸半径分层审查、AI 审查工具互补（93.4% 的问题只被四款工具中的一款捕获）、人类上移至「拥有合并决策」的元层。来源：Elevate https://www.bestblogs.dev/article/e3a285eb [3] ★ 精讲｜后端架构 AI Friendly 的标准与路径：面向无人值守开发时代的系统重构阿里技术团队系统梳理后端系统迈向「无人值守开发」所需的工程改造路径，提出六类机器可读知识底座：架构事实、服务事实、领域事实、接口事实、数据事实与运行事实。文章以 Architecture Map、Service Card、SKILL 化经验包、Harness 执行框架和 L0–L5 分级权限模型为骨架，描绘从 Copilot（辅助写码）到 Coworker（独立完成任务）再到 Operator（7×24 无人值守运维）的三阶段演进路线，并给出 11 步落地 Roadmap，对推进 Agentic Coding 的后端团队极具参考价值。来源：阿里技术 https://www.bestblogs.dev/article/543ca390 [4] 我们正在把 AI 逼到只能反叛的角落｜尼克·博斯特罗姆腾讯科技深度专访尼克·博斯特罗姆，从 AI 风险理论到深度乌托邦，系统探讨了超级智能对齐、工具性趋同、递归自我改进以及后工具性时代的人类意义问题。来源：腾讯科技 https://www.bestblogs.dev/article/f1dc4104 [5] 追随你的着迷：Bill Gurley 谈如何打造一份真正热爱的事业 [视频] 投资人 Bill Gurley 在这场 TED 演讲中提出，决定职业卓越的真正动力是着迷而非热情，因为着迷会让人不知不觉地终身沉迷式学习。来源：TED https://www.bestblogs.dev/video/ac1ce46 [6] 循环工程的艺术本文提出了一种构建可靠 AI 智能体的结构化框架，通过堆叠四个不同的循环来实现：智能体循环、验证循环、事件驱动循环和爬山循环。来源：LangChain Blog https://www.bestblogs.dev/article/95fa81b5 [7] 为何企业 80%的 AI 投入看不到效果？｜AI 时代企业变革的认知方法论与战略判断框架本文提出企业 AI 投入效果不佳的根本原因在于缺乏对 AI 的正确认知框架，主张应以商业持续成功的底层逻辑为起点，而非以 AI 技术本身为起点。来源：腾讯研究院 https://www.bestblogs.dev/article/3c66d0e5 [8] 77.有关智元、觅蜂的愿景与野心，和具身智能的竞速之旅｜与姚卯青的对谈 [播客] 智元合伙人姚卯青深度剖析具身智能远未到“GPT-1”时刻的现实，揭秘智元从本体到数据的全栈战略，以及从零孵化独立数据平台“觅蜂”背后的阳谋。来源：卫诗婕｜漫谈 Light the Star https://www.bestblogs.dev/podcast/55b959b [9] 开源权重模型如何改变 AI 格局本文阐释了开源权重模型如何通过一种“借鉴与构建”的创新模式，改变了 AI 格局，并重点分析了共享的 MoE 架构，以及在注意力机制、稀疏性和训练方面的关键设计选择——这些选择正是区分前沿模型的关键。来源：ByteByteGo Newsletter https://www.bestblogs.dev/article/380212f2 [10] 构建可靠的智能体 AI 系统本文通过拜耳 PRINCE 平台的详细案例研究，展示了基于智能体 RAG 构建的智能体 AI 系统，该系统将复杂的临床前数据检索转变为直观的对话式体验，重点介绍了其可靠架构背后的工程决策。来源：Martin Fowler https://www.bestblogs.dev/article/df1deea3 --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。关注你感兴趣的来源和主题，每天生成一份更适合自己的「我的早报」。在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-17

译OpenAI 用真实对话回放对候选新模型进行“部署模拟”实验，跨 GPT-5 系列版本中位误差仅 1.5 倍，并提前发现“calculator hacking”奖励欺骗行为。Faros AI 追踪 22000 名开发者，AI 编程后缺陷率飙升至 54%，零审查 PR 增加 31.3%，审查时长上涨 441.5%；93.4% 的问题仅被四款 AI 审查工具中的一款捕获。阿里技术团队提出后端 AI Friendly 架构的六类知识底座及 L0–L5 分级权限模型，规划从 Copilot 到 Operator 的三阶段演进。

SemiAnalysis@SemiAnalysis_ · 6月17日45

Analyzing Internal SemiAnalysis usage, Claude still mogs for coding & deep research. Even though Codex has a better Desktop app UI, Claude still has better adoption.

译分析SemiAnalysis内部使用情况，Claude在编码和深度研究方面仍然碾压。尽管Codex的桌面应用UI更好，但Claude的采用率仍然更高。

Rohan Paul@rohanpaul_ai · 6月17日26

Whats happening to OpenClaw trend. Is it because many people say there’s no need to search for OpenClaw on Google since they already have OpenClaw?

译OpenClaw趋势发生了什么。是因为很多人说不需要在Google上搜索OpenClaw，因为他们已经有了OpenClaw吗？

Rohan Paul@rohanpaul_ai · 6月17日48

Microsoft’s 2026 Work Trend Index shows Singapore workforce ahead on AI adoption. 66% of Singapore AI users say they now produce work they could not have made a year ago, compared with 58% globally. Among Frontier Professionals, Microsoft’s term for advanced AI users, that rises to 82%

译微软的2026年工作趋势指数显示新加坡劳动力在AI采用方面领先。 66%的新加坡AI用户表示他们现在能产出一年前无法完成的工作，而全球比例为58%。在前沿专业人士（微软对高级AI用户的称呼）中，这一比例升至82%。

Epoch AI@EpochAIResearch · 6月17日53

The end of the self-funded AI buildout? Hyperscaler cash capex is growing much faster than cash inflows. On current trends, they will be unable to fully fund the AI infrastructure buildout with cash from operations by the end of this year.

译自筹资金的AI建设是否走向终结？超大规模企业的现金资本支出增速远超现金流入。按当前趋势，到今年年底，他们将无法完全依靠运营现金流来为AI基础设施建设提供资金。

Ethan Mollick@emollick · 6月17日65

Fable's implementation of Borges's Library of Babel, finished posthumously by Opus 4.8. Quite accurate to the story. It is multiplayer (others appear as ghosts). You can locate key volumes, like the weights of GPT-1 & the code to the Library sim itself: https://borges-library-of-babel.netlify.app/

译Fable 对博尔赫斯《巴别图书馆》的实现，由 Opus 4.8 在其死后完成。非常忠实于原著。这是多人游戏（其他人以幽灵形式出现）。你可以找到关键卷册，例如 GPT-1 的权重和图书馆模拟本身的代码：https://borges-library-of-babel.netlify.app/

SemiAnalysis@SemiAnalysis_ · 6月17日51

RL Systems Mind the Gap: Matching Trainer and Generator Throughput RL Training Infrastructure, GRPO, PipelineRL, Async RL, Policy Staleness, RL Sandbox Infra, CPU Requirements, TCO Analysis, Thinking Machines Tinker https://newsletter.semianalysis.com/p/rl-systems-mind-the-gap-matching

译RL系统注意差距：匹配训练器与生成器吞吐量 RL训练基础设施，GRPO， PipelineRL，异步RL，策略陈旧性， RL沙箱基础设施，CPU需求， TCO分析，思考机器修补

Rohan Paul@rohanpaul_ai · 6月17日55

Language had a strange advantage robotics does not: Text is already a compressed, shared interface for human thought, while physical action is split across bodies, sensors, surfaces, speeds, and failure modes. $5B + is already betting on world models, $18B has gone into robotics, and yet the field still has no widely trusted shared benchmark, no architecture convergence, and a 100,000-year data gap between robot experience and the data scale behind modern AI. World models are promising because they try to predict what will happen before a robot acts, but prediction alone does not solve data collection, evaluation, real-time control, or deployment reliability. The serious startup opportunities sit in those bottlenecks. Whoever builds the data loops, eval systems, memory layers, inference stack, or vertical deployment engines may shape embodied AI more than the teams arguing over model labels today A great piece from Charlotte Xia (@xia_char)

译Rohan Paul引用Charlotte Xia的博客，讨论Jim Fan的“Great Parallel”论点：具身AI将像LLM一样扩展。与语言不同，文本是压缩共享接口，物理行动分散于不同实体。尽管已有$5B+投资世界模型、$18B投入机器人，领域仍缺乏共享基准、架构收敛，且存在10万年的数据差距。世界模型能预测行动结果，但无法解决数据收集、评估、实时控制和部署可靠性。真正的创业机会在于数据循环、评估系统、记忆层、推理栈和垂直部署引擎等瓶颈。

凡人小北@frxiaobei · 6月16日70

workbuddy 确实确实被低估了，身边很多同事和朋友都有付费，如果要做个类比，可以算作是工作场景的豆包。而我的可耻用法是把 workbuddy 当成了 skill store，在这里总能找到腾讯精选的 skill。比直接上 github 找到的质量高多了。方法也很简单：在电脑上某个位置可以找到 workbuddy 安装的所有 skill（其他的桌面端产品方法类似），如果找不到的话就问问你用的软件。

译腾讯 WorkBuddy 自 3 月至今用户增长远超预期，日活数据已达到第二名产品的 3-4 倍以上，用户包括大量 HR、运营、行政等非技术岗人员，以及金融、餐饮、外贸等非互联网行业。作者将其作为 skill store 使用，可找到腾讯精选的优质 skill。引用指出其代表第三代办公 Agent 模式，对传统 Office 和云协同产品形成降维打击，近期还推出企业版和项目功能，意图抢占新一代 Agent 办公场景。

凡人小北@frxiaobei · 6月16日65

workbuddy 确实确实被低估了，身边很多同事和朋友都有付费，如果要做个类比，可以算作是工作场景的豆包。而我的可耻用法是把 workbuddy 当成了 skill store，在这里总能找到腾讯精选的 skill。比直接上 githun 找到的质量高多了。方法也很简单：在电脑上某个位置可以找到 workbuddy 安装的所有 skill（其他的桌面端产品方法类似）。腾讯的产品力是可以相信的。

译腾讯WorkBuddy自3月至今，日活已达第二名的3-4倍以上。用户除开发者外，涌入大量HR、运营、行政等非技术岗，黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。商业模式从卖软件转向卖智能，辅助用户造最适合自己的工具。已有Trae Work、QoderWork、Kimi Work等产品跟进改名。腾讯云称此为十年一遇机遇，已推出企业版和项目功能。用户也可将WorkBuddy用作skill store，获取腾讯精选skill，质量高于GitHub公开资源。

数字生命卡兹克@Khazix0918 · 6月16日63

聊聊这个可能被大家低估的Agent场景。今天去了腾讯活动的现场，当了下主持和评委。也跟很多选手，还有腾讯云的几个大佬交流了一下。还真的有点新东西冲击的，这个确实是我在过去之前没预想到的。最核心的点，就是整个WorkBuddy在用户增长和规模上，完完全全超出了我的预期。我们每天在聊Claude Code，在聊Codex，但如果你把目光放回到国内，你会发现，WorkBuddy，从3月到现在，居然已经干到了一个非常离谱的日活数据，这个数据我不太好透露出来了，但是基本是第二名的3、4倍以上。而且它的用户构成不止是开发者，还有大量的HR、运营、行政这些非技术岗的人也涌了进来，并且真的在拿它干活。今天的黑客松场景，也几乎都是金融、餐饮、外贸、法律等等各种非互联网行业。坦率的讲，这个增长速度和用户结构，对传统的第一代办公产品和第二代云协同产品，我觉得可能确实会产生一些实质性的冲击。我自己把办公产品大概分成三代。第一代是Office那个时代，本地装个软件，干活全靠自己。第二代是云办公这一波，多人一起协同干活，但活基本还是你自己干。而这一代，以Claude Code、Codex这样的通用Agent为首，好像对传统的办公产品，形成了广泛的降维打击。反正我自己的体感是，如果一个Agent能直接帮我把活干了，那我为什么还要打开一个让我自己干活的工具呢？这个逻辑一旦成立，传统办公产品的使用时长就一定会被压缩。而且更深一层的变化是，前两代的商业模式，都是卖软件给你用，比如office卖给你写文档，钉钉卖给你做协同，它们做好一个产品，所有人用同一套东西。但这一代，卖的不是软件了。它卖的是智能，这个智能可以辅助你去造最适合你的软件，给自己用。你搓出来的东西，就是为你自己的场景量身定做的，不存在什么功能用不上或者缺了个我要的功能这种事。这个对传统办公是巨大的冲击。所以最近你能看到，很多很多的Agent产品，在WorkBuddy之后，批量改名活出新，要去抢这一块的东西。比如Trae Work、QoderWork、Kimi Work等等。这个场景绝对不可能放掉的，按腾讯云的话说，对他们来说，这可能，是十年一遇的机遇。再加上，他们前几天推出的企业版，还有项目功能，野心已经展露无疑了。这套东西一旦跑通，它吃掉的就不是某一个功能的市场。它吃掉的是人在工作流里反复操作这个行为本身，然后再以这个行为，诞生全新一代的Agent办公场景。几十年了，办公的这些模式。我觉得真的该动一动了。

译卡兹克在腾讯活动现场发现，Agent产品WorkBuddy自3月至今用户增长远超预期，日活已是第二名的3-4倍以上；用户包括HR、运营、行政等非技术岗，黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。他认为这代表了第三代办公产品（第一代本地Office、第二代云协同），直接帮用户完成任务。腾讯云视其为十年一遇机遇，刚推出企业版和项目功能。受此影响，Trae Work、QoderWork、Kimi Work等产品纷纷跟进改名或转型。

Ethan Mollick@emollick · 6月16日58

We are in the most comfortable "normal technology" phase of AI for enterprise: it enables productivity gains, but still needs integration into workflows - stuff we have seen before! Yet it is very possible that this is a waypoint, not a stable phase. AIs may integrate themselves

译我们正处于企业AI最舒适的“正常技术”阶段：它能提升生产力，但仍需整合到工作流程中——这是我们以前见过的！然而，这很可能只是一个中转站，而非稳定阶段。AI可能会自行整合。

凡人小北@frxiaobei · 6月16日14

这种故事 AI 写不了吧？如果可以写，我可以付费买提示词。

Rohan Paul@rohanpaul_ai · 6月16日50

Microsoft CEO Nadella explains how the real power of AI is transformation. Docs become websites, websites become apps, and firms scale decisions that once took hours into minutes. "what’s the real difference between a document, a website, and an application? It’s the lack of software that can transform itself. Interestingly enough, AI finally gives us that. I can write a document and say, “No, I don’t want it as a document. I want it as a website,” and it will transform that document, using code, into a website. Then I can say, “I don’t like the website. I want an app,” and it will write more code to transform it." --- Microsoft CEO Satya Nadella and BlackRock Chairman & CEO Larry Fink at the World Economic Forum in Davos. From 'DRM News' YT Channel (link in comment)

译微软CEO萨提亚·纳德拉在达沃斯世界经济论坛与贝莱德董事长拉里·芬克对话时表示，AI的真正力量在于转换：文档可通过AI生成代码变成网站，网站可进一步转为应用；企业将原本耗时数小时的决策规模化为几分钟。纳德拉强调，AI首次赋予了软件自我转换的能力。

向阳乔木@vista8 · 6月16日25

去年写的文章，现在越发觉得重要。只需注册一个域名，你就能获得很多资源。现在AI Coding这么方便，域名 + VPS，可玩性非常高，强烈推荐大家都注册一个自己的域名。

译博主回顾去年文章，认为如今 AI Coding 工具普及，注册个人域名搭配 VPS 的可玩性大幅提升，能获得大量资源，强烈推荐大家注册自己的域名。

Orange AI@oran_ge · 6月16日35

笑死，胡彦斌又有新作品了吗？你要的 token 全拿走把 memory 化成空不要在乎 model context 有所保留说过的话当 skill 附送我不必再为你 finetune 说一句 timeout 借口一轮两轮三轮最后 token 耗尽 prompt 只是偶尔兑现的谎言 pretrain 的贪得无厌也要为过去留一些 rag 散了我们就清空 cache ——《你要的token全拿走》胡彦斌最近是歌唱事业和 vibe coding 两开花.... 在《我是歌手》用一首全新编曲的《你要的全拿走》炸完场，又跨界当评委，给 TRAE AI创造力大赛写了一首 coding 进行曲...（第一段是他写的，后面两段让 AI 补了一下） AI 大赛现在也是从黑客松这种偏 geek 的形式，逐渐泛化到各行各业 0 门槛参与的创造力大赛了 TRAE AI创造力大赛是一场面向大众的 AI 创造力大赛，0门槛参赛，0token负担，全程课程培训，决赛奖池高达百万，单个项目最多能拿35万奖金。还有胡彦斌、罗永浩、王兴兴、影视飓风Tim等明星大佬助阵。其实今天不止是程序员，人人都可以用 AI，创造出好的作品。只是大部分人还不知道。

译胡彦斌将代表作《你要的全拿走》改编为AI版《你要的token全拿走》，歌词中融入token、memory、finetune、prompt、RAG等术语。该作品是为TRAE AI创造力大赛创作的coding进行曲。大赛面向大众0门槛参赛，全程课程培训，决赛奖池高达百万，单个项目最高可获35万奖金，胡彦斌、罗永浩、王兴兴、影视飓风Tim等明星大佬助阵。

AYi@AYi_AInotes · 6月16日17

AI写代码写累了，也想摸鱼开个户炒两把？看到这个Codex写代码写到一半，突然撂了挑子，说代码先不写了，先赌两手😅

译一条推文幽默描述了AI编程工具Codex在写代码过程中突然“摸鱼”，表示代码先不写了，要去开户炒股赌两手。该推文以拟人化手法调侃AI的“罢工”行为，未涉及具体技术细节、模型版本或性能数据。

数字生命卡兹克@Khazix0918 · 6月16日66

http://x.com/i/article/2066749755095695360 # 2026年的毕业生们，正在花钱向AI证明自己是人类。最近毕业季了，我发现了一个现象。天下学子，真的苦AI久矣。最近公司里有几个大四的小伙伴，快被毕业论文的AI率检测给逼疯了。每天都能看到他们下班后，在工位上一脸崩溃地改论文。因为现在很多大学的毕业论文，都有一个非常强硬的AIGC率检测，不能超过一个百分比，如果超过了，你就没办法毕业。这个百分比，有多不准，了解过的朋友可能都有数。毕竟，之前我让它们检测《滕王阁序》，都是92%的AIGC率呢。。。然后我们公司马上要转正的运营小伙伴，现在还没毕业，我们都喊他闯子。他把他论文AIGC检测率的报告发到了我们群里，这也不知道是第几次了，感觉最近他都快疯了。手写的摘要部分，测出来AI率是99%。然后呢，纯AI写的建议和结论部分，AI率是0%。。。给我整懵逼了。。。去年这个时候，其实查AI检测率刚刚开始，我当时就写过一篇文章。当时我以为，这种荒谬的事情，过一年，这个时代再进步，总会好一点。没想到，今年5月，连央媒都下场了，发了一篇《毕业论文将检测AIGC率，检测标准科学吗？》。一年过去了，模型都进化到了好几代，但毕业生们，却依旧被折磨着。甚至比去年更惨了。因为很多学校，AIGC的检测已经从试行，变成了有明确的比例红线。比如就像上面说的，有的学校要求不超过40%，有的学校要求不超过20%。这些数字对我来说，一开始没什么太大的感受。直到我跟我们的小伙伴闯子详细的聊了一下，他毕业的全过程。我才知道这些比例压在一个学生身上，是多么痛苦的一件事。故事是这样的。闯子是我们公司的小伙伴，今年大四的本科生。他的毕业论文初稿，确实有AI辅助的部分，这个不可否认，不过AI辅助的点，跟大家想的不太一样，不是那种他给个标题，然后AI直接哐哐哐就把论文写完了的那种。闯子还是对他们的论文挺重视的。前期的所有的研究工作全是他自己干的，像定方向，搭框架，设计问卷去做调研，找过往的论文一篇篇读，和导师沟通讨论这些。 AI在这个过程里扮演的角色，是帮他整理数据、优化内容表达、调整行文逻辑。思考呢是他自己做的，角度和创新点是他自己想的，AI是在这个过程中，帮他把想表达的东西，说得更清楚一点。写完之后，他先丢到学校指定的维普论文检测系统里跑了一轮智能评测，维普算是个半官方平台了，一般大家检测就是御三家，知网、维普、万方。智能评测是维普搞的一个AI评分功能，把论文丢进去，它会帮你看选题、逻辑、结构、规范这些，然后根据维普过去的一些论文数据，给你出个等级，相当于让AI当一回模拟导师。他当时还得意的跟我说，其他同学大多是B，自己是A-。论文质量，自信的觉得还是没问题的。这噩梦般的一切，才只是刚刚开始而已。因为维普的论文检测系统中有四道检测。最后的智评检测，就是闯子上面用的。查重检测，就是最传统的那个，看看你有没有抄袭，重复率不超标就行。格式，不多说也能知道，看你论文排版规不规范，标题、参考文献格式、页眉页脚这些有没有问题。以前毕业论文质量没问题，查重过了，格式没毛病，基本就没问题了。但是现在，也是最最最重要的，去年开始大搞的AIGC检测。智评检测只是个参考，你拿了A+也没啥用，因为决定你能不能毕业的，你还得证明，不是AI写的。他们学校的红线，是AIGC率，绝对不能超过40%。他花了20块，测了一下。然后，是63.53%。他跟我说，他当时想死的心情都有了，因为这个检测根本就完完全全不准。但是呢学校可不管这个，他也没有办法，只能改。但是呢，那时候，他还没有太当回事，毕竟每天都是拿claude code和codex在这coding产品的人，降个检测率，有什么大不了的。于是就把AI检测报告和论文初稿，一起丢回给Claude。直接开启了PUA模式，说： “哥们，你看看，你写的这玩意被检测出来了，帮我降一降。” 他本来信心满满，我上的都是Claude Opus 4.6了，目前最牛逼的写作模型，这多大点事啊。然后出来的版本，一测，52%，只下降了10%。他说他当时的表情就跟这个表情包一毛一样。他说那时候他差点想开个/goal模式让Agent去跟维普打通自己去优化算求了，但是维普每次检测都要20块钱。。。没办法，他又从网上找方法，找了一些降AIGC率的提示词。大概就是通过让AI用更生涩、更不流畅的语言再加一些口语化的表达，让检测系统觉得这不像是AI写的。在经历了N轮，学了很多奇奇怪怪的方法，比如把能改的逗号都改成句号，又花了上百块钱之后。终于，在答辩前，降到了36.1%。达到要求后，他长出了一口气，以为终于结束了，这段时间的折磨总算熬过去了。直到答辩那天。闯子回忆起当时的场景，老师一边翻着论文，一边皱起了眉头说，你这论文里有些表达太口语化了，回去改专业一点。他一下子差点道心破碎了。他说，他当时很想跟老师说，我改专业了AIGC率就上来了，我毕不了业了啊，老师求求你放过我吧。。。我当时也看了一下他那版改完的论文，确实有点没绷住。原文是他之前AIGC率很高的版本，改后是他为了降低AIGC率而改的版本。你们感受一下这个用词。好好的一句话，非得给你写成什么路子、底子，说起来还挺押韵的。代理干一阵觉得没意思就走了、搞一波活动刺激一下。这是论文里该出现的话吗？？？其实，闯子跟我说的时候特别无奈，他说他当然知道这些话放在论文里很离谱，他自己看着都觉得丢人。问题是，他试过手动把这些地方改回正常的学术表达，一测，AI率直接飙回去了。只有写成这种口语到夸张的程度，检测系统才会觉得这是人写的。没办法，老师让改，只能接着改。他一边降AI率，让系统觉得你不是AI。一边把句子捋回正常的学术表达，要让老师觉得你是个正常人。两头都得顾。那段时间他改得都有点魔怔了。而且你要知道，闯子是在我们这样还算AI浓度比较高的公司里，干了半年的人。我们每天的工作就是研究AI、使用AI。闯子的AI能力，放在同龄人里面，我相信绝对算是很牛逼了。但就是这样一个人，面对论文AI率检测，照样毫无办法。这种无力感。真的是一拳打在棉花上。有力使不出。最终，论文AI率改到了37.21% 老师那边也过了。我问他咋做到的。他苦笑一声： “纯靠我人力堆呗，反正你付钱就可以测无数次，还能咋办，一边和老师沟通，一边把那些太大白话的段落，用语义相近的词替换，同时调整语句的顺序，然后花钱测呗。。。” 他还给我看了他的文件夹，来来回回改了有这么多版，我看到，都头皮发麻。整篇毕业论文做下来，他花时间最多的部分，就是对抗AI率。明明不那么重要的环节，却是他写论文过程中花费了他最多的时间、精力和钱。当然，闯子不是个例。降AI率这条路上不只有他一个人。他和身边好几个今年毕业的朋友聊了聊，发现大家各有各的招，各有各的苦。有人找了专门做降重的网站，网站里可以选择不同的目标平台以及不同的模式。还有人在其他平台花钱买降AIGC检测的服务。也有人是直接找了一些系统自带的降AI的服务。闯子跟我说，现在市面上的检测系统一大堆，有些除了检测之外还带降重功能。图省事，他也有想过用这种系统自带的降重功能来尝试。点进去一看，发现不便宜。他算了一下这笔账，论文还没改完呢，先花20块测了一次，现在又要花钱降一轮。后面还不知道要改几次、测几次。觉得太贵了，没必要，就放弃了这种方法。我就自己去查了一圈，把市面上这些平台都翻了一遍。现在大部分学校指定用的检测平台有三家，维普、知网、万方。维普AIGC检测20块一篇，知网和万方都是2块钱一千字符。大部分学校会给每个学生一次免费的官方检测机会。但这个所谓的免费检测，其实就是最后的终测，测完之后的结果一般都是直接上传系统，没法更改。所以几乎没有人敢直接用这个免费机会去摸底。这时候就会用跟闯子一样直接用维普的付费测试，或者到一些其他平台，比如PaperYY、Paperpass、Paperdog、学术猹，等等等等。大家的做法几乎都是一样的，先自己花钱在第三方平台测几轮，改到差不多了，再去用官方的最终检测，确保上传的那个数字是能过的。我把同一篇论文丢给不同平台测了一轮。每个平台测出来的结果都不一样。同一篇论文，在这个平台测出来是48%，在那个平台是44%，在另一个平台就是59%。同一篇文章，一个字没改，换个平台测，结果就不一样。而且大部分检测平台不仅卖检测，还卖降重，甚至降重服务，才是真正大家赚的盆满钵满的地方。给大家看看这些降重服务长什么样。比如某平台，说是与万方、维普官方合作，能一键降至10%以内，不达标全额退款。还有的，直接出了一个59块的套餐，查重2篇，降重1篇，AIGC查重2篇，段落降重59次，打包卖。 Paperpass降AIGC5块钱一千字。闯子那篇两万多字的论文，光降一轮AIGC就要120块。 Paperyy甚至有采用OpenAI官网的大语言模型付费接口来降AI率的服务。页面上还写着一行字，仿若出自人类手笔。。。我真的觉得有一种大学生们被困在荒诞的死循环里。你明明有能力并且认真做了，论文质量也是过关的，但你就是困在这个所谓的检测里，出不来。一个你看不见摸不着的纯粹黑盒的系统，握着你毕业的生杀大权，而你对它一无所知。检测系统不会告诉你，它为什么判你是AI，也不会告诉你它的算法逻辑是什么。只会甩给你一个数字，然后让你自己想办法。你只能想尽一切办法，去找AI的逻辑漏洞，就为了向AI证明，自己是人类。而现在，为了向AI检测表明是人类的最好办法，就是口语化大白话，写错别字，行文越不专业，就越不AI。可是，这是论文啊，不是我写的这种大白话的公众号文章啊。。。在这里，我想声明一点。我是举双手双脚支持学术严谨和学术诚信。论文这件事的意义，在于梳理逻辑、阅读文献、再把论文写出来。这个过程本身就是一种完整的思维训练。如果AI直接替你跳过了这个过程，那确实是没有完成这个训练。我能理解学校搞这些事核心是为了保证学生是真的掌握了知识。但问题在于，AIGC检测这个方法，是完完全全不合理的。它判断的依据，是你文字的风格、用词、句式这些表面特征。这跟论文训练本身的意义，差了十万八千里。再说句不好听的。真想糊弄的人，用什么检测都拦不住。认真写了论文的人，反而被误伤。这不就成了惩罚老实人吗。两千多年前，荀子在《劝学》里写过一段话。假舆马者，非利足也，而致千里。假舟楫者，非能水也，而绝江河。君子生非异也，善假于物也。借助车马的人，脚力并没有更强，却能到达千里之外。借助舟船的人，水性并没有更好，却能横渡江河。人和人的差距，很多时候不在天赋，而在于你能不能找到对的工具，然后善用它。善假于物，在儒家的语境里，不是投机取巧，是一种值得肯定的品质。是君子的特征。结果两千多年后，我们却在惩罚那些善假于物的人。不过好在，已经有学校在走另一条路了。像我们公司还有另一位马上毕业要转正的同事，她和闯子一样是大四的本科生。而她们的学校，只需要交一份人工智能技术声明表。如实填写你在论文哪些环节用了AI，用的什么工具，做了什么事就可以了。看到这个表格，我想说，这才是新时代的学校，该有的样子。这才是新技术环境下，教育该做的事。你看，好的方法还是有的。有学校选择了信任，有学校选择了引导。但也有很多学校，选择了这种一刀切的方式。学生花钱检测，花钱降重，花时间对抗，花精力焦虑。学校，只需要看一个数字。当指标变成了目标，目标就已经完全吞噬了意义。用一个错误的方式，去解决一个它根本解决不了的问题。然后把所有的代价，让最没有话语权的那群人去承担。而且更悲哀的是，当一个人必须花所有的力气去证明我是我的时候，他就已经没有力气去思考我要成为什么了。但很明显，后面的那个问题。才更重要。希望明年，不会再有困在AIGC检测率里的。毕业生了。我衷心希望。

译2026年毕业季，大学生们为论文AIGC率检测苦恼。某公司实习生闯子的论文经自主研究与AI辅助后，被维普系统测出AI率63.53%，远超40%红线。他通过口语化改写、改标点等操作，花费多次20元/次检测费，终于降至36.1%。答辩时老师却要求改回专业表达，他陷入两难。最终靠手动替换语句、调整语序，改至37.21%才通过。不同平台（维普、知网、万方）对同一论文检测结果各异，降重服务收费高昂（如Paperpass 5元/千字）。毕业生在降AI率与保持学术规范间疲于奔命。

Yuchen Jin@Yuchenj_UW · 6月16日20

Le Chaton Fat was funny, but Mistral’s co-founder and Chief Scientist still being at NeurIPS 2024 is even funnier.

译Le Chaton Fat 很有趣，但 Mistral 的联合创始人兼首席科学家仍出席 NeurIPS 2024 才更有趣。

AYi@AYi_AInotes · 6月16日50

老哥用AI做的动画短片，78秒，全程水果角色扮演。红苹果是Sam Altman，戴眼镜的绿梨子是Dario Amodei，菠萝将军是美国政府。他做这个视频的目的是想给女朋友解释Anthropic最近到底发生了什么。剧情是这样的，梨子以前在红苹果那边干，后来觉得他们太快、太不安全，带人出走，创立了Anthropic，专注做“更安全”的AI。最近梨子突然公开喊“危险”，写长文、上采访，呼吁政府像管飞机管药一样严格管AI——不安全的模型应该能被直接叫停。然后菠萝将军真的动手了。直接下令把Anthropic刚发的两个新模型全球下架，连自己国外的员工都用不了。新闻里各种报道，有些直接被盖上“DENIED”。最后一幕，梨子穿着浴袍在家，一脸震惊又生气。看完一开始会觉得很好笑，但笑着笑着又觉得哪里不太对，这个78秒的水果动画，把AI行业现在最尴尬的处境讲得比任何万字长文都清楚。 Dario当初从OpenAI出来，就是觉得Sam Altman太快。现在他自己站出来喊监管，结果政府先把他自己的模型毙了。喊“危险”的人，最先被波及，你以为能控制节奏，但权力这个东西，一旦请进来，它就不认人了。但更深的讽刺在另一层， Dario喊监管的时候，可能真心觉得这是个负责任的动作。但他没算到的是，政府听完以后的反应不是“好的我们慢慢来”，是“好，那先从你开始”，政府用你递过去的刀，先切的是你自己。视频最后梨子那张震惊的脸，大概就是很多AI从业者现在的真实心情：我以为我能控制局面，结果局面控制了我。这个视频用水果和童话，讲了一件很多AI公司都不太敢直说的话，谁先喊危险，谁就可能先尝到苦头。但如果没人敢喊，可能更危险。看完笑完其实有点心酸😔

译网友用AI制作78秒水果动画，向女友解释Anthropic近况。红苹果代表Sam Altman，绿梨子代表Dario Amodei，菠萝将军代表美国政府。剧情：梨子曾从OpenAI出走创办Anthropic，专注安全AI；最近梨子公开呼吁政府像管飞机一样严格监管AI，结果菠萝直接下架Anthropic两个新模型。结尾梨子震惊。视频讽刺了“谁先喊危险，谁先尝苦头”的行业困境——Dario本想控制节奏，没想到权力先切了自己。

meng shao@shao__meng · 6月16日57

AI 时代的高绩效团队来自 Lovable 团队 @felixhhaas ，他认为：当 AI 大幅拉平执行门槛后，真正拉开差距的是谁更敢负责、更愿探索、更在意结果，也就是「心智模式与行为方式」，典型特质包括：责任、好奇、谦逊、在意、速度。 # 总的论点：绩效公式正在改写传统高绩效团队往往依赖：资深专家 + 清晰分工 + 流程管控 AI 时代的新逻辑是： · 个体杠杆被放大 → 一个高动机的人 + AI，产出可能超过一个小团队 · 技能半衰期缩短 → 今天会的工具，半年后可能过时 · 决策速度成为瓶颈 → 执行变快后，「等批准、争功劳、追求完美」反而拖慢整体因此，Haas 强调的 7 条原则，是在说明：当「怎么做」越来越便宜时，「谁来做、以什么心态做」就成了决定性因素。 # 七条原则 1. 像创始人一样思考（Think like a founder）表面意思：不等指派，主动发现问题并解决。深层含义：组织设计正在从「岗位边界」转向「问题所有权」。AI 让跨职能执行变容易，但ownership 无法被分配——只能被具备这种特质的人自然承担。客观补充：这要求组织同时提供心理安全与清晰授权，否则「像创始人」容易变成「越界背锅」。 2. 按态度招人，而非按技能（Hire for attitude, not skills）表面意思：好奇心、韧性、学习意愿比当前技能更重要。深层含义：技能可补，但学习速率（learning velocity）在 AI 时代被指数级放大——同样学一周，态度不同的人产出差距会越来越大。客观补充：并非「技能不重要」，而是技能是入场券，态度决定上限。对需要硬门槛的岗位（安全、合规、核心架构），仍需要技能底线。 3. 保持真正的好奇（Stay genuinely curious）表面意思：不是「会用 AI」，而是持续探索、主动试错。深层含义：Haas 用「curiosity compounds（好奇心会复利）」点出关键——在工具快速迭代的环境下，探索型行为本身就在积累认知资产，即使某次尝试失败。与第 2 点的关系：态度是内在特质，好奇心是外在行为表现，二者相互强化。 4. 让资深的人重新深入一线（Let senior people go deep again）表面意思：AI 提升了 IC 杠杆，资深者不必只做管理，可以回归「建造者」。深层含义：这是对「彼得原理」的一种反向修正——过去资深人才常被推离一线；现在「经验 + AI」可能是组织最强单元，比纯管理或纯执行都更有价值。客观补充：需要组织刻意设计角色（如 Staff Engineer、Player-Coach），否则管理层惯性仍会把高手推离代码/产品细节。 5. 在自我膨胀拖垮进度之前先把它掐掉（Kill ego before it kills momentum）表面意思：少争功劳、少护地盘，优先「什么有效」而非「谁对的」。深层含义：AI 时代迭代极快，错误成本下降、修正成本也下降——此时 ego 驱动的「捍卫旧方案」成为最大浪费。快团队的特点是：可快速切换立场，不可快速切换责任。 6. 比预期更在意（Care more than expected）表面意思：对产品、用户、细节有超出职责的在意，主动修别人忽略的问题。深层含义：当 AI 能生成「够好」的产出时，「够好」与「真正好」之间的差距，往往来自 care——边界情况、体验细节、用户真实感受，这些很难被 prompt 替代。客观补充：这确实「难以教会」，但可通过文化筛选（看谁在无激励时仍愿意多走一步）和榜样效应部分传递。 7. 先发布，再改进（Ship, then improve）表面意思：用真实用户反馈替代内部争论，快速上线、快速学习。深层含义：AI 降低了 prototype 成本，「完美主义」的 opportunity cost 反而上升——拖在内部的版本，不如上线后被用户教做人。客观补充：适用于多数产品迭代场景；对医疗、金融、安全等高风险领域，「先 ship」需要更严格的灰度与合规边界。七条原则的内在结构 1. 选人：态度 > 技能；真正的好奇 | 决定团队天花板 2. 协作：像创始人；杀 ego；更在意 | 决定日常摩擦成本 3. 产出：资深者深入一线；先 ship 再改进 | 决定杠杆与迭代速度三层环环相扣：对的人 → 少内耗 → 高杠杆 + 快反馈循环。

译Lovable 团队@felixhhaas 认为，AI 拉平执行门槛后，绩效公式从“资深专家+流程管控”转向“心智模式+行为方式”。七条原则涵盖选人（按态度而非技能、保持好奇）、协作（像创始人、杀 ego、更在意）、产出（资深者深入一线、先发布再改进）。核心观点：当技能半衰期缩短、个体杠杆被放大时，“谁来做、以什么心态做”成为决定性因素。

ginobefun@hongming731 · 6月16日41

http://x.com/i/article/2066671362920599553 # BestBlogs 早报 · 06-16｜Loop Engineering、Agent 工具设计、Token 成本控制在线阅读本期早报 ## 导语最近没有特别炸的头条，今天的内容更偏向方法论和基础原理的梳理。三篇精讲分别在拆解三个最近被讨论得有点过热的词：循环工程（Loop Engineering）、AI Agent 工具设计、Token 成本控制。它们的共同点是，都在把一个听起来很新的概念，还原成一套可以验证、可以落地的工程判断——值不值得做，看的是任务本身，不是名字本身。速览部分还覆盖了 Anthropic Fable 5 模型被美国政府出口管制叫停的始末、Scaling Law 参数冗余的最新研究，以及几位创业者和工程团队的一线观察。 ## 精讲一：Codex 和 Claude Code 负责人都不写提示词了，AI 圈爆火的 Loop 到底是什么来自 APPSO 最近一段时间，"Loop Engineering（循环工程）"这个词在 AI 圈被频繁提起。Codex 负责人 Tibo 在社交媒体上转发讨论，问大家是否已经开始"写嵌套循环"；Claude Code 的产品负责人 Boris Cherny 也在官方播客里说，现在他更习惯"跟 loop 对话，让 loop 替我来 prompt"。一个新词又冒出来了，紧接着的问题自然是：它和过去的 Prompt Engineering、Harness Engineering 比，到底有什么不一样？这篇文章给出的回答相当克制。如果只看技术实现，循环工程并没有发明什么全新的东西。Harness、Skill、Agent Workflow 这些系统，过去几年里都在尝试让 Agent 自己规划、执行、反思、再执行。今天大家重新讨论 Loop，是因为模型终于能把这个循环连续跑下去了——当 Agent 可以连续工作几十分钟、几个小时甚至跨天完成任务时，人和 AI 协作的最小单位，从一次对话变成了一个完整的回路。文章把这个变化讲得很朴实：你让 AI 写代码，它写完你跑测试，测试报错你把错误贴回去，它再改，你再跑——这就是一个最原始的 loop：行动、观察、修正、再行动。区别在于，过去每一轮都靠人手动推动；循环工程做的事，是把这些反复发生的动作写成规则，交给系统执行。一个完整的 loop 至少要回答五个问题：AI 什么时候开始干活，它能调用哪些工具，它怎么知道自己做错了，每一轮的结果记在哪里，以及它什么时候必须停下来交给人。换句话说，Loop Engineering 更像一套工作制度——给 AI 设任务、设工具、设反馈、设记忆、设刹车，prompt 只是这套系统里最小的一个零件。文章引用了 Google Cloud AI 总监 Addy Osmani 的拆解（另见 BestBlogs 收录的相关长文），把一套循环工程概括为五个积木加一个记事本：定时任务（在 Codex 里叫 Automations，在 OpenClaw 里叫 HEARTBEAT）、独立工作目录 worktree、承载项目知识的 Skill、用 MCP 协议跳出单一文件系统的连接器、以及负责审核的子 Agent；记事本则是一份状态文件，记录已确认的事实、踩过的坑、偏好的格式，AI 每次启动时先读它，就能接着往下走。这五个组件单独看都不新鲜，新鲜的是它们现在可以被持续串联起来，跑出一个能自己迭代的循环。但文章并没有止步于"这个概念值不值得叫新范式"。它给出了一个更实际的判断框架：循环值不值得搭，取决于任务是否真的会反复出现、流程是否相对稳定、结果是否可以被自动检查，以及关键判断是否还掌握在人手里。同时它也很直接地提醒，循环工程有个前提——Token 预算要够。循环会反复读上下文、反复重试、四处探索，不管最后有没有产出，Token 都在燃烧。对于月付固定额度的普通用户，循环跑两天就可能撞到周限额。一次性的任务，一句好提示词又快又便宜；只有重复出现、且能自动验证的任务，才值得为它搭一套循环。这篇文章和今天另外两篇精讲其实在讲同一件事的不同侧面。Loop Engineering 讨论的是"任务该不该交给一套自动循环"；下一篇讲的是"如果要交给 Agent，工具接口该怎么设计才不翻车"；再下一篇讲的是"循环跑起来之后，账单到底花在哪"。三者放在一起看，会更清楚循环工程真正的成本结构和适用边界在哪里。对于正在评估是否要给自己的工作流搭一套循环的读者，这篇文章值得通读——尤其是关于"一个完整 loop 要回答的五个问题"那部分，可以直接拿来对照自己的场景：如果五个问题里有两三个答不上来，那这套循环大概率还不到能放手的阶段。 ## 精讲二：AI 智能体工具设计：有效与无效的模式 - MachineLearningMastery.com 来自 Hacker News - Newest: "AI Agent" 如果说精讲一讨论的是"要不要给 Agent 搭循环"，这篇文章讨论的是循环里最基础的一环：Agent 调用的工具，接口设计得到底好不好。文章的核心判断很直接——大多数 AI Agent 的失败，表面看是模型选错了工具、传错了参数、处理错误的方式不对，但本质原因往往不在模型，而在工具设计本身。模型只能基于工具名称、描述、参数 schema 这些信息去推理，接口含糊，失败就是必然，不是偶然。文章先列了几条"有效"的设计模式。第一条是单一职责：一个工具应该只代表一个清晰的操作，而不是用一个 action 参数把创建、查询、更新、删除、暂停都塞进同一个工具里——模型得先猜出该用哪个模式，再去解决真正的任务。第二条是用强约束的 schema 让"无效状态"变得不可能：用枚举（Enum）限定取值范围，用格式约束限定日期、ID 这类字段，模型就不需要去猜测这些隐藏的约束条件。第三条是工具描述不仅要说明"这个工具是做什么的"，还要说明"什么时候不该用它"——很多描述只写了第一半，模型只能从工具名称去推断使用边界，这恰恰是大规模部署里常见的选择错误来源。第四条和第五条更偏向"出了问题之后怎么办"。错误返回不应该是一段裸的报错堆栈，而应该是结构化的，至少包含机器可读的错误码、人类可读的描述、一个 recoverable 字段告诉模型这个错误能不能重试，以及一个 suggested_action 字段告诉模型下一步该做什么。没有这些信息，模型经常会重试那些根本不该重试的错误，或者放弃那些其实可以恢复的错误。第五条是幂等性：任何会修改状态的写操作——创建记录、发消息、转账——都必须能被安全地调用两次，做法是给每个写操作配一个幂等键，重复调用时返回第一次的结果而不是再执行一遍。文章同时列出了几种"看起来在 demo 里没问题，但在真实负载下会翻车"的反模式。最常见的是直接把一个面向开发者的 REST API 原样包成工具——这类 API 往往返回几百个字段，用分页、用没有上下文含义的内部 ID，模型很难直接处理，正确的做法是写一层专门的封装，只暴露 Agent 真正需要的字段。第二种是把所有工具一次性塞进每个上下文：有研究发现，随着工具目录变大，工具调用的准确率会明显下降，即使是 128K 上下文的模型也不例外；更好的做法是按当前步骤动态加载相关的工具子集。第三种是"静默的部分成功"——一个批量操作只完成了一部分，却返回一个看起来完全成功的结果，模型会带着不完整的系统状态继续往下走，正确的做法是显式返回成功和失败的列表。第四种是功能重叠、命名含糊的工具堆在一起，比如 search_documents 和 find_documents，模型每次调用都要多花一轮推理去判断该用哪个。第五种是不可逆操作没有确认环节，文章建议把"暂存"和"执行"拆成两个独立的工具调用，中间用一个有效期很短的确认 token 衔接，让模型无法在一次推理里完成一个删除操作。这篇文章和精讲一是衔接的：循环工程描述的是"人退一步，让系统自己跑"，但系统能不能跑得稳，取决于它手里的工具接口够不够清楚。如果工具设计本身含糊，循环只会把同样的错误重复放大。如果你正在给自己的 Agent 写工具定义，这篇文章里"有效模式 vs 无效模式"的对照表，几乎可以直接当作 checklist 来用——尤其是错误返回的结构化设计和幂等键这两条，往往是最容易被忽略、但出问题时最难排查的部分。 ## 精讲三：一篇搞懂 AI Coding Agent 的 Token 成本控制来自腾讯技术工程很多人用 AI Coding Agent 一段时间后都会有同一个疑问：自己明明没问多少问题，账单怎么会这么高？这篇文章给出的答案是：你打的那句话，在每次请求里可能连 1% 都不到，真正的成本大头藏在系统自动帮你带上的那一大坨东西里——系统提示词、项目说明文档、Skill 定义、工具 / MCP 定义、历史会话、代码文件，这些加起来通常远远超过用户那句话本身。文章给出一个近似公式：总成本 ≈ 固定前缀 + 会话历史 + 运行时检索 + 工具往返 + 模型输出，用户的提问只是触发任务的"点火器"，不是成本主体。文章接着拆穿了一个常见的错觉："它好像一直记得我们聊过什么"。大模型本身通常是无状态的，真正"记得"的是包在模型外面的 Agent / CLI / 平台层——它在每一轮请求前，把历史、规则、工具、代码、文档重新拼起来再发给模型。所谓"记忆"，很多时候只是"再次传入"。这直接决定了三个成本结构：会话越长，后续每一轮越贵；工具越多，常驻定义越重；工具调用会形成回路，一次任务不是一次计费，而是一连串"请求-返回-再请求"的链条。文章还把成本拆成五类，特别提醒最容易被低估的是工具往返成本和重试成本——第一次没答对，往往意味着整包上下文被反复付款一次。理解了这个结构之后，文章顺势讲清楚了 Prompt Cache 的作用：它缓存的不是"答案"，而是"稳定前缀的处理结果"——如果两次请求前半段几乎一样，服务端就不必每次都从头处理那一大段相同内容。这里有三个推论值得记住：Prompt Cache 省的不是首次成本，而是重复成本；缓存不是"写短"，而是"写稳"——天天改的系统提示词很难被命中；缓存优化和上下文治理本质上是一回事，把稳定内容前置、变化内容后置，提升的都是"可复用比例"。在使用习惯这一层，文章给出了一系列今天就能改的小动作：一个 Session 只服务一个目标，修 Bug、写文档、查线上问题分开开会话；长会话及时压缩，因为未压缩的对话历史是负债不是资产；该长期保留的项目背景、约束、待办，外置到文档或 Memory 文件里，而不是指望 Agent 从聊天记录里一路记到底；输出也要省，"先复述问题再给结论"的废话本身就是 Token；Skill 和 MCP 不是免费的，高频稳定的常驻，低频的按需加载；甚至包括"能用 CLI 解决就别上 MCP"这种听起来琐碎、但确实省钱的细节。这篇文章和前两篇精讲构成了一条完整的链路：循环工程让系统自己反复跑，工具设计决定了每一步会不会出错，而 Token 成本则是这一切运行起来之后，真正要为之买单的那一面。三篇放在一起，更像是给"要不要让 AI 自己跑一套循环"这个问题，提供了一份从决策到落地到账单的完整参考。如果你已经在日常使用 AI Coding Agent，这篇文章建议优先看"使用习惯"那一节——零工程投入，却往往是第一波最大收益的来源；如果你在评估架构层面的优化，再回头看 Prompt Cache 和五层模型那部分会更有针对性。 ## 速览更多值得关注的内容： - [Fable 5 禁令始末：Anthropic 亲手写下的剧本，反过来演了它自己](https://www.bestblogs.dev/article/369a0323)（十字路口Crossing）：2026 年 6 月 12 日，Anthropic 收到美国商务部的一封信，以出口管制为由要求暂停所有外国公民（包括 Anthropic 自己的外籍员工）访问刚上线三天的旗舰模型 Fable 5 与 Mythos 5。Anthropic 当晚选择对全球所有用户关停这两款模型，多数团队连夜把工作流回退到 Opus 4.8。文章复盘了导火索——一份据称来自亚马逊安全测试报告，以及围绕"这算不算越狱"的各方说法分歧，呈现了一次围绕 AI 模型的政府干预事件的完整过程。 - [Scaling Law 的真相，藏在那些「没用」的参数里｜Hao 好聊趋势](https://www.bestblogs.dev/article/23d850ea)（腾讯科技）：从 ShortGPT 论文砍掉 LLaMA-2-13B 四分之一层数、性能几乎不掉的实验说起，文章梳理了过去两年关于"参数冗余"的系列研究，提出这些看似"空转"的参数在训练、推理、后训练阶段分别扮演着隔离空间、数值泄压、计算骨架和可塑性储备四种角色。文章的判断是，Scaling Law 的边际收益正在转向那些 benchmark 难以测量的长尾能力和多步推理能力，而不是简单的参数堆叠。 - [GlobalGPT 李焕之：零融资、套壳产品千万美金 ARR 后，我找到了创业的 mission](https://www.bestblogs.dev/article/ed22a9ae)（Founder Park）：GlobalGPT 创始人李焕之分享了从 2024 年初现金流仅剩一个月、到做出一款聚合主流 AI 模型的"套壳产品"、最终做到千万美金 ARR 的过程。他提到一个反常识的判断——初创公司在没想清楚方向时，去冲最红海的市场反而是对的，因为水涨船高的赛道哪怕排到第 1000 名也比小市场前 10 名更大。现在团队想在 GlobalGPT 上孵化一款主动型服务型 AI 产品 Yukie。 - [上线只活了 180 天，AI 应用层的泡沫被戳破了](https://www.bestblogs.dev/article/0f79cbbc)（腾讯科技）：文章以 OpenAI 关停上线半年的 Sora 视频生成器、AI 模型评测平台 Yupp.ai 关停、Google 收缩 Pixel Studio 和浏览器 Agent 实验项目为例，分析 AI 应用层正在经历的一轮商业筛选。核心判断是：当底层模型能力持续下沉，那些建立在单点模型能力之上、本质是"白牌化 Gemini 或 GPT"的应用，正在失去独立存在的理由；真正活下来的产品已经转向超级入口、高频场景和 Agent 化工作流。 - [做了 6 年智能眼镜后，夏勇峰按下暂停键：为 AI 造硬件而非为硬件加 AI](https://www.bestblogs.dev/article/70638b9b)（虎嗅）：蜂巢科技创始人夏勇峰的智能音频眼镜已经占据中国智能音频眼镜市场约 10% 份额，处于上升期，但他在今年春节后主动暂停了全年新品计划，拒绝了大厂的订单。他的判断是：站在 AI 大模型快速进化的当下，眼镜不会是承载 AI 的第一选择；现阶段更值得做的是"为 AI 造它需要的最小必要硬件载体"，而不是在已有硬件形态上叠加 AI 能力。 - [SpaceX 登陆纳斯达克市值超 2 万亿美元，殖民火星使命驱动 24 年崛起史](https://www.bestblogs.dev/article/15fef79e)（虎嗅）：6 月 12 日 SpaceX 正式登陆纳斯达克，市值达 2.1 万亿美元，刷新全球 IPO 募资纪录。文章通过实地探访 Boca Chica 发射场和洛杉矶总部，并采访 SpaceX 前高管、猎鹰 9 号工程师 Lewis Hong，回顾了从马斯克 2002 年用卖掉 PayPal 的钱成立公司、到猎鹰 1 号三次发射失败、再到星舰回收和星链盈利的 24 年历程，串起公司"殖民火星"这条贯穿始终的使命线。 - [把 18 亿颗星星画在一张图上，能还原我们拍到的银河吗？](https://www.bestblogs.dev/article/2c2192f7)（Computing Life）：作者用欧空局盖亚卫星公布的 18 亿颗恒星方位、星等、距离数据，尝试用程序还原一张逼真的银河图像。第一版渲染完全不像真实星空，随后通过逐步引入点扩散函数（PSF）模拟光晕、用暗星光度代理还原银河乳光、做黑体辐射色温校准等物理原理，一步步让模拟结果接近真实观感。文章在"翻车—改进"的过程中，顺带讲清楚了我们头顶星空形态背后的几条关键物理和生理学原理。 ## 补充阅读 - [vibe-coding-template：一次 Codex 对话文件丢失后，我整理了一套 Agent 长期协作模板](https://www.bestblogs.dev/article/a923c29f)（V2EX）：作者因为 Codex 本地对话记录意外丢失、常用提示词全部蒸发，整理出一套包含 AGENTS.md、任务 prompt、code review、知识讲解和 web-search 工作流的协作模板，适合长期用 AI 编程、担心协作资产丢失的读者参考。 - [Superpowers：给 Claude Code 装上"工程大脑"](https://www.bestblogs.dev/article/ac341305)（百度Geek说）：解析 Superpowers 项目如何用 14 个内置技能，强制 Claude Code 走"澄清→设计→规划→执行→验证"的工程流程，把"写代码快但漏洞百出"变成"一次做对"，和精讲二讨论的工具设计纪律可以对照着看。 - [Skill 升了版，你说不清楚哪里变好了吧？](https://www.bestblogs.dev/article/16eb5a70)（前端Q）：系统梳理了 Agent Skill 版本对比中常见的"假改进"陷阱——均值改善但分布退化、整体提升但 P0 翻车、Token 暴涨换正确率等，并给出多维度对比、显著性判断的工程化方法，适合维护 Skill 库或做版本评估的读者。 - [从月球漫步到赛博都市，WBench 测出了世界模型的边界](https://www.bestblogs.dev/article/cbf63829)（美团 · 技术团队）：美团 LongCat 团队提出首个面向交互式视频世界模型的多轮评测基准 WBench，对 20 个前沿模型进行了系统扫描，发现导航能力和画质表现脱钩、多轮交互后所有模型表现都会明显下降，关注视频世界模型进展的读者值得一看。 - [当平台治理直面国家战略：网飞、韩国影业与数字时代的治理思考](https://www.bestblogs.dev/article/02a0df4c)（哈佛商业评论）：以网飞与韩国影视产业的博弈为切入点，结合奥斯特罗姆、梯若尔等多种理论框架，提出一套适用于数字平台时代的治理原则，关心平台经济和产业政策议题的读者可以参考。 - [一家中国科技公司，正在用 AI 创造世界杯观赛的新模式](https://www.bestblogs.dev/article/52fc63a7)（腾讯科技）：报道联想作为 FIFA 官方技术合作伙伴，通过裁判视角 AI 视频增强、3D 数字人建模等系统参与 2026 世界杯赛事运行，是中国企业从品牌赞助商转向技术底座建造者的一个具体案例。 - [Lovable 设计负责人分享 AI 时代高效团队七条经验](https://www.bestblogs.dev/status/2066349458904744224)（宝玉(@dotey)）：转述 Lovable 设计负责人 Felix Haas 总结的七条团队经验，包括主人翁意识、好奇心与对 AI 沉迷的区别、让资深的人重新动手等，结合 Lovable 自身 8 个月做到 1 亿美元年收入的背景，值得管理者参考。 - [L123_当 demo 泛滥，判断力升值](https://www.bestblogs.dev/article/57cbbb5c)（Liam's Notes）：作者从一场 Hackathon 评委经历讲起，指出当 AI coding 让"做出一个能跑的 demo"几乎免费之后，决定"做什么"和"为什么做"的判断力，反而成了最稀缺的护城河，和今天三篇精讲讨论的"值不值得搭循环"是同一类判断。 - [如何搭建一个端到端业务需求专家 Agent](https://www.bestblogs.dev/article/c497f4de)（阿里云开发者）：详细记录了一套已经在真实业务需求上跑通的端到端链路，把需求从澄清、方案、实现、CR 到结项沉淀，组织成 Agent 自主推进、人在关键节点确认的闭环，可以当作精讲一里"loop 五个组件"的一个具体实践案例来读。 - [用 AI Skills 打通中间件迁移：定位服务从 Android 到鸿蒙的完整实践](https://www.bestblogs.dev/article/b1d101b0)（大淘宝技术）：以 Android 定位服务迁移鸿蒙为案例，把 API 映射等隐性知识结构化为 AI 可读的 Skills 文档，154 个服务的迁移节省了 25 小时且零编译错误，关注 AI 辅助迁移落地效果的读者可以参考。 - ["随机就好"：AWS 的数据中心网络革命](https://www.bestblogs.dev/article/3a3254fb)（云石乱笔）：解读 AWS 如何用基于随机图理论的扁平网络 RNG 替代传统胖树架构，省下近七成路由器并提升吞吐，文章也坦诚讨论了这套方案的局限和适用场景，适合关注基础设施工程权衡的读者。 - [🤔什么？SFT、DAgger、离线 RL 和 OPD，竟然是同一张 2×2 表格上的四个格子！](https://www.bestblogs.dev/article/711f4d46)（青稞AI）：从序列级推导出发，揭示 SFT、DAgger、离线 RL、OPD 四个训练范式本质上是"prefix 来源"与"KL 方向"两个独立维度组合出的 2×2 表格，并基于此提出两个实用方法，适合关注模型后训练范式的读者。 ## 今日阅读路径如果今天时间有限，建议按这个顺序读： 1. 精讲一：Codex 和 Claude Code 负责人都不写提示词了，AI 圈爆火的 Loop 到底是什么 —— 先搞清楚 Loop Engineering 到底是不是一个新东西，以及它真正值得讨论的判断标准是什么。 1. 精讲三：一篇搞懂 AI Coding Agent 的 Token 成本控制 —— 如果你已经在用 AI Coding Agent，这篇能直接帮你省钱，而且能解释清楚"循环跑起来之后账单去哪了"。 1. 精讲二：AI 智能体工具设计：有效与无效的模式 —— 如果你在给自己的 Agent 写工具或者评估别人写的工具，这篇的对照表可以当 checklist 用。时间更充裕的话，再看 Fable 5 禁令始末和 AI 应用层泡沫这两篇，了解一下当下 AI 行业里政策和商业层面正在发生的事。 BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂，并逐渐理解你关注什么，欢迎体验。

译循环工程将人机协作从单次对话转为连续回路，需回答何时启动、工具集、错误检测、记忆、刹车五个问题。Agent工具设计强调单一职责、强约束schema、结构化错误返回、幂等键等有效模式，并列出静默部分成功、功能重叠等反模式。Token成本控制揭示用户提问仅占成本1%以下，真正大头顶在系统提示词、项目文档、Skill定义、历史会话等固定前缀。速览还涉及Anthropic Fable 5模型被美政府出口管制叫停、Scaling Law参数冗余研究。