怎样最大程度的延长自己的寿命？

译日本Fugu仅0.6B参数，本质是AI项目经理，自动拆分任务，从顶级模型池挑选选手，分配思考、执行、验证三种角色，多轮协作合成答案。API调用与普通模型无异，编排策略由训练习得。跑分超越Claude和GPT，绕过scaling law军备竞赛。缺点包括黑箱、复杂任务延迟高、简单题成本更高。信号意义在于多智能体编排从实验室玩具正式变为可用生产力工具，orchestration layer新赛道开启。

Berryxia.AI@berryxia · 6月23日42

别吹了！根本不是那么回事！日本的Fugu在日语里面是河豚🐡的意思，就是那个胖嘟嘟很可爱有剧毒的河豚。对比了Fugu、GLM 5.2、Opus 4.8、GPt-5.5 其实实际还是和GLM 5.2 都有很明显的差距，没有到接近。这两天都是在搞营销宣发，这个也是美国VC机构主要投资的日本企业。话说日本在AI这一波中根本就没有赶上，他们可以「蒸馏」出牛逼的模型吗？我不信可以那么快赶超中美。

译Berry Xia发文质疑Sakana Fugu性能接近GLM 5.2的宣称，认为实际差距明显、属营销宣发。引用数据显示，在构建交易台任务中，Fugu Ultra输出22,225 token、成本$0.51；GLM 5.2输出13,677 token、成本仅$0.03，便宜约17倍。Opus 4.8（15,802 token/$0.31）和GPT-5.5（11,474 token/$0.26）成本也更低。主推文指出该模型来自美国VC投资的日本企业，质疑日本能否靠“蒸馏”快速赶超中美。

AYi@AYi_AInotes · 6月23日38

最近把传得神乎其神的白毛股神叙事，丢给AI逐条拆了一遍，结果挺意外的。三个月几百万浏览，几百条帖子，整套逻辑顺得不行。英伟达爆CPO需求，硅光子是卖铲子的，SIVE是最纯的那把铲子。评论区一片跟单，聊着聊着连杠杆都加上了。我没急着信也没急着骂，把整条叙事链拆出来，交给会自动溯源核证据的AI，按公开资料一条条核对，五条核心声称，四条站不住。最关键的几个硬事实，我又自己翻了一手来源对了一遍，结论基本扛得住。这篇不是要扒谁的皮，我更在意的是另一件事，现在大家都知道AI会幻觉，会一本正经地编，可编得太离谱的反而不可怕，你一眼就能看穿。真正麻烦的是另一种，术语没错，单点都有出处，语气又特别笃定，像干了二十年的老分析师，你顺着它的结论真去下单，钱就没了。有时候比胡说更危险的是听起来全对，这种伪正确的叙事，才是AI时代最杀人的陷阱，你亏了钱，甚至都找不到怪的人，只会觉得是自己运气不好。

译作者将流传的“白毛股神”投资叙事（英伟达CPO需求驱动硅光子、SIVE是最纯标的）交给具备自动溯源核证能力的AI，逐条交叉验证公开资料。五条核心声称中有四条缺乏依据，唯一站住脚的一条也被夸大。作者进一步人工复核硬事实后确认结论。推文警示：AI精确引用术语、逐条出处、语气笃定的“伪正确”叙事比明显胡诌更危险，可能诱导投资者盲目跟单。

Berryxia.AI@berryxia · 6月23日14

Seedance 这一波属于断档式的领先了。短期内，别的模型难以追赶了。

X.PIN@thexpin · 6月23日43

Musk and http://Z.ai really disgreed on how fast China's AI development is.

译马斯克和 http://Z.ai 对中国人工智能的发展速度确实存在分歧。

Emad@EMostaque · 6月23日38

When I left Stability AI a couple of years ago I predicted we would see almost perfect video from Chinese labs around now But it’s still amazing to see the quality of output reaching these levels where you can pretty much create anything you can imagine

译当我几年前离开 Stability AI 时，我预测我们现在会看到中国实验室产出近乎完美的视频。但看到输出质量达到这样的水平，几乎可以创造任何你能想象的东西，仍然令人惊叹。

Emad@EMostaque · 6月23日33

The upcoming @Seedance 2.5 model looking insane as well with multi asset input, way longer outputs etc I would expect @grok imagine to keep pace and real time of this quality by end of next year (!) Every pixel will be generated And that has a lot of implications

译Emad Mostaque 称即将推出的 Seedance 2.5 模型视觉效果惊人，支持多资产输入和更长输出。他预期 Grok Imagine 将在明年底跟上并实现实时生成同等质量。引用其两年前离开 Stability AI 时的预测：中国实验室大约现在会产出近乎完美的视频。如今看到输出质量已达到可创造任何想象内容的水平，每个像素都将被生成，这蕴含深远影响。

向阳乔木@vista8 · 6月23日41

最近听到了好多workbuddy在中小企业的应用，出乎意料的受欢迎。这可能是腾讯目前最PMF的AI产品。

Chubby♨️@kimmonismus · 6月23日25

Seedance 2.5 released. It looks insane! Still trying to figure out where Veo 4 is and why nothing comes close to Seedance

译Seedance 2.5 发布。看起来太疯狂了！仍在试图弄清楚 Veo 4 在哪里，以及为什么没有其他产品能接近 Seedance。

Ethan Mollick@emollick · 6月23日43

I know they are pivoting to health care(?!) but there is still nothing like Midjourney for making strange and atmospheric images and short animations in ways no other AI image generator can do. Here are some strange cities I made with similar prompts but very different styles.

译我知道他们正在转向医疗保健(?!)，但Midjourney在制作奇怪且氛围感的图像和短动画方面仍然无与伦比，其他AI图像生成器都无法做到。下面是我用类似提示但风格迥异的提示词制作的一些奇怪城市。

Berryxia.AI@berryxia · 6月23日27

字节已经发布了Seedance 2.5 了，直接起跳就是半个点，都不是0.1 说明这次的迭代应该蛮大的。还挺期待的看看到底有哪些变化，应该有很多产品都会第一时间接入自家的产品了。开始吧~·

译字节跳动已发布视频生成模型 Seedance 2.5，版本号从 2.1 直接跳至 2.5（增幅 0.4，而非小版本 0.1），暗示迭代幅度较大。目前具体功能更新尚未公布，但预计字节旗下多个产品将第一时间接入该模型。此前曾有预期 Seedance 2.1 发布，实际直接上线 2.5，进一步印证此次升级的重要性。

jason@jxnlco · 6月23日9

Codex remote control

译Codex 远程控制

Berryxia.AI@berryxia · 6月23日45

Dankoe的新文章把“AI会取代工作”这个话题彻底翻了个面，他说真正的威胁从来不是AI，而是你对别人的依赖。 Smith把这篇文章是之前那篇2亿阅读《如何重启人生》的续作，核心观点很直接：AI再强大，也只是工具。真正会让你被淘汰的，是你还把自己当成“被安排的人” 靠工资生存、没有自己的东西、没有独立创造的能力。他给出了在AI时代活下来的几个关键： - 逃离工资奴役，本质是把主动权拿回来 - 成功的五种成分：主动性、品味、说服力、持续力、迭代 - 媒体（内容创作）比代码更重要，因为内容需要人的判断和品味，而这些是AI目前给不了的 - 最实际的起步动作：改变环境 + 选一个反馈强的载体 + 明确自己的人生之作 + 明天就发布第一条内容 AI把“构建东西”的门槛大幅降低了，但“判断什么值得构建”和“根据真实反馈持续迭代”的能力，依然是人的核心竞争力。那些只知道喊“f*ck AI”或者只会让AI生成内容的人，依然会被时代甩在后面。这篇文章理论和实操结合得很好，翻译版也整理得非常清晰，值得认真看一遍。

译Dankoe的文章指出AI并非取代工作的元凶，真正威胁是对他人的依赖。他提出在AI时代生存的关键：逃离工资奴役、掌握主动性/品味/说服力/持续力/迭代五种成分、媒体比代码更需判断力。起步动作包括改变环境、选择反馈强的载体、明确人生之作、明天发布第一条内容。AI降低了构建门槛，但人的判断与迭代能力仍是核心竞争力。该文是此前2亿阅读《如何重启人生》的续作。

jason@jxnlco · 6月23日13

Enough monkeys typing with codex and one of them will build openclaw

译足够多的猴子用 codex 打字，其中一只就会造出 openclaw。

Ethan Mollick@emollick · 6月23日55

The thing that made Fable so impressive was its creative problem-solving and good judgement calls across long-running projects You can see this when I had it make a self-aware Snake game. I gave it no design feedback, just "make it better" Worth trying: https://snake-stable-build.netlify.app/

译让 Fable 如此令人印象深刻的是其跨长期项目的创造性问题解决和良好判断力你可以看到这一点：当我让它制作一个自知的贪吃蛇游戏时。我没有给它任何设计反馈，只是说“让它更好” 值得一试：https://snake-stable-build.netlify.app/

Rohan Paul@rohanpaul_ai · 6月23日67

In his new interview Microsoft CEO Satya Nadella warned that AI power is becoming too concentrated for society to treat it as normal tech progress. His concern is not that AI models are getting smarter, but that the money, chips, data centers, and user access behind them are being controlled by too few firms. When only a handful of companies can train frontier systems, every business using AI becomes dependent on their prices, rules, failures, and product choices. --- firstpost. com/tech/you-cant-call-it-progress-microsoft-ceo-satya-nadella-warns-against-concentration-of-ai-power-14025004.html

译微软CEO萨提亚·纳德拉在最新采访中警告，AI权力正变得过于集中，不能被视为正常的技术进步。他担忧的不是AI模型越来越智能，而是背后的资金、芯片、数据中心和用户访问被少数公司控制。当只有少数企业能够训练前沿模型时，所有使用AI的业务都将依赖于这些公司的定价、规则、故障和产品选择。

François Chollet@fchollet · 6月23日46

It seems almost too dumb to be true, but apparently the literal belief of SaaS bears is "all software is a 0 because Claude can one-shot these apps" Just staggering levels of short-sightedness in that statement

译这似乎愚蠢得令人难以置信，但显然SaaS空头的真实信念是“所有软件都是0，因为Claude可以一次性生成这些应用” 这种说法简直是惊人的短视。

François Chollet@fchollet · 6月23日49

A mirror facing a mirror creates the illusion of depth. A prediction machine directed towards itself creates the illusion of direction.

译镜子对着镜子创造深度的错觉。预测机器指向自身创造方向的错觉。

Yuchen Jin@Yuchenj_UW · 6月23日26

Fable 5 is not back. Apparently Anthropic’s non-citizen researchers can’t use Mythos/Fable 5 due to the ban, but they can still build more powerful models like Mythos 6 or Fable 6. If that’s true, I don’t think the ban makes much sense.

译Fable 5 没有回归。显然，由于禁令，Anthropic 的非公民研究员无法使用 Mythos/Fable 5，但他们仍然可以构建更强大的模型，如 Mythos 6 或 Fable 6。如果真是这样，我认为这项禁令没什么意义。

jason@jxnlco · 6月23日19

how many of you have a codex chief of staff thread? what kinds of stuff do you have them look over?

译你们中有多少人有一个Codex参谋长线程？你们让它们查看什么样的事情？

凡人小北@frxiaobei · 6月23日42

关于微信 Agent 小微的一点看法：一年前的帖子

译推文分析微信成为超级Agent OS的潜力。对比手机厂商（端侧感知型，偏向控制硬件，但服务碎片化）与微信（云端调度型，依靠小程序作为类MCP工具池，聊天作为天然上下文窗口）。微信可深度操控自身生态（页面跳转、功能触发），但缺端侧长期记忆和规划能力。结论认为真正跑得动的Agent应云负责理解、编排与聚合服务，端负责感知与控制，统一调用链、上下文管理与服务编排者有望成为智能体OS。

François Chollet@fchollet · 6月22日34

Programming is not about code, just like music is not about notation. It is the art & science of managing complexity through layers of abstraction. AI is simply a part of it.

译编程不是关于代码，就像音乐不是关于记谱法一样。它是通过抽象层管理复杂性的艺术与科学。AI只是其中的一部分。

Chubby♨️@kimmonismus · 6月22日59

I sat down with Akshay Kothari (@akothari), co-founder of @NotionHQ , to talk about Notion’s evolution from a notes app into an agent-first workspace. We discussed: • why templates became Notion’s real unlock • how humans, code, and AI agents will work side by side • Notion’s internal people-ops agent “Smilers” • self-healing company knowledge bases • Notion Workers and automation • why Notion wants model optionality instead of lock-in • why the future of work should augment human intelligence, not replace it The most interesting idea: AI agents won’t just automate busy work. They could allow expertise to spread across an entire organization, so workflows built by one person become reusable by everyone.

译在与Notion联合创始人Akshay Kothari的对话中，探讨了Notion如何从笔记应用演变为以AI智能体优先的工作空间。关键要点包括：模板成为增长突破口；人类、代码与AI Agent将协同工作；内部人事Agent“Smilers”；自愈式企业知识库；Notion Workers自动化；保持模型可选择性避免锁定；未来工作应增强而非替代人类智能。最引人深思的观点是：AI Agent不仅能自动化繁琐工作，还能让专业知识在整个组织内传播，使一人构建的工作流被所有人复用。

meng shao@shao__meng · 6月22日30

给大家更新一下国产四个模型的投票结果： GLM-5.2 - 79.7% DeepSeek V4 - 13.4% Kimi K2.7 - 5.2% MiniMax M3 - 1.7% GLM-5.2 这么强，MiniMax M3 这么惨吗？

译邵猛更新四个国产LLM投票：GLM-5.2获79.7%，DeepSeek V4 13.4%，Kimi K2.7 5.2%，MiniMax M3仅1.7%。他感叹GLM-5.2强势而MiniMax M3惨淡，并指出Gemini 3.5 Flash相比GLM-5.2不能打，Google DeepMind自Gemini 3.0后陷入沉寂。

Chubby♨️@kimmonismus · 6月22日29

I'm really looking forward to the Sonnet 5 release. Sonnet has sometimes been stronger than older Opus models at launch, most clearly with Claude 3.5 Sonnet outperforming Claude 3 Opus in areas like coding, speed, and cost-performance. But the real point of Sonnet obv. is not simply "beating Opus"; it is about translating frontier-level intelligence into a practical workhorse model: fast enough, affordable enough, and reliable enough to power real products, agent workflows, and everyday coding at scale. So yeah, exciting week ahead.

译用户 Kim 期待 Sonnet 5 发布，指出 Sonnet 系列常在发布时强于老一代 Opus，如 Claude 3.5 Sonnet 在编程、速度和性价比上超越 Claude 3 Opus。Sonnet 的核心价值是将前沿智能转化为实用工作模型：足够快、足够便宜、足够可靠，支撑实际产品、智能体工作流和日常大规模编码。引用推文暗示本周可能迎来繁忙发布，包括 GPT-5.6 和 Sonnet 5。

DogeDesigner@cb_doge · 6月22日18

Grok will make Hollywood-level movies one day, and that day is not far.

译Grok 终有一天能制作好莱坞级别的电影，而且那一天并不遥远。

Chubby♨️@kimmonismus · 6月22日23

Not again, @eucommission . Europe is once again being excluded from access to the latest SOTA scientific technology.

译Sakana AI发布Fugu Ultra，它不是传统意义上的前沿模型，而是一个学习编排层，将多个前沿模型转化为协调的智能体团队。其多智能体系统性能可与Fable 5相匹敌。然而，欧洲再次被欧盟委员会排除在访问这一最新SOTA技术之外，引发批评。

Chubby♨️@kimmonismus · 6月22日49

Sakana’s Multi-Agent on par with Fable 5: Sakana AI’s Fugu Ultra may not be a new frontier model in the classical sense. It is more like a learned orchestration layer that turns multiple frontier models into a coordinated agent team. The next jump in AI capability may come not only from larger base models, but from better test-time orchestration. I love it, Kudos Sakana!

译Sakana AI 推出 Fugu 多智能体编排系统，通过单一模型 API 调用即可协调多个前沿模型组成智能体团队。其 Fugu Ultra 模型性能与 Fable、Mythos 相当，且不受出口管制限制。主推文指出，Fugu Ultra 并非传统意义上的新基座模型，而是一个学习到的编排层，更智能的测试时编排可能是 AI 能力的下一个跃升点。

jason@jxnlco · 6月22日60

Guinness only posts bangers always great takes Make sure to give him a follow @guinnesschen

译Guinness Chen 表示，2026年6月了，别再手动编辑提示词，应该按住听写按钮即兴说上10分钟，把脑海里的每个碎片、警告、例子和感觉都交给模型——大语言模型最擅长的就是从语言中重建潜在意图。Jason Liu 称赞他只发好内容，观点总是很棒，并建议大家关注他 @guinnesschen。

AYi@AYi_AInotes · 6月22日57

GLM-5.2 的母公司智普年初上市，到现在半年时间涨了将近16倍，太离谱了，喵的我大腿都要拍断，当时觉得国内大模型公司股价泡沫严重，人真是只能赚自己认知内的钱啊😭 智普科技股价从上市初期约 131.50 HKD 上涨到目前约 2,094 HKD，YTD 涨幅约 1,492%，这个势头，估计很难有上车的机会了

译智谱年初上市，股价从约131.50 HKD涨至约2,094 HKD，YTD涨幅约1,492%。背后由GLM-5.2与Fable 5测评对比驱动：同一任务下GLM-5.2效果达Fable 5九成，但价格不到$0.10（Fable 5约$5），价差五十倍。该对比改变了设计探索默认选项——当开源模型做到“够好且便宜到可以随便用”，用户优先选择低成本方案。GLM-5.2此次正好踩上这条线。

数字生命卡兹克@Khazix0918 · 6月22日66

http://x.com/i/article/2068923862918877184 # AI用得好不好，跟你会不会管人，我觉得越来越是同一件事。故事是这样的。这个端午节在家，终于可以休息了，然后几乎就是疯狂的用Agent来做自己好玩的东西。有图为证，最近这个假期，差不多干掉了2000多万的token。这里我防杠一下，我知道可能会有人说，你这好几天才干掉2000万token，也不算啥，我基本每天API都是一个亿起步。我想说首先我不是那么重度的用户，我就是个普通的爱好者，其次这个PK在我看来没有任何意义，因为只能说明你烧的多但是不代表质量高，最后这个Claude Code客户端的token消耗计算是不算缓存的，如果算上缓存的话，一个稍微大型一点跑4个小时的任务，烧的token可能就是4个亿。因为Claude Fable 5被下架了，所以这个假期，我几乎全部用的都是Claude Opus 4.8，然后有一个任务，让我感慨万千，那一瞬间，我真的无比的怀念Claude Fable 5。这个任务，是我自己做的AI资讯聚合网站AIHOT的一个聚簇机制。也就是大家在精选页下看到的这个关联讨论多少条。我们外显监控的信源其实只有200个不到，但是背后其实还监控着近千个隐性信源，有多少可信信源共同讨论某一件事，几乎代表着未来AI时代我觉得热点的性质和定义。所以这就需要聚簇，也就是把大家讨论的事情给拆分、聚集、然后形成一簇，再把其中一个信源的单条信息推选出来当领袖对外展示，其他的隐藏在背后。大概就是这么个东西。而且做聚簇还有个必要性，就是比如某个大事件突然爆掉的时候，比如这周GPT-5.6发布了，那在AI领域，一定是上百个信源共同讨论，其中会有无数被精选，如果我们全都展示出来，那就直接刷屏了，整个AIHOT上你也看不到别的了，满屏的都是GPT-5.6，用户体验极差。所以于情于理，这个东西我们都要做好。但是呢，现在的聚簇机制，过去经常有问题，一会把不该聚的聚在了一块，一会把该聚的又分裂了，我自己看起来经常难受的要死。。。所以这个端午节假期，我就准备重构一下这个聚簇的算法。感觉没有那么难对吧，但是，坑比我想象的多太多了。首先最大的问题是，我知道当一个热点爆发的时候，相关新闻应该被聚拢成一个簇，我知道语义相近但事件不同的新闻必须被拆开，我知道时间窗口应该限制在24小时以内，我知道聚簇的阈值不能太松也不能太紧，太松了什么都黏在一起，太紧了每条新闻都是孤岛。这是最终的效果和目标，但是究竟什么样的算法和机制可以达成，坦诚的讲，我是个废物，我一无所知。。。所以我只能给Claude Code一段这样的目标，然后让他全网调研，用我们数据库里的真实数据进行量化回测，让它自己去实现。我把这些东西写清楚了，丢给了Opus 4.8。然后问题就来了。 Opus 4.8是一个很强的模型，这个我承认。但是至少在做这种只有模糊目标没有明确任务的事情上，全面崩盘。在方案设计上，就漏洞百出，查了一些论文，学了一些所谓的SOTA的做法，然后设计的方案乱七八糟，我稍微检查一下感觉里面就有漏洞，我一问它就自己反转反转再反转。经典台词：这里有个反转。后面都给我干生气了，怒斥这个墙头草，毫无底线，毫无坚持。最后拼拼凑凑在对抗式审查之后，出了一版方案，我开着那个最高级别的动态工作流也就是那个Ultracode让他做完，又是一堆BUG，最后又变成了哦阈值0.72高了点，我们降到0.71吧，没有考虑到多语言，也毫无各种各样的边界情况。这玩意干了我一天时间，中间不断修修补补，新方案修了旧的问题，又冒出来新的问题。最后给我干的快道心破碎了。那个状态，想起了我在公司里带一些能力还不错但你又不能完全放手的小伙伴的时候，你给他方向，他能走，但你得盯着，时不时拉一把，时不时补一句这个地方你漏了，这么做它不对。那天，我突然心中好怀念Claude Fable 5。如果Fable 5还安在，这个事情可能半天就搞定了，而且省心省力。因为我之前用Fable 5做过好几个类似复杂度的项目，每次的体验都是一样的，我只需要把目标讲清楚，甚至不需要那么明确的目标，一个模糊的目标也行，它给出来的方案经常比我自己能想到的要好N个数量级，而且大概率是能以非常优雅的姿态，完成你的目标。那玩意，就是那种你给它一个方向它能自己跑到终点还顺手把沿途的坑都填了的选手。但它出师未捷身先死，中道崩殂了。所以我只能用Opus 4.8或者GPT-5.5，然后用更细致的管理方式去补它们和Fable 5之间的差距。但这个体验，让我想明白了一件非常非常非常重要的事。不同能力的AI，你得用不同的管理方式。跟管人，是一模一样的。这几年，当过大头兵，当过小组长，管过小团队也管过大团队，现在也作为一个创始人在创业管着自己公司的三十来号人。我自己对管理最深的体感就是一句话：越厉害的人，你给的东西就得越不一样。比如纯粹的新人刚刚入职的时候，你可能得告诉他每一步怎么做。比如打开这个文件，复制这段数据，粘贴到那个表格里，格式调成这样，最后发给谁谁谁，你给他的，其实就是一个任务清单，每一步都写得清清楚楚。这其实就是Prompt Engineering的逻辑，你把每一步都告诉AI，它照着做。但是带了一段时间之后，他开始上手了，你就不用这么细了。你可以跟他说，这个月的视频内容排期你来做，风格参考上个月的，节奏控制在每周两条。你给他的，从一步一步的指令，变成了一个目标加上一些约束条件。这就是Harness Engineering的逻辑。你给AI一个目标和一套规则，它在规则内自己想办法达成。再后来，如果这个人真的很强，你会发现一个很微妙的变化。你甚至不需要给他特别具体的目标了，你跟他说，我们今年想把品牌在线下活动的影响力做起来，你来想想怎么搞吧。或者说，我们今年MCN的商业化收入，要保持口碑的同时健康的增长。他不光能做，他还能反过来给你一个你没想到的方案。而且他做完之后，还能把这次整套的流程沉淀成SOP，下次换一个人来，也能继续执行照着跑，它可以去拓展更牛逼的业务。这种人，是每个公司、每个团队、每个管理者做梦都想要的超级大佬。 Claude Fable 5给我的感觉，就是这种人。而它之下，Opus 4.8、GPT-5.5、GLM-5.2，都更像一个能力很强但你还是得盯着的高级员工。你看，差别就出来了。我做AIHOT聚簇那两天的痛苦，根源就在这里。我给了一个策略层的目标，但Opus 4.8需要的其实是更接近执行层的指引。这时候，我的管理方式和模型的能力层级之间有一个错配。就像你把一个合伙人级别的目标甩给了一个高级执行者级别的人，这个人其实并不是不行，只是你的预期和他的承接能力之间差了一层。回到管人这件事。我这两天其实也一直在想一个问题，为什么有些人用AI效果特别好，有些人就总觉得AI很笨。我现在越来越觉得，这跟一个人会不会管理，是强相关的。管人管得好的人，天然就知道怎么定义目标、怎么给约束、怎么设反馈机制。但更重要的是，他们知道怎么判断面前这个人的能力层级，然后动态调整自己的管理颗粒度，这一点真的非常非常非常重要。任正非有一句话我觉得非常对。 “让听得见炮声的人来做决策。” 这句话在华为内部被反复提起，意思是总部不要替前线的人做每一个决定，你把战略方向定清楚，把资源配到位，具体怎么打让前线自己判断。因为前线的人最了解现场的情况，他们的即时判断经常比总部坐在会议室里的遥控指挥要准得多。这个思维方式，我觉得跟现在用AI是完全一样的。你给AI写一堆详细的步骤，就像总部在遥控指挥，每一步都给前线下死命令，这个方式看起来很缜密，但一遇到你没预料到的情况，AI就懵了，因为步骤里没有覆盖到这种case。你给AI一个清晰的目标，一套约束，然后让它自己决定怎么执行，这才是“让听炮声的人做决策”，AI也才真正有了自主决策的空间。但是，这里有一个前提。任正非这句话之所以在华为管用，是因为华为的人才密度够高。你让一个刚入职的应届生去听炮声做决策，他可能连炮声从哪边来的都分不清就被炮给轰死了。但如果你让一个打了十年仗的业务老将去做同样的事，他不光能判断方向，还能在混乱中即兴发挥出你想不到的打法。同一套管理哲学，对不同能力的人，效果天差地别。同样是管人，你跟一个初级运营说“把这篇文章排到今天下午三点发”，这是一个执行层的目标，明确、可验证、没有歧义。你跟一个经纪总监说“这个季度MCN要在XX这个平台做到垂类领域No.1”，这是一个策略层的目标，模糊但有方向，需要对方自己拆解。你跟一个合伙人说"我们今年要成为AI行业最有影响力的内容公司”，这是一个愿景层的目标，几乎没有执行路径，但它锚定了所有人的方向。三个层次，给不同的人。你把执行层目标给了一个合伙人级别的人，他会觉得你不信任他，觉得你在微操。你把愿景层目标给了一个刚来的实习生，他会完全不知道从哪下手，然后焦虑到失眠。给AI也是一模一样的。我做聚簇那两天的痛苦，根源就在这里。我给了一个策略层目标，但Opus 4.8在这个任务的维度上，需要的其实是更接近执行层的指引，管理方式和能力层级之间，错配了。但是，以上所有这些讨论，其实都还停留在我们当下、今天的游戏里。 AI、Agent、模型一定是会继续进化的。 Cladue Fable 5马上可能就要回来了，GPT-5.6也要上线了，可能要不了多久，Claude Fable 6、GPT-6也会来了。也许三个月后，也许半年后，你手上用的每一个模型都能接策略层的目标，都能自己设计方案，都能在你没想到的地方做出超出你预期的判断。甚至，未来还会出现合伙人级别的模型。到那个时候，当你面前坐着十几个合伙人级别的Agent，每一个都比你聪明，每一个都比你高效，每一个都能在它的领域里交出你想不到的方案。那你作为管理者，到底还有什么存在的理由呢？你的精力、你的思考、你的时间，到底应该投资在什么地方呢？这个问题，在这个小小的假期中，浮现了出来。我想了很久答案，最后，我想到了一个人，叫德鲁克，就是这个老头，被誉为现代管理学之父。他的思想，如果被归纳成一句话的话，我觉得就是： “管理者的工作，是思考应该思考什么。” 大多数人每天在做的事情，是思考怎么做这件事，怎么写更好的代码，怎么做更漂亮的PPT，怎么跑更快的模型，怎么写更精准的prompt，这些是执行层的思考，不用想，AI进步的速度在这些事情上比人快一个数量级，你从Coding和Agent的进化上就能看出来了。再高一层，是思考做什么。比如做哪个产品，切哪个市场，选哪个技术路线，这些是策略层的思考，Fable 5级别的模型已经开始在这个层面展现出惊人的能力了。但德鲁克说的不是这两层，他说的是第三层，“思考应该思考什么”。这一层的意思是，你有没有能力判断，在所有可能思考的问题里面，哪几个问题才是真正值得你坐下来想的。换句话说，我们每个人的注意力和精力都是有限的，我们到底应该如何保护自己的精力，聚焦在真正值得我们注意的问题之上。 AI时代，目前看，在逼着所有人往第三层走。因为第一层和第二层的思考，AI都会越来越擅长，你在这两层上的优势，会被模型能力的增长不断蚕食。只有第三层，什么问题值得想这个判断，AI过去、现在、未来都做不了。倒不是说AI不能帮你列出选项、做决策树、分析利弊，这些它绝对都能做，而且做得比你快。但最后那一下，在所有分析都摆在桌面上之后，你选A还是选B，这个选择背后站着的，是你这个人的价值观、你的审美、你对世界的理解、你愿意为什么承担代价。这些东西，是计算不出来的。因为它们不是计算问题，是选择问题。计算有最优解，选择没有。选择只有你选的和你没选的，然后你用你的余生去承受这个选择的后果。 AI可以穷举所有可能的路径，给你每一条路的概率分布和预期收益。但这条路值不值得走，这个判断，永远只能由一个真实活过的、痛过的、做过错误选择并且承受过后果的人来做。这就是为什么管理学读到最后，一定会走向哲学。你去看德鲁克后期的内容，越写越像搞哲学的，怎么做计划、怎么定KPI他也不说了，他开始聊什么是有效的人生、什么是值得追求的东西。还有稻盛和夫，他一辈子管理思想的核心就一句话，“作为人，何谓正确”，因为他发现，当你管理的层级足够高的时候，所有的商业判断到最后都会变成一个伦理判断，你到底相信什么，你愿意守住什么。所以我现在的想法是这样的。很多人觉得AI越强，人就越没用，但我觉得刚好反过来，AI越强，你被推到的管理层级就越高，从一个执行者的位置被推到管理者，从管理者被推到战略制定者，从战略制定者被推到一个更接近哲学家的位置。你会被这个时代逼着，越来越往上升职，而你能不能接住这个新的位置，取决于这些年，我们到底有没有在积累真正不可替代的东西。如果不能，那可能就会像五代十国里的石重贵和耶律德光，被时代无情的碾过，然后吞噬。真是一个残忍，又吃人的时代。

译作者在端午节假期用Claude Opus 4.8重构AI新闻聚合站AIHOT的聚簇机制，消耗2000多万token，耗时一天屡次改阈值（0.72→0.71）、补多语言等边界情况仍问题百出。对比怀念已被下架的Claude Fable 5——后者只需给模糊目标就能自动跑完并填坑。由此总结：管理AI与管理人本质相同——越强的模型（如Fable 5）给方向即可（愿景/策略层），越弱的模型（如Opus 4.8、GPT-5.5、GLM-5.2）则需更细执行层指引，错配层级正是痛苦根源。

Rohan Paul@rohanpaul_ai · 6月22日20

Old video of Dario Amodei, here he was giving a lecture at Carnegie Mellon University back in 2016. At the time he was a researcher on the Google Brain team at Google. ---- From "Carnegie Mellon Software and Societal Systems Dept" YouTube channel, (link in comment)

译Dario Amodei 的旧视频，当时他于 2016 年在卡内基梅隆大学进行演讲。那时他是 Google Brain 团队的研究员。 ---- 来自“Carnegie Mellon Software and Societal Systems Dept”YouTube 频道，（链接在评论中）

Rohan Paul@rohanpaul_ai · 6月22日36

"Can AI ever be Newton? Can AI ever be Einstein? Can AI ever be Picasso?" Dr. Fei-Fei Li ( @drfeifei ) gives a very simple explanations of how today's AI still has a long way to go. --- From 'FII Institute' YT channel (full link in comment).

译"AI 能成为牛顿吗？AI 能成为爱因斯坦吗？AI 能成为毕加索吗？" 李飞飞博士给出了一个非常简单的解释，说明今天的 AI 还有很长的路要走。 --- 来自 'FII Institute' 的 YouTube 频道（完整链接在评论中）。

Yuchen Jin@Yuchenj_UW · 6月22日28

I often see tweets saying “Claude performs better in OpenCode/Cursor than in Claude Code.” Is this actually true? Hard to believe Anthropic wouldn’t have the best harness for its own models, especially when OpenCode is open source. Would love to see some real examples.

译我经常看到推文说“Claude在OpenCode/Cursor中的表现比在Claude Code中更好。” 这真的是真的吗？很难相信Anthropic不会为自己的模型提供最好的适配，尤其是OpenCode还是开源的。希望能看到一些真实的例子。

jason@jxnlco · 6月22日12

beautiful, lets fucking go

译在西村（West Village）看到了 Codex 的 Carrie Bradshaw 化

jason@jxnlco · 6月22日20

appshots are still one of the best features in codex

译appshots 仍然是 codex 中最好的功能之一。

François Chollet@fchollet · 6月22日45

The market is treating Adobe like a legacy software company in terminal decline. Yet the actual data shows it's one of the biggest beneficiaries of the rise of GenAI. In fact, it's one of the top 5 most profitable & fastest-growing AI companies today, in an industry where profitability is rare.

译市场将 Adobe 视为一家走向末路的传统软件公司。然而实际数据显示，它是 GenAI 崛起最大的受益者之一。事实上，它是当今最盈利且增长最快的五大 AI 公司之一，而在一个盈利稀少的行业中。

Rohan Paul@rohanpaul_ai · 6月22日47

A viral Europe 2031 scenario warns that Europe could become economically weaker, politically dependent, and strategically exposed if it fails to build its own frontier AI capacity. - Europe misread DeepSeek R1 as proof that small, clever teams could compete without massive compute, even though the deeper lesson was that reasoning models worked and compute still decided who could scale them. - Europe announced big AI numbers, including €200B for InvestAI, but much of it was aspirational, spread across years, and far smaller than what US hyperscalers were already spending on data centers. - Europe lacked enough AI compute, with the report framing the US advantage as 17.3GW of buildout versus 1.4GW in Europe, which meant fewer chips, fewer experiments, weaker models, and slower catch-up. - Europe moved too slowly on energy, permitting, and data centers, so its Gigafactories were delayed while American firms were already building giant facilities and signing massive compute deals. - Europe’s strongest AI firms could not raise capital at frontier scale, so companies like Mistral were compared against US labs raising sums that made European rounds look structurally insufficient. - Europe lost talent because top researchers and founders could get larger compute budgets, higher pay, faster teams, and more serious AI ambition in Silicon Valley than in Brussels, Paris, or Berlin. - Europe’s own institutions often blocked staff from using the best frontier tools for data-protection reasons, which meant policymakers were regulating systems they barely used in daily work. - Europe’s companies adopted AI more slowly because of fragmented rules, cautious management, sector restrictions, labor protections, and internal policies that pushed workers toward weaker European tools. - Europe focused on sovereignty mandates before it had strong sovereign suppliers, so “buy European” policies risked forcing public agencies and companies onto weaker systems. - Europe underestimated inference access as a strategic chokepoint, because even if US models were available commercially, Washington could later ration the compute needed to run them. - Europe had leverage in parts of the semiconductor chain, especially through ASML, but the scenario argues it failed to turn that leverage into a serious bargaining position before AI dependence hardened.

译欧洲2031场景分析警告，若不建立自主前沿AI能力将面临经济与战略脆弱。欧洲误读DeepSeek R1，以为小团队可替代算力，但推理模型有效且算力仍决定规模化。欧洲宣布€200亿InvestAI但分散数年，远不及美国超大规模厂商数据中心支出。美国AI算力17.3GW vs 欧洲1.4GW，导致芯片、实验和模型差距。欧洲人才流向硅谷，最强AI公司融资规模远逊美国。政策制定者因数据保护限制使用前沿工具，企业采用AI因碎片法规和保守管理滞后。主权采购政策在缺乏强大本土供应商时反削弱竞争力。低估推理访问战略瓶颈——美国未来可能限制算力供应。欧洲在ASML等半导体环节有杠杆但未转化为谈判筹码。

DogeDesigner@cb_doge · 6月22日51

ELON MUSK: "In 5 years, digital intelligence will exceed the sum of all human intelligence." Within five years, there may be at least 100 million humanoid robots, possibly even 1 billion. The economy could double in size within 5 to 7 years because AI and robotics may increase output dramatically. The pace of change will be so fast that the world could look very different in just a few years.

译Elon Musk 在回应中预测 AI 可能在 4-5 年内超越所有人类智能的总和，并进一步展望：5 年内人形机器人数量至少达 1 亿，甚至可能达到 10 亿；由于 AI 和机器人大幅提升产出，经济将在 5-7 年内翻倍。Musk 称变化速度极快，世界将在短短几年内截然不同。

elvis@omarsar0 · 6月22日58

I don't even prompt/speak to agents that much anymore. With loops, agents do most of it for me now. I do spend more time writing verifiers to provide additional rich instructions (text+audio+images) that help fill in gaps. What's next? Hard to tell!

译Elvis Saravia（DAIR.AI）称他如今很少直接向智能体提示，而是依靠循环（loops）让智能体自主完成大部分工作。他转而花更多时间编写验证器（verifiers），通过文本、音频、图像提供丰富指令弥补智能体知识缺口。引用推文补充，2026年6月起应放弃手动编辑提示词，改用语音听写10分钟，将碎片、警示、示例和氛围直接灌给模型——大语言模型最擅长从语言中重构潜在意图。这标志着AI智能体交互正从精细提示转向循环+口述+验证器的新范式。