# AI用得好不好，跟你会不会管人，我觉得越来越是同一件事。

- 来源：数字生命卡兹克 (@Khazix0918)
- 发布时间：2026-06-22 13:21
- AIHOT 分数：66
- AIHOT 链接：https://aihot.virxact.com/items/cmqos3q4v03paslx6rp51pouu
- 原文链接：https://x.com/Khazix0918/status/2068927263035506977

## AI 摘要

作者在端午节假期用Claude Opus 4.8重构AI新闻聚合站AIHOT的聚簇机制，消耗2000多万token，耗时一天屡次改阈值（0.72→0.71）、补多语言等边界情况仍问题百出。对比怀念已被下架的Claude Fable 5——后者只需给模糊目标就能自动跑完并填坑。由此总结：管理AI与管理人本质相同——越强的模型（如Fable 5）给方向即可（愿景/策略层），越弱的模型（如Opus 4.8、GPT-5.5、GLM-5.2）则需更细执行层指引，错配层级正是痛苦根源。

## 正文

http://x.com/i/article/2068923862918877184

# AI用得好不好，跟你会不会管人，我觉得越来越是同一件事。

故事是这样的。

这个端午节在家，终于可以休息了，然后几乎就是疯狂的用Agent来做自己好玩的东西。

有图为证，最近这个假期，差不多干掉了2000多万的token。

这里我防杠一下，我知道可能会有人说，你这好几天才干掉2000万token，也不算啥，我基本每天API都是一个亿起步。

我想说首先我不是那么重度的用户，我就是个普通的爱好者，其次这个PK在我看来没有任何意义，因为只能说明你烧的多但是不代表质量高，最后这个Claude Code客户端的token消耗计算是不算缓存的，如果算上缓存的话，一个稍微大型一点跑4个小时的任务，烧的token可能就是4个亿。

因为Claude Fable 5被下架了，所以这个假期，我几乎全部用的都是Claude Opus 4.8，然后有一个任务，让我感慨万千，那一瞬间，我真的无比的怀念Claude Fable 5。

这个任务，是我自己做的AI资讯聚合网站AIHOT的一个聚簇机制。

也就是大家在精选页下看到的这个关联讨论多少条。

我们外显监控的信源其实只有200个不到，但是背后其实还监控着近千个隐性信源，有多少可信信源共同讨论某一件事，几乎代表着未来AI时代我觉得热点的性质和定义。

所以这就需要聚簇，也就是把大家讨论的事情给拆分、聚集、然后形成一簇，再把其中一个信源的单条信息推选出来当领袖对外展示，其他的隐藏在背后。

大概就是这么个东西。

而且做聚簇还有个必要性，就是比如某个大事件突然爆掉的时候，比如这周GPT-5.6发布了，那在AI领域，一定是上百个信源共同讨论，其中会有无数被精选，如果我们全都展示出来，那就直接刷屏了，整个AIHOT上你也看不到别的了，满屏的都是GPT-5.6，用户体验极差。

所以于情于理，这个东西我们都要做好。

但是呢，现在的聚簇机制，过去经常有问题，一会把不该聚的聚在了一块，一会把该聚的又分裂了，我自己看起来经常难受的要死。。。

所以这个端午节假期，我就准备重构一下这个聚簇的算法。

感觉没有那么难对吧，但是，坑比我想象的多太多了。

首先最大的问题是，我知道当一个热点爆发的时候，相关新闻应该被聚拢成一个簇，我知道语义相近但事件不同的新闻必须被拆开，我知道时间窗口应该限制在24小时以内，我知道聚簇的阈值不能太松也不能太紧，太松了什么都黏在一起，太紧了每条新闻都是孤岛。

这是最终的效果和目标，但是究竟什么样的算法和机制可以达成，坦诚的讲，我是个废物，我一无所知。。。

所以我只能给Claude Code一段这样的目标，然后让他全网调研，用我们数据库里的真实数据进行量化回测，让它自己去实现。

我把这些东西写清楚了，丢给了Opus 4.8。

然后问题就来了。

Opus 4.8是一个很强的模型，这个我承认。

但是至少在做这种只有模糊目标没有明确任务的事情上，全面崩盘。

在方案设计上，就漏洞百出，查了一些论文，学了一些所谓的SOTA的做法，然后设计的方案乱七八糟，我稍微检查一下感觉里面就有漏洞，我一问它就自己反转反转再反转。

经典台词：这里有个反转。

后面都给我干生气了，怒斥这个墙头草，毫无底线，毫无坚持。

最后拼拼凑凑在对抗式审查之后，出了一版方案，我开着那个最高级别的动态工作流也就是那个Ultracode让他做完，又是一堆BUG，最后又变成了哦阈值0.72高了点，我们降到0.71吧，没有考虑到多语言，也毫无各种各样的边界情况。

这玩意干了我一天时间，中间不断修修补补，新方案修了旧的问题，又冒出来新的问题。

最后给我干的快道心破碎了。

那个状态，想起了我在公司里带一些能力还不错但你又不能完全放手的小伙伴的时候，你给他方向，他能走，但你得盯着，时不时拉一把，时不时补一句这个地方你漏了，这么做它不对。

那天，我突然心中好怀念Claude Fable 5。

如果Fable 5还安在，这个事情可能半天就搞定了，而且省心省力。

因为我之前用Fable 5做过好几个类似复杂度的项目，每次的体验都是一样的，我只需要把目标讲清楚，甚至不需要那么明确的目标，一个模糊的目标也行，它给出来的方案经常比我自己能想到的要好N个数量级，而且大概率是能以非常优雅的姿态，完成你的目标。

那玩意，就是那种你给它一个方向它能自己跑到终点还顺手把沿途的坑都填了的选手。

但它出师未捷身先死，中道崩殂了。

所以我只能用Opus 4.8或者GPT-5.5，然后用更细致的管理方式去补它们和Fable 5之间的差距。

但这个体验，让我想明白了一件非常非常非常重要的事。

不同能力的AI，你得用不同的管理方式。

跟管人，是一模一样的。

这几年，当过大头兵，当过小组长，管过小团队也管过大团队，现在也作为一个创始人在创业管着自己公司的三十来号人。

我自己对管理最深的体感就是一句话：

越厉害的人，你给的东西就得越不一样。

比如纯粹的新人刚刚入职的时候，你可能得告诉他每一步怎么做。

比如打开这个文件，复制这段数据，粘贴到那个表格里，格式调成这样，最后发给谁谁谁，你给他的，其实就是一个任务清单，每一步都写得清清楚楚。

这其实就是Prompt Engineering的逻辑，你把每一步都告诉AI，它照着做。

但是带了一段时间之后，他开始上手了，你就不用这么细了。你可以跟他说，这个月的视频内容排期你来做，风格参考上个月的，节奏控制在每周两条。

你给他的，从一步一步的指令，变成了一个目标加上一些约束条件。

这就是Harness Engineering的逻辑。你给AI一个目标和一套规则，它在规则内自己想办法达成。

再后来，如果这个人真的很强，你会发现一个很微妙的变化。

你甚至不需要给他特别具体的目标了，你跟他说，我们今年想把品牌在线下活动的影响力做起来，你来想想怎么搞吧。

或者说，我们今年MCN的商业化收入，要保持口碑的同时健康的增长。

他不光能做，他还能反过来给你一个你没想到的方案。

而且他做完之后，还能把这次整套的流程沉淀成SOP，下次换一个人来，也能继续执行照着跑，它可以去拓展更牛逼的业务。

这种人，是每个公司、每个团队、每个管理者做梦都想要的超级大佬。

Claude Fable 5给我的感觉，就是这种人。

而它之下，Opus 4.8、GPT-5.5、GLM-5.2，都更像一个能力很强但你还是得盯着的高级员工。

你看，差别就出来了。

我做AIHOT聚簇那两天的痛苦，根源就在这里。

我给了一个策略层的目标，但Opus 4.8需要的其实是更接近执行层的指引。

这时候，我的管理方式和模型的能力层级之间有一个错配。

就像你把一个合伙人级别的目标甩给了一个高级执行者级别的人，这个人其实并不是不行，只是你的预期和他的承接能力之间差了一层。

回到管人这件事。

我这两天其实也一直在想一个问题，为什么有些人用AI效果特别好，有些人就总觉得AI很笨。

我现在越来越觉得，这跟一个人会不会管理，是强相关的。

管人管得好的人，天然就知道怎么定义目标、怎么给约束、怎么设反馈机制。

但更重要的是，他们知道怎么判断面前这个人的能力层级，然后动态调整自己的管理颗粒度，这一点真的非常非常非常重要。

任正非有一句话我觉得非常对。

"让听得见炮声的人来做决策。"

这句话在华为内部被反复提起，意思是总部不要替前线的人做每一个决定，你把战略方向定清楚，把资源配到位，具体怎么打让前线自己判断。因为前线的人最了解现场的情况，他们的即时判断经常比总部坐在会议室里的遥控指挥要准得多。

这个思维方式，我觉得跟现在用AI是完全一样的。

你给AI写一堆详细的步骤，就像总部在遥控指挥，每一步都给前线下死命令，这个方式看起来很缜密，但一遇到你没预料到的情况，AI就懵了，因为步骤里没有覆盖到这种case。

你给AI一个清晰的目标，一套约束，然后让它自己决定怎么执行，这才是"让听炮声的人做决策"，AI也才真正有了自主决策的空间。

但是，这里有一个前提。

任正非这句话之所以在华为管用，是因为华为的人才密度够高。

你让一个刚入职的应届生去听炮声做决策，他可能连炮声从哪边来的都分不清就被炮给轰死了。

但如果你让一个打了十年仗的业务老将去做同样的事，他不光能判断方向，还能在混乱中即兴发挥出你想不到的打法。

同一套管理哲学，对不同能力的人，效果天差地别。

同样是管人，你跟一个初级运营说"把这篇文章排到今天下午三点发"，这是一个执行层的目标，明确、可验证、没有歧义。

你跟一个经纪总监说"这个季度MCN要在XX这个平台做到垂类领域No.1"，这是一个策略层的目标，模糊但有方向，需要对方自己拆解。

你跟一个合伙人说"我们今年要成为AI行业最有影响力的内容公司"，这是一个愿景层的目标，几乎没有执行路径，但它锚定了所有人的方向。

三个层次，给不同的人。

你把执行层目标给了一个合伙人级别的人，他会觉得你不信任他，觉得你在微操。你把愿景层目标给了一个刚来的实习生，他会完全不知道从哪下手，然后焦虑到失眠。

给AI也是一模一样的。

我做聚簇那两天的痛苦，根源就在这里。

我给了一个策略层目标，但Opus 4.8在这个任务的维度上，需要的其实是更接近执行层的指引，管理方式和能力层级之间，错配了。

但是，以上所有这些讨论，其实都还停留在我们当下、今天的游戏里。

AI、Agent、模型一定是会继续进化的。

Cladue Fable 5马上可能就要回来了，GPT-5.6也要上线了，可能要不了多久，Claude Fable 6、GPT-6也会来了。

也许三个月后，也许半年后，你手上用的每一个模型都能接策略层的目标，都能自己设计方案，都能在你没想到的地方做出超出你预期的判断。

甚至，未来还会出现合伙人级别的模型。

到那个时候，当你面前坐着十几个合伙人级别的Agent，每一个都比你聪明，每一个都比你高效，每一个都能在它的领域里交出你想不到的方案。那你作为管理者，到底还有什么存在的理由呢？你的精力、你的思考、你的时间，到底应该投资在什么地方呢？

这个问题，在这个小小的假期中，浮现了出来。

我想了很久答案，最后，我想到了一个人，叫德鲁克，就是这个老头，被誉为现代管理学之父。

他的思想，如果被归纳成一句话的话，我觉得就是：

"管理者的工作，是思考应该思考什么。"

大多数人每天在做的事情，是思考怎么做这件事，怎么写更好的代码，怎么做更漂亮的PPT，怎么跑更快的模型，怎么写更精准的prompt，这些是执行层的思考，不用想，AI进步的速度在这些事情上比人快一个数量级，你从Coding和Agent的进化上就能看出来了。

再高一层，是思考做什么。比如做哪个产品，切哪个市场，选哪个技术路线，这些是策略层的思考，Fable 5级别的模型已经开始在这个层面展现出惊人的能力了。

但德鲁克说的不是这两层，他说的是第三层，"思考应该思考什么"。

这一层的意思是，你有没有能力判断，在所有可能思考的问题里面，哪几个问题才是真正值得你坐下来想的。

换句话说，我们每个人的注意力和精力都是有限的，我们到底应该如何保护自己的精力，聚焦在真正值得我们注意的问题之上。

AI时代，目前看，在逼着所有人往第三层走。

因为第一层和第二层的思考，AI都会越来越擅长，你在这两层上的优势，会被模型能力的增长不断蚕食。

只有第三层，什么问题值得想这个判断，AI过去、现在、未来都做不了。

倒不是说AI不能帮你列出选项、做决策树、分析利弊，这些它绝对都能做，而且做得比你快。

但最后那一下，在所有分析都摆在桌面上之后，你选A还是选B，这个选择背后站着的，是你这个人的价值观、你的审美、你对世界的理解、你愿意为什么承担代价。

这些东西，是计算不出来的。

因为它们不是计算问题，是选择问题。

计算有最优解，选择没有。

选择只有你选的和你没选的，然后你用你的余生去承受这个选择的后果。

AI可以穷举所有可能的路径，给你每一条路的概率分布和预期收益。

但这条路值不值得走，这个判断，永远只能由一个真实活过的、痛过的、做过错误选择并且承受过后果的人来做。

这就是为什么管理学读到最后，一定会走向哲学。

你去看德鲁克后期的内容，越写越像搞哲学的，怎么做计划、怎么定KPI他也不说了，他开始聊什么是有效的人生、什么是值得追求的东西。

还有稻盛和夫，他一辈子管理思想的核心就一句话，"作为人，何谓正确"，因为他发现，当你管理的层级足够高的时候，所有的商业判断到最后都会变成一个伦理判断，你到底相信什么，你愿意守住什么。

所以我现在的想法是这样的。

很多人觉得AI越强，人就越没用，但我觉得刚好反过来，AI越强，你被推到的管理层级就越高，从一个执行者的位置被推到管理者，从管理者被推到战略制定者，从战略制定者被推到一个更接近哲学家的位置。

你会被这个时代逼着，越来越往上升职，而你能不能接住这个新的位置，取决于这些年，我们到底有没有在积累真正不可替代的东西。

如果不能，那可能就会像五代十国里的石重贵和耶律德光，被时代无情的碾过，然后吞噬。

真是一个残忍，又吃人的时代。
