为什么 Meta 正在摧毁自己的工程组织?
这家社交媒体巨头的领导层一直在以 AI 为驱动力对其工程组织进行疯狂整顿。我们报道一下发生了什么
你好——我是 Gergely,本期《Pragmatic Engineer 通讯》免费版由我撰写。在每一期中,我都会从高级工程师和工程领导者的视角,剖析大型科技公司和初创公司面临的挑战。订阅即可每周在收件箱中收到这样的深度解析:
许多订阅者会将这份通讯作为学习与发展预算来报销。如果您有此类预算,可以参照以下邮件模板发给您的经理。
二十年来,Meta 一直拥有一个独特且高效能的工程组织;直到今年四月左右。在公司存在的头二十年里,它秉持着“快速行动,打破常规”的文化,而在 2020 年代初期,这种文化转向了“在稳定基础设施上快速行动”。我认识的在 Meta 工作的工程师,曾被赋予权力去做好工作、专注于影响力,并在商业利益与扎实工程之间取得平衡。
但在过去几周,这一切都变了,仿佛领导层一直在按照详细的蓝图,以最冷酷高效的方式摧毁一个经过验证且成功的工程文化。
过去几周里,我一直在分享这家社交媒体公司内部工程师们的糟糕处境——这里曾是硅谷最受推崇的工作场所之一。在本文中,我们将回顾所发生的一切,并追问领导层究竟在想什么:他们正将软件工程从 2004 年到最近一直是利润中心的位置,在短短几周内降级为备受鄙视的成本中心。
我们将涵盖以下内容:
Meta 的 AI 前工程文化
投资 AI 并迫使工程师始终使用它
核心工程人员感觉被当成垃圾对待
有史以来最尴尬的宕机
内部混乱
自残式创伤
“AI 精神病”只是 Meta 的问题吗?
1. Meta 的 AI 前工程文化
我会将 Meta 的工程文化分为两个时代:“快速行动,打破常规”,以及后来的“在稳定基础设施上快速行动”。
“快速行动,打破常规”
在 2010 年代,Facebook 独特的工程文化在科技行业中几乎成了传奇——这家公司反其道而行之,违背了传统最佳实践,却取得了巨大的成功。
2012 年,当 Facebook 突破十亿用户大关时,公司制作了一本关于其文化的小册子,放在每位员工的办公桌上。这本小册子采用复古的宣传画设计,被戏称为“小红书”,借用了毛泽东主席著名著作(1964 年)的书名。
这本约 70 页的小册子,将 Facebook 的工程文化系统化地总结为:速度、无畏、主人翁精神和打破常规。
当时,Facebook 小红书里的这些口号不仅印在册子里,还遍布整个园区,包括:
快速行动,打破常规(Move Fast and Break Things)
完成比完美更重要(Done is Better Than Perfect)
更努力地失败(Fail Harder)
如果无所畏惧,你会怎么做?(What Would You Do If You Weren’t Afraid?)
每一天都像一周那么长(Every Day Feels Like a Week)
莱特兄弟没有飞行员执照(The Wright Brothers Did Not Have Pilot Licenses)
愚蠢的人才等待(The Foolish Wait)
命运眷顾勇敢者(Fortune Favors the Bold)
他们确实专注于打造好产品。这本小册子里还有:
“在稳定基础设施上快速前进”的文化
2022 年,我进行了一次深度挖掘,这是我们就 Meta 工程文化主题发布过的最长篇分析之一。那时情况已经发生了变化,过去那种鲁莽的做法基本消失了,取而代之的是“快速前进,但要依赖稳定基础设施”的原则。以下是我当时对 Meta 工程文化的描述:
“这种文化极度以工程为中心:远超大多数大型科技公司。这可能是因为马克·扎克伯格本人就是工程师,或者因为 Facebook 早期的许多创新都来自工程师。
关注个人影响力。影响力一直是 Facebook 关注的焦点。这一点从早期就非常明显,而且对创造影响力的关注至今未变。
与大多数大型科技公司的一个共同特点是,无论是工程文化还是整体文化,都极其注重个人影响力。这导致有些人只关注短期、可衡量的成果,并认为团队合作以及团队之间平分成果可能得不到同样的回报。”
缺乏严格的流程。Facebook 在所有大型科技公司中似乎拥有最少流程或标准化程度。甚至别想把它和亚马逊的工程文化以及那里无数的正式流程相提并论。但就算和谷歌、微软或优步这样的公司相比,Facebook 的流程也松散得多。这主要源于公司以工程为中心的性质,以及工程师们不喜欢流程。
对测试、文档或代码注释的重视程度出奇地低。与大型科技公司的其他公司相比,你会发现 Facebook 的自动化测试和文档少得惊人。内联代码注释也非常罕见。
一家由创始人兼工程师驱动的公司。Facebook 是少数几家创始人是工程师且仍担任 CEO 的大型科技公司之一。Netflix 是另一家,其联合 CEO 里德·哈斯廷斯在创办公司之前也是一名软件工程师。亚马逊直到最近也是这样的例子,但谷歌或苹果并非如此。也有一些较小的公司如 Cloudflare 是好例子,但它们都比 Facebook 年轻。
Bootcamp。一种独特的入职流程,与任何其他大型科技公司所提供的都不同。我们在“Bootcamp 与入职”部分会进一步介绍。
此外,Facebook 作为一款产品,拥有业内最复杂的自动发布系统之一。Instagram 拥有经过实战检验的基础设施,在此基础上推出一个新社交网络(Threads)几乎轻而易举,上线第一周就服务了 1 亿用户。
我在公司内部认识的工程师们都能干、有动力、有产品意识,他们的工作也受到赏识。首席执行官马克·扎克伯格极具影响力:他亲自编写了 Facebook 的第一个版本,始终贴近工程领域,并且非常重视软件工程师。那里的工程师们感觉自己在一个利润中心工作。
2. 投资人工智能并敦促工程师始终使用它
Meta 是苹果、微软、亚马逊、谷歌和它本身这五大巨头中唯一一家不拥有硬件平台或操作系统的公司。苹果有 iPhone、iPad 和 Mac,谷歌有 Android、ChromeOS 和 Pixel 手机,微软有 Windows,亚马逊有 Kindle。
回顾来看,如今的马克·扎克伯格似乎已下定决心不再错过任何一个平台级机遇——毕竟公司在2010年代未能成功打造自己的移动操作系统或手机。
这是他在 Oculus 的虚拟现实(VR)和 Meta Glasses 的增强现实上投入巨大的原因之一。Facebook 在2021年更名为 Meta,当时 VR 和元宇宙看起来前景广阔。数十亿美元被投入以确保 Meta 成为该领域的市场领导者。但再一次,VR 并未走向主流;自疫情结束以来,大众对该领域的兴趣已大幅降温。
当2022年人工智能显然将成为大趋势时,扎克伯格没有错过:他组建了内部 FAIR 团队(基础人工智能研究团队)以及一个 GenAI 产品组织,并发布了一系列开放权重的人工智能模型:
Llama 1:于2023年2月发布,距 ChatGPT 推出三个月,由 FAIR 团队构建
Llama 2:于2023年6月发布,由 GenAI 产品组织构建(后续所有 Llama 模型均由该组织构建)
Llama 3:于2024年4月发布。该模型是 Meta 当时最具竞争力的大语言模型,并获得了整个行业的广泛采用
Llama 4:于2025年4月发布。该模型令人大失所望
同年6月,Meta 以惊人的1480亿美元收购了 Scale AI 49%的股份,以重振其人工智能努力,并请来 Scale AI 的首席执行官 Alexandr Wang 接管 Meta 的人工智能战略。以20亿美元收购中国初创公司 Manus AI 的提议目前因中国阻止交易完成而悬而未决。
基于对 Scale AI 和 Wang 的投资,很明显 Meta(以及扎克伯格)决心打造一个能与最新版本 Claude 和 ChatGPT 相竞争的最先进大语言模型。但 Meta 基本需要从头开始,而能否实现就取决于 Alexandr Wang。
Scale AI 为 Meta 带来了非常具体的一类专长,它是业内最擅长以下方面的公司之一:
训练数据与标注:Scale 起步于(并至今仍以)为机器学习和人工智能训练提供高质量标注数据集而闻名,包括代码、文本、图像、视频等。
RLHF和微调:Scale运行的一套RLHF(人类反馈强化学习)流程,由人类为基础模型提供反馈,作为一个“人在回路”的数据引擎,许多领先的AI实验室使用它来创建更好的大语言模型。
王似乎拥有非常广泛的权限,可以从事他擅长的领域:创建训练数据、进行数据标注和RLHF。这项工作是通过利用Meta的工程团队劳动力,并对其进行监视来完成的。
问题1:追踪按键和鼠标点击,无法选择退出。四月底,Meta告知工程师们,他们被纳入一个追踪每一次按键和点击的系统,用于为Meta的新AI生成训练数据。无法选择退出。
毋庸置疑,这具有侵扰性并引发隐私问题:如果你登录个人银行账户,该工具会追踪你吗?当你写私人邮件或接听私人电话时呢?Meta没有进行任何咨询,也没有变通办法;只是一个自上而下的决定被强行推行。
本月,路透社报道称,员工们的担忧终于得到了倾听:
“Meta正在缩减其计划中收集员工鼠标移动、按键和其他操作作为AI训练数据的部分内容,该计划于周二在一份内部备忘录中宣布,此前数周内遭到了员工的强烈反对。
据由Meta AI模型构建超级智能实验室部门副总裁Stephane Kasriel撰写的备忘录称,新的控制措施将允许员工每次暂停数据收集最多30分钟,并可申请豁免参与该计划。
通过与现任Meta工程师的交谈,我了解到由于数据保护法规,该日志系统尚未在英国部署。
问题2:核心团队中30-50%的工程师被强制调岗至数据标注和RLHF,进一步激怒了员工。同样从四月底开始,产品工程团队接到了上级指令,要求30-50%的工程师离开团队,加入ADO组织(Agent Data Optimisation,智能体数据优化)。
“强制”重新分配在这里非常关键,因为 Meta 传统的工程文化。从 2004 年创立到去年之前,Meta 给予工程师自主权,让他们自己选择在哪里工作、做什么工作。这曾是公司运作的基础:
工程师并非为特定团队而招聘(某些情况下 Staff+ 级别除外)。他们是受聘于公司整体的。
在为期 6 周的新兵训练营期间,新员工会熟悉 Meta 的工程文化,然后选择一个团队。
团队匹配意味着与多个有名额的团队沟通,跟他们做一些小工作,然后找到匹配。
内部转岗很容易,而且往往由工程师主动发起。
通过新兵训练营选团队的做法大约在 2024 年开始减少,但任何在 Meta 工作至少两年的工程师都知道,以前他们可以选择做什么工作,当然也可以选择做最有影响力的事情。然后,毫无征兆地,他们被分配到一个影响力不明、工作琐碎、做久了肯定会损害职业前景的部门。
“数据标注”是更复杂的工作,尽管有点重复。有一种标注任务,你创建一个网站,然后查看它并判断它看起来好不好,并给出反馈:这是“典型”的数据标注。但这类工作出现频率较低。不过还有更复杂的 AI 训练任务,看起来像这样:
想出 AI 应该完成的一个任务
然后编写能够确认结果的测试
把所有内容打包到 Docker 容器中,使用 Harbor 框架
然后阅读 AI 编写的代码——通常是基于多个模型的反馈来做这件事,并给出反馈
这项工作并不容易——你也能看出为什么需要优秀的软件工程师来干!——但它很快就会变得重复枯燥。大多数我交谈过的工程师都表示,很难日复一日地保持动力做这项工作。不过,我确实也与公司内部的一位工程师聊过,他说通过变换使用的技术、给自己设定挑战,他反而觉得这项工作既有动力又有趣!这位工程师预计,在训练阶段过去之后,会有更多的软件工程工作到来。这里有一个启示:当生活给你柠檬时,你可以抱怨,也可以像这位开发者一样,把它做成柠檬水。
这种训练工作在 AI 行业是保密的,供应商为做这类工作的开发者开出每小时 100 美元以上的报酬。业内传言,OpenAI 和 Anthropic 花在训练环境(让模型擅长编程)上的费用,甚至比模型训练本身还要高!
基础设施和安全团队受岗位调动的冲击尤为严重。我与几位基础设施部门的工程师聊过,他们所在团队有 30% 到 50% 的人被抽调到 ADO 部门。在某些情况下,离开的正是最优秀的工程师。
一位工程师告诉我,整个情况就像电影《饥饿游戏》——当参赛者被随机选中,然后从他们的环境中抽离,带到一个完全不同的地方。只不过在 Meta,受影响的人要多得多:一个 10 人团队中就有 3 到 5 个人从构建服务于数亿用户的产品,转而反复给 AI 生成的 GitHub 仓库提供人工反馈。所以,影响范围比《饥饿游戏》更广,但后果没那么严重。
ADO 部门大约有 6500 人,比 OpenAI 和 Anthropic 的总人数还多。其中大约 4000 到 5000 人是软件工程师。Meta 总共有大约 25000 名工程师,这意味着每 5 到 6 名软件工程师中,就有 1 人可能正在全职做数据标注。
可以想象,大家都很积极地寻找新职位,而且没有人在 LinkedIn 或其他地方把自己的职位头衔更新为“Meta 数据标注员”。
我和从事这项工作的人聊过,他们并不喜欢做这个,而且对自上而下的决策方式感到沮丧。唯一的好处是,他们还有工作、保留了薪资,而且没有被裁。他们还有时间离开 Meta,去找一份薪资相当、又不是数据标注的工作。
3. 核心工程人员感觉像被当垃圾对待
问题 #3:长达一个月的等待游戏,在全公司制造恐惧。4 月 20 日,路透社报道称 Meta 计划在一个月内裁掉 10% 的员工,Meta 也证实了这一消息,这意味着在四周的时间里,所有人都知道自己可能很快失业。
强制调岗去做数据标注开始发生。正如我当时报道的那样:
“可以理解,对于这种(向数据标注的)重新调配,大家感受复杂,毕竟裁员即将到来。5 月 20 日(周三),Meta 将宣布裁员。也许那些转去做数据标注的人,实际上比产品团队的同事更‘安全’。当然,这只是猜测,但如果 Meta 裁掉那些被调去干数据标注的开发人员,那就太残忍了。”
问题 #4:Meta 的绩效评估极其激进,所以开发人员会优化所有指标。我了解到,与谷歌和苹果相比,Meta 内部的绩效评估流程 PSC(绩效总结周期)非常严格。Meta 内部的经理们会为了员工的薪资包“争斗”,这包括“压低”其他团队工程师的薪资包,以便让自己的直接下属排得更靠前。在这个过程中,将指标武器化是常态——无论是业务影响、代码审查次数、代码行数,还是 AI 相关指标(参见我们关于 Coding Machine 原型的播客)。
每个‘档位’分配多少员工的名额会下发给经理,随着经理们试图让自己的下属进入更高的档位,内部政治变得激烈起来。
几年下来,Meta 的工程师都学会了,想得到不好的 PSC 评分,最好的办法就是让所有指标——影响力、提交的代码以及其他数字——都比同事高。了解更多关于绩效校准的内部政治。
问题#5:模型 token 被认为是绩效的一部分,因此开发者们极力优化它。当裁员被确认后,工程师们还了解到,管理者将在绩效评估中检查 token 数量。这引发了担忧:那些 token 数量较低的员工可能被标记为表现不佳者并被解雇。
那么,作为 Meta 的一名工程师,对此的自然反应是什么?他们开始使用 AI 工具来生成更多的 token。这发生在 Meta 内部有一个 token 排行榜,鼓励“token最大化”的时期。正如我在 4 月 16 日所写:
“据《信息报》报道,Meta 员工在 30 天内总共使用了 60.2 万亿个 AI token (!!)。如果按 Anthropic 的 API 价格收费,这将花费 9 亿美元。当然,Meta 很可能以折扣价购买 token,但那笔费用仍可能超过 1 亿美元——其中很大一部分来自毫无意义的‘token最大化’。”
最大的问题:人们不再关心实际工作,而是专注于表演性工作。让我们看看 Meta 领导层决定引入其工作场所的四个要素:
在法律允许的情况下,追踪所有工程师的键盘和鼠标点击情况
将相当一部分工程师重新分配,从事全职数据标注工作
让员工知道,其中 10% 的人将被解雇
建立一种文化,让开发人员优化在绩效评估周期(PSC)中测量的所有指标
将 token 使用量作为绩效评估周期(PSC)的一部分进行衡量
把这些要素充分混合,你会得到什么?两件事:
每个人都过度使用 AI 来提升他们的个人数据。一支尽可能多使用 AI、尽可能少投入人类输入的假装工作的工程队伍。这是一种奇怪的激励机制:因为未能正确审查代码而导致的中断,并不构成解雇的理由,但手动编写代码(而不是让 AI 智能体去写)却可能让你丢掉工作。
每一位任职时间较长的工程师都在寻找新工作,或者至少正在考虑。那些在 Meta 待得更久的人已经看够了。让我用视觉方式描述一下:
最新数据似乎证实,从五月份开始,Meta 有更多工程师在寻找“出路”。以下是一年半以来,Meta 员工注册头部大厂面试准备服务 interviewing.io 的变化情况:正如创始人兼 CEO Aliner Lerner 与我们分享的那样,可以看到五月份的注册量相比去年同期出现了大幅跃升:
(我们在《2026 年软件工程师就业市场深度分析》中涵盖了来自 interviewing.io 的更多数据以及其他有趣的数据来源。)
值得肯定的是,Meta 为留在团队中的几名被视为关键的工程师发放了慷慨的留任股权激励包。这些激励包让员工在其他地方获得同等薪酬变得更加困难。不过,我与一位获得了股权追加的工程师聊过,他表示这种做法反而帮助他下定决心尽快离开,因为面对缺乏自主权、无法掌控局面的状况,他感到非常沮丧。
4. 最令人尴尬的宕机事件
Meta 的核心基础设施和安全团队突然发现自己严重人手不足。大多数人正在推动由 AI 生成的代码,并搭配仅由 AI 进行的审查完成合并,对质量并不怎么上心。毕竟,他们一边要应对可能被解雇的风险,一边又要在一支团队最优秀的工程师人数已减半的情况下,奋力支撑着团队的运转——而所有人都知道,使用 AI 本身可能会影响自己的职业保障。
两周前,也就是 5 月 30 日,Meta 发生了历史上最令人尴尬的宕机事件。以下是软件工程师 Siddharth Sundharam 的总结(重点标记为我所加):
“昨天,一大波 Instagram 账号——包括一些高知名度账号,比如 Obama White House 账户——似乎被黑了。
听着,我可不是新手。我花了将近十五年的时间在独角兽级规模的系统中识别漏洞和利用点,但这无疑是我见过的最不严肃、‘几乎蠢得难以置信’的一次。
接管流程如下:
步骤 01:伪造位置并启动支持。攻击者要发起攻击,只需要你的账号用户名。接着,他们会连接一个靠近你所在城市的 VPN 或代理,这样 Instagram 的安全算法就不会起疑。(从你的公开个人资料或“关于”栏目,或者用上百种其他方法,很容易就能拿到这个信息。)当请求看起来来自正确区域后,他们告诉 Meta 支持 AI 说账号被黑了,并要求它将验证码发送到攻击者控制的任意电子邮箱。
步骤 02:仅此而已。真的,就这些。
这是我见到的第一个真正投入生产的零认证密码重置。似乎完全没有额外检查所提供的邮箱是否真的是用户之前用过的。一旦 AI 将安全码发送到攻击者的邮箱,攻击者就将该码传回以完成验证。平台随之给出一个新的密码重置链接,将账号的完全所有权交给攻击者。
这是一起安全漏洞事件:Meta 将其额外安全、加固的前门敞开着,任何人都可以进来,而且事件发生时没有任何警报通知任何人!看起来 Meta 只有在用户开始在社交媒体上举报时才发现。
通过与 Meta 内部人士交流,我了解到 AI 是此次故障的核心原因。AI 生成的代码、AI 审查的代码,再加上安全团队被掏空,共同导致了这起极其尴尬的事件。我四处打探后,汇总了以下信息:
Instagram 的信任与安全团队因数据标注和裁员,流失了约 50% 的员工。一些最资深的成员被调去从事 AI 训练任务。
在过去两个月里,整个代码库中非常普遍地出现了完全未经人工介入、仅由另一个 AI 进行代码审查的 AI 生成改动。导致这次故障的改动看起来就是其中之一。
正常情况下,信任与安全团队会负责安全漏洞的监控和告警,但目前该团队因内部快速重组而完全陷入混乱。
Meta 的首席安全官在第二天就辞职了。服务中断于 6 月 1 日(周一)得到解决,并作为 SEV 流程的一部分启动了调查。周二,Meta 的首席信息与安全官(CISO)Guy Rosen 宣布离职。
巧合吗?我认为并非如此:如果该 CISO 曾警告过安全部门会被削弱但被忽视,那么他可能因此辞职,并且不再信任领导层。我还推测,该 CISO 此前并没有将 Instagram 安全团队的一半人员调去做数据标注的想法。
作为补充说明,此前最严重的一次服务中断发生在 2021 年,由于 DNS / BGP 配置问题,Meta 所有服务宕机了七个小时。那次中断很糟糕,但在我看来,Meta 对后续处理做得不错。在 2021 年那次宕机后,Meta 发布了一份事后分析报告并道歉。但对于最近这次 Instagram 账户被劫持的服务中断,Meta 并未这样做。
5. 内部乱象
《连线》杂志披露了 Meta 内部目前形势有多糟糕的更多细节:
“本周早些时候,在 Meta 一场仅限员工参与的直播演示中,有人爆出一连串脏话,声称‘自己就是公司的狗’,”《连线》杂志听到的一段录音显示。随后,这名员工要求主持会议的人给某位 Meta AI 高管写信,并“告诉他,他是个垃圾”。
这起事件发生在一场面向数千名员工的直播会议上,反映出该公司应用 AI 团队内部日益增长的挫败情绪。该团队于今年 3 月成立,旨在支持 Meta 超级智能实验室的 AI 研究员工作。三位在职员工告诉《连线》,员工们普遍对 Meta 组建这个约 6500 名工程师和产品经理的团队的方式,以及他们被分配去改进 AI 模型的那种苦差事感到不满。
“这简直就是监牢,”其中一位员工声称。“你突然之间在生活中失去了所有目标,几乎不跟任何人交流,每周只有这些任务。”
还有更多:据报道,Meta 的首席产品官 Chris Cox 向员工承认,Meta 的高层领导(即他之上的那批人,也就是 Meta 的 C 级管理层)造成了这场混乱。同样来自《连线》的报道:
据《连线》听到的录音,在本周一场面向 Instagram 全体员工的会议上,Meta 首席产品官克里斯·考克斯谈到了过去几个月里"这家公司的疯狂"所造成的"艰难"和"残酷"环境。他赞赏 Instagram 员工在推出功能、服务约 20 亿用户的同时,还能顶住他形容为"在冰雹中跑马拉松,然后队友被换掉,接着我们还在拍你"的压力。
"这算什么鬼东西,"他说道,引得一片笑声,然后重复了一遍自己的话。"这简直就是什么鬼东西。"
6. 自找的伤口
那么,正如 CPO 克里斯·考克斯所说,"这家公司的疯狂"到底有没有根源?我采访过的工程师们将矛头指向了两个人:马克·扎克伯格和亚历山大·王。扎克伯格完全掌控着公司,他决定将相当一部分工程人员重新分配到数据标注岗位、推行追踪软件,并在 Meta 实现创纪录收入和利润时裁掉 10% 的员工。作为 CEO,责任显然在他身上。
但很难不注意到——除了裁员之外——Meta 所做的一切都照搬了 Scale AI 的剧本,而这显然来自王:
强制记录键盘敲击和鼠标移动以生成训练数据
强制 4500 多名工程师进行数据标注,是为了获得高质量的 RLHF 数据,显然用于 Meta 正在构建的编程大语言模型
从业务核心部门抽调最优秀的工程师——这当然得到了马克·扎克伯格的批准,他认为对 Meta 来说,训练一个编程 AI 比可靠运营 Instagram、Facebook 或 Messenger 等核心业务更重要。哦,我有没有提到上周六(6 月 12 日)Facebook 和 Instagram 又发生了一次 SEV0 级别的事故,也就是全面宕机?
在这一切发生之前,Meta 原本有望在今年年底超越谷歌成为全球第一的广告业务公司。但不知为何,马克·扎克伯格认定构建一个编程大语言模型更为重要。
据报道,Meta 的领导层正在试图挽回他们造成的一切损失。《连线》杂志爆料称,Meta CTO 安德鲁·博斯沃思向员工承认,AI 重组搞得一塌糊涂,并承诺未来会改进沟通。
在我看来,扎克伯格显然不在乎工程师们对这些巨大变革的感受,而博斯沃思很可能对混乱局面视而不见——与此同时,工程师们心里清楚,对于公司而言,下一代 AI 模型比他们自己重要得多。博斯沃思还表示,员工将能使用 AI 辅导工具。在当前局面下,这还真是"体贴"啊!
根据我了解到的情况,Meta 的工程师文化已经死了,因为领导层已经明确表示,公司的工程部门就是一个成本中心。
不用说,我希望自己的判断完全错误,但截至目前,我从马克·扎克伯格和亚历山大·王——这两位制造当前混乱的高管——身上看不到任何与此相反的迹象。如果数据标注任务分配、员工追踪这类重大改革能立刻撤销,Meta 或许还有短暂的机会恢复常态。当前状况持续得越久,就会有越多的资深工程师选择离开。
7. “AI 狂热症”只是 Meta 的问题吗?
看到 Meta 的技术创始人如此沉迷于 AI,以至于忽视了那些打造公司核心的工程师,实在令人痛心。但 Meta 是孤例吗?
Mitchell Hashimoto(Ghostty 的创建者,HashiCorp 创始人)表示,他在其他创始人身上也看到了类似行为(引用原文,强调是我加的):
“我强烈认为,目前有些公司正深陷‘AI 狂热症’,根本没法跟它们理性地讨论这件事。我不能点名具体是谁,因为其中包括我非常尊敬的私人朋友,但我很担心这会演变成什么局面。”
我亲身经历过云迁移和云自动化时期基础设施领域关于 MTBF 与 MTTR(平均故障间隔时间 vs 平均恢复时间)的那场大辩论。现在那些争论又卷土重来了,只不过这次涉及的是……整个软件开发行业(也许实际上是整个世界)。
这很可怕,因为“精神病帮”几乎完全信奉“MTTR 就是一切”的心态:“发布有 bug 的代码没问题,因为智能体会飞快修复它们,而且规模是人类做不到的!”我们在基础设施领域学到过,MTTR 固然好,但你绝不能彻底抛弃弹性系统。
主要问题在于,我甚至不知道该如何向身边认识的人提起这件事,因为一提这个话题就会立刻被驳斥,比如“不不不,它有完整的测试覆盖”,或者“bug 报告正在减少”之类,这些根本不能反映全貌。
我们曾经在基础设施领域学过这一课:你可以通过自动化把自己变成一台高度有韧性的灾难机器。系统从局部指标看可能很健康,但在全局层面却变得不可理解。Bug 报告可以下降,而潜在风险却在爆发。测试覆盖率可以上升,而语义理解却在下降。变化发生得如此之快,以至于没人注意到底层架构正在腐朽。
我很担心。
Instagram 的接管故障正是如此:工程团队降低了 AI 生成和 AI 审查代码的质量门槛,大概指望能从故障中快速恢复。他们确实恢复了……但损失已经造成——高调的 Instagram 账号被黑,系统被入侵,而且这一切都非常公开。
Mitchell 强调了一个具体担忧:创始人高估了 AI 的能力,因此在将代码发布到生产环境时,抛弃了合理的防护措施。
要点
我们大多数人或许都能从 Meta 因过度聚焦 AI、排斥作为公司命脉的人员而导致的灾难性事件中吸取教训。好消息是,我听说在英国,部分 10% 的裁员突然被取消了:在强制咨询期结束时,几个基础设施和安全团队得知,他们团队里原本预计要裁掉的工程师都不会被解雇了。
梅塔(Meta)目前业务蒸蒸日上,并通过增加广告收入已经从人工智能中获益。与此同时,我的 Facebook 信息流里充斥着 AI 生成的虚假视频,下面还有成百上千条来自机器人和那些似乎没意识到这是 AI 内容的用户的评论。这一切看起来都只是 Meta 用以在旁边投放广告的更多内容而已。
然而,尽管业务一片繁荣,Meta 的领导层却发起了一场对其工程组织造成最大破坏的行动。显然,他们现在才意识到其中大部分努力都是毫无意义的。
如果你身处领导岗位,正因 AI 相关的理由而想要进行激进的架构调整,请深吸一口气,看看 Meta 如今的处境。与此同时,如果你是一家领导层过度押注 AI 的公司里的工程师,不妨考虑把这篇文章转发给他们,作为额外的背景参考。
如果你正在招聘那些深度参与 AI 实践的杰出工程师,那么现在从 Meta 挖人比以往任何时候都容易。我认识的每个还在 Meta 的工程师都是 AI 最早期的采用者,并且知道如何构建产品和 AI 基础设施。这些人对公司和领导层已经心灰意冷。Meta 的人才流失将成为其他初创公司和大型科技公司的收获;这大概是 AI 带来的一个有点意想不到的好处——尤其是对 Meta 自己来说!
似乎那句古老的格言“快速行动,打破常规”如今已经延伸到了 Meta 自身的工程组织上,公司急于在 AI 上过度投资,以免错过科技行业最新的这一大趋势。




