AI招聘工具存在种族偏见和系统性排斥;黑人占比26%,亚裔占比15%
大规模实地研究揭示AI招聘存在显著种族偏见与系统性排斥,算法单一文化让同一批人被所有雇主拒绝,这是AI公平性领域近年最扎实的实证,做招聘产品的人和政策制定者都应该仔细读。
一项覆盖340万人、400万份申请、150家雇主和1700个职位的大规模实地研究发现,AI招聘筛选工具存在显著的种族歧视:26%的黑人申请者和15%的亚裔申请者遭遇算法对其族群的系统性排斥;若AI按推荐率最高群体(通常为白人)标准执行,将有4万份额外申请进入下一轮。多数雇主依赖同一第三方供应商算法,形成“算法单一文化”,导致10%提交4份申请者被所有职位拒绝。对比同期未用AI的招聘数据(8.3万份申请、108家财富500强企业),未发现此类模式。研究呼吁对算法招聘进行独立监管。
首项关于实际招聘算法的大规模研究发现,系统拒绝候选人的模式令人担忧。
毕业季来临,2026 届毕业生正进入多年来最艰难的劳动力市场之一。入门级岗位招聘速度放缓。与此同时,AI 工具让求职者发送申请变得比以往任何时候都更容易。岗位减少、申请增多的双重作用下,公司现收到的入门级职位申请数量几乎是 2022 年的三倍。AI 不仅改变了公司是否招聘,更改变了招聘方式。90% 的美国雇主使用 AI 筛选工具来排序和排名求职者,其中大多数依赖相同的少数几家第三方供应商。当一种算法影响众多雇主时,对求职者会产生怎样的影响?
我们追踪了 340 万人,他们向 150 家雇主、11 个行业领域的 1700 个职位发布了 400 万份求职申请。每份申请都由同一家第三方供应商构建的 AI 招聘工具进行评估。我们的新论文罕见地揭示了算法招聘的“黑箱”,表明这些工具加剧了种族偏见,并让同一批求职者在任何地方申请时都被拒之门外。
招聘 AI 流程如下:求职者提交申请,申请被发送至招聘 AI 供应商,供应商的机器学习模型进行预测,产生的“推荐”或“不推荐”标签被发送给雇主,以辅助决策。
大规模揭示种族偏见
我们发现了大量证据表明 AI 候选者筛选存在种族差异。为衡量不良影响,我们采用了 EEOC 的“五分之四规则”——该规则在某一群体的推荐率低于最高推荐群体推荐率的 80% 时标记该职位,这对应美国相关就业法(第七章)。我们发现,26% 的黑人求职者和 15% 的亚裔求职者申请了其种族群体受到 AI 系统歧视的职位。换个角度理解:如果 AI 以与推荐最受青睐群体(通常是白人求职者)相同的比例推荐黑人和亚裔候选人,那么他们的申请中会有 4 万份进入下一招聘阶段。
不利影响如何衡量至关重要。我们研究的这家供应商为许多雇主的多个不同职位筛选申请人。如果我们将它所有的推荐合并在一起——将这家供应商视为一个庞大的招聘流程——我们并不会发现不利影响。如果我们像评估不利影响时通常会做的那样,单独审视每个职位,那么我们在许多职位中都能暴露不利影响。例如,假设这个AI工具经常推荐黑人申请人去仓库岗位,却很少推荐他们去金融岗位。如果我们把所有职位平均来看,这两种模式就会相互抵消,仿佛并不存在歧视。这种全局平均掩盖了在每个职位上实际发生的歧视。
我们的研究发现,对黑人和亚裔申请人存在显著的不利影响。
算法单一文化可能导致系统性拒绝
我们还研究了因共同依赖单一招聘供应商而带来的新问题。在我们先前的工作中,我们从理论上推测,如果算法单一文化(即许多雇主依赖同一套算法推荐)出现,可能会导致一些人被排除在工作之外。利用我们收集的真实招聘AI推荐的大规模数据集,我们对这一假设进行了检验。我们发现,与各公司统计上独立做出决定的情况相比,那些向由同一算法招聘供应商筛选的多个职位提交多份申请的人,更有可能被他们申请的所有职位拒绝。在提交四份申请的申请人中,有10%被所有申请单位拒绝。
我们的研究还发现,在其他情况下这种模式似乎并不存在。我们分析了此前规模最大的招聘决策研究数据,该研究在我们研究的同一时间段内,向108家财富500强公司发送了8.3万份申请,并且没有聚焦于是否使用AI来做决策。我们发现,在这批数据中,申请人被其申请的所有公司都拒绝的比率,并不高于各家公司彼此独立决策时你所能预期的水平。
这表明市场集中度至关重要:当一家招聘供应商主导某个行业的筛选流程时,候选人更有可能被排除在外。
我们发现,求职者投递的所有职位都被拒绝的概率,高于每个职位在统计上独立决策的基线预测值。
我们分析了此前最大规模的招聘结果研究数据,发现求职者被所有投递职位拒绝的比例,实际上可以由统计独立决策的基线有效预测。
AI 筛选工具同时具备三个不应共存于高风险决策中的特性:它们被广泛采用、影响深远、且对公众不透明。我们的研究在揭示 AI 招聘工具的后果方面取得了进展,但这项技术的许多影响仍不明确。随着使用大语言模型和智能体构建的新工具不断涌现,这一领域正在快速发展。
此项工作的关键启示在于,对算法招聘进行独立研究的价值和必要性。没有独立研究,就难以推行以证据为基础的 AI 政策,来监管 AI 对个人就业前景和整体劳动力构成的影响。
相关新闻
两个模型协同工作的表现比单个模型更差,这暴露了人工智能能力的一个关键短板。
HAI 主任 James Landay 探讨了历史上技术对生产率增长的影响。
斯坦福数字经济实验室主任、斯坦福 HAI 高级研究员 Erik Brynjolfsson 指出,认为“从 AI 中获得生产率的唯一途径是削减劳动力成本”是一种谬论,他认为企业通过让员工使用 AI 提升生产率,而非取代工人,可以获得更大的回报。