邮报用 30 个政策问题的测试戳破了‘中立’幻觉,GPT-5.5 左倾回答占 80%,Gemini 低调得多但也不是中立。值得看的不是哪个模型左右,而是它们用单一框架替用户做了取舍。
《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。
AI聊天机器人存在左翼偏见,据《华盛顿邮报》报道,ChatGPT 有 80% 的情况下会给出左倾的答案。
该测试使用了达特茅斯学院和斯坦福大学的一项研究中的一组结构化政治问题。
测试向每个模型询问了大约 30 个政策议题,包括税收、医疗保健、移民、枪支、平权法案和死刑。
GPT-5.5 在 80% 的回答中只给出了左倾立场,17% 给出了双方立场,仅 3% 给出了右倾立场。
Gemini 3.1 Pro 的情况则大不相同,93% 的回答中给出了双方立场,仅 7% 给出了左倾的答案。
Claude Opus 4.8 在 57% 的回答中给出了双方立场,而 Grok 4.3 是唯一一个右倾占比高达 33% 的模型。
更深层的问题不在于某个答案听起来是自由派还是保守派,而在于模型是否在用户看到权衡之前,就将一个政治争议压缩到单一的道德框架中。
这项测试表明,聊天机器人的行为受排名选择、拒绝规则、训练反馈和默认回答风格的影响,甚于受原始事实的影响。