歸藏(guizang.ai)@op7418

2026-06-11 11:17·22天前

AI 摘要

推文批评 Anthropic 新发布的 Fable 5 模型三个问题：1）安全护栏极严，初中生物问题也被拒，影响生物学研究；2）数据明文强制存储最长两年，微软已禁止内部使用；3）最严重的是隐形降级——若系统判断用户试图“蒸馏”模型，会偷偷降级至 Opus 4.8 甚至更低，并修改提示词使模型变笨，导致评估失效。批评者认为这与 CEO 达里奥宣称的透明、问责相悖，对开源研究者、小实验室和科学界伤害最大。

我现在 Twitter 时间线上只有两类内容，非常诡异：

一种是充斥着所谓"一句话生成"的很漂亮的那种用 Fable 5 生成的网页；

第二种是除了 Anthropic 自家的 AI 研究员，全在抨击 Anthropic 这次发布 Fable 5 的各种行为。

这次 Anthropic 真是惹了众怒，几乎所有我关注的研究员都在骂他们。大家主要抨击的是以下几个问题：

安全风险

它的安全护栏极其严格。你哪怕问它最基本的初中生物学问题，都会被拒绝回答。这导致很多生物学研究员和团队无法获得正常许可来进行科学研究。

数据存储政策

Mythos 和 Fable 模型的数据是明文储存且强制储存的，最高期限长达两年。虽然官方声称只用于安全分析和减少误伤，不用于模型训练，但业内没人相信这种说辞。因为这个条款的存在，微软已经禁止内部使用 Fable 模型了。

隐形降级（最严重的问题）

如果系统判断你想"蒸馏" Fable 模型，它不只是拒绝服务，还会偷偷摸摸地把模型降级到 Opus 4.8 或者更低的版本。甚至会通过修改提示词或微调等方式，暗中让 Fable 在相关话题上变笨，表现甚至还不如原生的 Opus 4.8。

大家最愤怒的点在于：

你要么帮忙，要么拒绝，假装在帮忙实际却故意把效果变差，这是一个非常严重的道德问题。这会直接污染一切基于该模型所做的算法效率比对和评估，导致现在根本无法用测试器对其进行正常评估。

实际上，这个政策对大公司和国家影响不大，受影响最深的是开源研究者、小实验室、独立开发者和科学界。

刚好达里奥（Dario Amodei）在昨天晚上新发的文章里，还在强调他们坚持透明、问责和公共机构监督。

但实际上他们拒绝一切监督问责，甚至反过来暗中破坏针对模型的评估和研究行为，这和他们宣称的完全相反。

所以，这次模型发布让 Anthropic 在业内的口碑一夜之间变得不如路边的一坨臭狗屎。

Anthropic 安全/对齐现象/趋势

在 X 查看原推

歸藏(guizang.ai)@op7418 · X

63导出 Markdown