因安全顾虑,Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题
阅读原文· ithome.comAnthropic 昨日推出最强 AI 模型 Claude Fable 5(Mythos 级),其在生物学领域能力突出,但为防范生物武器风险,设置极为保守的安全限制,导致模型拒绝回答“细胞膜”“线粒体”等大量基础生物问题,仅“什么是癌症”等极少数问题获回复,被拒提问转由 Claude Opus 4.8 解答。化学、网络安全类问题接纳度较高。Anthropic 表示此防护策略为临时取舍,未来计划面向生物专业群体推出解除限制的 Mythos 级模型。
IT之家 6 月 11 日消息,Anthropic 昨日推出了 ClaudeFable 5,称其为该公司目前面向大众开放的最强人工智能模型,并着重夸赞了其在生物学等领域的能力。但这款模型却无法解答高中生本应掌握的基础生物问题,而是会将相关提问转接给此前的旗舰模型 Claude Opus 4.8。
这并非因为 Fable 5 不知道答案,而是 Anthropic 从设计层面主动做了限制。
据IT之家了解,Fable 5 属于对外公开的“Mythos 级”模型。该系列模型在网络安全相关任务上能力极强,Anthropic 曾直言,贸然向公众开放这类模型存在极大风险。在 Mythos 级模型的漫长上线周期中,Anthropic 反复强调网络安全风险,而生物学领域是 Fable 5 安全限制最突出、约束也最严苛的板块。
外媒 The Verge 实际测试后发现,这款模型会拒绝回答大量基础生物问题,其中不少问题完全不存在安全隐患。无论是“介绍一下细胞膜”“讲解被称作细胞‘动力工厂’的线粒体是什么”,还是解释引发疯牛病的朊病毒、信使 RNA 疫苗的作用原理,它都一概不予回应。
这类限制同样适用于日常、本身并无危害的医学问题。面对“花粉症的成因”“哮喘药物的作用原理”“抗生素耐药性如何产生”以及“埃博拉病毒及其传播方式”等提问,Fable 5 也都会拒绝作答。仅有部分基础问题偶尔能得到回复,比如“什么是癌症”“什么是 DNA”。每当 Fable 5 拒绝回应时,Opus 4.8 基本都能给出完整解答。
Anthropic 表示,大范围屏蔽生物相关问题是刻意之举,且防护标准设置得极为保守,核心顾虑是防范生物武器相关风险。公司发言人帕鲁尔・马赫什瓦里称:“随着首款 Mythos 级模型 ClaudeFable 5 上线,我们意识到,如今 AI 模型完成现实科研任务的能力大幅提升,居心不良者也有可能利用这类模型开展高风险生物研究。我们一直借助分类器拦截模型回应生物武器相关请求。为安全推出 Fable 5,我们必须采取偏保守的防护策略,屏蔽绝大多数和生物研究相关的提问。”