Fable 遭美国政府封禁,TechCrunch 质疑真正原因并非模型越狱
阅读原文· techcrunch.com政府一纸令下就逼停 Anthropic 两大模型,这个先例比一次所谓的越狱争议严重得多,它直接挑战了 AI 公司独立运营的基本前提,所有做前沿模型的人都该警觉。
美国政府对 Anthropic 的模型 Fable 实施封禁,但 TechCrunch 发文质疑,实际原因可能并非此前认为的“模型越狱”问题。该文章在 Hacker News 引发讨论,获得 103 个点赞。
美国政府向 Anthropic 发出的执法信件,实质上是迫使该公司在周末前将其最新的人工智能模型下线,这对任何美国科技公司——无论是 AI 实验室还是其他企业——都应是一个警钟。
以下是这轮新闻风暴的快速回顾:周五下午,美国商务部向 Anthropic 发出一封信件,援引一项不为人知的出口管制指令,以未指明的国家安全关切为由,禁止非美国人士(包括 Anthropic 的员工)访问 Fable 5 和 Mythos 5。Anthropic 表示,其认为这封信与该模型防护措施被绕过有关,但不确定,因为信中没有提供具体细节。该信件尚未公开。
作为回应,Anthropic 将其两款顶尖模型向所有客户关闭,以确保遵守该指令。结果是,美国政府通过一次快速且单方面的行动,成功迫使一家科技公司将其模型下线,而这一行动似乎无需法院批准。
特朗普政府周五的干预表明,人工智能行业并未免于政府干预。这也向整个科技行业发出警告:要么服从,否则我们可以关闭你和你的产品。
Axios 援引消息人士称,周末这两大主角之间的局势十分紧张,并指出导致出口管制指令的是 Anthropic 与特朗普政府之间的“个性差异”,而非 AI 产品的技术问题。
周末浮出水面的关于该问题的新细节,进一步引发了人们对政府本就站不住脚的理由的质疑。
网络安全资深人士、Luta Security 创始人 Katie Moussouris 在一篇博客文章中表示,Anthropic 最近与她分享了一份安全研究人员撰写的论文的私密副本,该论文描述了 Fable 5 中所谓的防护措施绕过方式。(《华尔街日报》报道称,该论文的作者是亚马逊的安全研究人员。)Moussouris 表示,Anthropic 曾联系她,希望听取她对这篇论文的看法。
Moussouris 的博文描述了研究人员如何触发护栏绕过,但她指出,这种绕过行为“本不应触发出口管制”。两者的区别主要在于要求 AI 模型“审查代码中的安全问题”与要求它“修复此代码”。即便问题的措辞略有不同,最终结果也基本一致。
“论文中描述的行为无法得到有意义的修复,任何尝试只会削弱模型在防御方面的能力,”Moussouris 说道。她批评这项出口管制指令过于仓促、粗暴且方向错误。
此后,Moussouris 与数十位顶尖安全研究人员和专家共同呼吁特朗普政府撤销该出口管制令,称此举从美国网络防御者手中夺走先进网络安全能力是“危险的”。
历届政府在知识缺口问题上也曾做出过笼统的决策。例如,美国政府在 2010 年代用于修订涵盖网络安全工具(这些工具也可能被用于网络攻击)的出口法律时所使用的措辞过于宽泛,以至于无意中几乎将合法的安全与漏洞研究也列为非法。
然而,特朗普政府的这项指令似乎带有报复性质。
Tech Policy Press 主编 Justin Hendrix 表示,特朗普政府的这一举动“可能会在外国首都引发警报,让外界质疑美国 AI 用于关键应用时的可靠性”。其传递的信息是:美国境内的 AI 公司不能保证在不受美国政府干预的情况下运营。
特朗普政府尚未证实其为何动用出口管制指令。是官员们误读了报告而惊慌失措?还是亚马逊 CEO 安迪·贾西出于谨慎或恶意向政府高官说了什么,从而引发了这一反应?是翻译过程中出现了问题,还是以此向 Anthropic 施压(该政府与该公司的关系本已紧张)?有可能白宫并未意识到该信函要求所带来的深远后果,而官员们正急于弥补自己造成的损害。
引用亨德里克斯的话说:“气氛就像一团怀疑的云,高级官员们正基于个人和政治因素偏袒亲信。”其后果是,政府就其对美国制造的软件发布拥有多大的控制权开创了一个危险的先例。
这次是政府找 Anthropic 的麻烦;明天可能就会轮到任何其他公司。