76位网络安全专家联名要求撤销美国政府对Anthropic最强模型的出口禁令
阅读原文· techcrunch.com76名网络安全专家联名致信美国政府,要求撤销对Anthropic的Fable和Mythos模型的出口管制令,称此举将最强模型从防御者手中夺走,在对手快速进步时非常危险。美国政府近日以国家安全为由要求Anthropic限制出口,Anthropic已暂停全球用户访问。Mythos预览时仅约50家公司可用,后扩展至15国约150组织;其公开版Fable设有严格防护栏,几乎阻止所有网络安全提示。专家认为白宫可能依据亚马逊一篇未公开论文,但该论文仅让模型修复开源代码中已知漏洞,未展示真正越狱,且称该方法可在OpenAI的GPT-5.5、Anthropic的Claude Opus 4.8和Sonnet、以及月之暗面的Kimi 2.7上复现。
一个由数十名网络安全专家组成的团体,其中包括多位业内知名资深人士,向美国政府发布了一封公开信,要求其解除对Anthropic的Fable和Mythos模型的出口管制令。
根据这封公开信,“这一举措从[网络安全]防御者手中夺走了最好的模型”,他们现在无法使用这些模型来发现漏洞、提升自身软件和产品的安全性。
信中写道:“在对手快速进步时,毫无充分理由地从防御者手中夺走最强能力,这是危险的。”
据Anthropic称,上周五,美国政府以国家安全为由,命令Anthropic限制Fable和Mythos的出口,但未说明该命令背后的具体原因。作为回应,该公司暂停了全球所有用户对这两个模型的访问。
截至本文发布,这封信已获得76位网络安全专家的签名,其中包括:Facebook前首席安全官Alex Stamos;漏洞悬赏平台Bugcrowd创始人Casey Ellis;著名密码学家、前苹果安全设计与架构经理Jon Callas;计算机科学家Paul Vixie;Block前应用安全工程主管Dino Dai Zovi;Luta Security创始人Katie Mossouris;以及安全认知培训公司SocialProof Security的首席执行官Rachel Tobac。
当Mythos于4月以预览版形式推出时,Anthropic声称它在发现安全漏洞方面非常强大,以至于公司需要严格限制访问,以防止恶意黑客或外国对手利用它在互联网上造成混乱。实际上,这意味着Anthropic最初只让大约50家公司获得了Mythos的使用权限,最近又将这一群体扩大到约15个国家的150个组织。
上周,Anthropic发布了Fable,这是Mythos的公开版本。该公司表示,该版本具有严格的护栏,以阻止其在生物学、化学和网络安全领域的使用,并防止他人对模型进行知识蒸馏以进行复刻。Fable上的护栏非常严格,以至于许多网络安全专家发现,它基本上会拒绝任何与网络安全相关的提示词。
Anthropic表示,白宫的出口管制令可能是基于一份报告,该报告称存在一种方法可以绕过(即所谓的越狱)Fable,从而解锁其强大的Mythos级能力。
据公开信的签署人之一凯蒂·穆苏里斯(Katie Moussouris)透露,亚马逊研究人员在一篇尚未公开的论文中展示了该方法,但她本人已审阅过这篇论文。
但穆苏里斯在一篇博客文章中表示,这篇论文实际上并未演示一次真正的越狱。她写道,研究人员仅仅是在模型最初拒绝“审查代码是否存在安全问题”之后,要求 Fable 修复那些存在公开已知漏洞的代码,以及“故意植入的漏洞”。
“论文中描述的行为无法有意义地修复,任何尝试都只会削弱模型的防御能力,”穆苏里斯写道。“防御者需要能够让 AI 修复文件中的漏洞,解释修复为何重要,并编写测试来确认补丁生效。这不是绕过护栏。这是 AI 模型能为防御性安全所做的最有价值的事情:执行防御者每天都在运行的发现、修复和测试循环。”
穆苏里斯的批评在公开信中得到了呼应。公开信还指出,专家小组认为亚马逊论文中的方法“可以被复制”到 OpenAI 的 GPT-5.5、Anthropic 自己公开可用的 Claude Opus 4.8 和 Sonnet,“甚至包括 Kimi 2.7 等中国模型。”
该信还呼吁通过“民主的规则制定过程”制定透明且公平执行的法规,这些法规应基于行业和学术专家进行的科学研究,并且“仅在确保美国公众安全所必需的最低限度内使用。”
Topics