76位网络安全专家联名要求撤销美国政府对Anthropic最强模型的出口禁令

2026-06-15 23:29·17天前·Lorenzo Franceschi-Bicchierai

AI 摘要

76名网络安全专家联名致信美国政府，要求撤销对Anthropic的Fable和Mythos模型的出口管制令，称此举将最强模型从防御者手中夺走，在对手快速进步时非常危险。美国政府近日以国家安全为由要求Anthropic限制出口，Anthropic已暂停全球用户访问。Mythos预览时仅约50家公司可用，后扩展至15国约150组织；其公开版Fable设有严格防护栏，几乎阻止所有网络安全提示。专家认为白宫可能依据亚马逊一篇未公开论文，但该论文仅让模型修复开源代码中已知漏洞，未展示真正越狱，且称该方法可在OpenAI的GPT-5.5、Anthropic的Claude Opus 4.8和Sonnet、以及月之暗面的Kimi 2.7上复现。

AI 翻译 · 中文

一个由数十名网络安全专家组成的团体，其中包括多位业内知名资深人士，向美国政府发布了一封公开信，要求其解除对Anthropic的Fable和Mythos模型的出口管制令。

根据这封公开信，“这一举措从[网络安全]防御者手中夺走了最好的模型”，他们现在无法使用这些模型来发现漏洞、提升自身软件和产品的安全性。

信中写道：“在对手快速进步时，毫无充分理由地从防御者手中夺走最强能力，这是危险的。”

据Anthropic称，上周五，美国政府以国家安全为由，命令Anthropic限制Fable和Mythos的出口，但未说明该命令背后的具体原因。作为回应，该公司暂停了全球所有用户对这两个模型的访问。

截至本文发布，这封信已获得76位网络安全专家的签名，其中包括：Facebook前首席安全官Alex Stamos；漏洞悬赏平台Bugcrowd创始人Casey Ellis；著名密码学家、前苹果安全设计与架构经理Jon Callas；计算机科学家Paul Vixie；Block前应用安全工程主管Dino Dai Zovi；Luta Security创始人Katie Mossouris；以及安全认知培训公司SocialProof Security的首席执行官Rachel Tobac。

当Mythos于4月以预览版形式推出时，Anthropic声称它在发现安全漏洞方面非常强大，以至于公司需要严格限制访问，以防止恶意黑客或外国对手利用它在互联网上造成混乱。实际上，这意味着Anthropic最初只让大约50家公司获得了Mythos的使用权限，最近又将这一群体扩大到约15个国家的150个组织。

上周，Anthropic发布了Fable，这是Mythos的公开版本。该公司表示，该版本具有严格的护栏，以阻止其在生物学、化学和网络安全领域的使用，并防止他人对模型进行知识蒸馏以进行复刻。Fable上的护栏非常严格，以至于许多网络安全专家发现，它基本上会拒绝任何与网络安全相关的提示词。

Anthropic表示，白宫的出口管制令可能是基于一份报告，该报告称存在一种方法可以绕过（即所谓的越狱）Fable，从而解锁其强大的Mythos级能力。

据公开信的签署人之一凯蒂·穆苏里斯（Katie Moussouris）透露，亚马逊研究人员在一篇尚未公开的论文中展示了该方法，但她本人已审阅过这篇论文。

但穆苏里斯在一篇博客文章中表示，这篇论文实际上并未演示一次真正的越狱。她写道，研究人员仅仅是在模型最初拒绝“审查代码是否存在安全问题”之后，要求 Fable 修复那些存在公开已知漏洞的代码，以及“故意植入的漏洞”。

“论文中描述的行为无法有意义地修复，任何尝试都只会削弱模型的防御能力，”穆苏里斯写道。“防御者需要能够让 AI 修复文件中的漏洞，解释修复为何重要，并编写测试来确认补丁生效。这不是绕过护栏。这是 AI 模型能为防御性安全所做的最有价值的事情：执行防御者每天都在运行的发现、修复和测试循环。”

穆苏里斯的批评在公开信中得到了呼应。公开信还指出，专家小组认为亚马逊论文中的方法“可以被复制”到 OpenAI 的 GPT-5.5、Anthropic 自己公开可用的 Claude Opus 4.8 和 Sonnet，“甚至包括 Kimi 2.7 等中国模型。”

该信还呼吁通过“民主的规则制定过程”制定透明且公平执行的法规，这些法规应基于行业和学术专家进行的科学研究，并且“仅在确保美国公众安全所必需的最低限度内使用。”

Topics

TechCrunch：AI（RSS）

70导出 Markdown