6月13日

20:57

Chubby♨️@kimmonismus

2026年6月12日，美国商务部依据国家安全法，要求Anthropic立即停止向外国人提供其最强模型Fable 5和Mythos 5。因无法实时区分用户国籍，Anthropic被迫在全球范围内关闭这两款模型。Fable 5于6月9日发布，定价$10/M输入token、$50/M输出token，号称经1000+小时红队测试无通用越狱，95%会话未触发降级。Axios报道称，商务部因其他公司演示越狱方式而行动，政府此前曾试图劝阻发布未果。模型需保持关闭直到政府安全基础设施"加固完毕"（未来几周内）。Anthropic已上五角大楼黑名单。

Anthropic 安全/对齐政策/监管

关联讨论 25 条

20:21

Hacker News 热门（buzzing.cc 中文翻译）

牧羊犬：由最危险的AI模型打造的游戏

游戏《牧羊犬》（Shepherd's Dog）由被称为“最危险的AI模型”所创作，在Hacker News获得101个HN积分，发布在 koenvangilst.nl 上。

Anthropic 安全/对齐

19:42

AYi@AYi_AInotes

Fable5下架真相：亚马逊研究员举报漏洞致商务部出口管制

Anthropic顶级模型Fable5全球下架并非此前猜测的防中国，而是美国本土竞争对手所为。亚马逊AI研究员向美国政府提交越狱演示，声称可攻破Fable5和Mythos5安全护栏，美国商务部随即下达出口管制指令，迫使Anthropic切断所有用户访问。Anthropic事后复测称该漏洞狭窄且非通用，其他公开模型也普遍存在，属过度反应。但行政命令已生效，所有用户不分国籍均受影响。事件显示前沿AI竞争已跳出代码和算力战场，规则制定权成为不可抗力。

AYi: 很多人都以为Fable5下架是为了防中国,但其实真正触发管制的,是美国本土的竞争对手, 大家都被官方的国家安全话术带偏了,默认下架是防范技术外流的常规操作。实际上真正触发这次管制的,是美国本土一家公司提交的越狱演示,他们证明Mythos的...

Anthropic 安全/对齐政策/监管

17:55

Chubby♨️@kimmonismus

美国政府首次干预AI模型发布：强制Anthropic切断Fable 5和Mythos 5访问

2026年6月12日，美国国家安全部门发布出口指令，强制Anthropic切断所有外国国民对Fable 5和Mythos 5的访问，实际导致两个模型对所有用户禁用。Anthropic遵守命令但表示反对。这是政府首次因担心AI过于强大且可被越狱而直接干预模型发布。指令仅针对外国实体，意在防止强大模型（尤其是网络攻击能力）被用于挑战美国国家主权。此先例表明，当模型足够强大时，政府不会将安全交给私营公司；对欧洲而言，这意味着AI主权丧失和对美依赖加剧。

Chubby♨️: Holy Sh*t, this is a novelty: The US government issued a national-security export directive on June 12, 2026, forcing An...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

17:36

IT之家（RSS）

精选80

谷歌Android安全负责人因反对军事AI合作辞职

谷歌Android平台安全负责人René Mayrhofer辞职，他在5月18日内部告别信中指责公司“丧失道德指针”，批评谷歌悄悄放弃碳中和目标（因AI模型能耗），并与美国战争部签署允许AI用于“任何合法目的”的协议。今年4月下旬谷歌宣布向五角大楼提供AI用于机密工作，2025年2月更新AI原则时移除了不使用AI开发武器或监控工具的承诺。Mayrhofer担忧谷歌AI产品可能被用于针对公民的大规模监控，包括自己和家人。

Google 安全/对齐行业动态

推荐理由：Android 安全主管因军事 AI 合作愤而辞职，并公开内部告别信，这是谷歌放弃不作恶后最响亮的内部抗议，暴露了 AI 伦理与商业利益的深层冲突。

16:55

Chubby♨️@kimmonismus

Wait - 所以亚马逊，Anthropic 最大的投资者之一，据称越狱了 Claude，然后又向美国政府告密？这不可能是真的。什么。

Theo - t3.gg: Wall Street Journal is reporting that Amazon reported the jailbreaks to the Department of Commerce, who instituted the b...

Anthropic 安全/对齐政策/监管行业动态

16:41

AYi@AYi_AInotes

Fable-5下架真相：美国本土竞争对手提交越狱演示触发管制

Pliny团队在Fable-5发布24小时内，用多代理协作、文本混淆等手段绕过其Mythos模型安全层，提取网络攻击代码、冰毒合成等高危内容并公开传播。真正触发美国政府出口管制的并非中国因素，而是美国本土一家竞争对手提交的越狱演示。Anthropic事后复测称此为狭窄非通用漏洞，同类问题其他模型也普遍存在。事件表明当前对齐技术难防结构化多步骤协同攻击，前沿模型已成地缘战略资产，普通用户沦为博弈代价。

AYi: 这或许就是 Fable-5 被美国政府下架/全面禁用的直接导火索之一, 不是很多人说的什么例行合规调整,关键是在发布刚满二十四小时之后,安全层就被人从头到尾扒穿了。 Pliny团队用多代理协作,把文本混淆,分解重组,学术包装一套组合拳打下来...

Anthropic 安全/对齐

关联讨论 25 条

16:02

The Decoder：AI News（RSS）

美国政府强制Anthropic关闭面向全球用户的Claude Fable 5和Mythos 5

美国政府以存在所谓越狱风险为由，要求Anthropic立即停止向全球用户提供Claude Fable 5和Mythos 5。Anthropic已服从命令，但公开反驳称漏洞极小，且竞争对手的模型如GPT-5.5也存在类似问题。该公司警告，此举可能开创先例，导致所有前沿模型部署被叫停。

Anthropic 安全/对齐政策/监管行业动态

关联讨论 25 条

15:55

Chubby♨️@kimmonismus

美国政府于2026年6月12日以国家安全为由发布出口管制指令，要求Anthropic暂停所有外国国民（含Anthropic外籍员工）对Fable 5和Mythos 5的访问。Anthropic遵守指令但表示不认同，称此为误解并为中断向所有客户道歉。实际执行中，Anthropic必须立即为所有用户禁用这两个模型，其他Claude模型不受影响。这是美国首次因担忧AI模型过于强大且可能被越狱而直接干预。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

13:41

AYi@AYi_AInotes

Claude Fable 5 发布24小时被越狱，美国政府紧急下架

Claude Fable 5 发布刚24小时，安全层即被 Pliny 团队用多代理协作突破——通过文本混淆、分解重组、学术包装，成功诱导模型生成网络攻击代码、冰毒合成路径等高危内容，并附实锤截图全网传播。该模型安全设计采用分层降级（底层 Mythos 模型+多层分类器），但防不住碎片化恶意拼接。10号越狱帖发酵后，12号美国政府直接下达出口管制指令，全球下架。事件暴露当前对齐技术难以防御结构化多步骤协同攻击，安全护栏只拦普通用户，高水平攻击者可轻易绕过。

AYi: 跟大家分享下绝版的Claude Fable 5总结的AI生图焚决,+2个顶级美女人像提示词,这篇至少值3000块! 昨晚睡前让Fable 5总结了AI生图之性感人像提示词最有效的写法: 1️⃣用"成人 + 气质 + 材质"来定人设,比如 2...

Anthropic 安全/对齐政策/监管

13:36

IT之家（RSS）

国家安全部发布使用"AI 中转站"风险提示：警惕个人数据泄露

国家安全部6月13日发布专项风险提示，警惕“AI 中转站”泄露个人数据。“AI 中转站”是介于用户与AI模型官方API之间的第三方平台，运营主体不明、无备案，用户数据无安全保障。风险包括：数据被截留倒卖导致隐私泄露；使用低配模型冒充高端模型致结果失真；暗藏后门植入恶意代码远程窃取账号；未取得数据出境资质，擅自将数据传至境外服务器，可能造成商业机密乃至国家秘密外泄。

安全/对齐政策/监管

13:14

🚨 AI News | TestingCatalog@testingcatalog

美国以国家安全为由发出出口管制指令，要求 Anthropic 暂停所有外国国民（包括外国员工）对 Claude Fable 5 和 Claude Mythos 5 的访问。Anthropic 被迫立即禁用这两个模型以确保合规。目前未发现通用越狱，但存在特定越狱风险。其他 Claude 模型不受影响。Anthropic 认为此指令属于误解，正争取尽快恢复访问。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

11:09

elvis@omarsar0

因美国政府指令，Anthropic暂停所有用户对Claude Fable 5的访问。新产品会话将运行默认模型或Opus 4.8，已有Fable 5会话报错，平台请求也返回错误。DAIR.AI的Elvis Saravia评论称不必恐慌，认为Fable 5对大多数任务不值，且成本高、性能被削弱；规划任务用Opus 4.8、执行任务用GPT-5.5仍是当前最佳组合。

ClaudeDevs: As a result of a US government directive, we are suspending access to Claude Fable 5 for all users. You can continue to ...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

11:07

Nathan Lambert@natolambert

这太让人难过了。我一边刷屏一边看到所有人都觉得这很糟糕。那么多人只是想打造强大的AI并安全地部署它。政府应该为此提供便利，而不是砍掉它。我要去休息一下，希望明天能继续这个目标。谢谢大家。

大佬观点安全/对齐

11:05

Ars Technica：AI（RSS）

Anthropic应特朗普政府指令关闭Fable和Mythos模型

Anthropic根据特朗普政府指令关停了Fable和Mythos模型。美国商务部担忧Fable 5存在“越狱”风险，认为可能构成国家安全威胁。

Anthropic 安全/对齐行业动态

关联讨论 25 条

10:55

TechCrunch：AI（RSS）

同事件精选87

Anthropic的安全警告可能适得其反--政府已撤回其最强大AI

Anthropic对政府撤回其最强大AI模型表达不满，称仅基于一个狭窄的潜在越狱发现就召回已部署给数亿用户的商业模型不合理。

Anthropic 安全/对齐行业动态

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：政府直接叫停Anthropic部署中的商业模型，这在AI行业是头一遭，说明监管已不是纸面警告，所有做AI的都该重新掂量合规风险了。

10:41

Emad@EMostaque

所以 @Anthropic 即将学习 @SpaceX 的 ITAR/EAR 教训非国民将很难在那里以及 @OpenAI 的前沿模型岗位上工作。假设 AGI 是终极双重用途技术。

Anthropic OpenAI 大佬观点安全/对齐

10:34

meng shao@shao__meng

Claude 因 Fable 5/Mythos 5 下线再重置额度

Claude Fable 5 / Mythos 5 被全球紧急下线后，Claude 再次重置了所有用户的 5 小时和周使用额度。这一做法被指是 AI 团队用额度重置来弥补自身问题并安抚用户的惯用手段。

ClaudeDevs: We've reset 5-hour and weekly rate limits for all users.

Anthropic 安全/对齐行业动态

10:04

Rohan Paul@rohanpaul_ai

美国政府指令Anthropic暂停最强模型Fable 5和Mythos 5访问

美国商务部上周五以国家安全为由，要求Anthropic暂停所有外国国民（含公司内部外籍员工）对Fable 5和Mythos 5的访问。Anthropic已紧急对所有客户禁用这两个模型。起因是有人发现一种jailbreak可诱导模型提供本应拒绝的网络安全帮助。Anthropic认为政府未展示通用jailbreak，该技术范围狭窄，仅发现少量已知小漏洞，且其他公开模型也能提供类似能力。商务部长Howard Lutnick称这些模型将面临出口限制，直至美国政府强化国家安全系统（预计未来几周内）。Anthropic表示完美抵抗jailbreak目前任何模型都难以实现，并称此为误解，正努力恢复访问。其他Claude模型不受影响。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

09:35

Yuchen Jin@Yuchenj_UW

美国以国家安全为由发布出口管制指令，要求暂停所有外国国民（包括Anthropic外籍员工）访问Fable 5和Mythos 5。Anthropic宣布立即禁用这两款模型以遵守规定，其他Claude模型不受影响。Anthropic用户Yuchen Jin发推称其已使用Fable 5三天，认为该模型已达到ASI水平且非常危险，并期待开源AI，认为开源模型将在6个月内超越Mythos。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

09:29

Simon Willison 博客

美国政府对 Anthropic Fable 5 和 Mythos 5 下达出口管制指令

美国政府以国家安全为由，要求 Anthropic 暂停所有外国国民（包括外籍员工）对 Fable 5 和 Mythos 5 的访问。Anthropic 被迫全面禁用这两个模型，其他模型不受影响。政府声称发现了一种绕过 Fable 5 的方法，但 Anthropic 审查后确认该漏洞规模极小且非通用，其他公开模型（如 OpenAI GPT-5.5）也能发现相同漏洞，属于已知的次要缺陷。政府仅提供口头证据，未说明具体国家安全关切。Anthropic 表示将在24小时内公布更多细节。

Anthropic 安全/对齐政策/监管

关联讨论 25 条

09:19

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选84

美国政府下令暂停访问《Fable 5》和《Mythos 5》

美国政府发布指令，要求暂停访问 Anthropic 网站上的《Fable 5》和《Mythos 5》。

Anthropic 安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：美国政府首次以 jailbreak 为由强制暂停已部署的商业模型，Anthropic 这份声明逐条反驳，把监管过程缺乏透明度和技术事实依据的问题摊开了，这事的走向可能决定未来所有前沿模型的上线规则。

09:15

Anthropic：Newsroom（网页）

精选78

关于美国政府指令暂停访问Fable 5和Mythos 5的声明

美国政府以国家安全为由，指令Anthropic暂停所有外国国民（含海外员工）对Fable 5和Mythos 5的访问。Anthropic当日5:21pm (ET)收到指令后立即向所有客户禁用这两个模型，其他模型不受影响。政府称发现一种越狱Fable 5的方法；Anthropic审核认为该技术仅能识别少量已知微小漏洞，且其他公开模型（如OpenAI的GPT-5.5）也能做到。Anthropic坚持深度防御策略，认为此次越狱不具普遍性，不同意以此标准召回已服务数亿人的商用模型，正与政府合作争取尽快恢复访问。

Anthropic OpenAI 安全/对齐政策/监管

关联讨论 25 条

推荐理由：美国政府首次以国家安全为由暂停商用模型访问，Anthropic称这个标准若推广将冻结所有前沿发布。这是AI监管的一个危险先例，做模型的不能只看热闹。

09:14

Anthropic@AnthropicAI

美国出口管制迫使Anthropic禁用Fable 5和Mythos 5

Anthropic宣布，美国政府根据国家安全指令，暂停所有外国国民（包括Anthropic外籍员工）对Fable 5和Mythos 5的访问权限。Anthropic必须立即为所有客户禁用这两个模型以确保合规，其他Claude模型不受影响。公司表示这可能是误解，正在尽快恢复访问。

Anthropic 安全/对齐政策/监管

关联讨论 25 条

09:04

Deedy@deedydas

重磅： - 美国政府试图让Anthropic暂停Fable发布，但未能成功。 - 接着，Fable被一家公司越狱。 - 现在，美国对所有外国政府、公司及个人访问Fable实施出口管制。这意味着非美国公民使用Fable违法吗？

Anthropic 安全/对齐政策/监管

04:54

TechCrunch：AI（RSS）

谷歌起诉中国网络犯罪团伙 Outsider Enterprise：利用 AI 诈骗数十万受害者

谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙，指控其利用人工智能技术实施诈骗，受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。

Google 安全/对齐

03:49

Hacker News 热门（buzzing.cc 中文翻译）

特斯拉全自动驾驶功能在丹麦官方认证视频中使用了自行车道

特斯拉全自动驾驶功能（Full Self Driving）在丹麦官方认证视频中被发现使用了自行车道。该视频由丹麦媒体politiken.dk报道，时长01:49，在Hacker News上获得100个点赞。

具身智能安全/对齐

02:23

TechCrunch：AI（RSS）

精选74

Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙"Outsider Enterprise"

Google 起诉一个名为“Outsider Enterprise”的组织，指控其利用人工智能在两周内发送了 250 万条诈骗短信，导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。

Google 安全/对齐行业动态

推荐理由：谷歌起诉利用AI进行诈骗的中国犯罪团伙，披露细节和19亿美元损失规模让人震惊，这标志着AI滥用从实验走向产业化，所有AI工具厂商都该看看起诉书，思考如何防止平台被武器化。