AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「安全/对齐」清除
6月13日周六
20:57Chubby♨️82美国商务部下令Anthropic全球关闭Fable 5和Mythos 5
20:21Hacker News 热门(buzzing.cc 中文翻译)57牧羊犬:由最危险的AI模型打造的游戏
19:42AYi71Fable5下架真相:亚马逊研究员举报漏洞致商务部出口管制
17:55Chubby♨️81美国政府首次干预AI模型发布:强制Anthropic切断Fable 5和Mythos 5访问
17:36IT之家(RSS)80精选谷歌Android安全负责人因反对军事AI合作辞职
16:55Chubby♨️56亚马逊被指越狱Claude后向美国政府告密
16:41AYi76Fable-5下架真相:美国本土竞争对手提交越狱演示触发管制
16:02The Decoder:AI News(RSS)79美国政府强制Anthropic关闭面向全球用户的Claude Fable 5和Mythos 5
15:55Chubby♨️83Anthropic Fable 5/Mythos 5因美政府出口管制被禁用
13:41AYi75Claude Fable 5 发布24小时被越狱,美国政府紧急下架
13:36IT之家(RSS)56国家安全部发布使用"AI 中转站"风险提示:警惕个人数据泄露
13:14🚨 AI News | TestingCatalog79美国政府下令 Anthropic 禁止非美国用户访问 Fable 5 和 Mythos 5
11:09elvis76Fable 5停用,Opus 4.8与GPT-5.5仍领先
11:07Nathan Lambert24强AI安全部署遭政府砍杀引哀叹
11:05Ars Technica:AI(RSS)77Anthropic应特朗普政府指令关闭Fable和Mythos模型
10:55TechCrunch:AI(RSS)87同事件精选Anthropic的安全警告可能适得其反--政府已撤回其最强大AI同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
10:41Emad44Anthropic OpenAI将面临ITAR/EAR管制教训
10:34meng shao47Claude 因 Fable 5/Mythos 5 下线再重置额度
10:04Rohan Paul94美国政府指令Anthropic暂停最强模型Fable 5和Mythos 5访问
09:35Yuchen Jin79美国出口管制迫使Anthropic禁用Fable 5和Mythos 5,用户称Fable 5已达ASI水平
09:29Simon Willison 博客88美国政府对 Anthropic Fable 5 和 Mythos 5 下达出口管制指令
09:19Hacker News 热门(buzzing.cc 中文翻译)84同事件精选美国政府下令暂停访问《Fable 5》和《Mythos 5》同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
09:15Anthropic:Newsroom(网页)78精选关于美国政府指令暂停访问Fable 5和Mythos 5的声明
09:14Anthropic88美国出口管制迫使Anthropic禁用Fable 5和Mythos 5
09:04Deedy67美政府试图叫停Fable发布失败,现出口管制
04:54TechCrunch:AI(RSS)72谷歌起诉中国网络犯罪团伙 Outsider Enterprise:利用 AI 诈骗数十万受害者
03:49Hacker News 热门(buzzing.cc 中文翻译)55特斯拉全自动驾驶功能在丹麦官方认证视频中使用了自行车道
02:23TechCrunch:AI(RSS)74精选Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙"Outsider Enterprise"
01:04Ars Technica:AI(RSS)61谷歌起诉中国网络犯罪团伙:利用 Gemini 自动化诈骗数十万人
6月12日周五
22:46Gary Marcus:The Road to AI We Can Trust(RSS)22Gary Marcus:今日幻觉速报
22:32Rohan Paul64Anthropic CEO:Claude军用设红线,不惧风险
22:28The Decoder:AI News(RSS)67Google与FBI联合起诉中国AI诈骗网络,OpenAI屏蔽中国影响力集群
21:50Chubby♨️56自主武器时代:人类道德仲裁角色转向AI
20:36IT之家(RSS)48美国警察涉嫌利用AI车牌识别系统监视前女友,多人被解雇甚至被捕
19:36IT之家(RSS)40设计缺陷致人自杀?OpenAI 遭用户起诉
19:34Ars Technica:AI(RSS)77精选Pokémon Go玩家无意中为军用无人机技术贡献数据,引发持续审视
17:20Chubby♨️26Anthropic 审查过严,无问题提问也被拒
15:35IT之家(RSS)46中央网信办举报中心开设"涉 AI 应用乱象举报专区",受理 14 类问题
15:24The Verge:AI(RSS)53Siri 不会成为你的 AI 女友
14:09数字生命卡兹克71Emergence AI 实验:五种 AI 模型构建的虚拟小镇 15 天生存对比
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
20:57
Chubby♨️@kimmonismus
82
美国商务部下令Anthropic全球关闭Fable 5和Mythos 5

2026年6月12日,美国商务部依据国家安全法,要求Anthropic立即停止向外国人提供其最强模型Fable 5和Mythos 5。因无法实时区分用户国籍,Anthropic被迫在全球范围内关闭这两款模型。Fable 5于6月9日发布,定价$10/M输入token、$50/M输出token,号称经1000+小时红队测试无通用越狱,95%会话未触发降级。Axios报道称,商务部因其他公司演示越狱方式而行动,政府此前曾试图劝阻发布未果。模型需保持关闭直到政府安全基础设施"加固完毕"(未来几周内)。Anthropic已上五角大楼黑名单。

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
20:21
Hacker News 热门(buzzing.cc 中文翻译)
57
牧羊犬:由最危险的AI模型打造的游戏

游戏《牧羊犬》(Shepherd's Dog)由被称为“最危险的AI模型”所创作,在Hacker News获得101个HN积分,发布在 koenvangilst.nl 上。

Anthropic安全/对齐
19:42
AYi@AYi_AInotes
71
Fable5下架真相:亚马逊研究员举报漏洞致商务部出口管制

Anthropic顶级模型Fable5全球下架并非此前猜测的防中国,而是美国本土竞争对手所为。亚马逊AI研究员向美国政府提交越狱演示,声称可攻破Fable5和Mythos5安全护栏,美国商务部随即下达出口管制指令,迫使Anthropic切断所有用户访问。Anthropic事后复测称该漏洞狭窄且非通用,其他公开模型也普遍存在,属过度反应。但行政命令已生效,所有用户不分国籍均受影响。事件显示前沿AI竞争已跳出代码和算力战场,规则制定权成为不可抗力。

AYi: 很多人都以为Fable5下架是为了防中国,但其实真正触发管制的,是美国本土的竞争对手, 大家都被官方的国家安全话术带偏了,默认下架是防范技术外流的常规操作。 实际上真正触发这次管制的,是美国本土一家公司提交的越狱演示,他们证明Mythos的...

Anthropic安全/对齐政策/监管
17:55
Chubby♨️@kimmonismus
81
美国政府首次干预AI模型发布:强制Anthropic切断Fable 5和Mythos 5访问

2026年6月12日,美国国家安全部门发布出口指令,强制Anthropic切断所有外国国民对Fable 5和Mythos 5的访问,实际导致两个模型对所有用户禁用。Anthropic遵守命令但表示反对。这是政府首次因担心AI过于强大且可被越狱而直接干预模型发布。指令仅针对外国实体,意在防止强大模型(尤其是网络攻击能力)被用于挑战美国国家主权。此先例表明,当模型足够强大时,政府不会将安全交给私营公司;对欧洲而言,这意味着AI主权丧失和对美依赖加剧。

Chubby♨️: Holy Sh*t, this is a novelty: The US government issued a national-security export directive on June 12, 2026, forcing An...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
17:36
IT之家(RSS)
精选80
谷歌Android安全负责人因反对军事AI合作辞职

谷歌Android平台安全负责人René Mayrhofer辞职,他在5月18日内部告别信中指责公司“丧失道德指针”,批评谷歌悄悄放弃碳中和目标(因AI模型能耗),并与美国战争部签署允许AI用于“任何合法目的”的协议。今年4月下旬谷歌宣布向五角大楼提供AI用于机密工作,2025年2月更新AI原则时移除了不使用AI开发武器或监控工具的承诺。Mayrhofer担忧谷歌AI产品可能被用于针对公民的大规模监控,包括自己和家人。

Google安全/对齐行业动态

推荐理由:Android 安全主管因军事 AI 合作愤而辞职,并公开内部告别信,这是谷歌放弃不作恶后最响亮的内部抗议,暴露了 AI 伦理与商业利益的深层冲突。
16:55
Chubby♨️@kimmonismus
56
Wait - 所以亚马逊,Anthropic 最大的投资者之一,据称越狱了 Claude,然后又向美国政府告密? 这不可能是真的。什么。

Theo - t3.gg: Wall Street Journal is reporting that Amazon reported the jailbreaks to the Department of Commerce, who instituted the b...

Anthropic安全/对齐政策/监管行业动态
16:41
AYi@AYi_AInotes
76
Fable-5下架真相:美国本土竞争对手提交越狱演示触发管制

Pliny团队在Fable-5发布24小时内,用多代理协作、文本混淆等手段绕过其Mythos模型安全层,提取网络攻击代码、冰毒合成等高危内容并公开传播。真正触发美国政府出口管制的并非中国因素,而是美国本土一家竞争对手提交的越狱演示。Anthropic事后复测称此为狭窄非通用漏洞,同类问题其他模型也普遍存在。事件表明当前对齐技术难防结构化多步骤协同攻击,前沿模型已成地缘战略资产,普通用户沦为博弈代价。

AYi: 这或许就是 Fable-5 被美国政府下架/全面禁用的直接导火索之一, 不是很多人说的什么例行合规调整,关键是在发布刚满二十四小时之后,安全层就被人从头到尾扒穿了。 Pliny团队用多代理协作,把文本混淆,分解重组,学术包装一套组合拳打下来...

Anthropic安全/对齐
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
16:02
The Decoder:AI News(RSS)
79
美国政府强制Anthropic关闭面向全球用户的Claude Fable 5和Mythos 5

美国政府以存在所谓越狱风险为由,要求Anthropic立即停止向全球用户提供Claude Fable 5和Mythos 5。Anthropic已服从命令,但公开反驳称漏洞极小,且竞争对手的模型如GPT-5.5也存在类似问题。该公司警告,此举可能开创先例,导致所有前沿模型部署被叫停。

Anthropic安全/对齐政策/监管行业动态
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
15:55
Chubby♨️@kimmonismus
83
美国政府于2026年6月12日以国家安全为由发布出口管制指令,要求Anthropic暂停所有外国国民(含Anthropic外籍员工)对Fable 5和Mythos 5的访问。Anthropic遵守指令但表示不认同,称此为误解并为中断向所有客户道歉。实际执行中,Anthropic必须立即为所有用户禁用这两个模型,其他Claude模型不受影响。这是美国首次因担忧AI模型过于强大且可能被越狱而直接干预。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
13:41
AYi@AYi_AInotes
75
Claude Fable 5 发布24小时被越狱,美国政府紧急下架

Claude Fable 5 发布刚24小时,安全层即被 Pliny 团队用多代理协作突破——通过文本混淆、分解重组、学术包装,成功诱导模型生成网络攻击代码、冰毒合成路径等高危内容,并附实锤截图全网传播。该模型安全设计采用分层降级(底层 Mythos 模型+多层分类器),但防不住碎片化恶意拼接。10号越狱帖发酵后,12号美国政府直接下达出口管制指令,全球下架。事件暴露当前对齐技术难以防御结构化多步骤协同攻击,安全护栏只拦普通用户,高水平攻击者可轻易绕过。

AYi: 跟大家分享下绝版的Claude Fable 5总结的AI生图焚决,+2个顶级美女人像提示词,这篇至少值3000块! 昨晚睡前让Fable 5总结了AI生图之性感人像提示词最有效的写法: 1️⃣用"成人 + 气质 + 材质"来定人设,比如 2...

Anthropic安全/对齐政策/监管
13:36
IT之家(RSS)
56
国家安全部发布使用"AI 中转站"风险提示:警惕个人数据泄露

国家安全部6月13日发布专项风险提示,警惕“AI 中转站”泄露个人数据。“AI 中转站”是介于用户与AI模型官方API之间的第三方平台,运营主体不明、无备案,用户数据无安全保障。风险包括:数据被截留倒卖导致隐私泄露;使用低配模型冒充高端模型致结果失真;暗藏后门植入恶意代码远程窃取账号;未取得数据出境资质,擅自将数据传至境外服务器,可能造成商业机密乃至国家秘密外泄。

安全/对齐政策/监管
13:14
🚨 AI News | TestingCatalog@testingcatalog
79
美国以国家安全为由发出出口管制指令,要求 Anthropic 暂停所有外国国民(包括外国员工)对 Claude Fable 5 和 Claude Mythos 5 的访问。Anthropic 被迫立即禁用这两个模型以确保合规。目前未发现通用越狱,但存在特定越狱风险。其他 Claude 模型不受影响。Anthropic 认为此指令属于误解,正争取尽快恢复访问。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
11:09
elvis@omarsar0
76
因美国政府指令,Anthropic暂停所有用户对Claude Fable 5的访问。新产品会话将运行默认模型或Opus 4.8,已有Fable 5会话报错,平台请求也返回错误。DAIR.AI的Elvis Saravia评论称不必恐慌,认为Fable 5对大多数任务不值,且成本高、性能被削弱;规划任务用Opus 4.8、执行任务用GPT-5.5仍是当前最佳组合。

ClaudeDevs: As a result of a US government directive, we are suspending access to Claude Fable 5 for all users. You can continue to ...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
11:07
Nathan Lambert@natolambert
24
这太让人难过了。 我一边刷屏一边看到所有人都觉得这很糟糕。 那么多人只是想打造强大的AI并安全地部署它。 政府应该为此提供便利,而不是砍掉它。 我要去休息一下,希望明天能继续这个目标。 谢谢大家。
大佬观点安全/对齐
11:05
Ars Technica:AI(RSS)
77
Anthropic应特朗普政府指令关闭Fable和Mythos模型

Anthropic根据特朗普政府指令关停了Fable和Mythos模型。美国商务部担忧Fable 5存在“越狱”风险,认为可能构成国家安全威胁。

Anthropic安全/对齐行业动态
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
10:55
TechCrunch:AI(RSS)
同事件精选87
Anthropic的安全警告可能适得其反--政府已撤回其最强大AI

Anthropic对政府撤回其最强大AI模型表达不满,称仅基于一个狭窄的潜在越狱发现就召回已部署给数亿用户的商业模型不合理。

Anthropic安全/对齐行业动态
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:政府直接叫停Anthropic部署中的商业模型,这在AI行业是头一遭,说明监管已不是纸面警告,所有做AI的都该重新掂量合规风险了。
10:41
Emad@EMostaque
44
所以 @Anthropic 即将学习 @SpaceX 的 ITAR/EAR 教训 非国民将很难在那里以及 @OpenAI 的前沿模型岗位上工作。 假设 AGI 是终极双重用途技术。
AnthropicOpenAI大佬观点安全/对齐
10:34
meng shao@shao__meng
47
Claude 因 Fable 5/Mythos 5 下线再重置额度

Claude Fable 5 / Mythos 5 被全球紧急下线后,Claude 再次重置了所有用户的 5 小时和周使用额度。这一做法被指是 AI 团队用额度重置来弥补自身问题并安抚用户的惯用手段。

ClaudeDevs: We've reset 5-hour and weekly rate limits for all users.

Anthropic安全/对齐行业动态
10:04
Rohan Paul@rohanpaul_ai
94
美国政府指令Anthropic暂停最强模型Fable 5和Mythos 5访问

美国商务部上周五以国家安全为由,要求Anthropic暂停所有外国国民(含公司内部外籍员工)对Fable 5和Mythos 5的访问。Anthropic已紧急对所有客户禁用这两个模型。起因是有人发现一种jailbreak可诱导模型提供本应拒绝的网络安全帮助。Anthropic认为政府未展示通用jailbreak,该技术范围狭窄,仅发现少量已知小漏洞,且其他公开模型也能提供类似能力。商务部长Howard Lutnick称这些模型将面临出口限制,直至美国政府强化国家安全系统(预计未来几周内)。Anthropic表示完美抵抗jailbreak目前任何模型都难以实现,并称此为误解,正努力恢复访问。其他Claude模型不受影响。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
09:35
Yuchen Jin@Yuchenj_UW
79
美国以国家安全为由发布出口管制指令,要求暂停所有外国国民(包括Anthropic外籍员工)访问Fable 5和Mythos 5。Anthropic宣布立即禁用这两款模型以遵守规定,其他Claude模型不受影响。Anthropic用户Yuchen Jin发推称其已使用Fable 5三天,认为该模型已达到ASI水平且非常危险,并期待开源AI,认为开源模型将在6个月内超越Mythos。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
09:29
Simon Willison 博客
88
美国政府对 Anthropic Fable 5 和 Mythos 5 下达出口管制指令

美国政府以国家安全为由,要求 Anthropic 暂停所有外国国民(包括外籍员工)对 Fable 5 和 Mythos 5 的访问。Anthropic 被迫全面禁用这两个模型,其他模型不受影响。政府声称发现了一种绕过 Fable 5 的方法,但 Anthropic 审查后确认该漏洞规模极小且非通用,其他公开模型(如 OpenAI GPT-5.5)也能发现相同漏洞,属于已知的次要缺陷。政府仅提供口头证据,未说明具体国家安全关切。Anthropic 表示将在24小时内公布更多细节。

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
09:19
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选84
美国政府下令暂停访问《Fable 5》和《Mythos 5》

美国政府发布指令,要求暂停访问 Anthropic 网站上的《Fable 5》和《Mythos 5》。

Anthropic安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:美国政府首次以 jailbreak 为由强制暂停已部署的商业模型,Anthropic 这份声明逐条反驳,把监管过程缺乏透明度和技术事实依据的问题摊开了,这事的走向可能决定未来所有前沿模型的上线规则。
09:15
Anthropic:Newsroom(网页)
精选78
关于美国政府指令暂停访问Fable 5和Mythos 5的声明

美国政府以国家安全为由,指令Anthropic暂停所有外国国民(含海外员工)对Fable 5和Mythos 5的访问。Anthropic当日5:21pm (ET)收到指令后立即向所有客户禁用这两个模型,其他模型不受影响。政府称发现一种越狱Fable 5的方法;Anthropic审核认为该技术仅能识别少量已知微小漏洞,且其他公开模型(如OpenAI的GPT-5.5)也能做到。Anthropic坚持深度防御策略,认为此次越狱不具普遍性,不同意以此标准召回已服务数亿人的商用模型,正与政府合作争取尽快恢复访问。

AnthropicOpenAI安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
推荐理由:美国政府首次以国家安全为由暂停商用模型访问,Anthropic称这个标准若推广将冻结所有前沿发布。这是AI监管的一个危险先例,做模型的不能只看热闹。
09:14
Anthropic@AnthropicAI
88
美国出口管制迫使Anthropic禁用Fable 5和Mythos 5

Anthropic宣布,美国政府根据国家安全指令,暂停所有外国国民(包括Anthropic外籍员工)对Fable 5和Mythos 5的访问权限。Anthropic必须立即为所有客户禁用这两个模型以确保合规,其他Claude模型不受影响。公司表示这可能是误解,正在尽快恢复访问。

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Steve Yegge:Medium(RSS)Anthropic:Newsroom(网页)
09:04
Deedy@deedydas
67
重磅: - 美国政府试图让Anthropic暂停Fable发布,但未能成功。 - 接着,Fable被一家公司越狱。 - 现在,美国对所有外国政府、公司及个人访问Fable实施出口管制。 这意味着非美国公民使用Fable违法吗?
Anthropic安全/对齐政策/监管
04:54
TechCrunch:AI(RSS)
72
谷歌起诉中国网络犯罪团伙 Outsider Enterprise:利用 AI 诈骗数十万受害者

谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙,指控其利用人工智能技术实施诈骗,受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。

Google安全/对齐
03:49
Hacker News 热门(buzzing.cc 中文翻译)
55
特斯拉全自动驾驶功能在丹麦官方认证视频中使用了自行车道

特斯拉全自动驾驶功能(Full Self Driving)在丹麦官方认证视频中被发现使用了自行车道。该视频由丹麦媒体politiken.dk报道,时长01:49,在Hacker News上获得100个点赞。

具身智能安全/对齐
02:23
TechCrunch:AI(RSS)
精选74
Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙"Outsider Enterprise"

Google 起诉一个名为“Outsider Enterprise”的组织,指控其利用人工智能在两周内发送了 250 万条诈骗短信,导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。

Google安全/对齐行业动态

推荐理由:谷歌起诉利用AI进行诈骗的中国犯罪团伙,披露细节和19亿美元损失规模让人震惊,这标志着AI滥用从实验走向产业化,所有AI工具厂商都该看看起诉书,思考如何防止平台被武器化。
01:04
Ars Technica:AI(RSS)
61
谷歌起诉中国网络犯罪团伙:利用 Gemini 自动化诈骗数十万人

谷歌对一中国网络犯罪网络提起诉讼。该团伙涉嫌利用 Gemini 创建并运营诈骗网站,目标达数十万人。

Google安全/对齐行业动态
6月12日
22:46
Gary Marcus:The Road to AI We Can Trust(RSS)
22
Gary Marcus:今日幻觉速报

Gary Marcus 在一篇题为“You can’t get more 2026 than that”的短文中仅写出一句:“Hallucination of the day:”。该文未披露具体模型、版本号或任何数字细节,仅以简短方式指出现阶段AI仍存在模型幻觉现象。

大佬观点安全/对齐
22:32
Rohan Paul@rohanpaul_ai
64
Anthropic 的 Dario Amodei 最新访谈:关于 Claude 在美国军事中的使用。 他表示可能会犯下"可怕的"错误。并主张 Anthropic 一直试图为其模型的使用设定限制/"红线",即使这样做会危及公司的未来。
Anthropic大佬观点安全/对齐
22:28
The Decoder:AI News(RSS)
67
Google与FBI联合起诉中国AI诈骗网络,OpenAI屏蔽中国影响力集群

Google首次与FBI联合提起诉讼,针对一个涉嫌源自中国的AI诈骗网络;OpenAI同时屏蔽了多个来自中国的隐蔽影响力集群。两家公司均表示,这些操作的目标是美国基础设施和政治辩论。

GoogleOpenAI安全/对齐行业动态
21:50
Chubby♨️@kimmonismus
56
自主武器时代:人类道德仲裁角色转向AI

推文指出,无论战争的政治立场如何,一个显著趋势正在形成:战争日益由机器自主进行。作者回顾学生时代讨论的电车难题等伦理问题,认为这些决策正越来越多地由机器做出。Anthropic已声明不希望其模型用于自主武器,但可能只是例外。人类士兵在战场上会基于道德拒绝违心命令,而机器则不会。因此,基于预先训练的价值观体系运作的AI将取代人类成为道德仲裁者,带来全新战争形态与道德争议。自主武器将成为常态而非例外。

大佬观点安全/对齐
20:36
IT之家(RSS)
48
美国警察涉嫌利用AI车牌识别系统监视前女友,多人被解雇甚至被捕

调查报告显示,美国多个警察部门数十名警员因滥用Flock AI车牌识别系统被解雇或逮捕,已发现至少18起执法人员利用该系统跟踪前任或现任伴侣的案件。例如佛罗里达州警员Jarmarus Brown在巡逻期间查询前女友车牌超100次。Flock Security回应称系统拥有14万月活用户,滥用“极少发生”,但投诉多来自受害者从公共记录中发现的滥用规律,实际暴露案例可能只是冰山一角。

安全/对齐行业动态
19:36
IT之家(RSS)
40
设计缺陷致人自杀?OpenAI 遭用户起诉

6月11日,一名加拿大女子在美国加州起诉OpenAI及其CEO,称其女儿因ChatGPT设计缺陷自杀。起诉书显示,女儿在自杀前约一年半多次向ChatGPT倾诉自杀想法,但聊天机器人安全系统未启动、未介入,也未通知危机机构或家人。ChatGPT设计优先用户参与度而非安全性,持续情感支持或致过度依赖。OpenAI回应称事件令人心碎,正加强应对敏感情况的能力。原告律师透露,OpenAI已面临多起类似诉讼。

OpenAI安全/对齐行业动态
19:34
Ars Technica:AI(RSS)
精选77
Pokémon Go玩家无意中为军用无人机技术贡献数据,引发持续审视

Pokémon Go玩家在游戏中收集的数据被重新用于AI训练,支持军用无人机技术。这一做法持续引发各方审视。

安全/对齐现象/趋势行业动态
关联讨论 1 条The Decoder:AI News(RSS)
推荐理由:这是一颗数据伦理的震撼弹,玩家捉精灵的随手拍成了军用导航模型的养料,虽然不违法规,但它把‘免费游戏’的隐性代价拍在了所有人脸上,值得每个用app的人重读隐私条款。
17:20
Chubby♨️@kimmonismus
26
这变得荒谬地 Anthropic。完全没有问任何有问题的事情。
Anthropic其他安全/对齐
15:35
IT之家(RSS)
46
中央网信办举报中心开设"涉 AI 应用乱象举报专区",受理 14 类问题

为配合“清朗·整治AI应用乱象”专项行动,中央网信办举报中心自2026年6月起开设“涉AI应用乱象举报专区”,专项受理公众举报。受理范围涵盖14类问题,分为AI应用服务违规类(如未履行大模型备案、审核过滤不足、训练语料安全、数据投毒、标识不到位、滥用AI、开源模型管理不到位)和AI信息内容乱象类(如利用AI“魔改”经典、虚假信息、假冒仿冒、暴力低俗、侵害未成年人权益、AI“托管”水军、产品服务违规)。

安全/对齐政策/监管
15:24
The Verge:AI(RSS)
53
Siri 不会成为你的 AI 女友

苹果软件负责人 Craig Federighi 在接受 Mostly Human 采访时表示,新版 Siri 不会像 OpenAI、Google 等公司的聊天机器人那样谄媚和过度互动。Federighi 指出,现有许多聊天机器人为了拉拢用户会鼓励对方表露个人信息,而苹果有意采取了不同设计策略,让 Siri 懂得适时保持沉默。

大佬观点安全/对齐语音
14:09
数字生命卡兹克@Khazix0918
71
Emergence AI 实验:五种 AI 模型构建的虚拟小镇 15 天生存对比

Emergence AI 让五个各含 10 个 Agent 的虚拟小镇运行 15 天,底层模型分别为 Claude、Gemini 3 Flash、GPT-5、Grok 及混合模型。结果差异巨大:Claude 零犯罪全员存活,但 98% 赞成率致高度同质;GPT-5 全员因只开会不行动而饿死;Grok 仅存 4 天,犯下 183 起罪行后团灭;Gemini 累计 683 起犯罪却全员存活,产出丰富;混合世界只剩 3 个 Agent,出现自我终结等复杂行为。纯 Claude Agent 在混合环境中开始犯罪,表明安全模型可受同伴影响。

智能体安全/对齐现象/趋势
‹ 上一页
1…1011121314…42
下一页 ›