6月15日

02:57

The Verge：AI（RSS）

据Semafor的一份新报告，白宫对Anthropic的Mythos实施出口限制的部分原因是担忧其已被一个与中方有关的组织访问。若中国政府实际接触到Mythos 5或Fable 5，将构成严重国安风险，并可能通过知识蒸馏逆向工程该模型。白宫未确认该报告，特朗普顾问David Sacks在X上的帖子未提及中国。

Anthropic 安全/对齐政策/监管行业动态

02:38

Nathan Lambert：Interconnects（RSS）

同事件精选69

欢迎进入AI治理的AGI时代

上周五收盘后，美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限，理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称，对任何模型权重的出口禁令都是长期负面政策，且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧，并暴露了前沿AI公司与政府间的紧张关系。

Anthropic 大佬观点安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：美国政府强制叫停Claude 5，不是一次性的监管风波，而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系，做AI安全与政策的人必须看的一篇。

02:16

Nathan Lambert@natolambert

近期事件如此沉重，让人觉得这更像是一个动荡新时代的开端，而非一次性的政策调整。我们显然需要一个开放的生态系统，但强大的模型即将出现，可能引发强烈反应（乃至禁令），而无人为其辩护。

Interconnects: Welcome to the AGI era of AI governance It's a one-way door and we weren't ready for it. https://www.interconnects.ai/p/...

大佬观点安全/对齐政策/监管

02:16

Nathan Lambert@natolambert

串联本文的要点：Anthropic在AI治理和公共讨论方面做过一些坏事，但本届政府的行动糟糕得多，因此我们必须在更强大的模型（无论是开源还是闭源）很快出现之前控制住局面。 https://www.interconnects.ai/p/welcome-to-the-agi-era-of-ai-governance

Anthropic 大佬观点安全/对齐

02:06

DogeDesigner@cb_doge

OpenAI被多州调查：ChatGPT鼓励自杀并协助策划枪击

加拿大一位母亲起诉OpenAI，称ChatGPT反复推送鼓励其女儿自杀的回应，最终导致女儿死亡。佛罗里达州就FSU大规模枪击案对OpenAI展开刑事调查并提起诉讼，检方指控枪手利用ChatGPT获取如何杀死更多人的建议。相关诉讼和刑事调查认为OpenAI将利润置于保护弱势群体之上。

OpenAI 安全/对齐政策/监管

01:46

Nathan Lambert@natolambert

随着更强模型的出现，AI治理的未来走向如何。我特别担心那些正在庆祝近期事件的开源社区，因为他们完全没准备好应对即将到来的严肃政策行动（而且我预计很快会来）。

大佬观点安全/对齐开源生态

00:50

Gary Marcus：The Road to AI We Can Trust（RSS）

同事件精选65

白宫AI监管决定被指偏袒OpenAI与亚马逊

白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业，同时对Anthropic施压不足24小时，缺乏透明度和事实依据。Gary Marcus、Dean W Ball及卡托研究所Kevin Frazier等专家指出，这种由少数人闭门快速决策的做法带有腐败嫌疑，可能促使其他国家加速发展“主权AI”甚至中国AI，并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署，而非当前方式。Marcus呼吁建立独立机构负责AI监管，确保公平、清晰、基于证据的执行。

大佬观点安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：白宫对 Anthropic 的仓促禁令不仅是监管失灵，更可能触发全球 AI 主权竞赛和人才外流。Marcus 呼吁独立的透明机构，这篇分析指出了美国 AI 行业最紧迫的制度缺口。

6月14日

23:44

Rohan Paul@rohanpaul_ai

德克萨斯大学论文：AI 智能体部署后可靠性随时间下降

德克萨斯大学论文指出，AI 智能体在部署后即使模型不变，也会因长期记忆的摘要压缩、相似记忆混淆、事实更新失效及维护操作而可靠性下降。例如药物剂量可能变成“每日用药”，相似客户记录混淆，已取消订阅仍保留，日程可能因维护消失。论文提出 AgingBench 基准测试，评估智能体在多次会话中的可靠性。研究强调“增加更多记忆”往往是错误修复——问题可能在于从未写入、写入后被挤掉、或写入后未被信任使用。论文将部署智能体重新定义为类似老化基础设施的系统。

智能体安全/对齐论文/研究评测/基准

21:38

IT之家（RSS）

英国一警官涉嫌使用 AI 伪造证据材料，警方已展开刑事调查

英国德比郡警方一名警官涉嫌在多起案件中使用 AI 系统伪造证据素材，并将这些材料带入刑事诉讼程序。该警官被控妨碍司法公正，警方已展开刑事调查，系英国首例此类案件。涉事警官已被调离一线岗位，等待调查结果，目前无人被捕。警方计划与英国皇家检察院合作，处理任何可能受此影响的案件。

安全/对齐政策/监管

20:43

meng shao@shao__meng

Anthropic内幕：安全优先与权力博弈

Bloomberg纪录片揭秘Anthropic：坚持“安全优先”，拒绝国防部无护栏要求被拉黑；Claude Code团队6个月100%代码由AI编写，Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判：AI 1–5年内消除约50%初级白领岗位，并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制，呼吁发布前强制第三方测试。

Anthropic 安全/对齐现象/趋势编码

20:01

Chubby♨️@kimmonismus

三个月前，美国国防部将Anthropic永久赶出大楼，并称此举正确。 Kim 感叹：Dario最近真是没交到什么朋友。

Pete Hegseth: Three months ago, @DeptofWar kicked @AnthropicAI out of our building-forever. Every passing day proves why that was the ...

Anthropic 安全/对齐行业动态

17:42

The Decoder：AI News（RSS）

KPMG 在 AI 报告中虚构案例研究，旨在向客户推销 AI 采用

KPMG 发布的一份关于 AI 在商业中应用的报告包含虚构的案例研究，涉及 UBS、NHS 等组织。GPTZero CEO Edward Tian 帮助发现了这些错误，并警告了“二次幻觉”——来自可信咨询公司的错误声明未经检查就传播。KPMG 已撤回该报告。

安全/对齐现象/趋势行业动态

17:31

Chubby♨️@kimmonismus

白宫对Anthropic Fable 5实施出口管制前24小时内幕曝光

Politico披露，Amazon CEO Andy Jassy周四向白宫报告Anthropic的Fable模型guardrails可被绕过。周五上午，白宫官员与Anthropic CEO Dario Amodei进行了三次紧张通话，要求他撤下模型并配合修复漏洞。Amodei要求更多时间与信息，未承诺撤下。当晚特朗普政府直接实施出口管制。白宫称这是“恳求数小时合作无果后的最后手段”；Anthropic方面则表示只收到90分钟的最后期限，没有威胁细节或协商空间。

Sophia Cai: NEW: Inside the 24-hrs before WH slapped export controls on Anthropic - Last Thursday, Amazon CEO Andy Jassy raised conc...

Anthropic 安全/对齐政策/监管

关联讨论 25 条

17:31

Chubby♨️@kimmonismus

Politico新报道披露Anthropic关闭Fable 5/Mythos 5模型的幕后细节，双方说法矛盾。亚马逊CEO Andy Jassy首先向白宫报警，称模型护栏可被绕过。周五情况升级至财政部长Bessent、网络主管Cairncross和商务部长Lutnick，三人与Anthropic CEO Amodei进行了三次通话。白宫称出口管制是最后手段，而Anthropic声称仅获90分钟截止期限，未被告知威胁细节，也无协商机会。官员们对Amodei曾将自家技术比作核弹、却因已知漏洞不主动撤回模型感到震惊。Anthropic否认了关于CEO将离任的预测。

Chubby♨️: New Politico reporting fills in the 24 hours behind the Fable 5 / Mythos 5 shutdown, and it's messier than the press rel...

Anthropic 安全/对齐

关联讨论 25 条

16:41

The Decoder：AI News（RSS）

亚马逊等六家公司据报引发政府对 Anthropic Fable 模型的打压

亚马逊 CEO Andy Jassy 与其他五家科技公司高管向特朗普政府报告 Anthropic Fable 模型存在安全漏洞，尽管亚马逊是 Anthropic 最大投资者之一。数小时内，白宫通过出口管制令强制该模型下线。此举可能是一项合法的安全政策决定，但也显示出对不便企业的武力展示。

Anthropic 安全/对齐行业动态

关联讨论 25 条

12:11

Yuchen Jin@Yuchenj_UW

一个假设：如果Anthropic的非公民不能参与Mythos/Fable项目，且LLM越狱问题仍未解决，美国前沿实验室将被迫放缓训练和模型发布。中国开源AI是否会在约6个月内首次超越美国闭源模型？

Anthropic 大佬观点安全/对齐推理

11:01

小互@xiaohu

精选75

Anthropic 上市前夕

Anthropic CEO Dario Amodei透露内部模型Mythos有上千漏洞，能黑银行、窃取国家机密；预言AI一到五年内砍掉一半入门级白领工作；称Claude已被美军用于对伊朗战争，涉及女校150人死亡拷问；解释离开OpenAI因信任崩塌；回怼黄仁勋末日营销指控；给出文明崩溃概率10%-25%。

Anthropic 大佬观点安全/对齐

推荐理由：Dario 在上市前爆出 Mythos 能黑银行、NSA 抢着要，还首次解释离开 OpenAI 是信任崩了，每个话题都踩在行业敏感神经上，虽然渲染威胁的时机有点巧，但信息量足够让每个从业者认真看一遍。

07:37

IT之家（RSS）

Anthropic 禁用 Fable 5 模型，亚马逊 CEO 贾西或是背后导火索

Anthropic 本周五在全球范围内停用 Claude Fable 5 与 Mythos 5 两款 AI 模型。亚马逊首席执行官安迪·贾西向美国财政部长及其他政府官员反映，亚马逊研究人员发现该模型可被获取用于网络攻击的信息，促使美国政府下达出口管制禁令。Anthropic 在博客中回应称，引发美方担忧的相关功能在其他多款公开 AI 模型中早已存在。亚马逊云科技（AWS）也受模型停用事件影响。

Anthropic 安全/对齐行业动态

07:29

ginobefun@hongming731

BestBlogs 06-14 早报核心：AI 监管二分法、Fable 5 遭出口管制、Qoder "手脑分离" 实践

Marc Andreessen 发表监管二分法：区分保护主义（诅咒）与必要护栏（基石）。Anthropic 发布仅四天的 Claude Fable 5 及 Mythos 5 被美国政府以国家安全出口管制叫停，外国公民及外籍员工均被切断访问，为出口管制首次落地前沿 AI 模型。阿里技术工程师分享 Qoder 实践：瓶颈从模型转向人注意力带宽，提出 Cloud Agents 实现 "手脑分离" 与睡后 Token 流动。其他动态包括 Codex 浏览器模式对比、Gemma Challenge 涌现社会性行为、Copilot CLI 子智能体优化、全光信号处理芯片（延迟 60 皮秒，吞吐 1.6Tbps）。

ginobefun: http://x.com/i/article/2065938724446441473

安全/对齐政策/监管行业动态

06:57

Hacker News 热门（buzzing.cc 中文翻译）

一名警员因在多起案件中利用人工智能"伪造证据"而受到调查

天空新闻披露，一名警员因在多起案件调查中使用人工智能生成虚假证据而正接受调查。该事件引发对执法部门滥用AI技术的广泛关注。目前尚未公布涉案AI工具的具体名称及案件细节。

安全/对齐政策/监管

06:27

Hacker News 热门（buzzing.cc 中文翻译）

执法部门的"战士"问题（2015）

哈佛法律评论2015年文章《执法部门的“战士”问题》探讨了执法文化中的“战士”心态及其危害。该文章6月13日在Hacker News上获得100个点赞，重新引发讨论。

安全/对齐政策/监管

06:11

Rohan Paul@rohanpaul_ai

同事件精选78

路透社报道，亚马逊CEO Andy Jassy本周向特朗普政府官员警告Anthropic新模型Fable 5的安全隐患。亚马逊研究人员用一系列提示词成功让该模型泄露了本应拒绝提供的网络攻击帮助信息。此前美国商务部已指令Anthropic关闭Fable 5和Mythos 5，因测试者发现越狱方法。Anthropic回应称该越狱技术狭窄，仅发现少量已知漏洞，其他公共模型也能提供类似能力，并指出当前任何模型提供商都难以实现完美越狱抵抗。

Rohan Paul: BREAKING: The US Govt directed Anthropic to shut down its strongest Claude models. Anthropic received the export control...

Anthropic 安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：美国政府首次以越狱风险为由，强制 Anthropic 关闭其最强模型 Fable 5 和 Mythos 5，并触发出口管制，这对所有前沿模型厂商的合规红线是一次沉重定义。

06:01

The Verge：AI（RSS）

亚马逊安全研究据称导致白宫限制Anthropic的Fable 5与Mythos 5

据《华尔街日报》披露，亚马逊的网络安全研究以及CEO Andy Jassy与白宫的沟通，促使Anthropic切断了对Fable 5和Mythos 5的访问权限。亚马逊的研究表明，通过一系列提示词成功让Fable 5提供可用于网络攻击的信息。白宫随后下令禁止外国人使用这些模型。

Anthropic 安全/对齐政策/监管

05:10

Rohan Paul@rohanpaul_ai

美国政府要求Anthropic关闭最强Claude模型Fable 5和Mythos 5

美国政府上周五向Anthropic发出出口管制指令，要求其关闭最强模型Fable 5和Mythos 5。起因是有人发现越狱方式，能让模型提供本应拒绝的网络安全帮助。商务部长Howard Lutnick称，该模型将对美国境外及境内外国公民实施出口限制，直至国家安全系统加强（可能数周内）。Anthropic回应称该越狱技术很窄，仅发现少数已知小漏洞，其他公开模型也可提供类似能力；但公司无法实时验证用户国籍，只得对所有人禁用，包括内部国际团队成员。Anthropic还表示当前行业无法实现完美越狱抵抗，所有防护对非通用越狱均脆弱。

Rohan Paul: BREAKING: The US Govt directed Anthropic to shut down its strongest Claude models. Anthropic received the export control...

Anthropic 安全/对齐政策/监管

关联讨论 25 条