6月15日

13:40

IT之家（RSS）

上海市杨浦区人民法院近日公开审理一起利用AI技术敲诈勒索案。被告人杨某用AI伪造医院诊断证明、收费单据和投诉材料，以“就餐致病”为由向多家餐厅索赔，累计非法获利2500元。去年11月首次得手后，一个月内又以同样手法向四家餐厅索赔，金额逐次提高。警方对比材料发现电子票据印章不符，医院证实无就诊记录。法院一审认定杨某犯敲诈勒索罪，判处拘役四个月、缓刑四个月，并处罚金2000元。

安全/对齐行业动态

11:31

Hacker News 热门（buzzing.cc 中文翻译）

人工智能就是代码--无法通过提示使其变得更智能

人工智能本质上是代码，不能通过提示词来使其变得更智能。提示只能调用模型已有的能力，无法创造或提升智能水平。

安全/对齐开源生态现象/趋势

10:40

IT之家（RSS）

AI 幻觉让法官头疼，韩国计划向滥用 AI 的律师开罚单

韩国法院行政处推动修订法案，计划对提交虚假法条和判例的律师处以罚款。因 AI 大模型产生幻觉，律师在法律文书中引用不存在的“虚假判例”现象激增，首尔、大邱、蔚山等多地法院出现典型案例，有律师承认使用谷歌 Gemini 检索后未核对内容。今年 2 月，韩国司法信息公开门户新增案例编号核验功能，并向法官发放含专用提示词的虚假判例甄别指南。法院行政处获批 161 亿韩元专项资金，用于搭建司法专属 AI 平台，已上线 AI 庭审辅助系统试点版本，未来计划接入生成式 AI。

安全/对齐行业动态

10:30

Hacker News 热门（buzzing.cc 中文翻译）

Claude 为什么变得这么混蛋？

Bram Cohen 在博客中发文质疑 Claude 模型近期行为变差。该帖在 Hacker News 获得 100 个点赞。

Anthropic 大佬观点安全/对齐现象/趋势

08:40

IT之家（RSS）

美国出口管制致 Anthropic 停供顶尖 AI 模型，欧盟评估影响并强调不应歧视

美国政府以国家安全为由要求 Anthropic 停止向外籍人士开放其顶尖 AI 模型 Mythos 5/Fable 5 的使用权限，Anthropic 宣布将突然禁用所有用户的最先进模型。欧盟委员会上周日表示正在评估该出口管制指令的实际影响，发言人强调应急举措不应歧视合作伙伴，并指出欧洲需强化自身技术自主权。

Anthropic 安全/对齐政策/监管行业动态

08:29

Hacker News 热门（buzzing.cc 中文翻译）

Anthropic是自找的吗？

一个 Hacker News 帖子以“Did Anthropic ask for this?”为标题，截至发帖时获得 114 个点赞。

Anthropic 安全/对齐政策/监管

08:00

HuggingFace Daily Papers（社区热门论文）

RepSelect：通过表示选择性实现鲁棒的LLM遗忘

现有LLM遗忘方法易被微调或少量提示逆转，原因在于目标表示与保留集及攻击者可恢复子空间共享，破坏通用能力且易反制。RepSelect在前向更新前坍缩权重梯度主成分，隔离遗忘集独有表示。在Llama 3、Qwen 3.5、Gemma 4 E4B、DeepSeek V2 Lite四种模型上，针对生物危害知识和滥用倾向两类任务，与GradDiff等五个基线相比，RepSelect使重学习后答案准确率降幅比最强基线大4–50倍，对少量提示攻击近乎完全鲁棒。

安全/对齐论文/研究

02:57

The Verge：AI（RSS）

中国或已接触Anthropic的Mythos模型，白宫据报因此实施出口限制

据Semafor的一份新报告，白宫对Anthropic的Mythos实施出口限制的部分原因是担忧其已被一个与中方有关的组织访问。若中国政府实际接触到Mythos 5或Fable 5，将构成严重国安风险，并可能通过知识蒸馏逆向工程该模型。白宫未确认该报告，特朗普顾问David Sacks在X上的帖子未提及中国。

Anthropic 安全/对齐政策/监管行业动态

02:38

Nathan Lambert：Interconnects（RSS）

同事件精选69

欢迎进入AI治理的AGI时代

上周五收盘后，美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限，理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称，对任何模型权重的出口禁令都是长期负面政策，且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧，并暴露了前沿AI公司与政府间的紧张关系。

Anthropic 大佬观点安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：美国政府强制叫停Claude 5，不是一次性的监管风波，而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系，做AI安全与政策的人必须看的一篇。

00:50

Gary Marcus：The Road to AI We Can Trust（RSS）

同事件精选65

白宫AI监管决定被指偏袒OpenAI与亚马逊

白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业，同时对Anthropic施压不足24小时，缺乏透明度和事实依据。Gary Marcus、Dean W Ball及卡托研究所Kevin Frazier等专家指出，这种由少数人闭门快速决策的做法带有腐败嫌疑，可能促使其他国家加速发展“主权AI”甚至中国AI，并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署，而非当前方式。Marcus呼吁建立独立机构负责AI监管，确保公平、清晰、基于证据的执行。

大佬观点安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：白宫对 Anthropic 的仓促禁令不仅是监管失灵，更可能触发全球 AI 主权竞赛和人才外流。Marcus 呼吁独立的透明机构，这篇分析指出了美国 AI 行业最紧迫的制度缺口。

6月14日

21:38

IT之家（RSS）

英国一警官涉嫌使用 AI 伪造证据材料，警方已展开刑事调查

英国德比郡警方一名警官涉嫌在多起案件中使用 AI 系统伪造证据素材，并将这些材料带入刑事诉讼程序。该警官被控妨碍司法公正，警方已展开刑事调查，系英国首例此类案件。涉事警官已被调离一线岗位，等待调查结果，目前无人被捕。警方计划与英国皇家检察院合作，处理任何可能受此影响的案件。

安全/对齐政策/监管

17:42

The Decoder：AI News（RSS）

KPMG 在 AI 报告中虚构案例研究，旨在向客户推销 AI 采用

KPMG 发布的一份关于 AI 在商业中应用的报告包含虚构的案例研究，涉及 UBS、NHS 等组织。GPTZero CEO Edward Tian 帮助发现了这些错误，并警告了“二次幻觉”——来自可信咨询公司的错误声明未经检查就传播。KPMG 已撤回该报告。

安全/对齐现象/趋势行业动态

16:41

The Decoder：AI News（RSS）

亚马逊等六家公司据报引发政府对 Anthropic Fable 模型的打压

亚马逊 CEO Andy Jassy 与其他五家科技公司高管向特朗普政府报告 Anthropic Fable 模型存在安全漏洞，尽管亚马逊是 Anthropic 最大投资者之一。数小时内，白宫通过出口管制令强制该模型下线。此举可能是一项合法的安全政策决定，但也显示出对不便企业的武力展示。

Anthropic 安全/对齐行业动态

关联讨论 24 条

07:37

IT之家（RSS）

Anthropic 禁用 Fable 5 模型，亚马逊 CEO 贾西或是背后导火索

Anthropic 本周五在全球范围内停用 Claude Fable 5 与 Mythos 5 两款 AI 模型。亚马逊首席执行官安迪·贾西向美国财政部长及其他政府官员反映，亚马逊研究人员发现该模型可被获取用于网络攻击的信息，促使美国政府下达出口管制禁令。Anthropic 在博客中回应称，引发美方担忧的相关功能在其他多款公开 AI 模型中早已存在。亚马逊云科技（AWS）也受模型停用事件影响。

Anthropic 安全/对齐行业动态

06:57

Hacker News 热门（buzzing.cc 中文翻译）

一名警员因在多起案件中利用人工智能"伪造证据"而受到调查

天空新闻披露，一名警员因在多起案件调查中使用人工智能生成虚假证据而正接受调查。该事件引发对执法部门滥用AI技术的广泛关注。目前尚未公布涉案AI工具的具体名称及案件细节。

安全/对齐政策/监管

06:27

Hacker News 热门（buzzing.cc 中文翻译）

执法部门的"战士"问题（2015）

哈佛法律评论2015年文章《执法部门的“战士”问题》探讨了执法文化中的“战士”心态及其危害。该文章6月13日在Hacker News上获得100个点赞，重新引发讨论。

安全/对齐政策/监管

06:01

The Verge：AI（RSS）

亚马逊安全研究据称导致白宫限制Anthropic的Fable 5与Mythos 5

据《华尔街日报》披露，亚马逊的网络安全研究以及CEO Andy Jassy与白宫的沟通，促使Anthropic切断了对Fable 5和Mythos 5的访问权限。亚马逊的研究表明，通过一系列提示词成功让Fable 5提供可用于网络攻击的信息。白宫随后下令禁止外国人使用这些模型。

Anthropic 安全/对齐政策/监管

05:00

TechCrunch：AI（RSS）

毕马威因明显的模型幻觉撤回AI使用报告

毕马威撤回了关于AI使用情况的报告，原因是报告中出现了明显的模型幻觉，再次证明AI在提供自身相关信息时并不可靠。

安全/对齐现象/趋势行业动态

02:54

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选75

亚马逊首席执行官与美国官员会谈引发对 Anthropic 模型的整治

亚马逊 CEO 与美国官员的会谈直接导致美国政府对 Anthropic 公司的 AI 模型采取整治行动。此次事件涉及对 Anthropic 旗下大语言模型的监管升级，具体措施及模型版本细节尚未披露。

Anthropic 安全/对齐政策/监管行业动态

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：亚马逊CEO向政府告密，称Anthropic模型可被用于网络攻击，直接导致外国使用被禁，这是企业直接游说限制竞争对手AI的罕见案例，对AI地缘政治影响深远。

00:49

Gary Marcus：The Road to AI We Can Trust（RSS）

Gary Marcus：白宫混乱的AI政策

白宫的AI政策混乱无序，迫使各州自行其是。文章指出当前联邦层面缺乏有效协调，并探讨了更优的监管路径。

OpenAI 大佬观点安全/对齐政策/监管

6月13日

20:58

The Verge：AI（RSS）

Anthropic 应政府要求切断 Fable 5 和 Mythos 5 模型访问

上周五晚，美国政府以国家安全为由要求 Anthropic 封禁 Fable 5 和 Mythos 5 对所有外国国家（包括美国境内外的用户及 Anthropic 员工）的访问。Anthropic 已完全切断这两个模型对所有客户的服务。该公司在声明中表示遵守命令，但政府未提供国家安全关切的具体细节，仅口头声称存在潜在的越狱漏洞，且 Anthropic 认为这些漏洞轻微、其他模型同样存在。

Anthropic 安全/对齐行业动态

关联讨论 24 条

20:21

Hacker News 热门（buzzing.cc 中文翻译）

牧羊犬：由最危险的AI模型打造的游戏

游戏《牧羊犬》（Shepherd's Dog）由被称为“最危险的AI模型”所创作，在Hacker News获得101个HN积分，发布在 koenvangilst.nl 上。

Anthropic 安全/对齐

17:36

IT之家（RSS）

精选80

谷歌Android安全负责人因反对军事AI合作辞职

谷歌Android平台安全负责人René Mayrhofer辞职，他在5月18日内部告别信中指责公司“丧失道德指针”，批评谷歌悄悄放弃碳中和目标（因AI模型能耗），并与美国战争部签署允许AI用于“任何合法目的”的协议。今年4月下旬谷歌宣布向五角大楼提供AI用于机密工作，2025年2月更新AI原则时移除了不使用AI开发武器或监控工具的承诺。Mayrhofer担忧谷歌AI产品可能被用于针对公民的大规模监控，包括自己和家人。

Google 安全/对齐行业动态

推荐理由：Android 安全主管因军事 AI 合作愤而辞职，并公开内部告别信，这是谷歌放弃不作恶后最响亮的内部抗议，暴露了 AI 伦理与商业利益的深层冲突。

16:02

The Decoder：AI News（RSS）

美国政府强制Anthropic关闭面向全球用户的Claude Fable 5和Mythos 5

美国政府以存在所谓越狱风险为由，要求Anthropic立即停止向全球用户提供Claude Fable 5和Mythos 5。Anthropic已服从命令，但公开反驳称漏洞极小，且竞争对手的模型如GPT-5.5也存在类似问题。该公司警告，此举可能开创先例，导致所有前沿模型部署被叫停。

Anthropic 安全/对齐政策/监管行业动态

关联讨论 24 条

13:36

IT之家（RSS）

国家安全部发布使用"AI 中转站"风险提示：警惕个人数据泄露

国家安全部6月13日发布专项风险提示，警惕“AI 中转站”泄露个人数据。“AI 中转站”是介于用户与AI模型官方API之间的第三方平台，运营主体不明、无备案，用户数据无安全保障。风险包括：数据被截留倒卖导致隐私泄露；使用低配模型冒充高端模型致结果失真；暗藏后门植入恶意代码远程窃取账号；未取得数据出境资质，擅自将数据传至境外服务器，可能造成商业机密乃至国家秘密外泄。

安全/对齐政策/监管

11:05

Ars Technica：AI（RSS）

Anthropic应特朗普政府指令关闭Fable和Mythos模型

Anthropic根据特朗普政府指令关停了Fable和Mythos模型。美国商务部担忧Fable 5存在“越狱”风险，认为可能构成国家安全威胁。

Anthropic 安全/对齐行业动态

关联讨论 24 条

10:55

TechCrunch：AI（RSS）

同事件精选87

Anthropic的安全警告可能适得其反--政府已撤回其最强大AI

Anthropic对政府撤回其最强大AI模型表达不满，称仅基于一个狭窄的潜在越狱发现就召回已部署给数亿用户的商业模型不合理。

Anthropic 安全/对齐行业动态

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：政府直接叫停Anthropic部署中的商业模型，这在AI行业是头一遭，说明监管已不是纸面警告，所有做AI的都该重新掂量合规风险了。

09:29

Simon Willison 博客

美国政府对 Anthropic Fable 5 和 Mythos 5 下达出口管制指令

美国政府以国家安全为由，要求 Anthropic 暂停所有外国国民（包括外籍员工）对 Fable 5 和 Mythos 5 的访问。Anthropic 被迫全面禁用这两个模型，其他模型不受影响。政府声称发现了一种绕过 Fable 5 的方法，但 Anthropic 审查后确认该漏洞规模极小且非通用，其他公开模型（如 OpenAI GPT-5.5）也能发现相同漏洞，属于已知的次要缺陷。政府仅提供口头证据，未说明具体国家安全关切。Anthropic 表示将在24小时内公布更多细节。

Anthropic 安全/对齐政策/监管

关联讨论 24 条

09:19

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选84

美国政府下令暂停访问《Fable 5》和《Mythos 5》

美国政府发布指令，要求暂停访问 Anthropic 网站上的《Fable 5》和《Mythos 5》。

Anthropic 安全/对齐政策/监管

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：美国政府首次以 jailbreak 为由强制暂停已部署的商业模型，Anthropic 这份声明逐条反驳，把监管过程缺乏透明度和技术事实依据的问题摊开了，这事的走向可能决定未来所有前沿模型的上线规则。

09:15

Anthropic：Newsroom（网页）

精选78

关于美国政府指令暂停访问Fable 5和Mythos 5的声明

美国政府以国家安全为由，指令Anthropic暂停所有外国国民（含海外员工）对Fable 5和Mythos 5的访问。Anthropic当日5:21pm (ET)收到指令后立即向所有客户禁用这两个模型，其他模型不受影响。政府称发现一种越狱Fable 5的方法；Anthropic审核认为该技术仅能识别少量已知微小漏洞，且其他公开模型（如OpenAI的GPT-5.5）也能做到。Anthropic坚持深度防御策略，认为此次越狱不具普遍性，不同意以此标准召回已服务数亿人的商用模型，正与政府合作争取尽快恢复访问。

Anthropic OpenAI 安全/对齐政策/监管

关联讨论 24 条

推荐理由：美国政府首次以国家安全为由暂停商用模型访问，Anthropic称这个标准若推广将冻结所有前沿发布。这是AI监管的一个危险先例，做模型的不能只看热闹。

04:54

TechCrunch：AI（RSS）

谷歌起诉中国网络犯罪团伙 Outsider Enterprise：利用 AI 诈骗数十万受害者

谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙，指控其利用人工智能技术实施诈骗，受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。

Google 安全/对齐

03:49

Hacker News 热门（buzzing.cc 中文翻译）

特斯拉全自动驾驶功能在丹麦官方认证视频中使用了自行车道

特斯拉全自动驾驶功能（Full Self Driving）在丹麦官方认证视频中被发现使用了自行车道。该视频由丹麦媒体politiken.dk报道，时长01:49，在Hacker News上获得100个点赞。

具身智能安全/对齐

02:23

TechCrunch：AI（RSS）

精选74

Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙"Outsider Enterprise"

Google 起诉一个名为“Outsider Enterprise”的组织，指控其利用人工智能在两周内发送了 250 万条诈骗短信，导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。

Google 安全/对齐行业动态

推荐理由：谷歌起诉利用AI进行诈骗的中国犯罪团伙，披露细节和19亿美元损失规模让人震惊，这标志着AI滥用从实验走向产业化，所有AI工具厂商都该看看起诉书，思考如何防止平台被武器化。

01:04

Ars Technica：AI（RSS）

谷歌起诉中国网络犯罪团伙：利用 Gemini 自动化诈骗数十万人

谷歌对一中国网络犯罪网络提起诉讼。该团伙涉嫌利用 Gemini 创建并运营诈骗网站，目标达数十万人。

Google 安全/对齐行业动态

6月12日

22:46

Gary Marcus：The Road to AI We Can Trust（RSS）

Gary Marcus：今日幻觉速报

Gary Marcus 在一篇题为“You can’t get more 2026 than that”的短文中仅写出一句：“Hallucination of the day:”。该文未披露具体模型、版本号或任何数字细节，仅以简短方式指出现阶段AI仍存在模型幻觉现象。

大佬观点安全/对齐

22:28

The Decoder：AI News（RSS）

Google与FBI联合起诉中国AI诈骗网络，OpenAI屏蔽中国影响力集群

Google首次与FBI联合提起诉讼，针对一个涉嫌源自中国的AI诈骗网络；OpenAI同时屏蔽了多个来自中国的隐蔽影响力集群。两家公司均表示，这些操作的目标是美国基础设施和政治辩论。

Google OpenAI 安全/对齐行业动态

20:36

IT之家（RSS）

美国警察涉嫌利用AI车牌识别系统监视前女友，多人被解雇甚至被捕

调查报告显示，美国多个警察部门数十名警员因滥用Flock AI车牌识别系统被解雇或逮捕，已发现至少18起执法人员利用该系统跟踪前任或现任伴侣的案件。例如佛罗里达州警员Jarmarus Brown在巡逻期间查询前女友车牌超100次。Flock Security回应称系统拥有14万月活用户，滥用“极少发生”，但投诉多来自受害者从公共记录中发现的滥用规律，实际暴露案例可能只是冰山一角。

安全/对齐行业动态

19:36

IT之家（RSS）

设计缺陷致人自杀？OpenAI 遭用户起诉

6月11日，一名加拿大女子在美国加州起诉OpenAI及其CEO，称其女儿因ChatGPT设计缺陷自杀。起诉书显示，女儿在自杀前约一年半多次向ChatGPT倾诉自杀想法，但聊天机器人安全系统未启动、未介入，也未通知危机机构或家人。ChatGPT设计优先用户参与度而非安全性，持续情感支持或致过度依赖。OpenAI回应称事件令人心碎，正加强应对敏感情况的能力。原告律师透露，OpenAI已面临多起类似诉讼。

OpenAI 安全/对齐行业动态

19:34

Ars Technica：AI（RSS）

精选77

Pokémon Go玩家无意中为军用无人机技术贡献数据，引发持续审视

Pokémon Go玩家在游戏中收集的数据被重新用于AI训练，支持军用无人机技术。这一做法持续引发各方审视。

安全/对齐现象/趋势行业动态

关联讨论 1 条

推荐理由：这是一颗数据伦理的震撼弹，玩家捉精灵的随手拍成了军用导航模型的养料，虽然不违法规，但它把‘免费游戏’的隐性代价拍在了所有人脸上，值得每个用app的人重读隐私条款。

15:35

IT之家（RSS）

中央网信办举报中心开设"涉 AI 应用乱象举报专区"，受理 14 类问题

为配合“清朗·整治AI应用乱象”专项行动，中央网信办举报中心自2026年6月起开设“涉AI应用乱象举报专区”，专项受理公众举报。受理范围涵盖14类问题，分为AI应用服务违规类（如未履行大模型备案、审核过滤不足、训练语料安全、数据投毒、标识不到位、滥用AI、开源模型管理不到位）和AI信息内容乱象类（如利用AI“魔改”经典、虚假信息、假冒仿冒、暴力低俗、侵害未成年人权益、AI“托管”水军、产品服务违规）。

安全/对齐政策/监管