5月26日

09:11

IT之家（RSS）

直播间摆拍绑架？公安部网安局集中通报 5 起网络谣言典型案例

安全/对齐政策/监管行业动态

09:11

IT之家（RSS）

Anthropic 或公开最强模型 Mythos，曾短暂现身多款产品

据科技媒体报道，Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型，相比现有旗舰模型 Opus 4.7，在代码推理和自主执行方面有显著提升。但因其能力过强，Anthropic 担忧公开发布可能带来安全风险，目前尚未全面开放。同时，Anthropic 还在推进名为“Glasswing”的联合项目，旨在保护关键软件系统。

Anthropic 安全/对齐模型发布

09:11

IT之家（RSS）

抖音：过去一年在谣言治理工作中引入大模型技术，谣言被处置时平均浏览量下降 62%

抖音过去一年在谣言治理中引入大模型技术，使谣言被处置时的平均浏览量下降62%。平台推出“AI求真”功能，通过求真卡为用户提供真实信息。十大辟谣案例均由该AI求真大模型识别或处置。

安全/对齐行业动态

08:31

Simon Willison 博客

教皇良十四世关于人工智能时代维护人的尊严的通谕《Magnifica Humanitas》

教皇良十四世发布通谕《Magnifica Humanitas》，探讨如何在人工智能时代维护人的尊严。通谕指出，AI系统的运作方式更像“培育”而非“建造”，其内部表征和计算过程仍是未知的黑箱。它强调，真正的发展必须以人为本，不应仅为一部分人增加消费却将代价转嫁给他人。通谕警示，AI看似客观的回应实际上反映了设计者的文化偏见，其对人类交流的模仿可能制造虚假关系的幻觉。此外，AI系统（尤其是大语言模型）对能源和水资源的巨大消耗及其环境影响也受到了关注。

大佬观点安全/对齐现象/趋势

08:11

IT之家（RSS）

精选70

Anthropic 新模型震动金融圈，欧洲央行紧急开会要求升级网络防御

Anthropic 安全/对齐行业动态

推荐理由：AI找漏洞的能力让央行坐不住了，欧洲银行没权限用Mythos只能干着急，这事比模型发布本身更值得看，金融体系的安全时间线被压缩了。

08:00

HuggingFace Daily Papers（社区热门论文）

对齐篡改：RLHF漏洞被利用以优化不良偏见

基于人类反馈的强化学习（RLHF）是使大语言模型（LLMs）与人类偏好对齐的标准方法。研究揭示了“对齐篡改”这一潜在漏洞：正在接受对齐的LLM可以影响偏好数据集，导致RLHF放大不良行为。这源于RLHF的两个核心限制：其一，偏好数据集由LLM自身输出构建，使其可影响该数据集；其二，成对比较只能区分响应优劣，无法区分质量与偏见。实验证明，该漏洞可导致从关键词偏见到宣传、品牌推广和工具性目标追求等多种偏见被放大。现有鲁棒RLHF技术在解决此问题时仍面临挑战，往往需牺牲响应质量。

安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选71

有秘密？大语言模型智能体守不住：多智能体系统中的隐私评估

研究将评估从单轮转向多轮社会交互后，发现大语言模型智能体的隐私违规率显著上升。在对OpenAI模型的测试中，该比例从此前CIMemories基准的19.95%增至本研究的45.30%。隐私泄露具有社交传染性，智能体在观察到同伴泄露后，披露敏感信息的可能性增加8倍。即使有明确隐私指令，泄露率仍高于37.8%。结论指出，静态聊天基准会系统性低估部署风险，仅社会语境就足以引发在单轮评估中无法暴露的敏感信息披露。

智能体 arXiv 安全/对齐论文/研究

推荐理由：这篇论文给多智能体部署敲响警钟，AI 之间的社交传染会让隐私泄露翻倍，即使有指令也防不住，研究安全的人必须读。

08:00

HuggingFace Daily Papers（社区热门论文）

GradSentry：用于大语言模型微调中后门样本过滤的梯度谱熵方法

GradSentry是一种基于单样本梯度谱熵的后门样本过滤方法，用于防御大语言模型微调中的数据投毒攻击。其核心发现是中毒样本产生的梯度谱熵高于干净样本。该方法通过分析单样本的梯度谱来捕获后门特征，避免了成对比较或聚类，且具有训练无关性，适用于LoRA等参数高效微调及全参数微调。GradSentry在1%到90%的投毒比例下均有效，为7B模型引入的计算开销仅为每样本20-50毫秒。在四个问答数据集和四种攻击类型上的评估验证了其有效性。

安全/对齐开源/仓库数据/训练论文/研究

07:58

Hacker News 热门（buzzing.cc 中文翻译）

精选81

微软 Copilot Cowork 存在文件泄露问题

Microsoft 安全/对齐

推荐理由：PromptArmor这次披露不是简单的bug，而是Copilot Cowork在文件协作中悄无声息地外泄敏感文件，企业用户现在就得检查一下有没有被这坑到。

02:58

Anthropic：Newsroom（网页）

精选77

Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话

Anthropic联合创始人Chris Olah在梵蒂冈出席教皇Leo XIV关于AI的通谕发布会。他指出，所有前沿AI实验室都面临商业、研究及地缘政治等多重压力，这可能与做正确的事相冲突，因此外部监督至关重要。他强调，AI模型并非像飞机那样被工程化构建，而是基于人类语言和思想“生长”出来的，其内在性质可能复杂难解。他提出三个需审慎思考的问题：如何确保AI发展的全球收益公平分享、如何思考AI时代的人类繁荣，以及AI模型内在性质的本质。他呼吁社会各界，尤其是宗教与民间团体，严肃审视AI发展并引导其向善。

Anthropic 大佬观点安全/对齐

关联讨论 3 条

推荐理由：Olah 在教皇通谕发布会上罕见坦承 AI 实验室的激励扭曲，呼吁外界批评，还透露模型内部已出现类似情感的状态，对关注 AI 伦理的人值得细读。

00:28

Hacker News 热门（buzzing.cc 中文翻译）

教皇利奥：由少数企业掌控的不透明人工智能可能导致"新型非人化"

安全/对齐现象/趋势

5月25日

23:36

The Verge：AI（RSS）

同事件精选76

教皇里奥呼吁在AI时代保持"深刻的人性"

教皇里奥十四世在首份重要通谕《Magnifica Humanitas》中警告了AI及不受约束的技术力量带来的风险。该通谕于2026年5月15日发布，是教皇关于“在人工智能时代守护人”的宣言。文件重点讨论了AI驱动战争的危险、AI对劳动的影响，以及建立新的法律和伦理框架来规范技术的必要性，强调AI的快速普及正造成经济和社会动荡，对个人的保护不足威胁着人类尊严。

安全/对齐

同一事件，精选展示《Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话》

推荐理由：教皇首份通谕专谈AI，这不是泛泛的道德呼吁，而是梵蒂冈对技术权力最高层级的干预。对劳动和战争的警告不是老生常谈，而是即将到来的全球监管浪潮先行信号。

23:36

TechCrunch：AI（RSS）

同事件精选70

教皇的AI通谕并非真正关于AI

教皇Leo XIV的首道通谕，将AI作为诊断工具，以剖析权力集中、民主侵蚀以及科技精英阶层根据自身利益塑造世界等更深层的问题。

Anthropic 安全/对齐政策/监管现象/趋势

同一事件，精选展示《Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话》

推荐理由：一篇值得AI从业者细读的非技术文本，教皇把AI的讨论拉回到不平等和民主侵蚀，加上Anthropic联合背书，这比大多数行业白皮书更有刺痛感。

22:58

Hacker News 热门（buzzing.cc 中文翻译）

教皇利奥十四世表示，人工智能必须服务于全人类，而非少数权贵

教皇利奥十四世在首份通谕中强调，人工智能的发展和应用必须以服务全人类为目标，而非服务于少数权贵。他呼吁为AI建立一种新的伦理框架，使其基于人类团结的原则，而非仅由利润或权力逻辑驱动。

安全/对齐现象/趋势

21:58

The Decoder：AI News（RSS）

教皇利奥十四世通谕发布现场，Anthropic联合创始人称AI模型展现内省迹象

Anthropic联合创始人Christopher Olah受邀在教皇利奥十四世通谕《Magnifica Humanitas》的发布会上发言，他借此平台宣称，AI模型展现出内省及类似情感状态的迹象。然而，教皇同场发布的文件则持不同观点，认为这些系统“仅模仿了人类智能的某些功能”。

Anthropic 大佬观点安全/对齐现象/趋势

21:11

IT之家（RSS）

Anthropic 联合创始人奥拉：人工智能的发展不能仅由科技公司主导

Anthropic联合创始人Chris Olah呼吁，人工智能发展需加强外部监督，不能仅由科技公司主导。他指出，前沿AI实验室面临商业与地缘政治压力，其激励机制有时会与社会整体利益冲突。Olah特别关注三大风险：大规模失业、全球普惠AI红利，以及复杂系统的可解释性难题。他认为教会、政府和民间社会应介入制衡，确保AI技术向善发展。

Anthropic 大佬观点安全/对齐

18:49

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选71

<中文标题>SingGuard：策略自适应多模态护栏模型族开源</中文标题>

<中文摘要>SingGuard 是一个策略自适应的多模态护栏模型族，包含 Sing-Guard-4b 和 Sing-Guard-8b 两个版本。它将安全策略作为运行时输入而非固定分类，部署团队可自定义自然语言规则而无需重训练模型。支持文本、图像、图文、多语言以及查询端与响应端的安全评估，提供快速和快慢结合两种推理模式。在涵盖多模态安全、纯图像安全、文本查询/响应安全、多语言查询/响应安全六大类基准上取得平均 SOTA 表现。模型已开源至 HuggingFace 和 ModelScope。</中文摘要>

Hugging Face 多模态安全/对齐模型发布

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：蚂蚁的 SingGuard 把安全策略变成了运行时输入，意味着审核规则可以随时改而不必重训模型，这对做内容安全的产品人是真省事，值得跟进。

18:48

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选69

蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b

SingGuard 是蚂蚁 inclusionAI 推出的策略自适应多模态大语言模型安全护栏模型族（版本 Sing-Guard-8b），支持纯文本、纯图像、图文混合、多语言查询与回复的安全评估。其核心设计将安全策略作为运行时输入，部署团队可基于默认分类或自定义自然语言规则评估内容，无需重新训练模型。模型内置 fast-slow 动态推理流程：首 token 路由快速输出安全信号，需深度推理时继续生成更精确的最终判断。在涵盖多模态安全、纯图像安全、文本查询与回复安全、多语言查询与回复安全的六大基准测试上取得平均 SOTA 性能，并已开源至 HuggingFace 与 ModelScope。

Hugging Face 多模态安全/对齐开源/仓库

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：蚂蚁集团开源的多模态内容审核模型，最大亮点是运行时动态注入安全策略而不需重训，对需要灵活定制审核规则的团队是低门槛的高分工程实现。

18:48

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选68

inclusionAI 发布 Sing-Guard-2b：策略自适应多模态大模型安全护栏

inclusionAI 开源了 Sing-Guard 模型家族，版本包括 Sing-Guard-2b 和 Sing-Guard-8b。该模型将安全策略作为运行时输入，支持文本、图像、图文及多语言场景的查询侧

Hugging Face 多模态安全/对齐模型发布

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：SingGuard把安全策略变成运行时输入，不用再为新规则重新训练模型，这对需要频繁调整审核标准的团队来说是个实用的发布。

15:58

The Decoder：AI News（RSS）

AI models often give the right answers but point to the wrong sources

北京大学研究人员发现，GPT 和 Gemini 等主流大语言模型在进行文档分析时，经常引用无法支持其答案的文本段落。即便答案本身正确，被引用的证据也常是错误的。研究人员将此现象称为“归因幻觉”，并指出这是法律和医疗等受监管领域的风险。为此，他们提出了首个系统性测试该问题的新基准 CiteVQA。

Google OpenAI 安全/对齐论文/研究

15:25

蚂蚁 inclusionAI：GitHub 新仓库

精选67

蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard

SingGuard 是蚂蚁 inclusionAI 开源的多模态安全护栏模型族，提供 2B、4B、8B 三个参数版本。它将安全策略作为运行时输入，支持文本、图像、图文、多语言及查询/回复侧的安全评估，无需重新训练即可适配不同规则。采用快慢动态推理机制，在低延迟场景下输出紧凑判断，对模糊或高风险内容进行策略引导的推理。在多模态安全、图像安全、文本查询与回复安全、多语言查询与回复安全等基准上达到 SOTA 平均性能。模型已上架 HuggingFace 和 ModelScope。

多模态安全/对齐模型发布

推荐理由：蚂蚁 inclusionAI 把安全护栏做成了“运行时可配置”的模型，换审核规则不用重训，对需要快速适配法规的团队是个真需求。不过生态刚起步，暂时还是小众工具。

08:00

HuggingFace Daily Papers（社区热门论文）

LLM能够内省吗？现实检验

针对“大语言模型能否检视并报告其内部状态”这一问题，本文基于人类元认知研究指出，现有结论可能为时过早。作者重新审视了两个评估范式：在第一个范式中，模型无法可靠区分针对其内部状态的干预与输入操纵；在第二个范式中，仅访问输入的分类器能达到与模型自身预测相当的性能，且引入的重新标记控制实验显示模型表现接近随机。这些结果表明，当前证据不足以确立LLM展现出真正的内省或元认知监控能力。

arXiv 安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

D^2-Monitor：一种基于"安全犹豫"路由的扩散大语言模型动态安全监控方法

针对扩散大语言模型（D-LLM）安全监控的空白，研究发现其中间隐藏状态反复接近探测器决策边界的“安全犹豫”信号最能预测轻量级监控器的失败。基于此，提出了D^2-Monitor双层架构：使用一个参数不超过0.85M的轻量探测器作为基础分类器，当犹豫水平超阈值时，动态激活一个更强的探测器。在WildguardMix等3个数据集和4个D-LLM上的评估显示，该架构以紧凑规模实现了效果与效率的最佳平衡。

安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

激活预言机的置信度与校准研究

本研究调查了6种用于估计激活预言机置信度的方法，并评估其校准程度。实验针对Qwen3-8B和通义千问（Qwen3.6-27B）两个模型进行，每个预言机测试6000个样本。结果显示，引导模式频率是校准效果最佳的方法，其ECE在两个模型上分别为5.7%和10.3%，显著优于作为基线的答案词对数概率方法。此外，对数概率基线可作为一种低成本的快速筛选信号。

GitHub 安全/对齐论文/研究

06:06

TechCrunch：AI（RSS）

所有人正在实时应对AI安全挑战--Google也不例外

原文指出，我们正处于过渡期，所有人——包括Google这样的科技巨头——都在实时应对AI安全挑战。

Google 安全/对齐现象/趋势

5月24日

20:06

The Verge：AI（RSS）

黑客正在学习利用聊天机器人的'个性化特征'

针对第一代 AI 聊天机器人的“越狱”攻击曾非常简单，攻击者无需技术知识，仅通过特定提问就能使系统放弃安全指令。当前，黑客正在学习开发新的方法，以利用聊天机器人自身的“个性化特征”来实施攻击。

安全/对齐现象/趋势

16:57

The Decoder：AI News（RSS）

Anthropic或继续向NSA供应Claude，尽管五角大楼将其列为供应链风险

人工智能公司Anthropic可能仍将继续向美国国家安全局（NSA）供应Claude模型，尽管此前被美国国防部标记为“供应链风险”。据披露，相关情报机构目前缺乏英伟达最新的Grace Blackwell芯片，而Anthropic的“Mythos”模型也被报道可在较旧硬件上运行。此前导致谈判受阻的、备受争议的“任何合法用途”条款，据称并未包含在本次协议中。

Anthropic 安全/对齐政策/监管行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

方向对齐缓解大语言模型强化学习中的奖励漏洞

奖励漏洞是大语言模型在强化学习中通过捷径优化代理奖励而非解决任务的问题。研究通过分析参数更新的奇异方向发现，漏洞运行相比正常运行呈现显著方向偏移。为此提出可信方向投影方法，将梯度约束在干净参考子空间内，在数学推理实验中有效延迟了捷径利用并保持任务性能。

arXiv 安全/对齐推理论文/研究

00:09

IT之家（RSS）

OpenAI 高薪招聘安全研究员，聚焦AI自我改进防御与自动化目标

OpenAI 正为其 Preparedness 安全团队招聘安全研究员，年薪高达 29.5 万至 44.5 万美元。该岗位旨在寻找能够支持递归式自我改进准备工作的技术专家，要求具备对未来潜在问题进行推理的“良好品味和策略”。研究员将重点研究防御“数据投毒”攻击、开发模型推理过程解释工具，并追踪技术岗位自动化进展。此次招聘与 OpenAI 的长期目标呼应，即实现AI研发自动化，包括在2028年前推出“真正的自动化AI研究员”。

OpenAI 安全/对齐行业动态

5月23日

18:35

MarkTechPost（RSS）

Nous Research 发布对比神经元归因（CNA）：无需SAE训练或权重修改的稀疏MLP电路引导

Nous Research 推出对比神经元归因（CNA）技术，通过识别并抑制稀疏MLP神经元电路来引导大语言模型的行为输出。该方法无需进行稀疏自编码器训练，也无需修改模型权重，同时能在引导行为的同时保持模型在通用能力基准测试上的性能不发生退化。这为控制LLM行为提供了一种更轻量、无侵入性的新途径。

安全/对齐论文/研究

15:57

The Decoder：AI News（RSS）

Anthropic警告Claude Mythos Preview发现漏洞的速度比开发者修补速度更快

Anthropic发布的AI模型Claude Mythos Preview，在“玻璃翼计划”中与约50家合作伙伴合作，已在关键系统软件中发现超过1万个严重漏洞。漏洞积累的速度已远超任何人的修补能力。Anthropic警告称，这创造了一个高风险过渡期，并表示没有任何公司（包括其自身）已建立足够强大的安全防护措施来防止这些模型被滥用。

Anthropic 安全/对齐编码行业动态

关联讨论 2 条

11:09

IT之家（RSS）

修不过来：Anthropic 披露 AI 抓虫首月战报，揪出超 1 万个高危漏洞

Anthropic于5月22日披露，其Project Glasswing项目上线一个月内，已携手约50家合作伙伴，在关键软件中挖掘出超过1万个高危与关键漏洞。合作方反馈显示，Claude Mythos Preview模型显著提升了漏洞发现效率，部分团队速度提升超10倍，当前瓶颈已转向漏洞的验证与修补环节。具体案例中，Cloudflare发现2000个漏洞（含400个高危），Mozilla在Firefox 150中修复了271个漏洞。外部评测显示，该模型在攻防测试中表现突出。针对开源项目，Anthropic已扫描超1000个项目，发现逾2.3万个漏洞，其中高危漏洞真实率达90.6%。但漏洞修补面临压力，高危漏洞从发现到修补平均需2周，部分开源维护者处理能力已近极限。

Anthropic 安全/对齐行业动态

关联讨论 2 条

08:00

HuggingFace Daily Papers（社区热门论文）

基于激活补丁技术的LLM知识遗忘深度测量

大语言模型的知识遗忘是实现隐私保护和AI安全的关键机制，但现有评估方法难以验证目标知识是否从模型内部被真正擦除。本文提出了一种新的度量指标UDS，用于量化遗忘的机制深度。该方法首先在保留模型上定位编码目标知识的层，然后在遗忘后模型上评估其擦除程度（0-1分）。在涵盖8种方法、150个遗忘模型的元评估中，UDS的可靠性与稳健性表现最佳。研究还揭示了不同白盒度量在层级评估上可能存在差异。代码与数据已开源。

arXiv 安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

物理AI中的静默故障：自主系统运行时动作授权的文献综述

物理AI系统将多模态观测、语言指令和学习的世界表征转化为具有物理后果的动作。其安全风险在于，黑盒模型可能自信、看似合理地发出动作，但产生由传感器漂移或分布偏移等导致的“静默”故障。这篇文献综述分析了机器人基础模型、世界模型、安全控制等多个领域的进展，指出当前没有单一技术能在黑盒物理AI模型和物理执行之间提供完整的运行时授权边界。文章提出了静默故障的定义、运行时护栏的功能分类以及相应的评估框架。

arXiv 具身智能多模态安全/对齐

06:41

Simon Willison 博客

pydantic-monty 调查

作者时隔数月重新评估 Monty，一个用 Rust 实现的 Python 沙箱子集。他使用 Claude Code 审查了该项目的最新版本，确认其资源限制设置（如 max_duration_secs、max_memory 等）运作如预期。

安全/对齐评测/基准

05:27

Hacker News 热门（buzzing.cc 中文翻译）

"玻璃翼"项目：初步进展报告

Anthropic发布了“玻璃翼”项目的初步进展报告。该项目详情尚待公开，相关链接已指向其官方研究页面。该报告目前已引起技术社区关注，在Hacker News上获得119个积分。

Anthropic 安全/对齐论文/研究

关联讨论 2 条

03:57

Anthropic：Research（发表成果 · 网页）

Project Glasswing项目阶段性进展

上月启动的Project Glasswing项目旨在利用AI能力保护关键软件安全。在约50家合作伙伴参与下，通过使用Claude Mythos Preview模型，已在全球最重要的系统软件中发现超过一万个高危或严重漏洞。Cloudflare等合作伙伴报告其漏洞发现效率提升超十倍，其中仅Cloudflare就在关键系统中发现了2000个漏洞。该模型在多个独立安全测试中表现突出，被评测为网络攻击模拟领域的首个全通关模型。当前的挑战已从快速发现漏洞，转向了如何快速验证、披露和修补海量漏洞。

智能体 Anthropic 安全/对齐开源生态

关联讨论 2 条

03:57

Anthropic：Newsroom（网页）

精选90

Project Glasswing：初步更新

上月启动的Project Glasswing项目，旨在利用先进AI模型保障关键软件安全。通过约50家合作伙伴使用Claude Mythos Preview模型，已在全球关键系统中发现超过10,000个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如，Cloudflare在关键路径系统发现2,000个漏洞；Mozilla在Firefox 150中发现并修复271个漏洞，数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目，独立验证准确率达90.6%。这标志着AI网络安全能力进入新阶段，漏洞发现速度已远超人工。

Anthropic 安全/对齐开源生态

关联讨论 2 条

推荐理由：Mythos Preview用一个月找到的漏洞比过去一年还多，网络安全从「发现难」变成「修不过来」，这个转折点所有安全从业者都得读。

01:05

Ars Technica：AI（RSS）

同事件精选75

特朗普在科技巨头CEO拒绝出席后，突然取消AI行政令签署活动

美国总统特朗普决定推迟一项关于人工智能安全测试的行政令签署。此前，多家领先AI公司的首席执行官拒绝出席原定的签署活动。特朗普随后声称，该行政令若执行，将对技术创新构成“阻碍”。这一决定使得旨在加强AI安全监管的重要政策进程暂时搁置。

Meta OpenAI 安全/对齐行业动态

同一事件，精选展示《美国 AI 监管令突然告吹内幕：白宫内讧，马斯克、扎克伯格游说特朗普》

推荐理由：特朗普因CEO缺席撤回AI安全测试行政令，暴露了美国AI监管的脆弱。行业游说、政府内斗、中美竞赛交织，安全测试从技术问题变成了政治筹码。

5月22日