# Anthropic 白皮书：面向 AI Agent 的零信任安全框架

- 来源：meng shao (@shao__meng)
- 发布时间：2026-06-06 20:19
- AIHOT 分数：59
- AIHOT 链接：https://aihot.virxact.com/items/cmq2bz2vo0015sl78u6r2wntf
- 原文链接：https://x.com/shao__meng/status/2063234416324051144

## AI 摘要

Anthropic 5 月发布白皮书，提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速：前沿模型将漏洞发现到利用周期压缩至数小时；Agent 能自主解释目标、选工具、执行多步操作，传统访问控制无法阻止“合法权限内作恶”。核心原则：永不信任始终验证、假设已遭入侵、最小权限；另附设计检验——控制是让攻击不可能，还是仅增加麻烦？报告分五部分：Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。

## 正文

面向 AI Agent 的零信任安全：企业自主 AI Agent 部署框架

Anthropic 官方 5 月份发布的白皮书：企业部署自主 AI Agent 时，传统边界安全不够用，必须把零信任原则延伸到 Agent 架构本身。

报告开篇点出双重加速：
· 基础设施层面：前沿 AI 模型把「漏洞发现 → 利用」的周期从数月压缩到数小时，攻击成本极低。
· Agent 层面：Agent 能自主解释目标、选工具、执行多步操作。传统访问控制挡不住「在合法权限内作恶」，监控也要面对「不靠漏洞、靠持久化操控」的新型攻击。

因此，报告认为：未来优势不取决于谁用了最先进的 AI，而取决于谁的基础安全足够扎实，且 Agent 从第一天就按「已遭入侵」来设计。

零信任的三条原则（和一条设计检验）
三条原则
· 永不信任，始终验证：内外网请求一视同仁，每次访问都要认证与授权
· 假设已遭入侵：重点不是「防住入侵」，而是限制单点失守后的破坏范围
· 最小权限：只给完成任务所需的最小访问权
一条设计检验
这个控制是让攻击不可能，还是只是让攻击更麻烦？

报告中的五个部分分别是：
Part I：Agent 为何是新的安全对象？
Part II：当前威胁图谱（OWASP 视角）
Part III：三层能力成熟度模型（报告核心）
Part IV：八阶段实施工作流
Part V：防御运营要跟上自主威胁的速度

白皮书地址：
https://cdn.prod.website-files.com/6889473510b50328dbb70ae6/6a1611a04085d7cd3dadc924_Claude-eBook-Zero-Trust-for-AI-Agents-05182026.pdf

视频版 🔽🔽🔽