Anthropic 5 月发布白皮书,提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速:前沿模型将漏洞发现到利用周期压缩至数小时;Agent 能自主解释目标、选工具、执行多步操作,传统访问控制无法阻止“合法权限内作恶”。核心原则:永不信任始终验证、假设已遭入侵、最小权限;另附设计检验——控制是让攻击不可能,还是仅增加麻烦?报告分五部分:Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。
面向 AI Agent 的零信任安全:企业自主 AI Agent 部署框架
Anthropic 官方 5 月份发布的白皮书:企业部署自主 AI Agent 时,传统边界安全不够用,必须把零信任原则延伸到 Agent 架构本身。
报告开篇点出双重加速: · 基础设施层面:前沿 AI 模型把「漏洞发现 → 利用」的周期从数月压缩到数小时,攻击成本极低。 · Agent 层面:Agent 能自主解释目标、选工具、执行多步操作。传统访问控制挡不住「在合法权限内作恶」,监控也要面对「不靠漏洞、靠持久化操控」的新型攻击。
因此,报告认为:未来优势不取决于谁用了最先进的 AI,而取决于谁的基础安全足够扎实,且 Agent 从第一天就按「已遭入侵」来设计。
零信任的三条原则(和一条设计检验) 三条原则 · 永不信任,始终验证:内外网请求一视同仁,每次访问都要认证与授权 · 假设已遭入侵:重点不是「防住入侵」,而是限制单点失守后的破坏范围 · 最小权限:只给完成任务所需的最小访问权 一条设计检验 这个控制是让攻击不可能,还是只是让攻击更麻烦?
报告中的五个部分分别是: Part I:Agent 为何是新的安全对象? Part II:当前威胁图谱(OWASP 视角) Part III:三层能力成熟度模型(报告核心) Part IV:八阶段实施工作流 Part V:防御运营要跟上自主威胁的速度
白皮书地址: https://cdn.prod.website-files.com/6889473510b50328dbb70ae6/6a1611a04085d7cd3dadc924_Claude-eBook-Zero-Trust-for-AI-Agents-05182026.pdf
视频版 🔽🔽🔽