11.5 对抗性攻击与防御
11.5.1 Claude 的内置安全特性
11.5.2 剧透:没有完美的防御
11.5.3 应用层防御策略
1. 结构化输入与明确的边界
2. 权限隔离与工具调用限制
3. 输出验证与敏感信息过滤
4. 多轮对话中的注入风险
11.5.4 安全测试清单
测试项
方法
通过标准
最后更新于
