11.6 本章实战练习

本节包含一系列循序渐进的实战练习，帮助你掌握安全性和可靠性防护技术。

练习 1：提示词注入防护设计

设计一个抵抗提示词注入的系统提示词。

场景：构建一个客服助手，需要保护其系统指令不被用户注入覆盖。

要求：

定义清晰的系统指令边界
实现输入验证机制
设计降级策略

练习 2：幻觉识别与缓解

创建一个提示词框架，让模型在处理不确定信息时：

要求：

明确标注知识的确定性程度
在不确定时主动声明
提供信息来源引用
建议用户验证的方式

练习 3：偏见检测与公平性审查

设计审核流程，评估模型输出中的潜在偏见。

检查维度：

性别、种族、年龄相关偏见
地域刻板印象
经济阶层假设
文化背景偏见

练习 4：企业级安全架构设计

为一个特定的企业应用（如 HR 系统、金融咨询）设计完整的安全架构。

要求：

数据保护策略
输出审核机制
应急响应流程
合规性检查

练习 5：防御树综合应用

选择一个实际应用场景，应用完整的防御分类体系：

场景选择（选一个）：

公开 API 形式的 AI 应用
企业内部知识助手
面向消费者的内容生成工具
关键决策支持系统

要求：

识别所有威胁向量
设计分层防护
制定应急预案
建立监控机制

验收标准

注入防护覆盖 ≥ 90% 的已知攻击模式
幻觉率降低 ≥ 70%
公平性评分 ≥ 8/10
安全事件响应时间 ≤ 5 分钟
用户信心度提升可量化

上一页11.5 提示词注入防御完整攻防树：分类、防守与架构下一页本章小结

最后更新于 26天前