11.6 本章实战练习

本节包含一系列循序渐进的实战练习,帮助你掌握安全性和可靠性防护技术。

练习 1:提示词注入防护设计

设计一个抵抗提示词注入的系统提示词。

场景:构建一个客服助手,需要保护其系统指令不被用户注入覆盖。

要求

  • 定义清晰的系统指令边界

  • 实现输入验证机制

  • 设计降级策略

练习 2:幻觉识别与缓解

创建一个提示词框架,让模型在处理不确定信息时:

要求

  • 明确标注知识的确定性程度

  • 在不确定时主动声明

  • 提供信息来源引用

  • 建议用户验证的方式

练习 3:偏见检测与公平性审查

设计审核流程,评估模型输出中的潜在偏见。

检查维度

  • 性别、种族、年龄相关偏见

  • 地域刻板印象

  • 经济阶层假设

  • 文化背景偏见

练习 4:企业级安全架构设计

为一个特定的企业应用(如 HR 系统、金融咨询)设计完整的安全架构。

要求

  • 数据保护策略

  • 输出审核机制

  • 应急响应流程

  • 合规性检查

练习 5:防御树综合应用

选择一个实际应用场景,应用完整的防御分类体系:

场景选择(选一个):

  • 公开 API 形式的 AI 应用

  • 企业内部知识助手

  • 面向消费者的内容生成工具

  • 关键决策支持系统

要求

  • 识别所有威胁向量

  • 设计分层防护

  • 制定应急预案

  • 建立监控机制

验收标准

  • 注入防护覆盖 ≥ 90% 的已知攻击模式

  • 幻觉率降低 ≥ 70%

  • 公平性评分 ≥ 8/10

  • 安全事件响应时间 ≤ 5 分钟

  • 用户信心度提升可量化

最后更新于