11.3 偏见识别与公平性考量
11.3.1 偏见的来源与类型
训练数据偏见
常见偏见类型
偏见类型
表现形式
示例
11.3.2 偏见识别方法
方法一:对比测试
方法二:隐式关联测试
方法三:场景模拟测试
11.3.3 偏见缓解策略
策略一:提示词层面去偏
策略二:输出审核与过滤
策略三:多样性审查流程
策略四:反馈闭环
11.3.4 行业合规要求
行业
主要关注点
相关法规
11.3.5 公平性评估指标
讨论
最后更新于
