13.1 AI 的偏见与伦理

我们总以为机器是绝对理性的，但实际上，AI 就像一面镜子，照出了人类社会的偏见。

13.1.1 算法也会“歧视”吗？

是的，而且很常见。

原因：AI 是通过学习互联网上的数据长大的。如果数据本身包含偏见，AI 就会学会这种偏见。

案例：

如果你让 AI “画一个医生”，它大概率会画一个男性；让它“画一个护士”，大概率是女性。

这就是 刻板印象。虽然在统计学上可能是事实，但如果 AI 在做决策（比如贷款审批、医疗诊断）时带入这种偏见，就会造成社会不公。

即使我们想教 AI “要做个好人”，也很难定义什么是“好”。

让 AI 的价值观与人类价值观保持一致，这被称为 “对齐问题”（Alignment Problem），是目前 AI 研究最核心的领域之一。我们在之前学过的 RLHF（详见 4.4.3 节）正是解决对齐问题的核心技术手段之一。

如果让你设计一个“招聘 AI”的公平性规则，你会加入哪 2 条硬性约束，来降低性别或地域偏见？

最后更新于19小时前