4.2 监督学习

说明 本讲核心:监督学习就是“刷题”。当反馈清晰、数据可靠且训练流程合理时,模型表现通常会提升。 一句话口诀:有标签,叫监督;没标签,叫无监督。

4.2.1 填鸭式教育的胜利

监督学习(Supervised Learning) 是目前 AI 领域最成熟、应用最广的技术。 它的本质,就是一场 填鸭式教育

想象一个 “虎妈”(算法)教育孩子(模型):

  1. 刷题:虎妈拿出一张照片(输入 X),问:“这是什么?”

  2. 回答:孩子瞎猜:“是猫。”

  3. 打分:虎妈看了一眼背面写着的标准答案(标签 Y),说:“错!这是狗。”

  4. 修正:孩子挨了一手板,记住了这次教训。

在数据质量和训练流程都可靠的前提下,这种流程反复足够多次,模型识别能力通常会显著提升。 很多成熟 AI 应用(人脸识别、语音识别、垃圾邮件拦截)都建立在监督学习或其变体之上。

4.2.2 两种题型:选择题 vs 填空题

在监督学习的试卷上,主要有两种题型:

  1. 分类问题(Classification) —— 做选择题

    • 答案是 离散 的,有限个选项。

    • 例子:这封邮件是垃圾邮件吗?(A. 是 / B. 否)

    • 例子:这个图是数字几?(A. 0 / B. 1 ... / J. 9)

  2. 回归问题(Regression) —— 做填空题

    • 答案是 连续 的数字,可能性无限。

    • 例子:明天的房价是多少?(填:500万,501万...)

    • 例子:这孩子能长多高?(填:170cm,170.1cm...)

所以,区分它们的秘诀很简单:看输出结果是不是“连贯”的数值。

4.2.3 监督学习的代价:昂贵的“答案”

既然监督学习这么好用,为什么我们不把所有 AI 都做成监督学习? 因为 “标准答案”(标签) 太贵了。

要训练一个能看懂 X 光片的 AI,你需要请几百个年薪百万的放射科主任,一张一张地在片子上圈出肿瘤。 这哪里是训练数据,简直是用黄金铺出来的。 数据标注成本,是阻碍监督学习发展最大的拦路虎。

4.2.4 思考题

假设你想做一个“预测股票涨跌”的 AI。

  1. 这是一个分类问题(涨/跌)还是回归问题(涨多少点)?

  2. 它的“标签”(标准答案)从哪里来?需要人工标注吗,还是可以自动获得?(这一点决定了它是否昂贵)

最后更新于