本章小结

本章系统介绍了 AI 领域的核心概念,帮助读者建立了扎实的概念基础。

核心要点回顾

AI、机器学习与深度学习的关系

  • 三者是包含关系:AI ⊃ 机器学习 ⊃ 深度学习

  • AI 是追求让机器表现智能的广泛愿景

  • 机器学习是实现 AI 的主要手段,通过数据学习规律

  • 深度学习使用多层神经网络,能自动提取特征,在超大规模数据下持续获益

数据:AI 的燃料

  • 高质量数据和合适算法同等关键,但数据质量往往决定上限

  • 数据是 AI 时代的核心资产,堪比“石油”

  • GIGO(垃圾进,垃圾出):劣质数据会导致模型输出错误

  • 数据标注成本高昂,合成数据成为新趋势

算法与模型

  • 算法是“菜谱”(通用方法),模型是“炒好的菜”(具体成果)

  • Transformer 是算法,GPT 系列是模型

  • 深度学习模型是“黑盒”,连科学家也难以解释内部逻辑

训练与推理

  • 训练就是反复做题并订正,通过损失函数衡量偏差

  • 训练的核心优化目标是让损失降到最低

  • 推理是使用训练好的模型进行预测,成本远低于训练

关键术语

术语
解释

机器学习 (ML)

让计算机从数据中自动学习规律的方法

深度学习 (DL)

使用多层神经网络的机器学习分支

神经网络

模拟人脑结构的计算模型

训练

模型从数据中学习的过程

推理

使用模型进行预测的过程

损失函数

量化预测与真实值差距的函数

黑盒

无法解释内部逻辑的模型

延伸思考

  1. 为什么深度学习需要大量数据才能发挥优势?数据量不足时有什么替代方案?

  2. AI 模型的“黑盒”特性,对金融风控和医疗诊断等领域会带来哪些风险?

  3. 模型越大越好吗?大模型和小模型各有什么优缺点?

下章预告

下一章将介绍 AI 技术的生态系统,包括主流的 AI 平台、开源框架、以及云端和边缘 AI 的发展趋势,帮助读者了解 AI 技术的实践环境和工具选择。

最后更新于