2.1 智能的俄罗斯套娃

—— AI、机器学习与深度学习

别被这三个高大上的词绕晕了——它们其实是“一层包一层”的关系:AI 是大圈,机器学习是小圈,深度学习是核心。

2.1.1 名字越长,技术越新?

在 AI 的新闻里,你一会儿听到“人工智能”,一会儿听到“机器学习”,一会儿又是“深度学习”。 很多人以为这是三种不同的东西,或者认为名字越长越厉害。 其实,这是一个巨大的误解。

它们的关系,就像是 俄罗斯套娃

  1. 最外层的大娃娃叫 AI(人工智能) —— 这是一个 愿景(让机器像人)。

  2. 中间层的娃娃叫 ML(机器学习) —— 这是一个 手段(不用规则,用数据)。

  3. 最里层的娃娃叫 DL(深度学习) —— 这是一个 具体的工具(用神经网络)。

所以,当我们说 ChatGPT 是“深度学习”时,它自然也是“机器学习”,更是“人工智能”。

2.1.2 拆开第一层娃娃:从 AI 到 ML

我们在第一章说过,早期的 AI 是靠人手写规则(Expert Systems)。 那就像是给机器人写好了“操作手册”。

  • 见到红灯 -> 停。

  • 见到绿灯 -> 行。

但从 1980 年代开始,人们发现规则写不完,于是发明了 “机器学习”(Machine Learning)。 这相当于不再写手册了,而是给机器人看 10 万小时的开车视频,让它自己悟出红绿灯的规律。

这一次进化,是从“授人以鱼”(给规则)变成了“授人以渔”(给数据)。

2.1.3 拆开第二层娃娃:从 ML 到 DL

机器学习里有很多方法,比如“决策树”、“贝叶斯”等等。它们都很优秀,但有一个共同的瓶颈:虽然不用写规则了,但还得告诉机器关注哪里。 比如认猫,你得告诉算法:关注“耳朵”是不是尖的,关注“胡须”长不长。这叫“特征工程”。

直到 2012 年,“深度学习”(Deep Learning) 横空出世。 它的灵感来自人脑的神经元。它最大的本事是:我什么都不需要你告诉我,我自己找特征。 它会自动发现,原来“瞳孔的形状”比“耳朵的形状”更能区分猫。

这一次进化,是从“半自动”(人找特征)变成了“全自动”(端到端学习)。

2.1.4 为什么现在只谈深度学习?

明明机器学习有那么多门派,为什么现在讨论最多的几乎都是深度学习?

经济学里有一个解释:边际收益递增。 传统的机器学习算法,给它 1 万条数据,它很准;给它 100 万条数据,它的准确率就不涨了(饱和了)。 而深度学习这头“吞金兽”,给它 1 亿条数据,它会变聪明一点;给它 100 亿条,它变得更聪明。

在数据爆炸的今天,在很多非结构化任务里,深度学习通常更能从超大规模数据中持续获益。

理解了这个嵌套关系,后续章节里再遇到这些名词时你就不会头大了。接下来,我们来看看驱动这一切的原料——数据。

2.1.5 思考题

当你在一篇文章里看到“某某公司用 AI/ML/DL 做了一个产品”时,你能不能用“俄罗斯套娃”的方式判断:

  1. 它更像是在说愿景(AI)、手段(ML)还是具体技术路线(DL)?

  2. 这个产品最可能依赖的“数据”是什么?

最后更新于