如图1-2所示,深度学习(DeepLearning,DL)属于机器学习的子类。它的灵感来源于人类大脑的工作方式,这是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并非是一个全新的概念,可理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法以及激活函数等做出了调整,其目的在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,如文本、图像、声音。
如果是传统机器学习方法,我们会首先定义一些特征,如有没有胡须,耳朵、鼻子、嘴巴的模样,等等。总之,首先要确定相应的“面部特征”作为机器学习的特征,以此来对对象进行分类识别。
而现在,深度学习方法更进一步。深度学习可以自动找出这个分类问题所需要的重要特征,而传统的机器学习则需要人工给出特征。
那么深度学习是如何做到这一点的呢?以猫狗识别的例子来说,按照以下步骤即可:
(1)确定有哪些边和角跟识别出猫和狗关系最大。
(2)根据上一步找出的很多小元素(边、角等)构建层级网络,找出它们之间的各种组合。
(3)在构建层级网络之后,就可以确定哪些组合可以识别出猫和狗。
深度学习的“深”是因为它通常有较多的隐藏层,正是因为有那么多隐藏层存在,深度学习网络才拥有表达更复杂函数的能力,这样才能识别更复杂的特征,继而完成更复杂的任务。
本文节选自《PyTorch深度学习与企业级项目实战》,获出版社和作者授权发布。