表示学习(representation learning)
使用机器学习来发掘表示本身,而不仅仅把表示映射到输出。
表示学习算法的典型例子为自编码器(autoencoder)。自编码器由一个编码器(encoder)函数和一个解码器(decoder) 函数组合而成。
- 编码器:将输入数据转换为一种不同的表示。
- 解码器:将这个新的表示转换回原来的形式。
- 训练目标:输入数据经过编码器和解码器之后尽可能多地保留信息,同时希望新的表示有各种好的特性。
- 变差因素(factors of variation):设计特征或设计用于特征学习的算法时,目标通常是分离出能解释观察数据的变差因素。当分析语音记录时,变差因素包括说话者的年龄、性别、口音和说的词语等;当分析汽车的图像时,变差因素包括汽车的位置、颜色、太阳的角度和亮度等。
从原始数据中提取如此高层次、抽象的特征是非常困难的。许多诸如说话口音这样的变差因素,只能通过对数据进行复杂的、接近人类水平的理解来辨识。
深度学习(deep learning)
深度学习通过其它较为简单的概念构建复杂的概念,解决了表示学习中的核心问题。
深度学习模型典型例子是前馈深度网络或多层感知机(multilayer perceptron, MLP)。