本文重点
我们学习了卷积神经网络中的卷积层和池化层,这二者都是卷积神经网络中不可缺少的元素,本例中我们将搭建一个卷积神经网络完成手写字体识别。
卷积和池化的直观体现
手写字体识别
手写字体的图片大小是32*32*3的,它是一张 RGB 模式的图片,现在我们想识别它是从 0-9 这 10 个字中的哪一个,我们构建一个神经网络来实现这个功能。
第一个卷积层
过滤器大小为 5×5,步幅是 1,padding是 0,过滤器个数为 6,那么输出为 28×28×6。将这层标记为 CONV1,它用了 6 个过滤器,增加了偏差,应用了非线性函数 ReLU,最后输出 CONV1 的结果。
第一个池化层
然后构建一个池化层,使用最大池化的方式。参数 f= 2, s= 2,因为 padding 为 0,表示高度和宽度会减少一半。因此,28×28 变成了 14×14,通道数量保持不变,所以最终输出为 14×14×6,将该输出标记为 POOL1。
第二个卷积层
我们再为它构建一个卷积层,过滤器大小为 5×5,,即 f= 5,步幅是 1,padding 为 0,过滤器 16 个,所以 CONV2 输出为 10×10×16,这是CONV2 层。</