CNN卷积详解

转载自：https://blog.csdn.net/yilulvxing/article/details/107452153
仅用于自己学习过程中经典文章讲解的记录，防止原文失效。

1：单通道卷积
以单通道卷积为例，输入为（1,5,5），分别表示1个通道，宽为5，高为5。假设卷积核大小为3x3，padding=0，stride=1。

卷积过程如下：在这里插入图片描述
相应的卷积核不断的在图像上进行遍历，最后得到3x3的卷积结果，结果如下：

2：多通道卷积1
以彩色图像为例，包含三个通道，分别表示RGB三原色的像素值，输入为（3,5,5），分别表示3个通道，每个通道的宽为5，高为5。假设卷积核只有1个，卷积核通道为3，每个通道的卷积核大小仍为3x3，padding=0，stride=1。

卷积过程如下，每一个通道的像素值与对应的卷积核通道的数值进行卷积，因此每一个通道会对应一个输出卷积结果，三个卷积结果对应位置累加求和，得到最终的卷积结果（这里卷积输出结果通道只有1个，因为卷积核只有1个。卷积多输出通道下面会继续讲到）。

可以这么理解：最终得到的卷积结果是原始图像各个通道上的综合信息结果。
在这里插入图片描述
上述过程中，每一个卷积核的通道数量，必须要求与输入通道数量一致，因为要对每一个通道的像素值要进行卷积运算，所以每一个卷积核的通道数量必须要与输入通道数量保持一致。

我们把上述图像通道如果放在一块，计算原理过程还是与上面一样，堆叠后的表示如下：
在这里插入图片描述
3：多通道卷积2
在上面的多通道卷积1中，输出的卷积结果只有1个通道，把整个卷积的整个过程抽象表示，过程如下：

即：由于只有一个卷积核，因此卷积后只输出单通道的卷积结果（黄色的块状部分表示一个卷积核，黄色块状是由三个通道堆叠在一起表示的，每一个黄色通道与输入卷积通道分别进行卷积，也就是channel数量要保持一致，图片组这里只是堆叠放在一起表示而已）。

那么，如果要卷积后也输出多通道，增加卷积核（filers）的数量即可，示意图如下：
在这里插入图片描述
备注：上面的feature map的颜色，只是为了表示不同的卷积核对应的输出通道结果，不是表示对应的输出颜色。

然后将每个卷积核对应的输出通道结果（feature map）进行拼接，图中共有m个卷积核，则输出大小变为（mw’h’），其中w’、h’表示卷积后的通道尺寸，原始输入大小为（nwh）。

因此整个卷积层的尺寸为（mnk1*k2）是一个4维张量，其中m表示卷积核的数量，n表示通道数量，k1表示每一个卷积核通道的宽，k2表示每一个卷积核通道的高。

4：代码输出
以Pytorch为例，nn.Conv2d(in_channels，out_channels，kernel_size，stride=1，padding=0，dilation=1，groups=1，bias=True)。

参数解释如下：

in_channels：输入维度

out_channels：输出维度

kernel_size：卷积核大小，可以理解为对每个通道上的卷积的尺寸大小

stride：步长大小

padding：补0

dilation：kernel间距

代码表示：

import torchin_channels = 5  #输入通道数量
out_channels =10 #输出通道数量
width = 100      #每个输入通道上的卷积尺寸的宽
heigth = 100     #每个输入通道上的卷积尺寸的高
kernel_size = 3  #每个输入通道上的卷积尺寸
batch_size = 1   #批数量input = torch.randn(batch_size,in_channels,width,heigth)
conv_layer = torch.nn.Conv2d(in_channels,out_channels,kernel_size=kernel_size)out_put = conv_layer(input)print(input.shape)
print(out_put.shape)
print(conv_layer.weight.shape)

输出结果如下：

在这里插入图片描述
结果解释：

（1）输入的张量信息为[1,5,100,100]分别表示batch_size，in_channels，width，height

（2）输出的张量信息为[1,10,100,100]分别表示batch_size，out_channels，width’，height’，其中width’，height’表示卷积后的每个通道的新尺寸大小

（3）conv_layer.weight.shape的输出结果为[10, 5, 3, 3]，分表表示out_channels，in_channels，kernel_size ，kernel_size ，可以看到与上面的公式mnk1*k2一致。
4：代码输出
以Pytorch为例，nn.Conv2d(in_channels，out_channels，kernel_size，stride=1，padding=0，dilation=1，groups=1，bias=True)。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/13896.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！