（pytorch-深度学习系列）CNN的多输入通道和多输出通道

CNN的多输入通道和多输出通道

之前的输入都视为二维数组，但是真实数据往往具有更高的维度，彩色图像有RGB三个颜色通道，那么这个图像（高为h，宽为w）可以表示为 $3 * h * w$ 的多维数组，一般将表示通道数的维（即3这一维）称为通道维。

多输入通道

对于多维的输入，与二维的输入卷积操作类似，只是这里我们的卷积核需要构造成与输入数据通道数相同，从而使其能够与多通道数据进行互相关运算。

卷积的结果为将各个通道的互相关运算结果相加

例如，对与双通道数据，其维度为（2 * 3 * 3）：
$\begin{bmatrix} \begin{bmatrix} 0&1&2 \\ 3&4&5 \\ 6&7&8\end{bmatrix} \\ \\ \begin{bmatrix} 1&2&3 \\ 4&5&6 \\ 7&8&9\end{bmatrix} \end{bmatrix}$

使用卷积核，其维度为（2 * 2 * 2）：

$\begin{bmatrix} \begin{bmatrix} 0&1 \\ 2&3 \end{bmatrix} \\ \\ \begin{bmatrix} 1&2 \\ 3&4 \end{bmatrix} \end{bmatrix}$

那么运算为：
$\begin{bmatrix} \begin{bmatrix} 0&1&2 \\ 3&4&5 \\ 6&7&8\end{bmatrix} \\ \\ \begin{bmatrix} 1&2&3 \\ 4&5&6 \\ 7&8&9\end{bmatrix} \end{bmatrix} * \begin{bmatrix} \begin{bmatrix} 0&1 \\ 2&3 \end{bmatrix} \\ \\ \begin{bmatrix} 1&2 \\ 3&4 \end{bmatrix} \end{bmatrix} = \begin{bmatrix} 0&1&2 \\ 3&4&5 \\ 6&7&8\end{bmatrix} * \begin{bmatrix} 0&1 \\ 2&3 \end{bmatrix} + \begin{bmatrix} 1&2&3 \\ 4&5&6 \\ 7&8&9\end{bmatrix} * \begin{bmatrix} 1&2 \\ 3&4 \end{bmatrix} = \begin{bmatrix} 56&72 \\ 104&120 \end{bmatrix}$

实现多通道的互相关运算：

import torch
from torch import nndef corr2d_multi_in(X, K):# 沿着X和K的第0维（通道维）分别计算再相加res = d2l.corr2d(X[0, :, :], K[0, :, :])for i in range(1, X.shape[0]):res += d2l.corr2d(X[i, :, :], K[i, :, :])return resdef corr2d(X, K):  h, w = K.shapeY = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))for i in range(Y.shape[0]):for j in range(Y.shape[1]):Y[i, j] = (X[i: i + h, j: j + w] * K).sum()return Y

输入数据验证上面的矩阵计算：

X = torch.tensor([[[0, 1, 2], [3, 4, 5], [6, 7, 8]],[[1, 2, 3], [4, 5, 6], [7, 8, 9]]])
K = torch.tensor([[[0, 1], [2, 3]], [[1, 2], [3, 4]]])corr2d_multi_in(X, K)

输出：

tensor([[ 56.,  72.],[104., 120.]])

多输出通道

当输入通道有多个时，因为我们对各个通道的结果做了累加，所以不论输入通道数是多少，输出通道数总是为1。
设卷积核输入通道数和输出通道数、高和宽分别为：
$c_i 、c_o、 k_h、k_w$
如果希望得到含多个通道的输出，我们可以为每个输出通道分别创建一个核数组，其形状为：
$ci×kh×kwc_i\times k_h\times k_w$
将它们在输出通道维上连结，卷积核的形状即为
$co×ci×kh×kwc_o\times c_i\times k_h\times k_w$
在做互相关运算时，每个输出通道上的结果由卷积核在该输出通道上的核数组与整个输入数组计算而来。

该运算可以实现如下：

def corr2d_multi_in_out(X, K):# 对K的第0维遍历，每次同输入X做互相关计算。所有结果使用stack函数合并在一起return torch.stack([corr2d_multi_in(X, k) for k in K])

测试该运算：

K = torch.stack([K, K + 1, K + 2])
#(K+1)K中每个元素加一
K.shape # torch.Size([3, 2, 2, 2])

则现在的核数组为：
$\begin{bmatrix} \begin{bmatrix} \begin{bmatrix} 0&1 \\ 2&3 \end{bmatrix} \begin{bmatrix} 1&2 \\ 3&4 \end{bmatrix} \end{bmatrix} \\\\ \begin{bmatrix} \begin{bmatrix} 1&2 \\ 3&4 \end{bmatrix} \begin{bmatrix} 2&3 \\ 4&5 \end{bmatrix} \end{bmatrix} \\\\ \begin{bmatrix} \begin{bmatrix} 2&3 \\ 4&5 \end{bmatrix} \begin{bmatrix} 3&4 \\ 5&6 \end{bmatrix} \end{bmatrix} \end{bmatrix}$

corr2d_multi_in_out(X, K)

输出：

tensor([[[ 56.,  72.],[104., 120.]],[[ 76., 100.],[148., 172.]],[[ 96., 128.],[192., 224.]]])

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/507984.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

（pytorch-深度学习系列）CNN的多输入通道和多输出通道

CNN的多输入通道和多输出通道

多输入通道

多输出通道

相关文章

（pytorch-深度学习系列）CNN中的池化层-学习笔记

（pytorch-深度学习系列）卷积神经网络LeNet-学习笔记

（pytorch-深度学习系列）深度卷积神经网络AlexNet

（pytorch-深度学习系列）使用重复元素的网络（VGG）

（pytorch-深度学习系列）网络中的网络（NiN）

（pytorch-深度学习）包含并行连结的网络（GoogLeNet）

（pytorch-深度学习）批量归一化

（pytorch-深度学习）实现残差网络(ResNet)

（pytorch-深度学习）实现稠密连接网络（DenseNet）

（pytorch-深度学习）语言模型-学习笔记

（pytorch-深度学习）循环神经网络

配置jupyter-pytorch深度学习环境

（pytorch-深度学习）SE-ResNet的pytorch实现

（pytorch-深度学习）循环神经网络的从零开始实现

（pytorch-深度学习）使用pytorch框架nn.RNN实现循环神经网络

（pytorch-深度学习）通过时间反向传播

（pytorch-深度学习）门控循环单元（GRU）

（pytorch-深度学习）长短期记忆（LSTM）

（pytorch-深度学习）深度循环神经网络

（pytorch-深度学习）双向循环神经网络