参考
5.2 填充和步幅
5.2.1 填充
填充(padding)是指在输入高和宽的两侧填充元素(通常是0元素)。图5.2里我们在原输入高和宽的两侧分别添加了值为0的元素,使得输入高和宽从3变成了5,并导致输出高和宽由2增加到4。图5.2中的阴影部分为第一个输出元素及其计算所使用的输入和核数组元素: 0 * 0 + 0 * 1 + 0 * 2 + 0 * 3 = 0.
下面的例子里,我们创建一个高和宽为3的二维卷积层,然后设输入高和宽的填充数分别为1。给定一个高和宽为8的输入,我们发现输出的高和宽也是8.
import torch
import torch.nn as nn# 定义一个函数来计算卷积层。它对输入和输出做出相应的升维和降维
def comp_conv2d(conv2d, X):# (1, 1)代表批量大小和通道数X = X.view((1, 1) + X.shape) # (8, 8) -> (1, 1, 8, 8) Y = conv2d(X)return Y.view(Y.shape[2:]) # 注意这里是两侧分别填充1行或列,所以在两侧一共填充2行或列
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, padding = 1)X = torch.rand(8, 8)
comp_conv2d(conv2d, X).shape
当卷积核的宽和高不同时,我们也可以通过设置宽和高上不同的填充数使输出和输入具有相同的高和宽。
# 使用高为5、宽为3的卷积核。在高和宽两侧的填充数分别为2和1
conv2d = nn.Conv2d(in_channels= 1, out_channels= 1, kernel_size=(5,3), padding=(2,1))
comp_conv2d(conv2d, X).shape
5.2.2 步幅
# 下面我们让步幅为2,使输入的宽高减半
conv2d = nn.Conv2d(1,1, kernel_size= 3, padding=1, stride =2)
comp_conv2d(conv2d, X).shape