太久不看代码确实生疏了,盯着一堆不同的dilation,不知道有什么作用,论文中说是Atrous卷积,原来就是空洞卷积的意思。
Dilated/Atrous Convolution 空洞卷积(膨胀卷积/扩张卷积)
空洞卷积是一种不增加参数量/运算量,同时增加输出单元感受野的一种方法,Atrous卷积,就是带洞的卷积,卷积核是稀疏的,此外,空洞卷积还可以捕捉多尺度上下文信息,通过设置不同的dilation rate,感受野就会不一样,也即获取了多尺度信息,多尺度信息在视觉任务中相当重要。
最初是在语义分割中提出来的dilation convolution,是为了解决FCN思想的语义分割中,输出图像的size要求和输入图像的一致需要upsample,但由于FCN中使用pooling操作来增大感受野,同时降低分辨率,导致upsample无法还原由于一些pooling导致的细节损失问题,为了减小这种损失,自然需要移除pooling层,因此空洞卷积应运而生。
简单来说,就是在原本实心的kernal元素之间按照一定的规律加0作为空格