1. 概述
图像金字塔是图像多尺度表达的一种,主要应用与图像分割,是一种以多分辨率来解释图像的有效但概念简单的结构。图像金字塔实际上是一张图片在不同尺度下的集合,即原图的上采样和下采样集合。金字塔的底部是高分辨率图像,而顶部是低分辨率图像。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。
2. 为什么需要图像金子塔
对于一张图像,若观察距离增大(相当于图像尺寸变小),随着距离的增大,图像上的小目标无法清晰看到,而图像上的大目标在一定范围内还可以看到;
所以对大目标来说,图像缩小到一定程度不会影响其检测;
对于小目标来说,则需要放大图像来进行检测;
在进行目标检测时,不同尺寸的图像有利于检测不同大小的目标。
3. 生成图像金子塔的方式?
(1)下采样(缩小图像):
高斯金字塔,用来下采样:
为获得第i+1层高斯金字塔图像,使用如下步骤:
Step1: 对图像i进行高斯内核卷积;
Step2: 将所有偶数行和列去除。
得到的图像即为i+1层的图像,显而易见,结果图像只有原始图像的四分之一。通过对图像i层的不停迭代以上步骤就可以得到整个金字塔。
(2)上采样(扩大图片)
拉普拉斯金字塔:
Step1: 将图像在每个方向扩大为原来的2倍,新增的行和列以0填充;
Step2: 使用先前同样的内核(乘以4)与放大后的图像卷积,获得“新增像素”的值.
它将图像在每个方向上扩大为原图像的2倍,新增的行和列均用0来填充,并使用与“向下取样”相同的卷积核乘以4,再与放大后的图像进行卷积运算,以获得“新增像素”的新值。