目录
一、图像金字塔
1.图像金字塔是什么?
2.有哪些常见类型?
3.金字塔的构建过程
4.图像金字塔的作用
二、图像金字塔中的操作
1.向下采样
2.向上采样
3.注意--无法复原
三、代码实现
1.高斯金字塔向下采样
2.高斯金字塔向上采样
3.无法复原
4.拉普拉斯金字塔
一、图像金字塔
1.图像金字塔是什么?
- 是由一幅图像的多个不同分辨率的子图构成的图像集合。
- 是通过一个图像不断的降低采样率产生的,最小的图像可能仅仅有一个像素点。
- 图像金字塔的底部是待处理的高分辨率图像(原始图像),而顶部则为其低分辨率的近似图像。
2.有哪些常见类型?
<1> 高斯金字塔
通过逐层应用高斯滤波和下采样,生成不同分辨率的图像以表示多尺度信息。
<2> 拉普拉斯金字塔
拉普拉斯金字塔是由高斯金字塔向下采样时丢失的信息构成。
3.金字塔的构建过程
<1> 高斯金字塔
- 初始图像:导入原始图像。
- 高斯滤波:对图像应用高斯滤波。
- 下采样:将图像尺寸减半,生成下一级图像。
- 重复:重复高斯滤波和下采样步骤,直到达到所需的层数或图像尺寸过小。
<2> 拉普拉斯金字塔
- 生成高斯金字塔:先创建高斯金字塔。
- 上采样:将高斯金字塔的每层图像上采样到前一层的尺寸。
- 计算细节:用前一层的高斯图像减去上采样后的图像,得到拉普拉斯细节图像。
- 最后一层:拉普拉斯金字塔的最后一层即为高斯金字塔的最后一层。
4.图像金字塔的作用
<1> 特征点提取
- 图像金字塔允许在不同尺度下检测特征点,提高特征点检测的尺度不变性。
<2> 模板匹配
- 图像金字塔帮助处理不同尺度的模板匹配问题,提高匹配的准确性。
<3> 光流跟踪
- 通过在不同尺度层中估计光流,图像金字塔帮助处理大范围的运动,提高光流估计的精度。
二、图像金字塔中的操作
1.向下采样
向金字塔顶部移动时,图像的尺寸和分辨率都不断地降低。通常情况下,每向上移动一级,图像的宽和高都降低为原来的1/2。
<1> 步骤
- 高斯滤波(减少高频噪声)
- 删除其偶数行和偶数列(所以所用图像一般高宽都是偶数)
<2> 图示
2.向上采样
通常将图像的宽度和高度都变为原来的2倍。这意味着,向上采样的结果图像的大小是原始图像的4倍。因此,要在结果图像中补充大量的像素点。对新生成的像素点进行赋值的行为,称为插值。
<1> 步骤
- 插值
- 高斯滤波(减少由于插值产生的人工边界和不自然的过渡)
<2> 图示
3.注意--无法复原
通过以上分析可知,向上采样和向下采样是相反的两种操作。但是,由于向下采样会丢失像素值,所以这两种操作是不可逆的。也就是说,对一幅图像先向上采样、再向下采样,是无法恢复其原始状态的;同样,对一幅图像先向下采样、再向上采样也无法恢复到原始状态
三、代码实现
1.高斯金字塔向下采样
- 使用cv2.pyrDown()函数实现向下采样
import cv2 # opencv读取的格式是BGR2# 高斯金字塔操作中的向下采样
# 下采样 是一种减小图像尺寸的方法,它通常涉及到降低图像的分辨率,即减少图像中像素的数量,从而使图像看起来更小
# 上釆样 是一种增大图像尺寸的方法,它通过插值和滤波技术来恢复图像的分辨率和细节,通常用于图像放大或者与下采样后的图像进行比较。
# resize函数 是一种通用的图像尺寸调整方法,它可以按照指定的目标尺寸来缩放图像,不涉及金字塔结构或者特定的滤波操作。
# dst = cv2.pyrDown(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg') # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)# 向下采样
face_down_1 = cv2.pyrDown(face) # 下采样G1
cv2.imshow('face_down_1', face_down_1)
cv2.waitKey(0)
face_down_2 = cv2.pyrDown(face_down_1) # G2
cv2.imshow('face_down_2', face_down_2)
cv2.waitKey(0)
输出:
- 可以看出来图像的宽高逐层减半
2.高斯金字塔向上采样
- 使用cv2.pyrUp()函数实现向上采样
- 默认双线性插值法
import cv2 # opencv读取的格式是BGR2# 高斯金字塔操作中的向上采样
# dst = cv2.pyrUp(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# #src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg') # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)
face_up_1 = cv2.pyrUp(face)
cv2.imshow('face_up_1', face_up_1) # G1
cv2.waitKey(0)
face_up_2 = cv2.pyrUp(face_up_1)
cv2.imshow('face_up_2', face_up_2) # G2
cv2.waitKey(0)
cv2.destroyAllWindows()
输出:
- 可以看到向上采样之后的图像宽高逐层变成2倍
3.无法复原
# 对下采样后图像进行上采样,图像变模糊,无法复原
# 对上采样后图像进行下采样,图像变模糊,无法复原
face_down_1_up = cv2.pyrUp(face_down_1) # 下采样G1
face_up_1_down = cv2.pyrDown(face_up_1) # 上采样G1
cv2.imshow('yuantu', face)
cv2.imshow('down_1_up', face_down_1_up)
cv2.imshow('up_1_down', face_up_1_down)
cv2.waitKey(0)
cv2.destroyAllWindows()
输出:
- 可以看到两种操作之后的图像大小与原图一样
- 但是清晰度却比原图差了不少
4.拉普拉斯金字塔
# 拉普拉斯金字塔
face_down_2_up = cv2.pyrUp(face_down_2)
L0 = face - face_down_1_up
L1 = face_down_1 - face_down_2_up
fuyuan = face_down_1_up + L0
cv2.imshow('L0', L0)
cv2.imshow('L1', L1)
cv2.imshow('fuyuan', fuyuan)
cv2.waitKey(0)
输出:
- 可以看到拉普拉斯金字塔的复原效果还是不错的
- 我这里使用的是彩色图片,所以拉普拉斯图像是彩色的
- 如果使用的图片是灰度图,那么就是黑白的