数字图像处理之【高斯金字塔】与【拉普拉斯金字塔】

数字图像处理之【高斯金字塔】与【拉普拉斯金字塔】

1.1 什么是高斯金字塔?

高斯金字塔(Gaussian Pyramid)是一种多分辨率图像表示方法,用于图像处理和计算机视觉领域。它通过对原始图像进行一系列的高斯平滑和下采样操作,生成一组分辨率逐渐降低的图像层次结构。

高斯金字塔的构建过程通常包括以下步骤:

  1. 高斯平滑(Gaussian Smoothing):对原始图像应用高斯滤波器,生成一个平滑后的图像。高斯滤波器是一种低通滤波器,用于减少图像中的高频噪声。

  2. 下采样(Downsampling):将平滑后的图像进行下采样,通常是将图像的宽度和高度各减半,得到较低分辨率的图像。

  3. 重复上述步骤:对下采样后的图像重复高斯平滑和下采样过程,直到达到预定的分辨率级别。每一个新生成的图像称为一个金字塔层。

1.2 什么是拉普拉斯金字塔?

拉普拉斯金字塔(Laplacian Pyramid)基于高斯金字塔多分辨率图像表示方法,用于图像处理和计算机视觉领域。它通过从高斯金字塔中提取(高频)细节信息,形成一系列细节图像的层次结构。拉普拉斯金字塔可以用于图像压缩、图像增强和图像融合等任务。

构建拉普拉斯金字塔的过程通常包括以下步骤:

  1. 构建高斯金字塔:首先,通过高斯平滑和下采样操作构建高斯金字塔。

  2. 生成拉普拉斯金字塔层

    • 从高斯金字塔的每一层生成下一层(低分辨率层)后,将下一层上采样(通常是通过插值方法将图像的宽度和高度各加倍)回到当前层的分辨率。
    • 计算当前层与上采样后的图像的差值,得到当前层的拉普拉斯层。
  3. 重复上述步骤:对高斯金字塔的每一层重复生成拉普拉斯层的过程,直到达到最底层。

1.3 示意图

从图中我们可以得到什么信息?拉普拉斯金字塔图像=原图的高频信息。

因此如果我们想回复原图,是不是只要用拉普拉斯金字塔图像加上上采样后的图像就能得到?我想应该是的。但是用文字描述我认为过于繁琐,我们用数学公式来进行清晰的表达。

L n \mathrm{L_n} Ln为拉普拉斯金字塔的第 n \mathrm n n层(自底向上), G n \mathrm{G_n} Gn为高斯金字塔的第 n \mathrm n n层(自底向上), G a u s s B l u r \mathrm{GaussBlur} GaussBlur为高斯平滑函数, p y r D o w n \mathrm{pyrDown} pyrDown为下采样函数, p y r U p \mathrm{pyrUp} pyrUp为上采样函数,则有
G n + 1 = p y r D o w n ( G a u s s B l u r ( G n ) ) L n = G n − p y r U p ( p y r D o w n ( G a u s s B l u r ( G n ) ) ) G n = L n + p y r U p ( p y r D o w n ( G a u s s B l u r ( G n ) ) ) \begin{aligned} &\mathrm {G_{n+1}=pyrDown(GaussBlur(G_n))}\\ &\mathrm {L_n=G_{n}-pyrUp(pyrDown(GaussBlur(G_n)))}\\ &\mathrm {G_n=L_n+pyrUp(pyrDown(GaussBlur(G_n)))} \end{aligned} Gn+1=pyrDown(GaussBlur(Gn))Ln=GnpyrUp(pyrDown(GaussBlur(Gn)))Gn=Ln+pyrUp(pyrDown(GaussBlur(Gn)))

1.4 OpenCV实现

对于以上代码,读者可将图片换成自己喜欢的图片进行测试;函数内部有一部分条件语句是因为如果原图宽或高非偶数,那么下采样后再上采样就会和原图大小不一样。

比如 801 × 801 801\times801 801×801的图像下采样后尺寸是 401 × 401 401\times401 401×401(如果原图尺寸是奇数,那么使用向上取整的除法),再上采样就变成了 802 × 802 802\times802 802×802和原图尺寸不匹配。

为了正确处理这种突发情况,我们需要对图像进行裁剪,刚好裁剪1行和1列。

import cv2
import numpy as npdef correctSize(imgOri, imgDownsample):imgUpsample = cv2.pyrUp(imgDownsample)if imgOri.shape[0] % 2 == 1:  # 检查原始图像宽度是否为奇数imgUpsample = imgUpsample[1:, :, :]  # 如果是,将放大后的图像宽度减少1# imgUpsample = imgUpsample[1:, :]  # 如果是,将放大后的图像宽度减少1if imgOri.shape[1] % 2 == 1:  # 检查原始图像宽度是否为奇数imgUpsample = imgUpsample[:, 1:, :]  # 如果是,将放大后的图像宽度减少1# imgUpsample = imgUpsample[1:, :]  # 如果是,将放大后的图像宽度减少1return imgOri, imgUpsampleimg = cv2.imread('lena.png')
# img = cv2.imread('lena.png',cv2.IMREAD_GRAYSCALE) # 读取灰度图像print(img.shape)
img12 = cv2.pyrDown(img)
img14 = cv2.pyrDown(img12)
img18 = cv2.pyrDown(img14)
img116 = cv2.pyrDown(img18)
ori, imgUpsample = correctSize(img, img12)
# imgRes = cv2.subtract(img, img12)
# 暂不清楚用subtract有什么隐藏机制,用该函数做减法会损失不少信息,所以就直接用原始减法好了
imgRes = ori - imgUpsample
imgRes = imgRes.clip(0, 255)
# imgRes = cv2.subtract(*correctSize(img12, img14))
# imgRes = cv2.subtract(*correctSize(img14, img18))
# imgRes = cv2.subtract(*correctSize(img18, img116))cv2.imshow("高斯金字塔第n层图像的高频信息图-拉普拉斯", imgRes)
# cv2.imshow("高斯金字塔第n层图像的高频信息图-拉普拉斯", np.hstack((imgUpsample, imgRes)))cv2.waitKey()
cv2.destroyAllWindows()

1.5 手搓代码(高斯平滑+下采样+上采样+拉普拉斯图像生成)

首先给出高斯平滑所用的高斯核
1 256 [ 1 4 6 4 1 4 16 24 16 4 6 24 36 24 6 4 16 24 16 4 1 4 6 4 1 ] \frac{1}{256}\begin{bmatrix}1&4&6&4&1\\4&16&24&16&4\\6&24&36&24&6\\4&16&24&16&4\\1&4&6&4&1\end{bmatrix} 2561 1464141624164624362464162416414641

然后就是手搓代码了,纯手搓,但是运行速度有点慢,如果你图像很大的话

import cv2
import numpy as npimg = cv2.imread('lena.png')# 定义高斯核,并归一化,用来做卷积
GaussSmoothKernel = np.array([[1, 4, 6, 4, 1],[4, 16, 24, 16, 4],[6, 24, 36, 24, 6],[4, 16, 24, 16, 4],[1, 4, 6, 4, 1]], dtype=np.float32)
GaussSmoothKernel = GaussSmoothKernel / 256Smoothedimg = np.zeros(img.shape, dtype=np.uint8)# 下面的单数是封装好的,可用来做图像卷积
# Smoothedimg = cv2.filter2D(img, -1, GaussSmoothKernel)
for i in range(img.shape[0]):for j in range(img.shape[1]):for k in range(3):if i-2 < 0 or i+2 >= img.shape[0] or j-2 < 0 or j+2 >= img.shape[1]:# 处理图像边边角角的模糊,在else语句中的操作没法对边角进行平滑,因为边界像素没有相邻像素,无法进行卷积操作for m in range(5):for n in range(5):if i+m-2 >= 0 and i+m-2 < img.shape[0] and j+n-2 >= 0 and j+n-2 < img.shape[1]:Smoothedimg[i, j, k] += GaussSmoothKernel[m, n] * img[i+m-2, j+n-2, k]else:# 图像的边界处的像素无法通过此操作进行卷积操作Smoothedimg[i, j, k] = np.sum(GaussSmoothKernel * img[max(i-2, 0):min(i+3, img.shape[0]), max(j-2, 0):min(j+3, img.shape[1]), k], axis=(0, 1))downsample = Smoothedimg[::2, ::2, :]# 生成一个0值张量,用来存储上采样后的图像
Upsample = np.zeros((downsample.shape[0]*2, downsample.shape[1]*2, 3), dtype=np.uint8)for i in range(downsample.shape[0]):for j in range(downsample.shape[1]):Upsample[i*2, j*2, :] = downsample[i, j, :]# 下面为插值操作Upsample[i*2+1, j*2, :] = downsample[i, j, :]Upsample[i*2, j*2+1, :] = downsample[i, j, :]Upsample[i*2+1, j*2+1, :] = downsample[i, j, :]# 用于处理图像各方向为奇数的情况:这种情况上采样后图像会比原图大一点点,因此需要给它做个裁剪
if img.shape[0] % 2 == 1:Upsample = Upsample[1:, :, :]
if img.shape[1] % 2 == 1:Upsample = Upsample[:, 1:, :]# 获取拉普拉斯图像
Laplacian = img - Upsample# cv2.imshow('img', img)
# cv2.imshow('Smoothedimg', Smoothedimg)
# cv2.imshow('downsample', downsample)
# cv2.imshow('Upsample', Upsample)
# cv2.imshow('Laplacian', Laplacian)
cv2.imshow('ori+smoothedimg+downsample+Upsample+Laplacian', np.vstack((np.hstack((img, Smoothedimg)), np.hstack((Upsample, Laplacian)))))# 该语句配合上面插值语句使用,把上面的插值语句注释,然后用下面这条语句输出,你将看到下采样丢失了多少信息
# cv2.imshow('DownsampleLossInfo', (Smoothedimg - Upsample).clip(0, 255))cv2.waitKey(0)
cv2.destroyAllWindows()

看看效果呗,感觉手搓的效果还不赖,当然肯定没法和封装好的比,封装好的函数使用了更为复杂的插值算法

在这里插入图片描述

上图从左到右边,从上到下依次为 原图 → 高斯平滑后的图 → 经过下采样后,再进行上采样恢复了分辨率的图 → 拉普拉斯图 原图\to高斯平滑后的图\to经过下采样后,再进行上采样恢复了分辨率的图\to拉普拉斯图 原图高斯平滑后的图经过下采样后,再进行上采样恢复了分辨率的图拉普拉斯图

1.6 一些后话

其实看了上面的东西我觉得读者也应该理解为什么高斯核被称为低通滤波器了:低频信息总是通过(保留),高频信息却被删除了。这使得图像看起来更加平滑,减少了噪声和细节。

相反,OpenCVSobel算子就是一个具有高通滤波器性质的算子,该算子用来做图像锐化,即边缘增强,这意味着它会增强图像的边缘和细节,而使平滑区域变暗或去除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/38269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RTMP推流到SRS流媒体服务器消息处理

RTMP推流到SRS流媒体服务器消息处理 SRS和客户端是怎么交换消息的&#xff1f;各个消息有什么作用&#xff1f;握手成功后&#xff0c;SRS和客户端进行消息交换&#xff0c;对应wiresharek这部分截图&#xff1a; 流程图&#xff08;之前画的&#xff0c;可能不够详细&#xf…

在Linux (Ubuntu 16) 下安装LabVIEW

用户尝试在Ubuntu 16操作系统上安装LabVIEW&#xff0c;但找不到合适的安装文件来支持Ubuntu。已经下载了运行时文件&#xff0c;并尝试将.rpm包转换为.deb包并安装在Ubuntu上。然而&#xff0c;安装完成后&#xff0c;没有在应用程序中看到LabVIEW的图标。 用户希望能够在Ubu…

【操作系统】内存管理——页面分配策略(个人笔记)

学习日期&#xff1a;2024.6.28 内容摘要&#xff1a;页面分配策略和内存映射文件&#xff0c;内存映射文件 页面分配置换策略 基本概念 驻留集&#xff0c;指请求分页存储管理中给进程分配的物理块的集合&#xff0c;在采用了虚拟存储技术的系统中&#xff0c;驻留集大小一…

springcloud第4季 分布式事务seata实现AT模式案例2【经典案例】

一 seata案例 1.1 背景说明 本案例使用seata的at模式&#xff0c;模拟分布式事务场景&#xff1a;【下订单&#xff0c;减库存&#xff0c;扣余额&#xff0c;改状态】 AT模式原理&#xff1a;是2pc方案的演变&#xff0c; 一阶段&#xff1a;业务数据和回滚日志记录在同一…

Android studio 打包低版本的Android项目报错

一、报错内容 Execution failed for task :app:packageRelease. > A failure occurred while executing com.android.build.gradle.internal.tasks.Workers$ActionFacade> com.android.ide.common.signing.KeytoolException: Failed to read key key0 from store "…

static修饰的对象在内存中的存储及其用法

一、static修饰的变量在内存中的存储位置 static关键字无论是在C语言还是C中都有着极其重要的作用&#xff0c;那么对于static来说&#xff0c;它修饰的对象是存储在内存的哪个位置呢&#xff1f;它的作用与它在内存中的位置有什么联系&#xff1f;还有它都适用于哪些场景&…

15.数据库简介+MySQl使用+SQL语句

文章目录 数据库简述一.数据库简介DB1.定义:2.DBMS数据库管理系统3.数据库分类 二.MySQL的安装1.安装步骤2.MySQL数据库图形管理工具3.mysql程序常用命令4.MySQL字符集及字符序5.Navicat快捷键操作 三.MySQL数据库基本操作 .........................................表管理一.…

RPC远程过程调用--Thrift

RPC远程过程调用–Thrift 简介 Thrift是一个由Facebook开发的轻量级、跨语言的远程服务调用框架&#xff0c;后进入Apache开源项目。支持通过自身接口定义语言IDL定义RPC接口和数据类型&#xff0c;然后通过编译器生成不同语言代码&#xff0c;用于构建抽象易用、可互操作的R…

黄子韬揭秘徐艺洋与EXO的不解之缘

黄子韬揭秘&#xff1a;徐艺洋与EXO的不解之缘在娱乐圈的繁华与喧嚣中&#xff0c;总有一些不为人知的故事&#xff0c;它们或温馨、或励志&#xff0c;或是感叹命运的奇妙。近日&#xff0c;黄子韬在一档热门综艺节目中意外爆料&#xff0c;揭开了徐艺洋与EXO之间鲜为人知的秘…

ffmpeg使用bmp编码器把bgr24编码为bmp图像

version #define LIBAVCODEC_VERSION_MAJOR 60 #define LIBAVCODEC_VERSION_MINOR 15 #define LIBAVCODEC_VERSION_MICRO 100 note 不使用AVOutputFormat code void CFfmpegOps::EncodeBGR24ToBMP(const char* infile, const char* width_str, const char* height_str…

IT之家最新科技热点

人不走空 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌赋&#xff1a;斯是陋室&#xff0c;惟吾德馨 目录 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌…

使用Java连接数据库并且执行数据库操作和创建用户登录图形化界面(3)专栏里有上两步的源代码

创建用户登录程序&#xff0c;验证用户账号和密码信息是否在数据库student中的用户表tb_account中存在。用户登录界面如下图所示&#xff1a; 当单击“登录”按钮时&#xff0c;处理以下几种情况&#xff1a; &#xff08;1&#xff09;用户名未输入&#xff0c;提示用户名不能…

业务模型扩展字段存储

构建业务模型时&#xff0c;通常模型会设置扩展信息&#xff0c;存储上一般使用JSON格式存储到db中。JSON虽然有较好的扩展性&#xff0c;但并没有结构化存储的类型和非空等约束&#xff0c;且强依赖代码中写入/读取时进行序列化/反序列化操作&#xff0c; 当扩展信息结构简单且…

代码随想录第37天|动态规划

01背包理论基础 参考 01背包: 每个物品只有一个, 只要选或不选两个选项 暴力解法: 回溯法枚举 dp[i][j]: i 表示 0 ~ i 的物品, j 表示容量, 数值表示当前的最大价值递推公式: max(dp[i-1][j], dp[i-1][j-weight[i]] value[i])初始化: j 0 时, 无法放任何有价值的物品, d…

ASP.Net.WebAPI和工具PostMan

1.WebAPI概述 1.1 WebAPI WebAPI 是一种传统的方式&#xff0c;用于构建和暴露 RESTUI风格的Web服务。它提供了丰富的功能和灵活性&#xff0c;可以处理各种HTTP请求&#xff0c;并支持各种数据格式&#xff0c;如JSON、XML等。 WebAPI使用控制器(Controllers)和动作方法(Ac…

【计算机网络仿真】b站湖科大教书匠思科Packet Tracer——实验10 IPv4地址 — 构造超网(无分类编址)

一、实验目的 1.加深对构造超网的理解&#xff1b; 二、实验要求 1.使用Cisco Packet Tracer仿真平台&#xff1b; 2.观看B站湖科大教书匠仿真实验视频&#xff0c;完成对应实验。 三、实验内容 1.构建网络拓扑&#xff1b; 2.根据各网络所指定的地址块完成以下工作&#…

携手亚马逊云科技,维塑科技推出运动健康领域首个AI大模型

导读&#xff1a;生成式AI运动健康&#xff0c;将如何改变我们的生活&#xff1f; 人工智能技术正不断重塑着我们的工作、生活方式。那么&#xff0c;AI能否改善我们的健康状况呢&#xff1f;AI大模型在运动健康领域的探索为我们带来新的想象。 2023年&#xff0c;全球领先的AI…

java之命令执行审计思路

1 漏洞原理 因用户输入未过滤或净化不完全&#xff0c;导致Web应用程序接收用户输入&#xff0c;拼接到要执行的系统命令中执行。一旦攻击者可以在目标服务器中执行任意系统命令&#xff0c;就意味着服务器已被非法控制。 2 审计中常用函数 一旦攻击者可以在目标服务器中执行…

Redis发布、订阅模式(Pub/Sub)详解

Redis发布、订阅模式&#xff08;PUB-SUB&#xff09;详解 Redis的发布订阅&#xff08;Pub/Sub&#xff09;机制是一种消息通信模式&#xff0c;用于消息的广播。它允许多个客户端订阅&#xff08;Subscribe&#xff09;特定的频道&#xff08;Channel&#xff09;&#xff0c…

Docker镜像拉去不了解决方案

原理&工具 使用海外的服务器拉去镜像&#xff0c;压缩为tar包&#xff0c;传输到本地在本地运行 服务器&#xff1a;这里我使用的是AWS的服务器&#xff0c;新用户注册免费使用1年&#xff08;流量超了就不免费了&#xff0c;一般用不完&#xff0c;还有使用 Cloudflare …