OpenCV:入门(五)

图像梯度

图像梯度计算的是图像变化的速度。对于图像的边缘部分,其灰度值变化较大,梯度值也 较大;相反,对于图像中比较平滑的部分,其灰度值变化较小,相应的梯度值也较小。一般情 况下,图像梯度计算的是图像的边缘信息。

严格来讲,图像梯度计算需要求导数,但是图像梯度一般通过计算像素值的差来得到梯度 的近似值(近似导数值)。

 例如,图 9-1 中的左右两幅图分别描述了图像的水平边界和垂直边界。

针对左图,通过垂直方向的线条 A 和线条 B 的位置,可以计算图像水平方向的边界:

  •  对于线条 A 和线条 B,其右侧像素值与左侧像素值的差值不为零,因此是边界。
  •  对于其余列,其右侧像素值与左侧像素值的差值均为零,因此不是边界。 针对右图,通过水平方向的线条 A 和线条 B 的位置,可以计算图像垂直方向的边界:
  •  对于线条 A 和线条 B,其下侧像素值与上侧像素值的差值不为零,因此是边界。
  •  对于其余行,其下侧像素值与上侧像素值的差值均为零,因此不是边界。

但是实际图像处理中肯定不会像上图一样好处理,所以我们也有相对复杂的算子:Sobel算子,Scharr算子,拉普拉斯算子等。 

一,Sobel算子

(1)原理

Sobel 算子是一种离散的微分算子,该算子结合了高斯平滑和微分求导运算。该算子利用 局部差分寻找边缘,计算所得的是一个梯度的近似值。

需要说明的是,滤波器通常是指由一幅图像根据像素点(x, y)临近的区域计算得到另外一幅 新图像的算法。因此,滤波器是由邻域及预定义的操作构成的。滤波器规定了滤波时所采用的 形状以及该区域内像素值的组成规律。滤波器也被称为“掩模”、“核”、“模板”、“窗口”、“算 子”等。一般信号领域将其称为“滤波器”,数学领域将其称为“核”。本章中出现的滤波器多 数为“线性滤波器”,也就是说,滤波的目标像素点的值等于原始像素值及其周围像素值的加权和。这种基于线性核的滤波,就是我们所熟悉的卷积。在本章中,为了方便说明,直接使用 “算子”来表示各种算子所使用的滤波器。例如,本章中所说的“Sobel算子”通常是指 Sobel 滤波器。  

1.计算水平方向偏导数的近似值

得到结果为:P5x = (P3-P1) + 2·(P6-P4) + (P9-P7)  

很明显,这些点都是x轴方向的点,而且离p5点越近权重越大。

那么垂直方向偏导数的近似值应该也很好理解了,我们只需要转置一下sobel算子就可以了。

2. 计算垂直方向偏导数的近似值 

P5y = (P7-P1) + 2·(P8-P2) + (P9-P3)

差不多,对吧? 

 (2)函数解析

dst = cv2.Sobel( src, ddepth, dx, dy[,ksize[, scale[, delta[, borderType]]]] )

  • dst 代表目标图像。
  • src 代表原始图像。
  • ddepth 代表输出图像的深度。其具体对应关系如表 9-1 所示。

  • dx 代表 x 方向上的求导阶数。
  • dy 代表 y 方向上的求导阶数。
  • ksize 代表 Sobel 核的大小。该值为-1 时,则会使用 Scharr 算子进行运算。
  • scale 代表计算导数值时所采用的缩放因子,默认情况下该值是 1,是没有缩放的。
  • delta 代表加在目标图像 dst 上的值,该值是可选的,默认为 0。
  • borderType 代表边界样式。该参数的具体类型及值如表 9-2 所示。  

 1.参数ddepth

在函数 cv2.Sobel()的语法中规定,可以将函数 cv2.Sobel()内 ddepth 参数的值设置为-1,让 处理结果与原始图像保持一致。但是,如果直接将参数 ddepth 的值设置为-1,在计算时得到的 结果可能是错误的。 在实际操作中,计算梯度值可能会出现负数。如果处理的图像是 8 位图类型,则在 ddepth 的参数值为-1 时,意味着指定运算结果也是 8 位图类型,那么所有负数会自动截断为 0,发生信息丢失。为了避免信息丢失,在计算时要先使用更高的数据类型 cv2.CV_64F,再通过取绝 对值将其映射为 cv2.CV_8U(8 位图)类型。所以,通常要将函数 cv2.Sobel()内参数 ddepth 的 值设置为“cv2.CV_64F”

简而言之,就是计算梯度时会出现负数,这就会导致一些问题(部分图像无法显示),这部分会在代码示例部分更加详细讨论,我们可以通过参数调整让8位图先升高位数防止截断,当然也可以用abs取绝对值来解决,我们放在后续讨论。

2.方向

在函数 cv2.Sobel()中,参数 dx 表示 x 轴方向的求导阶数,参数 dy 表示 y 轴方向的求导阶 数。参数 dx 和 dy 通常的值为 0 或者 1,最大值为 2。如果是 0,表示在该方向上没有求导。当 然,参数 dx 和参数 dy 的值不能同时为 0。

参数 dx 和参数 dy 可以有多种形式的组合,主要包含:

  • 计算 x 方向边缘(梯度):dx=1, dy=0。
  • 计算 y 方向边缘(梯度):dx=0, dy=1。
  • 参数 dx 与参数 dy 的值均为 1:dx=1, dy=1(这个效果不是很好,一般分别计算x,y方向梯度再计算)
  • 计算 x 方向和 y 方向的边缘叠加:通过组合方式实现。

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as pltcircle = cv2.imread("circle.jpg")
kernel = np.ones((5, 5), np.uint8)
circle = cv2.erode(circle,kernel=kernel,iterations=2)
sobel_x = cv2.Sobel(circle,cv2.CV_64F,1,0,ksize=5)
sobel_x_abs = cv2.convertScaleAbs(sobel_x)
sobel_y = cv2.Sobel(circle,cv2.CV_64F,0,1,ksize=5)
sobel_y_abs = cv2.convertScaleAbs(sobel_y)
sobel_x_y = cv2.Sobel(circle,cv2.CV_64F,1,1,ksize=5)
sobel_x_y_mix = cv2.addWeighted(sobel_x_abs,0.5,sobel_y_abs,0.5,0)
plt.subplot(231), plt.imshow(sobel_x), plt.title("Sobel_X")
plt.subplot(232), plt.imshow(sobel_y), plt.title("Sobel_Y")
plt.subplot(233), plt.imshow(sobel_x_y), plt.title("Sobel_X_Y")#不建议直接计算
plt.subplot(234), plt.imshow(sobel_x_abs), plt.title("Sobel_X_ABS")
plt.subplot(235), plt.imshow(sobel_y_abs), plt.title("Sobel_Y_ABS")
plt.subplot(236), plt.imshow(sobel_x_y_mix), plt.title("Sobel_X_Y_MIX")
plt.show()

和上文提及一般,对比sobel_x和sobel_x_abs图像,我们发现sobel_x图像出现缺失,这是因为计算出负值后出现的截断,导致值为0,对应就是黑点,无法显示出来,这里我们采用取绝对值解决了这个问题。

同样地,我们对比sobel_x_y和sobel_x_y_mix两幅图,前者是通过直接在函数中设置参数dx,dy=1产生的效果,后者是分别计算后叠加在一起的图像,采用的是addweighted方法。

二,Scharr算子

(1)原理

Scharr算子的原理和Sobel算子很相似,就是换了一个滤波器(核),不过Scharr算子精度更高一些。

如图:

(2)函数解析

dst = cv2.Scharr( src, ddepth, dx, dy[, scale[, delta[, borderType]]] ) 

  • dst 代表输出图像。
  • src 代表原始图像。
  • ddepth 代表输出图像深度。该值与函数 cv2.Sobel()中的参数 ddepth 的含义相同,具体可 以参考表 9-1。
  • dx 代表 x 方向上的导数阶数。
  • dy 代表 y 方向上的导数阶数。
  • scale 代表计算导数值时的缩放因子,该项是可选项,默认值是 1,表示没有缩放。
  • delta 代表加到目标图像上的亮度值,该项是可选项,默认值为 0。
  • borderType 代表边界样式。具体可以参考表 9-2。  

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':     circle = cv2.imread("circle.jpg")kernel = np.ones((5, 5), np.uint8)circle = cv2.erode(circle,kernel=kernel,iterations=2)scharr_x = cv2.Scharr(circle,cv2.CV_64F,1,0)scharr_x_abs = cv2.convertScaleAbs(scharr_x)scharr_y = cv2.Scharr(circle,cv2.CV_64F,0,1)scharr_y_abs = cv2.convertScaleAbs(scharr_y)scharr_x_y_mix = cv2.addWeighted(scharr_x_abs,0.5,scharr_y_abs,0.5,0)plt.subplot(231), plt.imshow(scharr_x), plt.title("Scharr_X")plt.subplot(232), plt.imshow(scharr_y), plt.title("Scharr_Y")plt.subplot(234), plt.imshow(scharr_x_abs), plt.title("Scharr_X_ABS")plt.subplot(235), plt.imshow(scharr_y_abs), plt.title("Scharr_Y_ABS")plt.subplot(236), plt.imshow(scharr_x_y_mix), plt.title("Scharr_X_Y_MIX")plt.show()cv2.waitKey(0)

对比Sobel图像:

我们发现Scharr算子显然更加精细一些,效果也要好一些,当然有兴趣的话可以使用其他图片进行更好的观察。 

三, Laplacian算子

(1)原理

Laplacian(拉普拉斯)算子是一种二阶导数算子,其具有旋转不变性,可以满足不同方向 的图像边缘锐化(边缘检测)的要求。通常情况下,其算子的系数之和需要为零。例如,一个 3×3 大小的 Laplacian 算子如图 9-24 所示。

Laplacian 算子类似二阶 Sobel 导数,需要计算两个方向的梯度值。例如,在图 9-25 中:

  • 左图是 Laplacian 算子。
  • 右图是一个简单图像,其中有 9 个像素点。  

计算像素点 P5 的近似导数值,如下:

P5lap = (P2 + P4 + P6 + P8) - 4·P5  

(2)函数解析

dst = cv2.Laplacian( src, ddepth[, ksize[, scale[, delta[, borderType]]]] ) 

  • dst 代表目标图像。
  • src 代表原始图像。
  • ddepth 代表目标图像的深度。
  • ksize 代表用于计算二阶导数的核尺寸大小。该值必须是正的奇数。
  • scale 代表计算 Laplacian 值的缩放比例因子,该参数是可选的。默认情况下,该值为 1, 表示不进行缩放。
  • delta 代表加到目标图像上的可选值,默认为 0。
  • borderType 代表边界样式。 该函数分别对 x、y 方向进行二次求导,具体为: 

上式是当 ksize 的值大于 1 时的情况。当 ksize 的值为 1 时,Laplacian 算子计算时采用的 3×3 的核如下:

通过从图像内减去它的 Laplacian 图像,可以增强图像的对比度,此时其算子如图 9-27 所 示。  

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':circle = cv2.imread("circle.jpg")laplacian = cv2.Laplacian(circle,cv2.CV_64F)laplacian_abs = cv2.convertScaleAbs(laplacian)plt.subplot(121),plt.imshow(laplacian),plt.title("Laplacian")plt.subplot(122),plt.imshow(laplacian_abs),plt.title("Laplacian_abs")plt.show()cv2.waitKey(0)

四,算子总结

Sobel 算子、Scharr 算子、Laplacian 算子都可以用作边缘检测,它们的核如图 9-29 所示。

Sobel 算子和 Scharr 算子计算的都是一阶近似导数的值。通常情况下,可以将它们表示为:

Sobel 算子= |左-右| / |下-上|

Scharr 算子= |左-右| / |下-上|

式中“|左-右|”表示左侧像素值减右侧像素值的结果的绝对值,“|下-上|”表示下方像素值减上 方像素值的结果的绝对值。

Laplacian 算子计算的是二阶近似导数值,可以将它表示为:

Laplacian 算子= |左-右| + |左-右| + |下-上| + |下-上|

通过公式可以发现,Sobel 算子和 Scharr 算子各计算了一次“|左-右|”和“|下-上|”的值, 而 Laplacian 算子分别计算了两次“|左-右|”和“|下-上|”的值。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/840017.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剖析并实现C++17新特性的Any类型

问题: 对于这样的场景:对于一些CS(客户端-服务端)模型,当用户在客户端传入相应的事件时,我们需要实现框架即在服务端去分配线程处理这些事件,即调用用户的事件处理函数,那么对于不同…

中文信息期刊投稿邮箱

《中文信息》杂志是国家新闻出版总署批准的国家级刊物(月刊),国内外公开发行,大十六开印刷。本刊主要反映我国中文信息处理的学术水平,重点刊登科技、经济、教育等领域的基础理论、科研与应用技术的学术论文&#xff0…

Rust:如何使用 Pytorch 深度学习模型?

以下笔记内容仅供参考,尚未进行实际验证。 在Rust中使用PyTorch通常涉及使用一个称为tch的第三方crate,它是PyTorch的C API的Rust绑定。下面是一个简单的例子,展示了如何在Rust程序中加载一个PyTorch模型并进行预测。 首先,你需要…

第2天 搭建安全拓展_小迪网络安全笔记

1.常见搭建平台脚本使用: 例如 phpstudy IIS Nginx(俗称中间件): 什么是中间件: 中间件是介于应用系统和系统软件之间的一类软件,它使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部分或不同的应用&#…

vue2引入brand.vue和brand-add-or-update.vue后重启项目报错解决方案

最近在用粒谷商城项目练手,学习到P59时引入品牌两个vue文件,重启(npm run dev)项目报错: ERROR Failed to compile with 2 errors 12:11:59Th…

前端调用浏览器录音功能且生成文件(vue)

如果可以实现记得点赞分享&#xff0c;谢谢老铁&#xff5e; 首先在页面中给两个按钮&#xff0c;分别是“开始录音”&#xff0c;“结束录音”。以及录音成功后生成一个下载语音的链接。 1. 先看页面展示 <template><div><button click"startRecording…

【论文阅读】Rank-DETR(NIPS‘23)

paper:https://arxiv.org/abs/2310.08854 code:https://github.com/LeapLabTHU/Rank-DETR

Go 生成UUID唯一标识

什么是UUID 通用唯一识别码&#xff08;英语&#xff1a;Universally Unique Identifier&#xff0c;简称UUID&#xff09;是一种软件建构的标准&#xff0c;亦为自由软件基金会组织在分散式计算环境领域的一部份。 UUID的目的&#xff0c;是让分散式系统中的所有元素&#x…

微信小程序视频怎么保存到本地

你是否遇到过在微信小程序中发现了精彩的视频&#xff0c;却不知道如何将其保存到本地的困扰&#xff1f;别担心&#xff0c;这篇文章将为您揭示2024年最新的保存方法&#xff0c;让您轻松下载和保留这些珍贵的视频内容。不管您是使用安卓设备还是苹果设备&#xff0c;我们都为…

SD3303A大功率高精度LED驱动芯片3W低功耗高效率工作温度40c+85%

SD3303A是一款大功率高亮度LED驱动芯片&#xff0c;可以提供 1A的电流驱动3W的LED。具有高效率&#xff0c;低功耗等特点 &#xff0c;适用于电池供电的LED照明设备。 SD3303A具有开路保护和过温保护。 SD3303A需要使用两颗10uF(或者更大)的瓷 片电容&#xff0c;来保证电路性能…

学生手机管理方案

咱们现在的学生&#xff0c;手机几乎成了标配。所以问题就来了&#xff0c;怎么管理这些手机&#xff0c;让手机在课堂上不成为学习的干扰&#xff1f; 先得搞明白&#xff0c;手机在学生手里上该扮演什么角色。手机确实能帮学生查资料、交流学习&#xff0c;甚至写作业&#x…

Log360:护航安全,远离暗网风险

暗网有时候就像是一个神秘的地下世界&#xff0c;是互联网的隐蔽角落&#xff0c;没有任何规则。这是一个被盗数据交易、网络犯罪分子策划下一步攻击的地方。但仅仅因为它黑暗&#xff0c;不意味着你要对潜在的威胁视而不见。 暗网 这就是ManageEngine Log360的用武之地&…

用Visual Studio进行Qt开发的Cmake模板

使用Visual Studio进行Qt开发的时候&#xff0c;我们可以借用Cmake的moc功能和相应对Qt的支持生成VS工程。 文件组织 Root │ cmake.sh // cmake执行脚本 │ CMakeLists.txt // 根目录cmake文件 │ README.md │ text.txt ├─bin …

【Oracle篇】rman工具实用指南:常用命令详解与实践(第二篇,总共八篇)

&#x1f4ab;《博主介绍》&#xff1a;✨又是一天没白过&#xff0c;我是奈斯&#xff0c;DBA一名✨ &#x1f4ab;《擅长领域》&#xff1a;✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux&#xff0c;也在扩展大数据方向的知识面✌️…

chatgpt功能真的强大好用吗?

最近听到很多人说chatgpt的功能强大&#xff0c;非常好用。 我有点好奇&#xff0c;于是试用了一下&#xff0c;问了几个最近搜索过的问题&#xff0c;以检验chatgpt的能力。 1、如何解非线性方程 解非线性方程的方法有很多&#xff0c;取决于方程的具体形式和所需的精度。以…

WPF拖放控件

拖放官方文档 拖放操作通常涉及两个参与方&#xff1a;拖动对象所源自的拖动源和接收放置对象的拖放目标。 拖动源和放置目标可能是相同应用程序或不同应用程序中的 UI 元素。 我这里实现的是对TabControl的Tab页面进行拖放&#xff0c;以达成类似Chrome浏览器的拖放功能。 …

【Webpack】webpack scope hoisting

scope hoisting 是 webpack 的内置优化&#xff0c;它是针对模块的优化&#xff0c;在生产环境打包时会自动开启。 在未开启 scope hoisting 时&#xff0c;webpack 会将每个模块的代码放置在一个独立的函数环境中&#xff0c;这样是为了保证模块的作用域互不干扰。 而 scope…

【Centos7+JDK1.8】Jenkins安装手册

一、安装环境 Centos7 JDK1.8 Jenkins-2.346.3 JDK1.8安装以及网络配置等 自行搜索资料解决。 二、卸载历史安装的Jenkins&#xff0c;直接全部复制粘贴下面的命令 service jenkins stop yum -y remove jenkins rpm -e jenkins rpm -ql jenkins rm -rf /etc/sysconfig/je…

解决远程链接的“Gtk-WARNING **: cannot open display;

1.需要检查ssh配置中X11Forwarding是否启用 2.检查本地ssh工具是否启用x11转发&#xff08;下图以mobaxterm为例&#xff09; 3.检查是否有防火墙等其他网络拦截&#xff0c;如果没有特殊需求&#xff0c;这里可以直接将防火墙服务关闭 4.按上诉操作检查后&#xff0c;正常情况…

P2P服务端模型配合 Tool.net P2pServerAsync 类使用

Tool.Net 支持的 P2P 服务器模型实例 说明服务器部分相关代码相关调用实例Tcp版本Udp版本 最后附一张思维图 说明 当前文章&#xff0c;仅是Tool.Net 开源库的一个缩影。本次更新V5.0版本以上提供支持。可以提供简单实现P2P功能用于业务开发。 服务器部分相关代码 完整代码&…