【计算机视觉】边缘检测

图像的边缘简单来说就是图像中灰度不连续的地方。
在这里插入图片描述

1.图像梯度

图像梯度是指图像像素灰度值在某个方向上的变化;图像梯度是图像的一阶导数,实际计算时可以使用差分来近似。

1.1 什么是图像梯度?

图像梯度是一种数学工具,用于描述图像中像素值变化的速度和方向。换句话说,它反映了图像亮度值在空间上的变化率,因此是边缘检测特征提取图像分析中常用的重要概念。

1.1.1 图像梯度的定义

给定一幅二维灰度图像 I ( x , y ) I(x, y) I(x,y),它的梯度是一个向量,定义如下:

∇ I = ( ∂ I ∂ x , ∂ I ∂ y ) \nabla I = \left( \frac{\partial I}{\partial x}, \frac{\partial I}{\partial y} \right) I=(xI,yI)

  • ( ∂ I ∂ x ) ( \frac{\partial I}{\partial x} ) (xI):图像在 x x x-方向上的变化率(水平梯度)。
  • ( ∂ I ∂ y ) ( \frac{\partial I}{\partial y} ) (yI):图像在 y y y-方向上的变化率(垂直梯度)。

梯度的大小方向定义如下:

  • 梯度大小(Gradient Magnitude):
    ∣ ∇ I ∣ = ( ∂ I ∂ x ) 2 + ( ∂ I ∂ y ) 2 |\nabla I| = \sqrt{\left( \frac{\partial I}{\partial x} \right)^2 + \left( \frac{\partial I}{\partial y} \right)^2} ∣∇I=(xI)2+(yI)2
  • 梯度方向(Gradient Direction):
    θ = arctan ⁡ ( ∂ I ∂ y ∂ I ∂ x ) \theta = \arctan\left(\frac{\frac{\partial I}{\partial y}}{\frac{\partial I}{\partial x}}\right) θ=arctan(xIyI)
1.1.2 如何计算图像梯度

在离散图像中,梯度的计算通常使用滤波器(卷积核)近似求导数。以下是常见方法:

1. 基本差分(Finite Difference)

利用相邻像素值的差分近似求导数:

  • ( ∂ I ∂ x ≈ I ( x + 1 , y ) − I ( x , y ) ) ( \frac{\partial I}{\partial x} \approx I(x+1, y) - I(x, y) ) (xII(x+1,y)I(x,y))
  • ( ∂ I ∂ y ≈ I ( x , y + 1 ) − I ( x , y ) ) ( \frac{\partial I}{\partial y} \approx I(x, y+1) - I(x, y) ) (yII(x,y+1)I(x,y))
2. Sobel算子

Sobel算子是一种常用的离散梯度滤波器,使用以下卷积核:

  • 水平梯度核( G x G_x Gx):
    [ − 1 0 1 − 2 0 2 − 1 0 1 ] \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix} 121000121
  • 垂直梯度核( G y G_y Gy):
    [ − 1 − 2 − 1 0 0 0 1 2 1 ] \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix} 101202101

使用 Sobel 算子计算出的梯度既平滑了噪声,又能准确提取边缘。

3. Scharr算子

Scharr算子是 Sobel 算子的改进版,能更好地处理图像细节。它的权值分布更均匀,适合高精度梯度计算。

4. 拉普拉斯算子

拉普拉斯算子计算的是二阶导数,用于检测图像的变化区域,而不是简单的一阶变化。

1.2 梯度的计算示例
import cv2 as cv
import numpy as np# 加载图像
img = cv.imread('example.jpg', cv.IMREAD_GRAYSCALE)# 计算水平和垂直梯度
grad_x = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=3)  # 水平梯度
grad_y = cv.Sobel(img, cv.CV_64F, 0, 1, ksize=3)  # 垂直梯度# 计算梯度大小
magnitude = cv.magnitude(grad_x, grad_y)# 显示结果
cv.imshow('Original', img)
cv.imshow('Gradient X', cv.convertScaleAbs(grad_x))
cv.imshow('Gradient Y', cv.convertScaleAbs(grad_y))
cv.imshow('Gradient Magnitude', cv.convertScaleAbs(magnitude))
cv.waitKey(0)
cv.destroyAllWindows()
1.3 梯度的应用
  1. 边缘检测:
    • 梯度强度大的地方往往是图像边缘,结合阈值可以提取轮廓(如 Canny 边缘检测)。
  2. 特征提取:
    • 梯度方向是许多特征描述符(如 SIFT、HOG)的基础。
  3. 图像增强:
    • 利用梯度信息可以增强图像的边缘或细节。
  4. 运动检测:
    • 梯度变化在时间序列中的对比可以用来检测运动或变化区域。

2.Canny边缘检测

Canny边缘检测是一种经典的多步骤边缘检测算法,由 John F. Canny 在 1986 年提出。它以鲁棒性、高准确性和抗噪性著称,广泛用于图像处理和计算机视觉任务中。

2.1 算法步骤

Canny 边缘检测分为以下几个步骤:

1. 噪声抑制(平滑处理)
  • 目标:减少噪声对边缘检测的影响。

  • 方法:对图像进行高斯模糊。
    高斯模糊会平滑图像中的细节和噪声,同时保留大的结构边缘。

    公式(高斯滤波器):
    G ( x , y ) = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 G(x, y) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}} G(x,y)=2πσ21e2σ2x2+y2
    其中, σ \sigma σ 决定平滑程度(模糊核的标准差)。

2. 计算图像梯度
  • 目标:找出图像中的边缘,即像素值变化剧烈的区域。

  • 方法:使用 Sobel 算子计算水平梯度 ( G x G_x Gx) 和垂直梯度 ( G y G_y Gy),然后计算梯度的大小和方向。

    梯度大小(强度)计算公式:
    ∣ G ∣ = G x 2 + G y 2 |G| = \sqrt{G_x^2 + G_y^2} G=Gx2+Gy2

    梯度方向计算公式:
    θ = arctan ⁡ ( G y G x ) \theta = \arctan\left(\frac{G_y}{G_x}\right) θ=arctan(GxGy)

    • 梯度强度大的地方可能是边缘。
    • 梯度方向用于后续的非极大值抑制。
3. 非极大值抑制(Non-Maximum Suppression)
  • 目标:精确定位边缘,去除非边缘的噪声响应。

  • 方法

    • 在梯度方向上检查当前像素值是否为局部极大值。
    • 如果不是局部极大值,则将该像素设为 0(非边缘)。

    操作:

    • 将梯度方向分为四个主方向(0°、45°、90°、135°)。
    • 比较当前像素与梯度方向上相邻两个像素的大小。
4. 双阈值边缘检测
  • 目标:区分强边缘、弱边缘和非边缘。
  • 方法
    • 设置两个阈值:高阈值 ( T h i g h T_{high} Thigh) 和低阈值 ( T l o w T_{low} Tlow)。
    • 对梯度强度进行分类:
      • 强边缘:梯度强度 > T h i g h > T_{high} >Thigh
      • 弱边缘 T l o w < 梯度强度 ≤ T h i g h T_{low} < \text{梯度强度} \leq T_{high} Tlow<梯度强度Thigh
      • 非边缘:梯度强度 l e q T l o w leq T_{low} leqTlow
5. 边缘连接(Hysteresis Thresholding)
  • 目标:确定最终的边缘。
  • 方法
    • 强边缘直接保留。
    • 弱边缘若与强边缘相连,则保留为边缘;否则丢弃。
2.2 Canny 边缘检测的代码实现
import cv2 as cv
import numpy as np# 加载图像(灰度模式)
img = cv.imread('example.jpg', cv.IMREAD_GRAYSCALE)# Canny 边缘检测
edges = cv.Canny(img, threshold1=50, threshold2=150)# 显示结果
cv.imshow('Original Image', img)
cv.imshow('Canny Edges', edges)
cv.waitKey(0)
cv.destroyAllWindows()
2.3 Canny 函数参数详解
cv.Canny(image, threshold1, threshold2, apertureSize=3, L2gradient=False)
  1. image:输入图像,必须为灰度图像。
  2. threshold1:低阈值,用于区分弱边缘和非边缘。
  3. threshold2:高阈值,用于区分强边缘和弱边缘。
  4. apertureSize:Sobel 算子的核大小(默认为 3)。常用值:3、5、7。
  5. L2gradient:布尔值,是否使用更精确的梯度计算(默认为 False)。
    • 如果为 True,则使用 L2 范数( G x 2 + G y 2 \sqrt{G_x^2 + G_y^2} Gx2+Gy2 )。
    • 如果为 False,则使用 L1 范数( ∣ G x ∣ + ∣ G y ∣ |G_x| + |G_y| Gx+Gy)。
2.4 Canny 边缘检测的优点
  1. 鲁棒性:可以很好地抵抗噪声,适用于复杂场景。
  2. 多步骤处理:包括平滑、梯度计算和非极大值抑制,结果更加精确。
  3. 边缘连接:通过双阈值和滞后连接有效去除了孤立的边缘点。
2.5 Canny 边缘检测的缺点
  1. 参数敏感:双阈值的选择对结果影响很大,需要手动调整。
  2. 计算成本高:多步骤处理增加了算法复杂度,不适合实时性要求高的应用。
2.6 应用场景
  1. 边缘检测:
    • 图像分割前的边缘提取。
  2. 特征提取:
    • 用于形状识别或物体检测。
  3. 运动检测:
    • 对帧差图像进行边缘检测,以识别移动物体的轮廓。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/64045.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Microsemi Libero SoC免费许可证申请指南(Microchip官网2024最新方法)

点击如下链接&#xff1a; https://www.microchip.com/en-us/products/fpgas-and-plds/fpga-and-soc-design-tools/fpga/licensing 点击右侧&#xff0c;请求免费的License 如果提示登录&#xff0c;请先登录Microchip账号。 点击Request Free License。 选项一年免费的Li…

[C++]类的继承

一、什么是继承 1.定义&#xff1a; 在 C 中&#xff0c;继承是一种机制&#xff0c;允许一个类&#xff08;派生类&#xff09;继承另一个类&#xff08;基类&#xff09;的成员&#xff08;数据和函数&#xff09;。继承使得派生类能够直接访问基类的公有和保护成员&#xf…

harbor镜像仓库搭建

Harbor简介 Harbor的发展背景和现状 Harbor项目起始于2014年左右,当时正值容器技术和微服务架构迅速崛起的时期。随着越来越多的企业开始采用容器化部署应用,对于私有镜像管理的需求也日益增长。传统的解决方案要么缺乏必要的企业级特性(如访问控制、安全性和可扩展性),…

01-51单片机硬件基础

开发板介绍 学校授课用的是普中科技的EM3.V2.2开发板&#xff0c;没什么好说的&#xff0c;记着去淘宝上找原理图&#xff0c;别迷信课本。 网上有卖51最小系统板的&#xff0c;比开发板便宜&#xff0c;也有下载模块&#xff0c;可以自己搭建外围电路。 还可以自己在protue…

方法引用和lambda表达式的奥妙

方法引用替代Lambda表达式 什么情况可以使用方法引用替代lambda表达式&#xff1f; 下面代码中两处使用了lambda表达式&#xff0c;一个是filter内&#xff0c;一个是forEach内。其中&#xff0c;forEach内的lambda表达式可以被方法引用替代&#xff0c;但是filter内的lambda…

Android通过okhttp下载文件(本文案例 下载mp4到本地,并更新到相册)

使用步骤分为两步 第一步导入 okhttp3 依赖 第二步调用本文提供的 utils 第一步这里不做说明了&#xff0c;直接提供第二步复制即用 DownloadUtil 中 download 为下载文件 参数说明 这里主要看你把 destFileName 下载文件名称定义为什么后缀&#xff0c;比如我定义为 .mp4 下…

What is load balancing? 什么是负载均衡?

原文链接 What Is Load Balancing? | IBM 什么是负载均衡&#xff1f; 在多台服务器之间高效的分配网络流量的过程&#xff0c;以优化应用程序的可用性&#xff0c;同时确保积极的用户体验。 电商网站依赖负载均衡&#xff08;load balancing&#xff09;来确保web应用能够无…

黑马商城微服务复习(6)

MQ高级 1. 消息可靠性2. 发送者的可靠性1. 发送者问题2. 生产者重试机制3. 生产者确认机制4. MQ可靠性5. 消费者的可靠性 3. 延迟消息1. 定义2. 死信交换机 1. 消息可靠性 发送消息时丢失&#xff1a; 生产者发送消息时连接MQ失败生产者发送消息到达MQ后未找到Exchange生产者发…

内网是如何访问到互联网的(华为源NAT)

私网地址如何能够访问到公网的&#xff1f; 在上一篇中&#xff0c;我们用任意一个内网的终端都能访问到百度的服务器&#xff0c;但是这是我们在互联网设备上面做了回程路由才实现的&#xff0c;在实际中&#xff0c;之前也说过运营商是不会写任何路由过来的&#xff0c;那对于…

oracle归档模式下的快速热备方法-适合小库

在我们的一些小型的oracle生产库中&#xff0c;有些时候我们可以在不停库且不使用rman的情况下实现数据库的热备。该热备的原理是通过控制数据文件块头的scn号在备份时候不变化&#xff0c;进而保证备份的数据文件数据一致性。 一、环境 数据库版本&#xff1a; 数据库需要开启…

rabbitMq举例

新来个技术总监&#xff0c;把 RabbitMQ 讲的那叫一个透彻&#xff0c;佩服&#xff01; 生产者 代码举例 public String sendMsg(final String exchangeName,final String routingKey,final String msg) {} /*** 发送消息* param exchangeName exchangeName* param routin…

2024年12月13日Github流行趋势

项目名称&#xff1a;nexus-xyz / nexus-zkvm 项目维护者&#xff1a;govereau slumber danielmarinq sjudson yoichi-nexus项目介绍&#xff1a;Nexus zkVM 是一个零知识虚拟机。项目star数&#xff1a;1,948项目fork数&#xff1a;343 项目名称&#xff1a;soxoj / maigret …

(九)机器学习 - 多项式回归

多项式回归&#xff08;Polynomial Regression&#xff09;是一种回归分析方法&#xff0c;它将自变量 xx 和因变量 yy 之间的关系建模为 nn 次多项式。多项式回归的目的是找到一个 nn 次多项式函数&#xff0c;使得这个函数能够最好地拟合给定的数据点。 多项式回归的数学表达…

Linux USB开发整理和随笔

目录 1 概述 2 硬件原理基础 2.1 USB发展 2.2 USB的拓扑 2.3 硬件接口 2.4 USB总线协议 2.4.1 通信过程 2.4.2 概念关系 2.4.3 管道PIPE 2.4.4 传输 2.4.5 事务 2.4.6 包结构与类型 2.4.6.1 令牌包 2.4.6.2 数据包 2.4.6.3 握手包 2.5 描述符 2.5.1 设备描述符…

️️️ 避坑指南:如何修复国密gmssl 库填充问题并提炼优秀加密实践20241212

&#x1f6e1;️ 避坑指南&#xff1a;如何修复国密gmssl 库填充问题并提炼优秀加密实践 ✨ 引言 在当下的数据安全环境中&#xff0c;SM4作为中国国家密码算法的代表性选择&#xff0c;被广泛应用于金融、通信和政府领域。然而&#xff0c;在实际开发中&#xff0c;即便是开…

沈阳理工大学《2024年811自动控制原理真题》 (完整版)

本文内容&#xff0c;全部选自自动化考研联盟的&#xff1a;《沈阳理工大学811自控考研资料》的真题篇。后续会持续更新更多学校&#xff0c;更多年份的真题&#xff0c;记得关注哦~ 目录 2024年真题 Part1&#xff1a;2024年完整版真题 2024年真题

2023 年 408 大题解析

讲解视频推荐&#xff1a; 【BOK408真题讲解-2023】 一、数据结构 1. 算法题&#xff08;图的邻接矩阵&#xff09;13’ 已知有向图 G 采用邻接矩阵存储&#xff0c;类型定义如下&#xff1a; typedef struct{ //图的类型定义int num Vertices, numEdges; //图的顶点数和有…

【R语言】基础知识

一、对象与变量 R语言中的所有事物都是对象&#xff0c;如向量、列表、函数&#xff0c;变量、甚至环境等。它的所有代码都是基于对象object的操作&#xff0c;变量只是调用对象的手段。 1、对象 在R语言中&#xff0c;对计算机内存的访问是通过对象实现的。 # 字符型向量 …

【SpringBug】lombok插件中@Data不能生成get和set方法

一&#xff1a;问题引入 可以看到我们在类UserInfo上写了Data注解&#xff0c;但是在测试文件中生成的反编译target文件Us二Info中没有get和set方法 二&#xff1a;解决方法 1&#xff1a;Spring升级问题&#xff08;解决了我的问题&#xff09; 原因是Spring官方进行了升级…

Java版-图论-最短路-Floyd算法

实现描述 网络延迟时间示例 根据上面提示&#xff0c;可以计算出&#xff0c;最大有100个点&#xff0c;最大耗时为100*wi,即最大的耗时为10000&#xff0c;任何耗时计算出来超过这个值可以理解为不可达了&#xff1b;从而得出实现代码里面的&#xff1a; int maxTime 10005…