边缘检测详解
- 0. 前言
- 1. 图像导数
- 2. LoG/zero-crossing
- 2.1 Marr-Hildteth 算法
- 3. Canny 与 holistically-nested 算法
- 3.1 Canny 边缘检测
- 3.2 holistically-nested 边缘检测
- 小结
- 系列链接
0. 前言
边缘是图像中两个区域之间具有相对不同灰级特性的边界,或者说是亮度函数突然变化的像素。边缘检测器是一组重要的局部图像预处理方法,用于定位强度函数中的(急剧)变化。可以通过使用以下算法来检测边缘上的点:
- 一阶导数的局部最大值或最小值
- 二阶导数的零交叉点 (
zero-crossing
)
判断一个边缘检测算法是否足够优秀可以使用以下标准:
- 能够最大程度地减少假阳性(即虚假边缘)和假阴性(即缺失真实边缘)的概率
- 检测到的边缘必须尽可能接近真正边缘
在本节中,首先,我们将学习如何使用二阶导数的过零点检测图像中的边缘。然后,介绍如何使用深度学习模型进行边缘检测,并将其与 Canny
边缘检测器进行比较。
1. 图像导数
我们首先介绍如何计算图像导数(梯度)以及边缘对图像导数的影响(以便我们可以使用图像导数进行边缘检测)。我们可以使用特定核/掩码的卷积操作近似图像导数:
- 图像一阶导,掩码 [ − 1 1 ] \left[ \begin{matrix} -1 &1 \end{matrix} \right] [−11]
f ′ ( x ) = lim x → ∞ f ( x + h ) − f ( x ) h = f ( x + 1 ) − f ( x ) f'(x)={\lim_{x \to \infty}}\frac {f(x+h)-f(x)}{h}=f(x+1)-f(x) f′(x)=x→∞limhf(x+h)−f(x)=f(x+1)−f(x) - 图像二阶导,掩码 [ 1 − 2 1 ] \left[ \begin{matrix} 1 &-2 &1 \end{matrix} \right] [1−21]
f ′ ′ ( x ) = lim x → ∞ f ′ ( x + h ) − f ′ ( x ) h = f ′ ( x ) − f ′ ( x − 1 ) = f ( x + 1 ) − 2 f ( x ) + f ( x − 1 ) \begin{aligned} f''(x)&={\lim_{x \to \infty}}\frac {f'(x+h)-f'(x)}{h}=f'(x)-f'(x-1)\\ &=f(x+1)-2f(x)+f(x-1) \end{aligned} f′′(x)=x→∞limhf′(x+h)−f′(x)=f′(x)−f′(x−1)=f(x+1)−2f(x)+f(x−1)
使用以上近似函数计算二值图像的导数,并注意其对导数的影响,以便理解为什么导数可以用于边缘检测。
(1) 首先导入所需的模块、函数,然后读取二值黑白图像:
from scipy.signal import convolve
from skimage.io import imread
from skimage.color import rgb2gray
import matplotlib.pylab as pltimg = rgb2gray(imread('example.png'))
h, w = img.shape
(2) 构建卷积核,使用空间卷积计算一阶导数 ∂ f ∂ x \frac {∂f} {∂x} ∂x∂f 和二阶导数 ∂ 2 f ∂ 2 x \frac {∂^2 f} {∂^2x} ∂2x∂2f:
kd1 = [[1, -1]]
kd2 = [[1, -2, 1]]
imgd1 = convolve(img, kd1, mode='same')
imgd2 = convolve(img, kd2, mode='same')
(3) 最后,绘制输入图像及其导数:
plt.figure(figsize=(20,10))
plt.gray()
plt.subplot(231), plt.imshow(img), plt.title('image', size=10)
plt.subplot(232), plt.imshow(imgd1), plt.title('1st derivative', size=10)
plt.subplot(233), plt.imshow(imgd2), plt.title('2nd derivative', size=10)
plt.subplot(234), plt.plot(range(w), img[0,:]), plt.title('image function', size=10)
plt.subplot(235), plt.plot(range(w), imgd1[0,:]), plt.title('1st derivative function', size=10)
plt.subplot(236), plt.plot(range(w), imgd2[0,:]), plt.title('2nd derivative function', size=10)
plt.show()
从以上结果图像可以看出,在边缘像素周围可以观察到以下内容:
- 原始图像中的边缘像素强度急剧变化
- 一阶导数在边缘像素处达到最大值
- 二阶导数在边缘像素处具有零交叉点
2. LoG/zero-crossing
在本节中,我们将使用导数的零交叉 (zero-crossing
) 特性查找图像中的边缘。在边缘像素上,一阶导数达到最大化(或最小化),而此处的二阶导数为零。然而,我们并不能总是找到导数为零的离散像素,因此需要寻找零交叉,以近似与梯度最大值/最小值相对应的位置。
但是,这种方法对噪声较为敏感(因为它需要两次求导),为了解决这个问题,我们需要首先平滑图像并去除噪声。因此,有以下两种方法使用二阶导数来识别边缘:
- 首先执行平滑,然后应用梯度
- 结合平滑和梯度操作
导数是使用拉普拉斯 (Laplacian
∇ 2 ∇2 ∇2) 算子计算的,并使用高斯算子平滑图像。这两个算子通常可以被组合为高斯拉普拉斯算子 (Laplacian of Gaussian
, LoG
),因此可以减少卷积运算:
卷积的导数定理可以描述为:
∂ ∂ x ( h ∗ f ) = ( ∂ ∂ x h ) ∗ f \frac \partial {\partial x}(h*f)=(\frac \partial {\partial x}h)*f ∂x∂(h∗f)=(∂x∂h)∗f
高斯拉普拉斯算子 (Laplacian of Gaussian
, LoG
),或称 Marr-Hildteth
算子描述如下:
∇ 2 [ f ( x , y ) ∗ G ( x , y ) ] = ∇ 2 G ( x , y ) ∗ f ( x , y ) \nabla ^2[f(x,y)*G(x,y)]=\nabla ^2G(x,y)*f(x,y) ∇2[f(x,y)∗G(x,y)]=∇2G(x,y)∗f(x,y)
其中 G ( x , y ) = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 G(x,y)=\frac 1 {2\pi\sigma ^2}e^{-\frac {x^2+y^2}{2\sigma ^2}} G(x,y)=2πσ21e−2σ2x2+y2,将 G ( x , y ) G(x,y) G(x,y) 带入上式可得:
L o G ( x , y ) = ∇ 2 G ( x , y ) = ∂ 2 ∂ x 2 G ( x , y ) + ∂ 2 ∂ y 2 G ( x , y ) = − 1 π σ 4 [ 1 − x 2 + y 2 2 σ 2 ] e − x 2 + y 2 2 σ 2 \begin{aligned} LoG(x,y)&=\nabla ^2 G(x,y)=\frac {\partial ^2} {\partial x^2}G(x,y)+\frac {\partial ^2} {\partial y^2}G(x,y)\\ &=-\frac 1 {\pi\sigma ^4}[1-\frac {x^2+y^2} {2\sigma ^2}]e^{-\frac {x^2+y^2}{2\sigma ^2}} \end{aligned} LoG(x,y)=∇2G(x,y)=∂x2∂2G(x,y)+∂y2∂2G(x,y)=−πσ41[1−2σ2x2+y2]e−2σ2x2+y2
参数 σ σ σ 是高斯核的宽度,并用于控制平滑量。紧接着图像的 LoG
变换之后,对零交叉的连续计算会输出图像中的边缘,这通常称为 Marr-Hildteth
(LoG
) 算法。
2.1 Marr-Hildteth 算法
Marr-Hildteth
(LoG
) 算法描述如下:
- 计算图像
LoG
- 在每一行和每一列中找到零交叉点
- 计算零交叉点的斜率
- 将阈值应用于梯度并标记边缘
使用该算法检测到的边缘结构根据高斯核宽度参数 σ σ σ 不同而不同:
- 检测到更大尺度的边缘,减少噪声,但增加边缘位置的不确定性
- 检测到更精细的细节特征
但该算法不能很好地处理角点;LoG
的零交叉点能够对边缘进行较好的定位,尤其是当边缘不是很锐利时,该方法存在噪声抑制。
(1) 导入所有必需的库,读取输入图像,并根据 LoG/zero-crossings
找到其中的边缘:
import numpy as np
from scipy import ndimage
from skimage.io import imread
import matplotlib.pyplot as plt
from skimage.color import rgb2gray
(2) 定义函数 any_neighbor_neg()
,该函数根据给定(正值)像素,返回其周围 8
个邻居中是否有负值像素,如果存在负值像素,则意味着存在零交叉点,将计算并返回相应边的斜率:
def any_neighbor_neg(img, i, j):for k in range(-1,2):for l in range(-1,2):if img[i+k, j+k] < 0:return True, img[i, j] - img[i+k, j+k]return False, None
(3) 定义函数 zero_crossing()
,该函数以黑色输出图像开始,如果以下条件均为真,则将像素颜色更改为白色,即边缘像素:
- 像素是一个正像素
- 它的
8
个邻居中至少有一个负像素 - 边缘的斜率(如果存在负像素)高于给定的阈值(仅检测强边缘)
def zero_crossing(img, th):out_img = np.zeros(img.shape)for i in range(1,img.shape[0]-1):for j in range(1,img.shape[1]-1):found, slope = any_neighbor_neg(img, i, j)if img[i,j] > 0 and found and slope > th:out_img[i,j] = 255return out_img
(4) 读取输入图像并将其转换为灰度图像,使用不同 σ σ σ 值调用 scipy.ndimage
模块的 gaussian_lapace()
函数将 LoG
运算符应用于图像。使用不同 σ σ σ 值以及不同阈值计算所得图像中的零交叉点,随着 σ σ σ 的增加,使用的阈值会降低,并绘制使用不同 σ \sigma σ 检测到到的的边缘:
img = rgb2gray(imread('1.png'))
#img = misc.imread('../new images/tagore.png')[...,3]
print(np.max(img))
fig = plt.figure(figsize=(10,16))
plt.subplots_adjust(0,0,1,0.95,0.05,0.05)
plt.gray() # show the filtered result in grayscale
for sigma, thres in zip(range(3,10,2), [1e-3, 1e-4, 1e-5, 1e-6]):plt.subplot(2,2,sigma//2)result = ndimage.gaussian_laplace(img, sigma=sigma)result = zero_crossing(result, thres)plt.imshow(result)plt.axis('off')plt.title('LoG with zero-crossing, sigma=' + str(sigma), size=10)plt.tight_layout()
plt.show()
3. Canny 与 holistically-nested 算法
在本节中,我们将学习一种基于深度学习的边缘检测技术,称为 holistically-nested
边缘检测。我们还将结果与另一种主流的基于梯度的边缘检测算法 Canny
进行比较,我们首先将介绍这两种不同的算法。
3.1 Canny 边缘检测
Canny
边缘检测是一种多阶段算法,依赖于找到图像导数的极值。接下来,我们将使用 OpenCV
实现 Canny
边缘检测:
- 降噪:作为一种基于梯度的边缘检测技术,它易受图像中的噪声的影响;因此,第一步是用高斯滤波器去除图像中的噪声(例如,使用核尺寸
5 x 5
) - 然后,用水平和垂直方向的
Sobel
核(使用卷积)对图像平滑图像的强度梯度计算执行滤波,Sobel
垂直和水平核如下,本质上只是导数算子的变体:
S x = [ + 1 + 2 + 1 0 0 0 − 1 − 2 − 1 ] , S y = [ + 1 0 − 1 + 2 0 − 2 + 1 0 − 1 ] S_x= \left[ \begin{matrix} +1 &+2 &+1 \\ 0 &0 &0\\ -1 &-2 &-1 \\ \end{matrix} \right], S_y= \left[ \begin{matrix} +1 &0 &-1 \\ +2 &0 &-2 \\ +1 &0 &-1 \\ \end{matrix} \right] Sx= +10−1+20−2+10−1 ,Sy= +1+2+1000−1−2−1
根据以上公式,每个像素的边缘梯度和方向计算如下,梯度方向始终垂直于边缘:- 梯度大小: ∣ G ∣ = S x 2 + S y 2 |G|=\sqrt {S_x^2+S_y^2} ∣G∣=Sx2+Sy2
- 角度: θ = t a n − 1 S x S y \theta=tan^{-1}\frac {S_x}{S_y} θ=tan−1SySx
- 非极大值抑制:在计算梯度大小和方向之后,对图像进行全扫描以去除可能不构成边缘的任何不需要的像素。为此,在每个像素上,检查该像素在梯度方向上是否是其邻域中的局部最大值,得到具有较小边缘的二值图像
- 滞后性:这个阶段在决定在以上步骤中检测到的边缘中,哪些是真实的边缘,哪些边缘是虚假的边缘。为此,使用阈值
minVal
和maxVal
,强度大于maxVal
的边缘都是确定的真实边缘, 而小于minVal
的边缘都是确定的虚假边缘,因此需要将其丢弃。而位于这两个阈值之间的边缘,如果它们连接到确定的边缘像素,则认为它们是边缘的一部分;否则,它们也会被丢弃。
3.2 holistically-nested 边缘检测
Holistically-nested
边缘检测 (Holistically-nested Edge Detection
, HED
) 是一种新的边缘检测算法,该算法解决了边缘检测算法中的两个重要问题:
- 端到端的模型训练和预测
- 多尺度多层次特征学习
该模型使用深度学习模型执行端到端的预测,可以充分利用全卷积神经网络和深度监督网络。HED
会自动学习丰富的层次表示,它比基于 CNN
的边缘检测算法快数个数量级。
首先下载预处理模型,并保存在 models
文件夹中,网络架构如下所示:
(1) 导入所需库和函数:
import cv2
import numpy as np
import matplotlib.pylab as plt
(2) 加载输入图像并获取其尺寸:
image = cv2.imread('2.png')
(h, w) = image.shape[:2]
(3) 将图像转换为灰度图像,用高斯模糊进行模糊,并使用 Canny
边缘检测获得边缘,滞后阈值分别为 80
和 150
:
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
canny = cv2.Canny(blurred, 80, 150)
(4) 接下来,我们将用一个居中的裁剪层替换 OpenCV
的裁剪层,使用 getMemoryShapes()
和 forward()
方法创建类 CropLayer()
。在 getMemoryShapes()
方法中,裁剪层接收两个输入,并保持批大小和通道数量,计算开始和结束裁剪坐标,并返回数据集形状;在 forward()
方法中,使用 divide(x)
执行裁剪:
class CropLayer(object):def __init__(self, params, blobs):self.xstart = 0self.xend = 0self.ystart = 0self.yend = 0def getMemoryShapes(self, inputs):inputShape, targetShape = inputs[0], inputs[1]batchSize, numChannels = inputShape[0], inputShape[1]height, width = targetShape[2], targetShape[3]self.ystart = (inputShape[2] - targetShape[2]) // 2self.xstart = (inputShape[3] - targetShape[3]) // 2self.yend = self.ystart + heightself.xend = self.xstart + widthreturn [[batchSize, numChannels, height, width]]def forward(self, inputs):return [inputs[0][:,:,self.ystart:self.yend,self.xstart:self.xend]]
(5) 接下来,读取预训练的模型:
prototxt_path = "models/deploy.prototxt"
model_path = "models/hed_pretrained_bsds.caffemodel"net = cv2.dnn.readNetFromCaffe(prototxt_path, model_path)
(6) 使用 dnn_registerLayer()
将新层注册到模型中:
cv2.dnn_registerLayer('Crop', CropLayer)
(7) 使用 blobFromImage()
为 HED
模型从输入图像构造输入 blob
:
blob = cv2.dnn.blobFromImage(image, scalefactor=1.0, size=(w, h), mean=(104.00698793, 116.66876762, 122.67891434), swapRB=False, crop=False)
(8) 将 blob
设置为网络的输入,并运行正向传播 format
方法计算输出:
net.setInput(blob)
outs = net.forward()
hed = cv2.resize(outs[0][0,:,:], (w, h))
hed = (255 * hed).astype("uint8")
(9) 通过 Canny
和 Holistically-nested
边缘检测获得的输出边缘检测结果如下所示:
plt.figure(figsize=(20, 8))
plt.gray()
plt.subplots_adjust(0,0,1,0.975,0.05,0.05)
plt.subplot(131), plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB)), plt.axis('off'), plt.title('input', size=10)
plt.subplot(132), plt.imshow(canny), plt.axis('off'), plt.title('canny', size=10)
plt.subplot(133), plt.imshow(hed), plt.axis('off'), plt.title('holistically-nested', size=10)
plt.show()
小结
边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识图像中亮度变化明显的点,图像属性中的显著变化通常反映了图像中的重要变化和特征。边缘检测是图像处理和计算机视觉中,尤其是特征提取中的一个重要研究领域。在本节中,我们学习了多种边缘检测算法,包括基于梯度的算法以及基于深度神经网络的方法。
系列链接
Python图像处理【1】图像与视频处理基础
Python图像处理【2】探索Python图像处理库
Python图像处理【3】Python图像处理库应用
Python图像处理【4】图像线性变换
Python图像处理【5】图像扭曲/逆扭曲
Python图像处理【6】通过哈希查找重复和类似的图像
Python图像处理【7】采样、卷积与离散傅里叶变换
Python图像处理【8】使用低通滤波器模糊图像
Python图像处理【9】使用高通滤波器执行边缘检测
Python图像处理【10】基于离散余弦变换的图像压缩
Python图像处理【11】利用反卷积执行图像去模糊
Python图像处理【12】基于小波变换执行图像去噪
Python图像处理【13】使用PIL执行图像降噪
Python图像处理【14】基于非线性滤波器的图像去噪
Python图像处理【15】基于非锐化掩码锐化图像
Python图像处理【16】OpenCV直方图均衡化
Python图像处理【17】指纹增强和细节提取