图像水平梯度和竖直梯度代码

晓强Deep Learning的读书分享会，先从这里开始，从大学开始。大家好，我是晓强，计算机科学与技术专业研究生在读。我会不定时的更新我的文章，内容可能包括深度学习入门知识，具体包括CV，NLP方向的基础知识和学习的论文；网络表征学习的相关论文解读。当然我每天的读书心得也会分享给大家，可能涉及我们生活各个方面的书籍。我也会不定时回答大家的问题与大家一同进步，共同交流，互相监督，结交更多的朋友。希望大家多留言，多交流，多多关照。

【晓白】今天终于有时间整理以后写一篇技术类文章啦，以后我会不定期更文章，先从计算机视觉开始，逐步更新多个深度学习应用领域的知识点，如有错误大家多指正，多交流，多讨论，共同学习，互相进步。如果内容对大家有一些帮助，请大家多点赞支持，分享。接下来我们来分享第三课时。系列课程请关注我的文章链接。

第三课：图像分割

图像分割：图像分割是指将图像分成若干具有相似性质的区域的过程，主要有基于阈值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割和实例分割。

分割的原则就是使划分后的子图在内部保持相似度最大，而子图之间的相似度保持最小。将G = (V,E) 分成两个子集A,B,使得：

固定阈值图像分割:

直方图双峰法：双峰法：六十年代中期提出的直方图双峰法 (也称 mode 法) 是典型的全局单阈值分割方法。基本思想：假设图像中有明显的目标和背景，则其灰度直方图呈双峰分布，当灰度级直方图具有双峰特性时，选取两峰之间的谷对应的灰度级作为阈值。

固定阈值分割：

• 函数：cv2.threshold(src, thresh, maxval, type)

• 参数说明：

参数1：原图像

参数2：对像素值进行分类的阈值

参数3：当像素值高于(小于)阈值时，应该被赋予的新的像素值，

参数4：第四个参数是阈值方法。

返回值：函数有两个返回值，一个为retVal, 一个阈值化处理之后的图像。

自动阈值图像分割：

自适应阈值法：

函数：cv2.adaptiveThreshold()

迭代法阈值分割：

步骤

1．求出图象的最大灰度值和最小灰度值，分别记为ZMAX和ZMIN，令初始阈值

T0=(ZMAX+ZMIN)/2；

2．根据阈值TK将图象分割为前景和背景，分别求出两者的平均灰度值ZO和ZB ；

3．求出新阈值TK+1=(ZO+ZB)/2；

4．若TK==TK+1，则所得即为阈值；否则转2，迭代计算；

5 ．使用计算后的阈值进行固定阈值分割。

Otsu大津法：

• 最大类间方差法，1979年日本学者大津提出，是一种基于全局阈值的自适应方法。

• 灰度特性：图像分为前景和背景。当取最佳阈值时，两部分之间的差别应该是最大的，衡量差别的标准为最大类间方差。

• 直方图有两个峰值的图像，大津法求得的Ｔ近似等于两个峰值之间的低谷。

图像边缘提取：

图像梯度：

梯度：梯度是一个向量，梯度方向指向函数变化最快的方向，大小就是它的模，也是最大的变化率，对于二元函数z=f(x,y)，它在点(x,y)的梯度就是

, 或者：

这个梯度向量的幅度和方向角为：

图像梯度：

图像梯度即图像中灰度变化的度量，求图像梯度的过程是二维离散函数求导过程。边缘其实就是图像上灰度级变化很快的点的集合。下图展示了一个灰度图的数学化表达，像素点(x,y)的灰度值是f(x,y),它有八个邻域。

图像在点(x,y)的梯度为：

模板卷积：要理解梯度图的生成，就要先了解模板卷积的过程，模板卷积是模板运算的一种方式，其步骤如下：

（1）将模板在输入图像中漫游，并将模板中心与图像中某个像素位置重合；

（2）将模板上各个系数与模板下各对应像素的灰度相乘；

（3）将所有乘积相加（为保持灰度范围，常将结果再除以模板系数之和，后面梯度算子模板和为0的话就不需要除了）；

（4）将上述运算结果（模板的响应输出）赋给输出图像中对应模板中心位置的像素。

梯度图：梯度图的生成和模板卷积相同，不同的是要生成梯度图，还需要在模板卷积完成后计算在点(x,y)梯度的幅值，将幅值作为像素值，这样才算完。

注意：梯度图上每个像素点的灰度值就是梯度向量的幅度

生成梯度图需要模板，右图为水平和竖直方向最简单的模板。

简单的水平模板梯度

竖直模板梯度

梯度算子：梯度算子是一阶导数算子，是水平G(x)和竖直G(y)方向对应模板的组合，也有对角线方向。 常见的一阶算子： Roberts交叉算子，Prewitt算子，Sobel算子

Roberts交叉算子：

Roberts交叉算子其本质是一个对角线方向的梯度算子，对应的水平方向和竖直方向的梯度分别为：

优点：边缘定位较准，适用于边缘明显且噪声较少的图像。

缺点：

（1）没有描述水平和竖直方向的灰度变化，只关注了对角线方向，容易造成遗漏。

（2）鲁棒性差。由于点本身参加了梯度计算，不能有效的抑制噪声的干扰。

Prewitt算子：

Prewitt算子是典型的3*3模板，其模板中心对应要求梯度的原图像坐标(x,y)，(x,y)对应的8-邻域的像素灰度值如下表所示：

Prewitt算子：

Sobel算子：

Sobel算子其实就是是增加了权重系数的Prewitt算子，其模板中心对应要求梯度的原图像坐标，对应的8-邻域的像素灰度值如下表所示：

函数：

dst = cv2.Sobel(src, ddepth, dx, dy，ksize)

参数说明：

参数1：需要处理的图像；

参数2：图像的深度，-1表示采用的是与原图像相同的

深度。目标图像的深度必须大于等于原图像的深度；

参数3，4：dx和dy表示的是求导的阶数，0表示这个方向上没有求导，一般为0、1、2；

参数5：ksize是Sobel算子的大小，必须为1、3、5、7。

Canny边缘检测算法：

Canny算子是先平滑后求导数的方法。John Canny研究了最优边缘检测方法所需的

特性，给出了评价边缘检测性能优劣的三个指标：

1 好的信噪比，即将非边缘点判定为边缘点的概率要低，将边缘点判为非边缘点的概率要低；

2 高的定位性能，即检测出的边缘点要尽可能在实际边缘的中心；

3 对单一边缘仅有唯一响应，即单个边缘产生多个响应的概率要低，并且虚假响应边缘应该得到最大抑制。

函数：cv2.Canny(image, th1, th2，Size)

image：源图像

th1：阈值1

th2：阈值2

Size：可选参数，Sobel算子的大小

步骤：

1. 彩色图像转换为灰度图像（以灰度图单通道图读入）

2. 对图像进行高斯模糊（去噪）

3. 计算图像梯度，根据梯度计算图像边缘幅值与角度

4. 沿梯度方向进行非极大值抑制（边缘细化）

5. 双阈值边缘连接处理

6. 二值化图像输出结果

连通区域分析算法：连通区域（Connected Component）一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域，连通区域分析是指将图像中的各个连通区域找出并标记。连通区域分析是一种在CV和图像分析处理的众多应用领域中较为常用和基本的方法。例如：OCR识别中字符分割提取（车牌识别、文本识别、字幕识别等）、视觉跟踪中的运动前景目标分割与提取（行人入侵检测、遗留物体检测、基于视觉的车辆检测与跟踪等）、医学图像处理（感兴趣目标区域提取）等。在需要将前景目标提取出来以便后续进行处理的应用场景中都能够用到连通区域分析方法，通常连通区域分析处理的对象是一张二值化后的图像。在图像中，最小的单位是像素，每个像素周围有邻接像素，常见的邻接关系有2种：4邻接与8邻接。