晓强Deep Learning的读书分享会,先从这里开始,从大学开始。大家好,我是晓强,计算机科学与技术专业研究生在读。我会不定时的更新我的文章,内容可能包括深度学习入门知识,具体包括CV,NLP方向的基础知识和学习的论文;网络表征学习的相关论文解读。当然我每天的读书心得也会分享给大家,可能涉及我们生活各个方面的书籍。我也会不定时回答大家的问题与大家一同进步,共同交流,互相监督,结交更多的朋友。希望大家多留言,多交流,多多关照。
【晓白】今天终于有时间整理以后写一篇技术类文章啦,以后我会不定期更文章,先从计算机视觉开始,逐步更新多个深度学习应用领域的知识点,如有错误大家多指正,多交流,多讨论,共同学习,互相进步。如果内容对大家有一些帮助,请大家多点赞支持,分享。接下来我们来分享第三课时。系列课程请关注我的文章链接。
第三课:图像分割
图像分割:图像分割是指将图像分成若干具有相似性质的区域的过程,主要有基于阈值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割和实例分割。


分割的原则就是使划分后的子图在内部保持相似度最大,而子图之间的相似度保持最小。将G = (V,E) 分成两个子集A,B,使得:


固定阈值图像分割:
直方图双峰法:双峰法:六十年代中期提出的直方图双峰法 (也称 mode 法) 是典型的全局单阈值分割方法。基本思想:假设图像中有明显的目标和背景, 则其灰度直方图呈双峰分布,当灰度级直方 图具有双峰特性时,选取两峰之间的谷对应 的灰度级作为阈值。

固定阈值分割:
• 函数:cv2.threshold(src, thresh, maxval, type)
• 参数说明:
参数1:原图像
参数2:对像素值进行分类的阈值
参数3:当像素值高于(小于)阈值时,应该被赋予的新的像素值,
参数4:第四个参数是阈值方法。
返回值:函数有两个返回值,一个为retVal, 一个阈值化处理之后的图像。






自动阈值图像分割:
自适应阈值法:
函数:cv2.adaptiveThreshold()



迭代法阈值分割:
步骤
1. 求出图象的最大灰度值和最小灰度值,分别记为ZMAX和ZMIN,令初始阈值
T0=(ZMAX+ZMIN)/2;
2. 根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值ZO和ZB ;
3. 求出新阈值TK+1=(ZO+ZB)/2;
4. 若TK==TK+1,则所得即为阈值;否则转2,迭代计算;
5 . 使用计算后的阈值进行固定阈值分割。
Otsu大津法:
• 最大类间方差法,1979年日本学者大津提出,是一种基于全局阈值的自适应方法。
• 灰度特性:图像分为前景和背景。当取最 佳阈值时,两部分之间的差别应该是最大的,衡量差别的标准为最大类间方差。
• 直方图有两个峰值的图像,大津法求得的 T近似等于两个峰值之间的低谷。



图像边缘提取:
图像梯度:
梯度:梯度是一个向量,梯度方向指向函数变化最快的方向,大小就是它的模,也是最大的变化率, 对于二元函数z=f(x,y),它在点(x,y)的梯度就是

, 或者 :


这个梯度向量的幅度和方向角为:

图像梯度:
图像梯度即图像中灰度变化的度量,求图像梯度的过程是二维离散函数求导过程。边缘其实就是图像上灰度级变化很快的点的集合。下图展示了一个灰度图的数学化表达,像素点(x,y)的灰度值是f(x,y),它有八个邻域。

图像在点(x,y)的梯度为:


模板卷积:要理解梯度图的生成,就要先了解模板卷积的过程,模板 卷积是模板运算的一种方式,其步骤如下:
(1)将模板在输入图像中漫游,并将模板中心与图像中 某个像素位置重合;
(2)将模板上各个系数与模板下各对应像素的灰度相乘;
(3)将所有乘积相加(为保持灰度范围,常将结果再除 以模板系数之和,后面梯度算子模板和为0的话就不需要 除了);
(4)将上述运算结果(模板的响应输出)赋给输出图像 中对应模板中心位置的像素。

梯度图:梯度图的生成和模板卷积相同,不同的是要生成梯 度图,还需要在模板卷积完成后计算在点(x,y)梯度 的幅值,将幅值作为像素值,这样才算完。
注意:梯度图上每个像素点的灰度值就是梯度向量 的幅度
生成梯度图需要模板,右图为水平和竖直方向最简 单的模板。



梯度算子:梯度算子是一阶导数算子,是水平G(x)和竖直G(y)方向对应模板的组合,也 有对角线方向。 常见的一阶算子: Roberts交叉算子,Prewitt算子,Sobel算子
Roberts交叉算子:

Roberts交叉算子其本质是一个对角线方向的梯度算子,对应的水平方向和竖直方向的梯度分别为:

优点:边缘定位较准,适用于边缘明显且噪声较少的图像。
缺点:
(1)没有描述水平和竖直方向的灰度变化,只关注了对角线方向,容易造成遗漏。
(2)鲁棒性差。由于点本身参加了梯度计算,不能有效的抑制噪声的干扰。
Prewitt算子:

Prewitt算子是典型的3*3模板,其模板中心对应要求梯度的原图像坐标(x,y),(x,y)对应的8-邻域的像 素灰度值如下表所示:

Prewitt算子:

Sobel算子:

Sobel算子其实就是是增加了权重系数的Prewitt算子,其模板中心对应要求梯度的原图像坐标,对应 的8-邻域的像素灰度值如下表所示:

函数:
dst = cv2.Sobel(src, ddepth, dx, dy,ksize)
参数说明:
参数1:需要处理的图像;
参数2:图像的深度,-1表示采用的是与原图像相同的
深度。目标图像的深度必须大于等于原图像的深度;
参数3,4:dx和dy表示的是求导的阶数,0表示这个方 向上没有求导,一般为0、1、2;
参数5:ksize是Sobel算子的大小,必须为1、3、5、7。


Canny边缘检测算法:
Canny算子是先平滑后求导数的方法。John Canny研究了最优边缘检测方法所需的
特性,给出了评价边缘检测性能优劣的三个指标:
1 好的信噪比,即将非边缘点判定为边缘点的概率要低,将边缘点判为非边缘点的概 率要低;
2 高的定位性能,即检测出的边缘点要尽可能在实际边缘的中心;
3 对单一边缘仅有唯一响应,即单个边缘产生多个响应的概率要低,并且虚假响应边 缘应该得到最大抑制。
函数:cv2.Canny(image, th1, th2,Size)
image:源图像
th1:阈值1
th2:阈值2
Size:可选参数,Sobel算子的大小
步骤:
1. 彩色图像转换为灰度图像(以灰度图单通道图读入)
2. 对图像进行高斯模糊(去噪)
3. 计算图像梯度,根据梯度计算图像边缘幅值与角度
4. 沿梯度方向进行非极大值抑制(边缘细化)
5. 双阈值边缘连接处理
6. 二值化图像输出结果

连通区域分析算法:连通区域(Connected Component)一般是指图像中具有相同像素值且位置相邻的 前景像素点组成的图像区域,连通区域分析是指将图像中的各个连通区域找出并标记。 连通区域分析是一种在CV和图像分析处理的众多应用领域中较为常用和基本的方法。 例如:OCR识别中字符分割提取(车牌识别、文本识别、字幕识别等)、视觉跟踪中的运动前景 目标分割与提取(行人入侵检测、遗留物体检测、基于视觉的车辆检测与跟踪等)、医学图像处 理(感兴趣目标区域提取)等。 在需要将前景目标提取出来以便后续进行处理的应用场景中都能够用到连通区域分析 方法,通常连通区域分析处理的对象是一张二值化后的图像。在图像中,最小的单位是像素,每个像素周围有邻接像素,常见的邻接关系有2种:4邻接与8邻接。


如果A与B连通,B与C连通,则A与C连通,在视觉上看来,彼此连通的点形成了一个区域,而不连 通的点形成了不同的区域。这样的一个所有的点彼此连通点构成的集合,我们称为一个连通区域。

Two-Pass 算法:两遍扫描法( Two-Pass ),正如其名,指的就是通过扫 描两遍图像,将图像中存在的所有连通域找出并标记。
第一次扫描:
• 从左上角开始遍历像素点,找到第一个像素为255的点, label=1;
• 当该像素的左邻像素和上邻像素为无效值时,给该像素 置一个新的label值,label ++,记录集合;
• 当该像素的左邻像素或者上邻像素有一个为有效值时, 将有效值像素的label赋给该像素的label值;
• 当该像素的左邻像素和上邻像素都为有效值时,选取 其中较小的label值赋给该像素的label值


第二次扫描:
• 对每个点的label进行更新,更新为其对于其集合中最小 的label

区域生长算法:区域生长是一种串行区域分割的图像分割方法。区域生长是指从某个像素出发,按照一定的准则, 逐步加入邻近像素,当满足一定的条件时,区域生长终止。
区域生长的好坏决定于
• 初始点(种子点)的选取。
• 生长准则。
• 终止条件。
区域生长是从某个或者某些像素点出发,最后得到整个区域,进而实现目标的提取。
基本思想:将具有相似性质的像素集合起来构成区域。
步骤:1. 对图像顺序扫描,找到第1个还没有归属的像素, 设该像素 为(x0, y0);
2. 以(x0, y0)为中心, 考虑(x0, y0)的4邻域像素(x, y)如果(x0, y0)满足生长准则, 将(x, y)与(x0, y0)合并(在同一区域内), 同时将(x, y)压入堆栈;

区域生长原理:
• 从堆栈中取出一个像素, 把它当作(x0, y0)返回到步骤2;
• 当堆栈为空时,返回到步骤1;
• 重复步骤1 - 4直到图像中的每个点都有归属时;
• 生长结束。

分水岭算法:任意的灰度图像可以被看做是地质学表面,高亮度的地方是山峰,低亮度的地方是山谷。

给每个孤立的山谷(局部最小值)不同颜色的水(标签),当水涨起来,根据周围的山峰(梯度), 不同的山谷也就是不同的颜色会开始合并,要避免山谷合并,需要在水要合并的地方建立分水岭, 直到所有山峰都被淹没,所创建的分水岭就是分割边界线,这个就是分水岭的原理。
步骤
1. 将白色背景编程黑色背景 - 目的是为了后面变的变换做准备
2. 使用filter2D与拉普拉斯算子实现图像对比度的提高
3. 转为二值图像4. 距离变换
5. 对距离变换结果进行归一化[0-1]之间
6. 使用阈值,在此二值化,得到标记
7. 腐蚀每个peak erode
8. 发现轮廓 findContours
9. 绘制轮廓 drawContours
10.分水岭变换 watershed
11.对每个分割区域着色输出结果
【晓议】今天外面阴雨连绵,技术文章更新完毕,每一部分的代码讲解,请关注我之后私信我,我会发给大家。您如果在计算机入门时或者想转行学习计算专业的知识,有什么问题也可以一起讨论解决。谢谢大家的关注和分享。如果对您有帮助,请帮我点赞。谢谢。
晓强DL:OpenCV图像处理zhuanlan.zhihu.com