OpenCV与图像处理学习七——传统图像分割之阈值法(固定阈值、自适应阈值、大津阈值)
- 一、固定阈值图像分割
- 1.1 直方图双峰法
- 1.2 OpenCV中的固定阈值分割
- 二、自动阈值图像分割
- 2.1 自适应阈值法
- 2.2 迭代法阈值分割
- 2.3 Otsu大津阈值法
前面的笔记介绍了一些OpenCV基本的图像处理,后面将学习使用OpenCV的传统的图像分割方法,这次笔记的内容是阈值法进行图像分割。
图像分割是指将图像分成若干具有相似性质的区域的过程,主要有基于阈值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割和实例分割。下图是一个实例分割的例子,与语义分割不同的地方在于,它能将同类别的物体的每个个体都区分开,如下图中每个人的轮廓都被分割开:
分割的原则就是使划分后的子图在内部保持相似度最大,而子图之间的相似度最小,将G = (V, E) 分成两个子集A,B,使得:
一、固定阈值图像分割
即设定一个固定的阈值,整张图片的每个像素的像素值都与该值进行比较,若小于该阈值则将像素值改为一个固定的值(常用0),若大于该阈值则将像素值改为另一个固定的值(常用255),则可以将图像进行二值分割,得到一张二值图。
1.1 直方图双峰法
六十年代中期提出的直方图双峰法(也称mode法)是典型的全局单阈值分割方法。
基本思想:假设图像中有明显的目标和背景,则其灰度直方图呈双峰分布,当灰度级直方图具有双峰特性时选取两峰之间的谷对应的灰度级作为阈值,大于阈值的作为前景,小于的作为背景。
缺点:对图像的要求太高,很多图像的直方图并不满足双峰的分布。
1.2 OpenCV中的固定阈值分割
在OpenCV中的函数:
retval, dst = cv2.threshold( src, thresh, maxval, type[, dst] )
参数:
- src:输入图像,单通道或四通道图像。
- thresh:设定的固定阈值。
- maxval:当type参数设置为
THRESH_BINARY
时,表示像素值大于阈值时设置的值,或设置为THRESH_BINARY_INV
时,表示像素值小于阈值时设置的值。 - type:阈值类型,如下图所示,前五种类型是基本类型,最后两种(大津阈值和三角形阈值)与前面的基本类型结合可以实现特殊的阈值分割:
这里也需要注意一下这个函数的输出:
- retval:第一个参数返回的是阈值,在使用五种基本类型时就等于你设置的阈值,而在使用大津阈值法和三角形阈值法时将会得到它计算出来的阈值,一般用的不多。
- dst:第二个参数返回的才是分割之后的图像。
下面看几个例子:
# 加载opencv和matplotlib
import cv2
import matplotlib.pyplot as plt# 灰度图读入
img = cv2.imread('./image/thresh.png', 0)
threshold = 127
# 阈值分割
ret, th = cv2.threshold(img, threshold, 255, cv2.THRESH_BINARY)
print(ret)cv2.imshow('Original', img)
cv2.imshow('thresh', th)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果如下:
返回的第一个参数就是设置的阈值:
127.0
即像素值低于127的都被赋予0,高于的都被赋予255,得到一张二值化的图像。
再来看一下五种基本的阈值分割方法的区别:
# 导入第三方包
import cv2
from matplotlib import pyplot as plt
# opencv读取图像
img = cv2.imread('./image/person.png',0)
# 5种阈值法图像分割
ret1, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret2, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret3, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret4, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret5, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
# 使用for循环进行遍历,matplotlib进行显示
for i in range(6):plt.subplot(2, 3, i+1)plt.imshow(images[i], cmap='gray')plt.xticks([])plt.yticks([])plt.suptitle('fixed threshold')
plt.show()
结果为:
注意:除了前两种方法是二值化图像,后三种并不是,因为它们会保留一部分的原像素值。
如果这个图不够直观,将输入图像换成上一个例子里的渐变灰度图,结果如下:
二、自动阈值图像分割
2.1 自适应阈值法
很明显,设置一个固定阈值对全局像素进行分割是不合理的,如果这张图片的光照角度不好,一边比较亮一边比较暗,但是我们想分割图里的细节,只用一个固定阈值的话很可能会出现下面的结果:
而自适应阈值分割则将图像分成很多个小块(region),对每个小块单独计算其阈值,然后用这个计算得到的阈值对该小块进行分割,这样的好处是,即使受到光照影响,某一块较暗或较亮,但是可以单独计算这一块的合理阈值来进行分割而不用使用全局的固定阈值,换句话说,亮的小块对应的阈值较大,暗的小块对应的阈值较小,从而可以达到很好的分割效果。
函数:
dst = cv2.adaptiveThreshold( src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst] )
参数:
- src:输入图像,只能是单通道灰度图。
- maxValue:最大阈值,即小块计算的阈值不能超过这个值,一般设置为255.
- adaptiveMethod:计算小块阈值的方法,包括
cv2.ADAPTIVE_THRESH_MEAN_C
和cv.ADAPTIVE_THRESH_GAUSSIAN_C
,即求小块内的均值或高斯加权求和: - thresholdType:阈值方法,这里只能是
THRESH_BINARY
或THRESH_BINARY_INV
,即 - blockSize:小块的尺寸,如11就是11×11。
- C:最终阈值等于小区域计算出的阈值再减去这个常数。
看一下刚刚用固定阈值分割效果很差的那个图用自适应阈值来分割的效果:
# 自适应阈值与固定阈值对比
import cv2
import matplotlib.pyplot as plt
img = cv2.imread('./image/paper2.png', 0)# 固定阈值
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 自适应阈值
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)
th3 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 4)
# 全局阈值,均值自适应,高斯加权自适应对比
titles = ['Original', 'Global(v = 127)', 'Adaptive Mean', 'Adaptive Gaussian']
images = [img, th1, th2, th3]
for i in range(4):plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')plt.title(titles[i], fontsize=8)plt.xticks([]), plt.yticks([])
plt.show()
可以看出效果还是很好的,相比之下,高斯方法的自适应阈值能获得更好的效果,其噪点更少。
2.2 迭代法阈值分割
步骤:
- 求出图像的最大灰度值和最小灰度值,分别记为Zmax和Zmin,另初始阈值为T0 = (Zmax + Zmin) / 2。
- 根据阈值Tk将图像分割为前景和背景,分别求出两者的平均灰度值Zo和Zb。
- 求出新的阈值Tk+1 = (Zo + Zb) / 2。
- 若Tk == Tk+1,则即为所求的阈值,否则转到步骤2继续迭代。
- 使用计算后的阈值进行阈值分割。
其实迭代法就是将固定阈值分割里手动给定阈值改为了迭代计算阈值,可以适用的范围更多一些,但是本质还是固定阈值变换。
看个例子:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cmdef best_thresh(img):# step 1: 设置初始阈值img_array = np.array(img).astype(np.float32) # 转化成数组I = img_arrayzmax = np.max(I)zmin = np.min(I)tk = (zmax+zmin)/2# step 2: 根据阈值将图像进行分割为前景和背景,分别求出两者的平均灰度zo和zbb = 1m, n = I.shape;while b == 0:ifg = 0ibg = 0fnum = 0bnum = 0for i in range(1, m):for j in range(1, n):tmp = I(i, j)if tmp >= tk:ifg = ifg + 1fnum = fnum + int(tmp) # 前景像素的个数以及像素值的总和else:ibg = ibg+1bnum = bnum + int(tmp) # 背景像素的个数以及像素值的总和# step 3: 计算前景和背景的新平均值zo = int(fnum / ifg)zb = int(bnum / ibg)# step 4: 比较tk是否等于新平均值if tk == int((zo+zb) / 2):b = 0else:tk = int((zo+zb)/2)# step 5: 返回的就是迭代计算后的阈值return tkimg = cv2.imread("./image/bird.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
img = cv2.resize(gray, (200, 200)) # 大小
yvzhi = best_thresh(img)
ret1, th1 = cv2.threshold(img, yvzhi, 255, cv2.THRESH_BINARY)
print(ret1)
plt.imshow(th1, cmap=cm.gray)
plt.show()
结果为:
2.3 Otsu大津阈值法
大津法:也叫最大类间方差法,1979年日本学者大津提出,是一种基于全局阈值的自适应方法。
图像分为前景和背景,当取最佳阈值时,两部分之间的差别应该是最大的,衡量差别的方法为最大类间方差。
直方图有两个峰值的图像,用大津法求得的阈值近似为谷底,如下图所示,即代替了手动输入阈值。
大津法中类间方差是需要最大化的目标函数,那么它的定义如下图所示:
在OpenCV中大津阈值法只是在固定阈值法的函数cv2.threshold
的阈值方法type
这个参数后加上cv2.THRESH_OTSU
,同时将参数2thresh
忽视(设置多少无所谓,一般使用0),例如:
ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
看一个例子:
import cv2
from matplotlib import pyplot as pltimg = cv2.imread('./image/noisy.png', 0)
# 固定阈值法
ret1, th1 = cv2.threshold(img, 100, 255, cv2.THRESH_BINARY)
# Otsu阈值法
ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)# 先进行高斯滤波,再使用Otsu阈值法
blur = cv2.GaussianBlur(img, (5, 5), 0)
ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
images = [img, 0, th1, img, 0, th2, blur, 0, th3]
titles = ['Original', 'Histogram', 'Global(v=100)','Original', 'Histogram', "Otsu's",'Gaussian filtered Image', 'Histogram', "Otsu's"]for i in range(3):# 绘制原图plt.subplot(3, 3, i * 3 + 1)plt.imshow(images[i * 3], 'gray')plt.title(titles[i * 3], fontsize=8)plt.xticks([]), plt.yticks([])# 绘制直方图plt.hist, ravel函数将数组降成一维plt.subplot(3, 3, i * 3 + 2)plt.hist(images[i * 3].ravel(), 256)plt.title(titles[i * 3 + 1], fontsize=8)plt.xticks([]), plt.yticks([])# 绘制阈值图plt.subplot(3, 3, i * 3 + 3)plt.imshow(images[i * 3 + 2], 'gray')plt.title(titles[i * 3 + 2], fontsize=8)plt.xticks([]), plt.yticks([])
plt.show()
这里比较了固定阈值法、大津阈值法和加上高斯滤波的大津阈值法,效果如下所示:
相比之下,高斯滤波加大津阈值法的效果是最好的,也是实际使用中最常用的。
以上就是基于阈值的传统图像分割中常用的几种阈值分割方法。