目录
- 模板匹配
- 概念
- 单对象模板匹配
- 多对象模板匹配
- 直方图
- 1.查找直方图
- 2.绘制直方图
- 3.掩膜的应用
模板匹配
概念
模板匹配和卷积原理很像,模板在原图像上从原点开始滑动,计算模板与图像被模板覆盖的地方的差别程度,这个差别程度的计算方法在opencv里有6种,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图是AxB大小,而模板是axb大小,则输出结果的矩阵是(A-a+1)x(B-b+1) (通过.shape查看验证)
匹配算法 | method |
---|---|
平方差匹配法:计算平方不同,计算出来的值越小,越相关 | cv2.TM_SQDIFF |
归一化平方差匹配法:计算归一化平方不同,计算出来的值越接近0,越相关 | cv2.TM_SQDIFF_NORMED |
相关匹配法:计算相关性,计算出来的值越大,越相关 | cv2.TM_CCORR |
归一化相关匹配法:计算归一化相关性,计算出来的值越接近1,越相关 | cv2.TM_CCORR_NORMED |
相关系数匹配法:计算相关系数,计算出来的值越大,越相关 | cv2.TM_CCOEFF |
归一化相关系数匹配法:计算归一化相关系数,计算出来的值越接近1,越相关 | cv2.TM_CCOEFF_NORMED |
通常来讲,随着从简单测量方法(平方差)到更复杂的测量方法(相关系数法),我们可以获得越来越准确的匹配。然而这同时也会以越来越大的计算量为代价。对于选取何种方法,针对不同的匹配情况进行对此分析比较,选取更适合自己应用场景同时兼顾速度和精度的最佳方案。一般使用归一化的。
cv2.minMaxLoc()函数会返回四个值——最小值及其位置、最大值及其位置(这里的位置是匹配框左上角顶点的坐标位置)
import cv2img = cv2.imread('./image/img1.jpg', 0)
template = cv2.imread('./image/template.png', 0)
h, w = template.shape[:2]
# print(img.shape)
# print(template.shape)
# (225, 203)
# (82, 100)
res = cv2.matchTemplate(img, template, cv2.TM_SQDIFF)
# print(res.shape) --> (144, 104)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
理解:利用这个函数找最大值最小值,以及从六种中选择出的匹配算法,两者结合,得到最匹配的点的坐标。由于这个点是匹配框的左上顶点,我们再求得模板图像的长和宽,有左上顶点、长、宽,即可得到与模板匹配的图像
单对象模板匹配
import cv2
from matplotlib import pyplot as pltimg = cv2.imread('./image/img1.jpg', 0)template = cv2.imread('./image/template.png', 0)
h, w = template.shape[:2] # 切片,取shape的前两个值代表模板长宽,不取第三个值(代表BGR)# 六种匹配方法
methods = ['cv2.TM_CCOEFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR','cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED']for meth in methods:img2 = img.copy() # 不然原图会被覆盖# eval 语句用来计算存储在字符串中的有效 Python 表达式method = eval(meth)# 模板匹配res = cv2.matchTemplate(img, template, method)# 寻找最值min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)# 使用不同的比较方法,对结果的解释不同# 如果是平方差匹配或归一化平方差匹配,取最小值if method in [cv2.TM_SQDIFF, cv2.TM_SQDIFF_NORMED]:top_left = min_locelse:top_left = max_locbottom_right = (top_left[0] + w, top_left[1] + h)# 画矩形cv2.rectangle(img, top_left, bottom_right, 255, 2)# 展示plt.subplot(121), plt.imshow(res, cmap='gray')plt.title('Matching Result'), plt.xticks([]), plt.yticks([]) # 隐藏坐标轴plt.subplot(122), plt.imshow(img, cmap='gray')plt.title('Detected Point'), plt.xticks([]), plt.yticks([])plt.suptitle(meth)plt.show()
注意到其中有一个匹配算法的结果匹配的不好
多对象模板匹配
import cv2
import numpy as npimg_rgb = cv2.imread('./image/img1.jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('./image/template.png', 0)
h, w = template.shape[:2]# 选择的匹配算法是相关系数法
res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED)
threshold = 0.4
# 取匹配程度大于%40的坐标
loc = np.where(res >= threshold)
for pt in zip(*loc[::-1]): # *号表示可选参数bottom_right = (pt[0] + w, pt[1] + h)# 画矩形cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)
cv2.imshow("img", img_rgb)
cv2.waitKey(0)
直方图
-
什么是直方图?你可以将直方图视为图形或绘图,从而为你提供有关图像强度分布的总体思路。它是X轴上的像素值(范围从0到255,并非总是)和Y轴上图像中相应像素数量的绘图。
-
一些直方图相关的术语
BINS:上面的直方图显示每个像素值的像素数量,即从0到255。也就是说,你需要256个值来显示上述的直方图。但是请考虑,如果您不需要分别查找所有像素值的像素数量,但是像素值的间隔中的像素数量是多少?例如,你需要找到位于10到15之间,然后是16到31,…,240到255之间的像素值。你只需要16个值来表示直方图。这就是OpenCV教程中关于直方图的例子。
因此,你所做的只是将整个直方图拆分成16个子部分,每个子部分的值是其中所有像素数的总和。这个子部分被称为“BIN”。在第一种情况下,BINS中的每组的像素数目都是256,而在第二种情况下,它仅为16个。在OpenCV中,BINS由术语hitSize表示。
DIMS:这是我们收集数据的参数数量。在这种情况下,我们只收集强度值的数量,所以这里是1.
RANGE:这是你要测量的强度值的范围。通常,它是[0,256],即所有强度值。
1.查找直方图
1)OpenCV中的直方图计算
我们使用cv2.calcHist()函数来查找直方图。让我们熟悉这个函数及其参数:
Cv2.calcHist(image,channels,mask,hitSize,range[,hist[,accumulate]])
- image(图像):它是类型为uint8或者float32的源图像。应该用方括号给出,即“[img]”.
- .Channels(通道):它也是被放在方括号内。它是我们计算直方图的通道的索引。例如,如果输入是灰度图像,则其值为[0].对于彩色图像,可以分别通过[0],[1]或者[2]计算蓝色、绿色或者红色通道的直方图 。
- Mask(掩膜):要查找完整图像的直方图,它会显示为“无”。但是,如果你想找到特定区域的图像直方图,你必须为此创建一个蒙版图像并将其作为蒙版
- histSize:这代表我们的BIN数量。需要用方括号给出。对于全尺寸,我们传入[256].
- Range(范围):通常情况下,它是[0,256].
img = cv2.imread('1.jpg', 0)
hist = cv2.calcHist([img], [0], None, [256], [0, 256])
#hist是一个256*1的数组,每个值对应于图像中具有相应像素值的像素数
print(hist)
2)Numpy中的直方图计算
img = cv2.imread('1.jpg', 0)
hist, bins = np.histogram(img.ravel(), 256, [0, 256])
print("hist", hist)
print("bins", bins)
hist与我们之前计算的相同。但是bins将有257个元素因为Numpy计算bins为0-0.99,1-1.99,2-2.99等。为了表示这一点,他们还在bins的末尾加上256.但我们不需要高达256,255就够了。OpenCV函数比np.histogram()要快(大约40倍)。所以坚持使用OpenCV函数。
2.绘制直方图
两种方法:
Ø Shortway:使用matplotlib绘图函数
Ø Long way:使用OpenCV绘图函数
1)使用Matplotlib(主要)
Matplotlib带有一个直方图绘制函数:matplot.pyplot.hist()
它直接找到直方图并绘制它.不需要使用calcHist()或者np.histogram()函数来查找直方图。
`import cv2`
`from matplotlib import pyplot as plt`
`img = cv2.imread('home.jpg',0)`
`plt.hist(img.ravel(),256,[0,256]); plt.show()`
或者你可以使用matplotlib的正常绘制方式,这对BGR绘制是有利的.为此,你首先需要查找直方图数据。
`import cv2`
`from matplotlib import pyplot as plt``img = cv2.imread('8.jpg')`
`color = ('b', 'g', 'r')`
`for i, col in enumerate(color): # 枚举``histr = cv2.calcHist([img], [i], None, [256], [0, 256])``plt.plot(histr, color=col)``plt.xlim([0, 256])`
`plt.show()`
2)使用OpenCV
用OpenCV的话,你可以将直方图的值与其二进制一起调整为x,y坐标,以便你可以使用cv2.line()或cv2.polyline()函数绘制它以生成与上面相同的图像。这已经在OpenCV-Python2官方demo中可用。
3.掩膜的应用
我们使用cv2.calcHist()来查找完整图像的直方图。如果你想查找图像中某些区域的直方图,该怎么办?只需在想查找直方图的区域创建一个带白色的蒙版图像,否则就是黑色。然后将它作为掩膜。
例子:
img = cv2.imread('2.jpg')`#创建一个掩膜`mask = np.zeros(img.shape[:2], dtype='uint8')`
mask[100:300, 100:400] = 255`
masked_img = cv2.bitwise_and(img, img, mask=mask)`#计算有掩膜和没有掩膜时的直方图`#只需改变第三个参数`hist_full = cv2.calcHist([img], [0], None, [256], [0, 256])`
hist_mask = cv2.calcHist([img], [0], mask, [256], [0, 256])`plt.subplot(221), plt.imshow(img, 'gray'), plt.title("origianl")`
plt.subplot(222), plt.imshow(mask, 'gray'), plt.title('mask')`
plt.subplot(223), plt.imshow(masked_img, 'gray'), plt.title('masked_img')`
plt.subplot(224), plt.plot(hist_full), plt.plot(hist_mask), plt.title('hist')`plt.xlim([0, 256])`plt.show()`
解释代码:
-
mask = np.zeros(img.shape[:2], dtype=‘uint8’)
用法:zeros(shape, dtype=float, order=‘C’)
返回:返回来一个给定形状和类型的用0填充的数组;
参数:shape:形状
dtype:数据类型,可选参数,默认np.float64
order:可选参数,c代表与c语言类似,行优先;F代表列优先
-
plt.title(‘hist’)
将该figure对象的表头名命名为hist
-
plt.subplot(221)
subplot()函数则用来实现,在一个大图中,出现多个小的子图。
处理哪个figure,则选择哪个figure,再进行画图。
221表示是一个两行两列布局的图,且现在画的是右上角的小图
同理,236表示画的2行3列布局的最右下角的图
-
hist_full = cv2.calcHist([img], [0], None, [256], [0, 256])
plt.plot(hist_full)
hist_full是一个shape为(256,1)的数组,表示0-255每个像素值对应的像素个数,下标即为相应的像素值
plt.plot()一般需要输入x,y,若只输入一个参数,那么默认x为range(n),n为y的长度,在这里即表示图像x轴为0-255像素点灰度值,y轴为对应灰度值的像素点数量
一个plt.plot()代表该图像中的一条图线
-
plt.imshow()
负责对图像进行处理,并显示其格式,但是不能显示。
-
plt.show()
显示图像
-
plt.xlim([0,256])
x轴上的值的取值范围为0-256