非极大值抑制NMS是目标检测常用的后处理算法,用于剔除冗余检测框
总体概要:
对NMS进行分类,大致可分为以下六种,这里是依据它们在各自论文中的核心论点进行分类,这些算法可以同时属于多种类别。
-
分类优先:传统NMS,Soft-NMS (ICCV 2017)
-
定位优先:IoU-Guided NMS (ECCV 2018)
-
加权平均:Weighted NMS (ICME Workshop 2017)
-
方差加权平均:Softer-NMS (CVPR 2019)
-
自适应阈值:Adaptive NMS (CVPR 2019)
-
+中心点距离:DIoU-NMS (AAAI 2020)
分类优先
传统NMS有多个名称,据不完全统计可以被称为:Traditional / Original / Standard / Greedy NMS,为统一起见,下称Traditional NMS。
Traditional NMS算法是最为经典的版本,伪代码如下:
缺点:
-
顺序处理的模式,计算IoU拖累了运算效率。
-
剔除机制太严格,依据NMS阈值暴力剔除。
-
阈值是经验选取的。
-
评判标准是IoU,即只考虑两个框的重叠面积,这对描述box重叠关系或许不够全面
测试图片
假如有如下 预测框
import cv2img = cv2.imread('./cat&dog.png')boxes = [(140,110,500,800),(110,70,550,810),(260,60,600,780),(620,80,990,780),(710,62,1050,760),(780,120,1100,740)]colors = [(255,255,0),(0,255,255),(0,255,0),(255,0,0),(255,0,255),(0,0,255)]labels = ['dog']*3 + ['cat']*3for index,(box,color) in enumerate(zip(boxes,colors)):x1,y1,x2,y2 = boxcv2.rectangle(img,(x1,y1),(x2,y2),color,2)cv2.putText(img, labels[index], (x1,y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.8, color, 2)cv2.imshow('img',img)
cv2.waitKey(20000)
cv2.destroyAllWindows()
nms实现逻辑是什么?
非极大值抑制(Non-Maximum Suppression,NMS)是一种常用于目标检测中的技术,用于消除重叠的目标框并保留置信度最高的目标框。其实现逻辑如下:
1.输入阶段: 对于每个检测到的目标框,包括其坐标(左上角和右下角)和置信度(confidence score)。
2.根据置信度排序: 首先,根据目标框的置信度对所有检测到的目标框进行排序,通常是按照置信度从高到低的顺序排列。
3.初始化空列表: 创建一个空列表,用于存储最终保留的目标框。
4.遍历目标框: 从置信度最高的目标框开始,遍历每个目标框。
5.计算重叠面积: 对于当前遍历到的目标框,计算它与之前已经保留的目标框之间的重叠面积(通常使用交并比(Intersection over Union,IoU)来衡量)。
6.剔除重叠目标框: 如果当前目标框与任何已经保留的目标框的重叠面积大于预先设定的阈值(通常为一个较小的值,如0.5),则将其剔除,否则将其保留。
7.重复此过程: 继续遍历剩余的目标框,重复上述步骤,直到所有目标框都被处理。
8.输出结果: 最终输出被保留下来的目标框,这些目标框不会与其他目标框重叠太多。
NMS 的核心思想是通过逐步筛选,去除与置信度最高的目标框有较大重叠的其他目标框,从而保留最具代表性和置信度最高的目标框。这样可以减少冗余的检测结果,提高目标检测算法的准确性和效率。