目标检测:NMS代码

非极大值抑制NMS是目标检测常用的后处理算法,用于剔除冗余检测框

总体概要:

对NMS进行分类,大致可分为以下六种,这里是依据它们在各自论文中的核心论点进行分类,这些算法可以同时属于多种类别。

  1. 分类优先:传统NMS,Soft-NMS (ICCV 2017)

  2. 定位优先:IoU-Guided NMS (ECCV 2018)

  3. 加权平均:Weighted NMS (ICME Workshop 2017)

  4. 方差加权平均:Softer-NMS (CVPR 2019)

  5. 自适应阈值:Adaptive NMS (CVPR 2019)

  6. +中心点距离:DIoU-NMS (AAAI 2020)

分类优先

传统NMS有多个名称,据不完全统计可以被称为:Traditional / Original / Standard / Greedy NMS,为统一起见,下称Traditional NMS。

Traditional NMS算法是最为经典的版本,伪代码如下:

缺点:

  1. 顺序处理的模式,计算IoU拖累了运算效率。

  2. 剔除机制太严格,依据NMS阈值暴力剔除。

  3. 阈值是经验选取的。

  4. 评判标准是IoU,即只考虑两个框的重叠面积,这对描述box重叠关系或许不够全面

测试图片

假如有如下 预测框

import cv2img = cv2.imread('./cat&dog.png')boxes = [(140,110,500,800),(110,70,550,810),(260,60,600,780),(620,80,990,780),(710,62,1050,760),(780,120,1100,740)]colors = [(255,255,0),(0,255,255),(0,255,0),(255,0,0),(255,0,255),(0,0,255)]labels = ['dog']*3 + ['cat']*3for index,(box,color) in enumerate(zip(boxes,colors)):x1,y1,x2,y2 = boxcv2.rectangle(img,(x1,y1),(x2,y2),color,2)cv2.putText(img, labels[index], (x1,y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.8, color, 2)cv2.imshow('img',img)
cv2.waitKey(20000)
cv2.destroyAllWindows()

 

 

nms实现逻辑是什么?

非极大值抑制(Non-Maximum Suppression,NMS)是一种常用于目标检测中的技术,用于消除重叠的目标框并保留置信度最高的目标框。其实现逻辑如下:

1.输入阶段: 对于每个检测到的目标框,包括其坐标(左上角和右下角)和置信度(confidence score)。

2.根据置信度排序: 首先,根据目标框的置信度对所有检测到的目标框进行排序,通常是按照置信度从高到低的顺序排列。

3.初始化空列表: 创建一个空列表,用于存储最终保留的目标框。

4.遍历目标框: 从置信度最高的目标框开始,遍历每个目标框。

5.计算重叠面积: 对于当前遍历到的目标框,计算它与之前已经保留的目标框之间的重叠面积(通常使用交并比(Intersection over Union,IoU)来衡量)。

6.剔除重叠目标框: 如果当前目标框与任何已经保留的目标框的重叠面积大于预先设定的阈值(通常为一个较小的值,如0.5),则将其剔除,否则将其保留。

7.重复此过程: 继续遍历剩余的目标框,重复上述步骤,直到所有目标框都被处理。

8.输出结果: 最终输出被保留下来的目标框,这些目标框不会与其他目标框重叠太多。

NMS 的核心思想是通过逐步筛选,去除与置信度最高的目标框有较大重叠的其他目标框,从而保留最具代表性和置信度最高的目标框。这样可以减少冗余的检测结果,提高目标检测算法的准确性和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/854387.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于mysqlbinlog恢复数据

1、把binlog转换为SQL mysqlbinlog --base64-outputdecode-rows -vv /usr/local/mysql/log-bin/mysql-bin.000003 >result.sql find / -name result.sql 2、查看events show binlog events in mysql-bin.000003; 3、回滚到3667那一行的数据 mysqlbinlog -v /usr/local/mys…

Linux中手动配置Java jdk17环境

1、下载jdk二进制文件 点击官网地址:jdk-17_linux-x64_bin.tar.gz 或者使用wget下载 wget https://download.oracle.com/java/17/latest/jdk-17_linux-x64_bin.tar.gz -P /usr/local/src/2、解压文件 tar zxvf jdk-17_linux-x64_bin.tar.gz3、修改配置 打开文件…

专业学习|博弈论-课程沿革

学习来源:北京大学刘霖《博弈论》MOOC公开课 备注:仅做学习分享,请勿转载,转载必究! (一)博弈论的预备知识 基本的微积分的知识和概率论的知识。简单的说会求导数,会求简单的积分&am…

消息队列-Rabbit运行机制

Producer(生产者) 和 Consumer(消费者) Producer(生产者) :生产消息的一方(邮件投递者)Consumer(消费者) :消费消息的一方(邮件收件人) 消息一般由 2 部分组成:消息头(或者说是标签 Label)和 …

【已解决】chrome视频无法自动播放的问题

问题: 在用datav开发大屏的时候,放了一个视频组件,但是发现视频组件即使设置了自动播放,仍然无法自动播放 原因: 76 以上版本的谷歌浏览器只能在系统静音下自动播放 解决: 音频自动播放浏览器白名单设置&…

kafka在windows上的启动

启动zookeeper 解压kafka安装包到对应目录下,找到对应config目录下的zookeeper.properties文件 新建一个data文件夹,随便放哪 打开该文件,找到 dataDir/tmp/zookeeper 属性 将原来的属性值,修改为新建data文件夹地址,…

如何修改倍福CX7000PLC IP地址

我们可以通过登录网页修改PLC的IP地址,这个需要我们知道PLC的初始IP地址 1、浏览器直接输入PLC 的IP地址 2、点击修改按钮(就是那个旋转) 修改IP地址前DHCP要先disable关闭 。 3、DHCP关闭 4、点击保存 5、在CAT3里搜索 在SYSTEM双击,之后点击搜索,具体过程可以参考下…

【html】如何利用id选择器实现主题切换

今天给大家介绍一种方法来实现主题切换的效果 效果图&#xff1a; 源码&#xff1a; <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initia…

充电学习—5、healthed 电池服务

1、healthed服务监听接收内核kernel的电池事件&#xff0c;然后上传数据给framware层的batterysevice&#xff0c;BatteryService计算电池的电量&#xff0c;显示&#xff0c;绘制动画等 android电池系统框架&#xff1a; 2、healthd服务入口&#xff1a;android/system/cor…

2024年设计、数字化技术与新闻传播国际学术会议(ICDDTJ 2024)

2024年设计、数字化技术与新闻传播国际学术会议(ICDDTJ 2024) 2024 International Conference on Design, Digital Technology and Journalism 会议地点&#xff1a;哈尔滨&#xff0c;中国 网址&#xff1a;www.icddtj.com 邮箱: icddtjsub-conf.com 投稿主题请注明:ICDD…

python之Bible快速检索器

内容将会持续更新&#xff0c;有错误的地方欢迎指正&#xff0c;谢谢! python之Bible快速检索器 TechX 坚持将创新的科技带给世界&#xff01; 拥有更好的学习体验 —— 不断努力&#xff0c;不断进步&#xff0c;不断探索 TechX —— 心探索、心进取&#xff01; 助力快…

CSS入门基础2

目录 1.标签类型 2.块元素 3.行内元素 4.行内块元素 5.标签行内转换 6.背景样式 1.标签类型 标签以什么方式进行显示&#xff0c;比如div 自己占一行&#xff0c; 比如span 一行可以放很多个HTML标签一般分为块标签和行内标签两种类型&#xff1a; 块元素行内元素。 2.块…

数据结构进阶——AVL树

数据结构进阶——AVL树 0. 前言1. AVL树的概念2. AVL树节点&#xff0c;和树的定义3. AVL树的插入4. AVL树的旋转5. AVL树的验证6. AVL树的删除&#xff08;了解&#xff09;7. AVL树实现完整代码8. AVL树的性能 0. 前言 学习本章&#xff0c;需要大家先掌握搜索二叉树&#xf…

「6.18福利」精选大厂真题|笔试刷题陪伴|明天正式开屋啦 - 打卡赢价值288元丰厚奖励

&#x1f370;关于清隆学长 大家好&#xff0c;我是清隆&#xff0c;拥有ACM区域赛 银牌&#x1f948;&#xff0c;CCCC天梯赛 国一&#xff0c;PTA甲级 98 分。 致力于算法竞赛和算法教育已有 3 年&#xff0c;曾多次 AK 互联网大厂笔试&#xff0c;大厂实习经验丰富。 打卡…

ai智能语音机器人好不好用,语音识别

智能语音机器人的真正价值是帮助企业解决电销上带来的一些问题&#xff0c;可以提高效率。为电销人员节省大量的时间与精力&#xff0c;提高电销水平&#xff0c;那我们一起来看看智能语音机器人好不好用 1、真人式语音群呼 用智能语音机器人打电话给客户的时候是真人的声音&a…

常见端口大全

常见默认端口 1、HTTP: 80 2、HTTPS: 443 3、FTP: 21 4、FTPS : 990 5、SSH: 22 6、Telnet: 23 7、SMTP: 25 8、DNS : 53 9、DHCP: 67 (服务器), 68 (客户端) 10、TFTP : 69 11、HTTP Alt: 8080 12、POP3: 110 13、 NNTP: 119 14、NTP : 123 15、IMAP: 143 16、SNMP : 161 17、…

国家商用密码算法-SM4Tool.jar

SM4Tool.jar可能是指一个特定的Java工具集&#xff0c;用于实现SM4&#xff08;国家商用密码算法之一&#xff09;的加密和解密功能。SM4是一种分组密码算法&#xff0c;广泛应用于中国的各种安全通信场景中&#xff0c;如金融、电子政务、物联网等。由于我没有直接访问或运行特…

新手如何入门Web3?

一、什么是Web3&#xff1f; Web3是指下一代互联网&#xff0c;它基于区块链技术&#xff0c;致力于将各种在线活动变得更加安全、透明和去中心化。Web3是一个广义的概念&#xff0c;涵盖了包括数字货币、去中心化应用、智能合约等在内的多个方面。它的主要特点包括去中心化、区…

2024软考各科目难度怎么样?怎么选?

在2024年的软考中&#xff0c;各科目难度因专业领域和具体内容的差异而有所不同。以下是对软考高级、中级和初级科目难度的分析&#xff1a; &#xff08;1&#xff09;高级科目难度分析&#xff1a; 下半年高级考试科目有&#xff1a;系统分析师、系统架构设计师、网络规划设…

cesium ClippingPolygon多边形裁切

1.多边形裁切 1.1 基本流程 cesium117版本添加了多边形裁切功能&#xff0c;本文分析源码&#xff0c;看看是如何处理的。多边形裁切的大概流程分为4部分: 通过经纬度坐标传入多个闭合的边界&#xff1b;将多个边界打包成两张纹理&#xff0c;一张是每个多边形的坐标&#xf…