深度学习之非极大值抑制NMS介绍

1. 基本介绍

        非极大值抑制(Non-Maximum Suppression,NMS)是深度学习中一种常用的目标检测算法,用于在检测结果中去除冗余的边界框。

        在目标检测任务中,通常会使用候选框(bounding boxes)来表示可能包含目标物体的区域。这些候选框是通过目标检测模型生成的,每个候选框都会伴随一个置信度分数,表示该候选框包含目标物体的概率。当候选框的数量较多时,简单地选择置信度最高的候选框可能会导致冗余和重叠的检测结果。NMS算法通过判断候选框之间的重叠程度,去除那些与已选择的候选框高度重叠的冗余框,从而提供更准确的目标检测结果。

        NMS的目标是从所有候选框中选择出最佳的、不重叠的候选框,以提供最准确的目标检测结果。

        NMS的核心思想是通过设定一个阈值来判断两个候选框是否重叠。常用的重叠度量是交并比(IoU),定义为两个候选框的交集面积除以它们的并集面积。当两个候选框的IoU大于设定的阈值时,认为它们重叠。

        在NMS算法中,通常会设定一个IoU阈值,例如0.5。算法的步骤如下:

        A. 按照置信度分数对所有候选框进行排序,从高到低。

        B. 选择置信度最高的候选框,并将其作为最终输出的一个检测结果。

        C. 计算该候选框与其他未处理的候选框的重叠区域的面积(可以使用交并比(Intersection over Union,IoU)来度量重叠程度)。

        D. 去除与已选择的候选框有较高重叠的候选框,以避免重复检测。

        E. 重复步骤2到4,直到所有候选框都被处理完毕。

        NMS算法保留了置信度最高的候选框,并通过去除与其重叠的其他候选框,消除了冗余的检测结果。通过调整IoU阈值,可以控制NMS的严格程度。较高的IoU阈值会保留更多的候选框,但可能导致冗余检测;较低的IoU阈值可以去除更多的冗余框,但可能会错过一些真实目标。

        NMS算法是目标检测领域中常用的后处理步骤,可应用于各种检测模型,如基于区域的卷积神经网络(Region-based Convolutional Neural Networks,R-CNN)、单阶段检测器(例如YOLO和SSD)等。它在提高目标检测结果的准确性和稳定性方面起到了重要的作用。

2. 示例代码

        以下是一个简单的示例代码,演示了如何使用Python实现非极大值抑制(NMS)算法:

import numpy as npdef calculate_iou(box1, box2):"""计算两个框的交并比(IoU)"""x1, y1, w1, h1 = box1x2, y2, w2, h2 = box2# 计算交集的坐标x_intersection = max(x1, x2)y_intersection = max(y1, y2)w_intersection = max(0, min(x1 + w1, x2 + w2) - x_intersection)h_intersection = max(0, min(y1 + h1, y2 + h2) - y_intersection)# 计算交并比intersection = w_intersection * h_intersection  #计算交集重合部分union = w1 * h1 + w2 * h2 - intersection  iou = intersection / unionreturn ioudef nms(boxes, scores, iou_threshold):"""非极大值抑制(NMS)算法"""sorted_indices = np.argsort(scores)[::-1]  # 根据分数对框进行降序排序selected_indices = []while sorted_indices.size > 0:current_index = sorted_indices[0]selected_indices.append(current_index)# 计算当前框与其他框的IoUcurrent_box = boxes[current_index]remaining_indices = sorted_indices[1:]ious = np.array([calculate_iou(current_box, boxes[i]) for i in remaining_indices])# 找到IoU小于阈值的框below_threshold_indices = remaining_indices[ious < iou_threshold]sorted_indices = below_threshold_indicesreturn selected_indices# 示例数据
boxes = np.array([[20, 30, 50, 50],[25, 35, 40, 40],[70, 80, 30, 30],[80, 90, 20, 20],[100, 120, 60, 60]
])
scores = np.array([0.9, 0.75, 0.8, 0.65, 0.95])# 设置阈值
iou_threshold = 0.5# 使用NMS进行框的抑制
selected_indices = nms(boxes, scores, iou_threshold)# 打印选择的框
for index in selected_indices:print(boxes[index], scores[index])

        这个示例代码中,首先定义了一个calculate_iou函数,用于计算两个框的交并比(IoU)。然后定义了一个nms函数,实现了非极大值抑制算法。最后,给出了一个示例数据,包含了一组框的坐标和对应的置信度分数。通过调用nms函数,可以得到经过NMS处理后的选择框的索引,并打印出选择的框及其对应的分数。

        注意,此示例代码仅为演示目的,并未涵盖所有可能的情况。在实际应用中,可能需要根据具体的需求进行适当修改和优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/848501.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

王道408数据结构CH2_线性表

概述 2 线性表 2.1 基本操作 2.2 顺序表示 线性表的元素从1开始&#xff0c;数组元素下标从0开始 2.2.1 结构体定义 #define Maxsize 50typedef struct{ElemType data[Maxsize];int length; }SqList;#define Initsize 100typedef struct{ElemType *data;int Maxsize ,length;…

Ansible部署 之 zookeeper集群

简介 Ansible是近年来越来越火的一款轻量级运维自动化工具&#xff0c;主要功能为帮助运维实现运维工作的自动化、降低手动操作的失误、提升运维工作效率。常用于自动化部署软件、自动化配置、自动化管理&#xff0c;支持playbook编排。配置简单&#xff0c;无需安装客户端&am…

Github 2024-06-06 Go开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-06统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行 创建周期:248 天开发语言:Go协议类型:MIT LicenseStar数量:42421 个Fork数量:2724 次关注人…

js中的事件循环机制(宏任务和微任务)

JavaScript的事件循环机制是其非阻塞I/O模型的核心&#xff0c;它使得JavaScript能够在单线程环境中高效地处理异步操作。事件循环机制主要由以下几个部分组成&#xff1a; 调用栈&#xff08;Call Stack&#xff09;&#xff1a; 这是JavaScript执行同步代码的地方&#xff0c…

Android状态栏适配问题

Android状态栏适配是一个老生常谈的问题&#xff0c;那么我又拿出来讲了&#xff0c;因为这个东西确实太重要了&#xff0c;基本上每个项目都用得到。状态栏总共有几种形态。第一&#xff0c;让状态栏颜色跟应用主色调一致&#xff0c;布局内容不占有状态栏的位置。第二&#x…

c++学习笔记“类和对象”;友元函数

目录 4.4 友元 4.4.1 全局函数做友元 4.4.1 类做友元 4.4.1 成员函数做友元 4.4 友元 生活中你的家有客厅(Public)&#xff0c;有你的卧室(Private) 客厅所有来的客人都可以进去&#xff0c;但是你的卧室是私有的&#xff0c;也就是说只有你能进去但是呢&#xff0c;你也可…

PSOPT在Ubuntu22.04下的安装

求解器pospt的原链接如下&#xff1a; PSOPT/psopt: PSOPT Optimal Control Software (github.com) 在该文件夹下提供了安装的指导文件&#xff0c;文件内容如下&#xff1a; 在 Ubuntu 22.04 中&#xff0c;如果按照适用于 Ubuntu 20.04 的说明执行 PSOPT 代码&#xff0c;目…

详细分析Mysql中的SQL_MODE基本知识(附Demo讲解)

目录 前言1. 基本知识2. Demo讲解2.1 ONLY_FULL_GROUP_BY2.2 STRICT_TRANS_TABLES2.3 NO_ZERO_IN_DATE2.4 NO_ENGINE_SUBSTITUTION2.5 ANSI_QUOTES 前言 了解Mysql内部的机制有助于辅助开发以及形成整体的架构思维 对于基本的命令行以及优化推荐阅读&#xff1a; 数据库中增…

完美解决 mysql 报错ERROR 1524 (HY000): Plugin ‘mysql_native_password‘ is not loaded

文章目录 错误描述错误原因解决步骤 跟着我下面的步骤走&#xff0c;解决你的问题&#xff0c;如果解决不了 私信我来给你解决 错误描述 执行ALTER USER root% IDENTIFIED WITH mysql_native_password BY 123456;报错ERROR 1524 (HY000): Plugin mysql_native_password is not …

596. 超过5名学生的课

596. 超过5名学生的课 题目链接&#xff1a;596. 超过5名学生的课 代码如下&#xff1a; # Write your MySQL query statement below selectclass from (select class,count(student) as num from Courses group by class) as t where num > 5

AI炒股:获取个股的历史成交价格并画出K线图

任务&#xff1a;获取贵州茅台的近几个月的价格数据&#xff0c;绘制k线图&#xff1b; 在deepseek中输入提示词&#xff1a; 你是一个Python编程专家&#xff0c;要完成一个编写Python脚本的任务&#xff0c;具体步骤如下&#xff1a; 用AKShare库获取股票贵州茅台&#xf…

PID算法在电机速度控制上的应用

目录 概述 1 系统硬件框架 1.1 框架介绍 1.2 硬件实物图 2 STM32Cub生成工程 2.1 软件版本信息 2.2 配置参数 ​编辑2.3 生成项目 3 PID算法实现 3.1 概念 3.2 代码实现 4 其他功能实现 4.1 设置电机速度 4.2 PID算法控制电机 4.3 功能函数的调用 5 测试 5.1 …

Python怎么给图片加水印

在Python中&#xff0c;可以使用PIL&#xff08;Python Imaging Library&#xff09;库或者其更活跃的分支Pillow来给图片添加水印。下面是一个简单的示例&#xff0c;展示如何使用Pillow给图片添加文本水印&#xff1a; from PIL import Image, ImageDraw, ImageFont# 打开原…

3072. 将元素分配到两个数组中 II Rust 线段树 + 离散化

题目 给你一个下标从 1 开始、长度为 n 的整数数组 nums 。 现定义函数 greaterCount &#xff0c;使得 greaterCount(arr, val) 返回数组 arr 中 严格大于 val 的元素数量。 你需要使用 n 次操作&#xff0c;将 nums 的所有元素分配到两个数组 arr1 和 arr2 中。在第一次操…

winscp无法上传,删除,修改文件并提示权限不够的分析

使用winscp删除文件,报了个错如下 根据这个错就去百度,网上大部分都是通过下面这种方法解决: 在winscp端进行设置 输入主机名(即IP地址)、用户名和密码,然后点击高级 在箭头所指位置输入sudo + sftp应用程序的路径 先查询 sudo find / -name sftp-server -print点击Sh…

如何让 AI 自动阅读文档样例,编写符合你需求的代码?

&#xff08;注&#xff1a;本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费&#xff09; 痛点 我本科读的计算机专业。当时编程&#xff0c;讲究的就是个扎实。例如哈夫曼编码用来压缩解压文件&#xff0c;那真的是自己一行行代码写过来的。更…

【Pytorch】计算机视觉项目——卷积神经网络TinyVGG模型图像分类(如何使用自定义数据集)

目录 一、前言二、工作流程回顾三、详细步骤流程1. 环境配置2. 数据准备数据集下载数据存储结构&路径查看图片 3. 数据转换4. 自定义数据集&#xff08;Custom Dataset &#xff09;4.1 方法一&#xff1a;使用ImageFolder加载数据集信息查看张量转图片创建DataLoader 4.2 …

大型ERP设计-业务与功能指引:委托加工二(有偿供料)

委托加工二&#xff08;有偿提供材料&#xff09; 前言&#xff1a;在对ORACLE和SAP的核心模块功能全面解读的基础上&#xff0c;给出大型ERP设计的建议-业务与功能指引&#xff0c;企业选型、开发大型ERP软件的公司和ERP顾问可以参考。模块包括财务、计划与制造、供应链、项目…

Android AAudio——C API创建AudioTrack(六)

虽然 AAudio 试图提供一种直接的硬件访问途径,但在某些场景下,如处理兼容性问题、使用系统服务(如 AudioFlinger)或者在某些设备上,使用 AudioTrack 可能是最有效或最合适的途径。这并不违背 AAudio 的初衷,因为它的目标是提供高性能的音频处理,而不是避免使用系统服务。…

Java Web学习笔记12——JavaScript字符串

String&#xff1a; String字符串对象创建方法有两种&#xff1a; 方式一&#xff1a; var str new String("Hello String"); 方式二&#xff1a; var str "Hello String"; 常见的属性和方法&#xff1a; <!DOCTYPE html> <html lang"…