目标检测基础初步学习

目标检测(Object Detection)

目标检测任务说明

在动手学习深度学习中对目标检测任务有如下的描述。

图像分类任务中,我们假设图像中只有一个主要物体对象,我们只关注如何识别其类别。 然而,很多时候图像里有多个我们感兴趣的目标,我们不仅想知道它们的类别,还想得到它们在图像中的具体位置。 在计算机视觉里,我们将这类任务称为目标检测(object detection)或目标识别(object recognition)

在给定的一张目标检测的图片中,我们可以看到几个重要的元素,彩色的框,类别标签,及其它的预测值。从而引出了目标检测中几个重要的概念信息的说明
在这里插入图片描述

  1. 类别标签( Category label):在图中指的是car person dog horse等几个类别的说明。
  2. 置信度得分 (Confidence score):在图中指的是对于每个类别标签的预测分数。
  3. 边界框(Bounding box):是指对于每个类别的物体所框选的位置。

通过边界框给出了物体的相关位置信息

我们通常使用边界框(bounding box)来描述对象的空间位置。 边界框是矩形的,由矩形左上角的以及右下角的x和y坐标决定。 另一种常用的边界框表示方法是边界框中心的轴坐标(x,y)以及框的宽度和高度

一个边缘框可以通过4个数字定义

  • (左上x, 左上y,右下x,右下y)
  • (左上x, 左上y,宽,高)

在这里插入图片描述
(60,65,378,579):在图中对应向右为x轴正方向,向下为y轴正方向

在这里插入图片描述
下面的四个图依次介绍了计算机视觉中常见的四个任务,依次包括了

  • Classification
  • Classification+ Localization
  • Object Detection
  • instance segmetation(实例分割)

定位和检测:

  • 定位是找到检测图像中带有一个给定标签的单个目标
  • 检测是找到图像中带有给定标签的所有目标

目标检测常用数据集

PASCAL VOC数据集

PASCALVOC挑战赛在2005年至2012年间展开。

PASCAL VOC 2007:9963张图像, 24640个标注; PASCAL VOC 2012:11530 张图像,27450个标注。

该数据集有20个分类:

  • Person: person

  • Animal: bird, cat, cow, dog,horse, sheep

  • Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train

  • Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

在这里插入图片描述

官网地址:http://host.robots.ox.ac.uk/pascal/VOC/

在这里插入图片描述

MS COCO数据集

MS COCO的全称是Microsoft Common Objects in Context,起源于是微软于2014年出资标注的MicrosoftCOcO数据集,与lmageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。

在lmageNet竞赛停办后,COcO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软 Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。

COCO ( Common Objects in Context) 数据集包含20万个图像: 11.5万多张训练集图像,5千张验证集图像,2万多张测试集图像,80个类别中有超过50方个自标标注。平均每个图像的目标数为7.2

在这里插入图片描述

官网地址:https://cocodataset.org/#home

在这里插入图片描述

目标检测的性能指标

检测精度

  • Precision,Recall,F1score
  • loU (Intersection over Union)
  • P-R curve (Precison-Recall curve)
  • AP(AveragePrecision)
  • mAp(mean Average Precision)

在引入检测精度相关的概念的时候,首先引入混淆矩阵(confusion matrix)的概念

在这里插入图片描述

  • 第一位T/F:表示预测的对错
  • 第二位P/N:表示预测的结果

同时结合给定的示意图进行更好的理解

在这里插入图片描述

Precision:精度Precision(查准率)是评估预测的准不准(看预测列)

precision  = T P T P + F P \text { precision }=\frac{T P}{T P+F P}  precision =TP+FPTP

在这里插入图片描述

召回率Recall(查全率)是评估找的全不全(看实际行)

recall  = T P T P + F N \text { recall }=\frac{T P}{T P+F N}  recall =TP+FNTP

在这里插入图片描述

Accuracy: 精准度,划分正确的所占的比例

Accuracy  = T P + T N T P + F P + F N + T N \text { Accuracy }=\frac{T P+T N}{T P+F P+F N+T N}  Accuracy =TP+FP+FN+TNTP+TN

F1 score:

F 1 s c o r e = 2 × Precision  × Recall  Precision  + Recall  { F1 score }=\frac{2 \times \text { Precision } \times \text { Recall }}{\text { Precision }+ \text { Recall }} F1score= Precision + Recall 2× Precision × Recall 

loU (lntersection over Union ):交并比

在说明交并比的概念之前首先要先说明两个概念:Ground truth(真实的框) Prediction(模型预测的框)

在这里插入图片描述

通俗的说两个概念的比即为交并比(确定一个IOU假设为0.5根据IOU的值来进行划分,从而确定划分的是否正确

AP衡量的是学习出来的模型在每个类别上的好坏(Average Precision)

在这里插入图片描述
举一个简单的例子:在图中Ap是指人,羊等每个类别的值,而Map是综合去平均值

下面说明Ap的计算方法:

在这里插入图片描述
AP (Average Precision) in PAsCAL VOC challenge

对于PASCALVOC挑战,如果IoU>O.5,则预测为正样本(TP)。但是,如果检测到同一目标的多个检测,则视第一个检测为正样本(TP),而视其余检测为负样本(FP)。

mAP衡量的是学出的模型在所有类别上的好坏。是去所有类别上AP的均值

检测速度

  • 前传耗时
  • 每秒帧数FPS(FramesPerSecond)
  • 浮点运算量(FLOPS)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/21979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++软件调试技术】什么是pdb文件?如何使用pdb文件?哪些工具需要使用pdb文件?

目录 1、什么是pdb文件? 2、如何配置生成pdb文件? 3、pdb文件的时间戳和文件名称 3.1、pdb文件的时间戳 3.2、pdb文件的文件名称 4、有pdb文件才能在Visual Studio中调试代码 5、在Windbg中使用pdb文件 5.1、使用lm命令查看二进制文件的时间戳&a…

翻译《The Old New Thing》- Why do atoms start at 0xC000?

Why do atoms start at 0xC000? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20080429-00/?p22543 Raymond Chen 2008年04月03日 有两种类型的原子,即所谓的整数原子,它们只是一些小整数,还有就是没有…

GE的六西格玛是怎么成功的?

六西格玛作为一种先进的质量管理方法,旨在通过消除缺陷、提高流程效率来降低成本、增强客户满意度。GE作为最早采用六西格玛的公司之一,其成功的原因首先离不开高层领导对精益六西格玛理念的坚定支持和推动。公司高层不仅亲自参与培训和项目实践&#xf…

何为云防护?有何作用

云防护又称云防御。随着Internet互联网络带宽的增加和多种DDOS 黑客工具的不断发布,云计算越演越热,DDOS拒绝服务攻击的实施越来越容易,DDOS攻击事件正在成上升趋势。出于商业竞争、打击报复和网络敲诈等多种因素,导致很多IDC 托管…

一分钟了解香港的场外期权报价

香港的场外期权报价 在香港这个国际金融中心,场外期权交易是金融市场不可或缺的一部分。场外期权,作为一种非标准化的金融衍生品,为投资者提供了在特定时间以约定价格买入或卖出某种资产的机会。对于希望参与这一市场的投资者来说&#xff0…

电脑记事本怎么恢复之前的内容记录

每个人都曾有过这样的时刻——在记事本上精心记录下的重要内容,一不小心就被删除了。那种心情,仿佛一瞬间从山顶跌落到谷底,无尽的懊悔涌上心头。我也曾遭遇过这样的困境,那些消失的文字对我来说意义非凡,它们的丢失仿…

基于小波变换贝叶斯LMMSE估计的图像降噪方法(MATLAB 2018)

自从小波被发现以来,由于其优良的时频局部化性能,大大解决了信号与图像降噪的难题。利用小波降噪大致有三种方法,分别是基于小波模极大值原理、基于小波变换系数的相关性,和最为常用的小波阈值函数法。 基于小波模极大值降噪 该…

AI程序员来了,大批码农要失业

根据GitHub发布的《Octoverse 2021年度报告》,2021年中国有755万程序员,排名全球第二。 ChatGPT的出现,堪比在全球互联网行业点燃了一枚“核弹”,很多人都会担心“自己的工作会不会被AI取代”。 而2024年的AI进展速度如火箭般&am…

S4 BP 维护

前台输入Tcode:BP 问候填写金税开票信息使用的开户行名称,注释填写金税开票信息使用的开户行代码 屏幕下滑按需填写其他数据,如:街道2,街道3,街道/门牌号,街道4,街道5,区域,邮编、城市、国家、地区、语言,电话(发票地址里的电话(必须是客户开票资料里提供的电话,会…

【MyBatisPlus】MyBatisPlus条件查询

【MyBatisPlus】MyBatisPlus条件查询 文章目录 【MyBatisPlus】MyBatisPlus条件查询1、查询条件方式2、组合条件3、NULL值处理4、查询投影-设置【查询字段、分组】5、查询条件6、字段映射与表名映射问题导入 1、查询条件方式 MyBatisPlus将书写复杂的SQL查询条件进行了封装&…

JSON 数据格式化方法

文章目录 数据介绍IDE 或脚本格式化在线工具网址总结 数据介绍 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它基于JavaScript 编程语言的一个子集。尽管它起源于 JavaScript,但 JSON 已经成为了一个完全独立于…

2024专精特新趋势论坛,汉王友基分享数字化创新实践之路

5月31日,由深圳市中小企业服务局作为指导单位,36氪主办的“WISE新风向2024专精特新趋势论坛”在粤港澳大湾区顺利举办。 汉王友基作为国家级专精特新“小巨人”企业代表,受邀参加此次大会,企业CTO邓立明先生进行了《数字赋能&…

让企业自己掌握数据主权,可道云teamOS让企业数据私有化不再是难题,让企业数据更安全、更可控

越来越多的企业开始意识到,仅仅依赖公共云存储服务可能无法满足其对于数据安全性的高标准要求。 毕竟每年都会有不同程度的数据泄露问题爆出,导致大家在使用企业网盘的时候也总是惴惴不安。一旦数据泄露或被非法获取,企业将面临巨大的经济损…

geotrust泛域名https600元

泛域名https证书,也可以称之为通配符https证书,是开发者用来保障网站安全、提升用户信任度的方案之一。开发者可以使用泛域名https证书为多个网站进行数据加密以及身份认证服务,提升网站的安全性。今天就随SSL盾小编了解geotrust旗下的泛域名…

如何理解 Java 线程的概念及线程的创建和管理,包括 Runnable 接口和 Thread 类

多线程编程是现代软件开发中的重要技术,能够显著提高程序的效率和响应速度。Java 提供了丰富的多线程编程支持,使开发者可以轻松地创建和管理线程。 1. 线程的基本概念 1.1 进程与线程 进程:是操作系统中独立运行的程序,每个进…

AI大模型页面

自己做的AI,模仿GPT。 访问地址:欢迎 请大家给点意见,需要追加哪些功能。

Windows下设置pip代理(proxy)

使用场景 正常网络情况下我们安装如果比较多的python包时,会选择使用这种 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-hostpypi.tuna.tsinghua.edu.cn 国内的镜像来加快下载速度。 但是,当这台被限制上…

【python】修改目标检测的xml标签(VOC)类别名

需求: 在集成多个数据集一同训练时,可能会存在不同数据集针对同一种目标有不同的类名,可以通过python脚本修改数据内的类名映射,实现统一数据集标签名的目的。 代码: # -*- coding: utf-8 -*- # Time : 2023/9/11 1…

出海APP遭遇大流量攻击的应对与防御策略

随着全球化的加速,越来越多的中国企业选择将APP推向海外市场。然而,这也意味着他们将面临更加复杂多变的网络安全环境,其中大流量DDoS攻击便是常见且破坏力巨大的威胁之一。本文将深入探讨出海APP遭遇大流量攻击的识别、应急处理及长期防御策…

osi七层网络模型安全加固

应用层加固 应用层的攻击: 1、针对应用层协议的攻击:HTTP攻击、DNS攻击、电子邮件攻击等,利用应用层协议的漏洞,构造恶意数据包,是目标服务器执行恶意代码或暴露敏感信息 HTTP攻击:XSS、CSRF、HTTP头注入…