fastReID论文总结

fastReID论文总结

  • fastReID
    • ReID所面临的挑战
    • 提出的背景
        • 概念:所谓ReID就是从视频中找出感兴趣的物体(人脸、人体、车辆等)
        • 应用场景:
        • 存在的问题:当前的很多ReID任务可复用性差,无法快速落地使用
        • 解决方式:发布了FastReID,可复用和快速落地
    • fastReID的亮点
    • fastReID的成就
    • 训练策略
        • learning rate warm-up
        • Backbone Freezing
    • 测试
    • 排序方法
        • QE
        • K-reciprocal
    • 验证
        • CMC
        • mAP
        • ROC
        • mINP

fastReID

ReID所面临的挑战

  • 摄像头位置的不同导致角度不一
  • 照片像素和色彩存在差异
  • 行人姿态不一
  • 检测框质量不一
  • 存在遮挡和不对齐

提出的背景

概念:所谓ReID就是从视频中找出感兴趣的物体(人脸、人体、车辆等)
应用场景:
  • 搜索电视中演员的镜头
  • 从视频监控中寻找走失的孩子、嫌疑犯
  • 商品追踪、保护野生动物
存在的问题:当前的很多ReID任务可复用性差,无法快速落地使用
解决方式:发布了FastReID,可复用和快速落地

fastReID的亮点

  1. 模块化和可扩展设计:方便研究人员快速地将新设计的模块插入到系统的任意部分,而且能够帮助研究员和工程师快速地实验新的想法。
  2. 配置化:可统一配置模型结构、模型训练、模型评价、模型部署到YAML文件中。可自定义模型结构的主干网络、训练测试、损失函数等。
  3. 评估体系丰富:ROC、mINP
  4. 工程部署:提供知识蒸馏来获取轻量级模型,同时提供了不同框架的模型转换工具。
  5. 提供了最先进的预训练模型:提供多个任务包括行人重识别、遮挡/部分行人重识别、跨域行人重识别和车辆行人重识别的模型和配置。

fastReID的成就

- 图像预处理:调整到同一个尺寸(128,256),翻转,随机擦除,自动增强(自动搜索图像增强的最佳策略)
- backbone:使用了3种主干网络ResNet,ResNeXt,ResNetSt,并且加入了注意力机制和IBN
- 聚合层:使用了四种池化方式最大池化、平均池化、GeM池化、注意力池化
- head:三种head    BN head、linear head、Reduction head:降低维度
- Loss: CEloss、Arcface、Circle loss、Triplet loss

训练策略

learning rate warm-up

使用较小学习率训练几个epoch,因为模型初始的权重是随机的,直接训练会导致震荡和不稳定

改进:为了避免从较小学习率到大学习率引起的误差,让学习率随着每个step增大,之道和预设的一致。

Backbone Freezing

即微调

测试

采用了DSR计算距离

把qure分成N个小部分(xi),gallery也分成N个小部分(yi),xi从Y中找到最相似的yi得到匹配分数,加上所有匹配分数

排序方法

QE

对前top_k的结果,对它们计算特征求和取平均,再计算一次查询,目的是为了提高召回率

K-reciprocal

验证

CMC

top_k的击中概率[top1,top2,top3]

mAP

平均精度

ROC

模型能力

mINP

mAP存在缺陷

在这里插入图片描述

上图中展示了两个匹配列表,其中共10个目标并仅有三个正确结果,绿色表示正确的匹配,。根据平均查准率(Average Precision, AP),第一个匹配列表的AP为0.77,第二个匹配列表的AP为0.7,按照的AP的评价标准,AP值越大的性能越好,因此第二个匹配的性能要优于第一个。

但是,第一个列表中虽然在最靠前的两个结果均正确,但是直到第十个才找到了第三个结果,第二个列表在排序第五的位置就找到了全部的正确结果,因此直观来讲,第二个匹配的性能应该要优于第一个。

在这里插入图片描述

R为最后找到的样本,G为找到了多少样本。这个公式的含义就是截止到最后一个正确的结果时,已经查出的样本中错误的样本所占的比例,因此NP的值越小,性能应该越好。当所有的正确结果都在最前面时,NP的值应该为0。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/182730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

常见的 QML 类型

在 QML(Qt Modeling Language)中,“type” 通常指的是定义特定界面组件或功能的元素。QML 类型可以是基本的用户界面元素,如按钮或文本框,也可以是更复杂的控件,如列表视图或滑块。QML 类型还可以是用于组织…

基于SpringBoot实现的教务查询系统

一、系统架构 前端:html | js | css | jquery | bootstrap 后端:springboot | springdata-jpa 环境:jdk1.7 | mysql | maven 二、代码及数据库 三、功能介绍 01. 登录页 02. 管理员端-课程管理 03. 管理员端-学生管理 04. 管理员端-教师管理…

EntityFrameworkCore数据库优先命令总结

初始化,直接使用数据库逆向生成模型 命令如下: Scaffold-DbContext connectionString providerName options C#有偿Q群:927860652这里的每个参数都有自己的用途: connectionString:数据库连接字符串。这应包括服…

C++ day45 爬楼梯 零钱兑换 完全平方数

题目1:70 爬楼梯(进阶版) 题目链接:爬楼梯 对题目的理解 需要爬n阶才能到达楼顶,每次可以至多爬m个台阶,m的区间是[1,n),有多少种方法爬到楼顶 本题是一个完全背包问题,每一阶都…

史上最全接单平台集锦,程序员不容错过!

非典型程序员不是每天都累成狗,天天”996"甚至”007“。可能,面临着上班摸鱼没事干,下班躺尸打游戏的无聊境况。那么,如果你也是这样的程序员,有没有什么安排可以打发时间? 闲着还不如挣钱~心情好的时…

uniapp 使用 flex布局 将 图片展示 循环排列两列

将以下代码改成图片展示 循环排列两列 展示 <template><view><image v-for"(image, index) in imageList" :key"index" :src"image"></image></view> </template><script> export default {data() {…

【QML】qml+gstreamer显示的同时录像,避免卡顿

1. 问题 使用QML的CameravideoRecorder(Camera)VideoOutput实现显示加录像功能。在Ubuntu上运行正常&#xff0c;视频流畅。但是在开发板上&#xff08;RK3568&#xff09;上出现明显卡顿&#xff0c;无法正常录像。 2. 解决方案 将摄像头数据通过gstreamer共享内存到某个位…

cddd 安装指南(pip install cddd)

pip install cddd 这个命令可能会报错&#xff0c;因为要求是TensorFlow1.10.0 TensorFlow1.10.0对应的Python版本是3.6&#xff0c;所以如果你的Python版本是3.6以上是不行的.....

PTApt——2023年软件设计综合实践_7(数据结构)

6-1 递增的整数序列链表的插入 本题要求实现一个函数&#xff0c;在递增的整数序列链表&#xff08;带头结点&#xff09;中插入一个新整数&#xff0c;并保持该序列的有序性。 答案&#xff1a; 语言选C(gcc) List Insert(List L, ElementType X) {List tmp (List) mal…

142. 环形链表 II --力扣 --JAVA

题目 给定一个链表的头节点 head &#xff0c;返回链表开始入环的第一个节点。 如果链表无环&#xff0c;则返回 null。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评测系统内部使…

OpenCV实现手势音量控制

前言&#xff1a; Hello大家好&#xff0c;我是Dream。 今天来学习一下如何使用OpenCV实现手势音量控制&#xff0c;欢迎大家一起前来探讨学习~ 一、需要的库及功能介绍 本次实验需要使用OpenCV和mediapipe库进行手势识别&#xff0c;并利用手势距离控制电脑音量。 导入库&am…

Python内置函数与标准库函数的详细解读

一、内置函数与标准库函数的区分 Python 解释器自带的函数叫做内置函数&#xff0c;这些函数可以直接使用&#xff0c;不需要导入某个模块。 Python 解释器也是一个程序&#xff0c;它给用户提供了一些常用功能&#xff0c;并给它们起了独一无二的名字&#xff0c;这些常用功能…

JSP 9大内置对象详解

一、内置对象特点: 1.由JSP规范提供,不用编写者实例化。 2. 通过Web容器实现和管理 3.所有JSP页面均可使用 4.只有在脚本元素的表达式或代码段中才可使用(<%使用内置对象%>或<%使用内置对象%>) 二、常用内置对象: 1.输出输入对象:request对象、response对象、…

C++初阶 | [五] 内存管理

摘要&#xff1a;new and delete&#xff0c;定位new&#xff0c;&#xff08;C内存管理的方式&#xff09;&#xff0c;malloc/free和new/delete的区别&#xff0c;内存泄漏 关于内存&#xff1a; 栈又叫堆栈——非静态局部变量/函数参数/返回值等等&#xff0c;栈是向下增长…

华为OD机试 - 园区参观路径(Java JS Python C)

题目描述 园区某部门举办了Family Day,邀请员工及其家属参加; 将公司园区视为一个矩形,起始园区设置在左上角,终点园区设置在右下角; 家属参观园区时,只能向右和向下园区前进,求从起始园区到终点园区会有多少条不同的参观路径。 输入描述 第一行为园区的长和宽; 后…

Linux详解——安装JDK

目录 一、下载jdk 二、tar包安装 三、rpm包安装 一、下载jdk 1.下载jdk https://www.oracle.com/technetwork/java/javase/downloads/index.html 2.通过CRT|WinSCP工具将jdk上传到linux系统中 二、tar包安装 # 1.将JDK解压缩到指定目录 tar -zxvf jdk-8u171-linux…

FreeRTOS学习之路,以STM32F103C8T6为实验MCU(2-12:内存管理)

学习之路主要为FreeRTOS操作系统在STM32F103&#xff08;STM32F103C8T6&#xff09;上的运用&#xff0c;采用的是标准库编程的方式&#xff0c;使用的IDE为KEIL5。 注意&#xff01;&#xff01;&#xff01;本学习之路可以通过购买STM32最小系统板以及部分配件的方式进行学习…

苍穹外卖--查看,删除购物车

代码开发 Controller层 在ShoppingCartController中创建查看购物车的方法&#xff1a; /*** 查看购物车* return*/GetMapping("/list")ApiOperation("查看购物车")public Result<List<ShoppingCart>> list(){return Result.success(shopping…

VituralBox学习

vagrant box add BOX镜像文件位置及名称 --name [文件夹名称] vagrant init 多个 vagrant box add [box文件夹] BOX镜像文件位置及名称 cd [box文件夹] vagrant init [box文件夹] 生成 Vagrantfile vagrant up 启动 修改ssh配置文件并重启服务&#xff1a; cd /etc/ssh…

MyBatis使用教程详解<下>

回顾上一篇博文,我们讲了如何使用注解/XML的方式来操作数据库,实际上,一个Mapper接口的实现,这两种方式是可以并存的. 上一篇博文中,我们演示的都是比较简单的SQL语句,没有设计到复杂的逻辑,本篇博文会讲解复杂SQL的实现及一些细节处理.话不多说,让我们开始吧. 一. #{}和${} …