【MOT】《Multiple Object Tracking in Recent Times: A Literature Review》

在这里插入图片描述

原文

  • Bashar M, Islam S, Hussain K K, et al. Multiple object tracking in recent times: A literature review[J]. arXiv preprint arXiv:2209.04796, 2022.
  • https://arxiv.org/pdf/2209.04796

参考文章

  • 多目标跟踪最新综述(基于Transformer/图模型/检测和关联/孪生网络)

文章目录

  • 1 MOT MAIN CHALLENGES
  • 2 MOT APPROACHES
  • 3 MOT BENCHMARKS
  • 4 MOT METRICS
  • 5 APPLICATIONS
  • 6 FUTURE DIRECTIONS

1 MOT MAIN CHALLENGES

(1)Occlusion

(2)Challenges for Lightweight Architecture

(3)Some Common Challenges

  • inaccurate object detection
  • motion blurring
  • ID Switching

在这里插入图片描述

2 MOT APPROACHES

在这里插入图片描述

(1)Transformer

transformer专门处理序列信息,所以transformer可以完美地完成逐帧处理

在这里插入图片描述
Meinhardt T, Kirillov A, Leal-Taixe L, et al. Trackformer: Multi-object tracking with transformers[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2022: 8844-8854.

在这里插入图片描述

(2)Graph Model

从连续帧中检测到的一组目标被视为一个节点,两个节点之间的链接被视为一个边缘。通常情况下,数据关联是通过应用匈牙利算法来完成的

在这里插入图片描述

Dai P, Weng R, Choi W, et al. Learning a proposal classifier for multiple object tracking[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 2443-2452.

在这里插入图片描述

(3)Detection and Target Association

在这里插入图片描述

(4)Attention Module

在这里插入图片描述

Wan J X, Zhang H, Zhang J, et al. Dsrrtracker: Dynamic search region refinement for attention-based siamese multi-object tracking[J]. arXiv preprint arXiv:2203.10729, 2022.

在这里插入图片描述

(5)Motion Model

在这里插入图片描述

(6)Siamese Network

在这里插入图片描述
Xing D, Evangeliou N, Tsoukalas A, et al. Siamese transformer pyramid networks for real-time UAV tracking[C]//Proceedings of the IEEE/CVF winter conference on applications of computer vision. 2022: 2139-2148.

在这里插入图片描述

(7)Tracklet Association

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
Yu E, Li Z, Han S. Towards discriminative representation: Multi-view trajectory contrastive learning for online multi-object tracking[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022: 8834-8843.

3 MOT BENCHMARKS

在这里插入图片描述
在这里插入图片描述

4 MOT METRICS

(1)MOTP

Multiple Object Tracking Precision

(2)MOTA

Multiple Object Tracking Accuracy

(3)IDF1

The Identification Metric

precision、recall、F1

(4)Track-mAP

(5)HOTA

Higher Order Tracking Accuracy

(6)LocA

Localization Accuracy

(7)AssA: Association Accuracy Score

(8) DetA: Detection Accuracy

(9) DetRe: Detection Recall

(10)DetPr: Detection Precision

(11) AssRe: Association Recall

(12) AssPr: Association Precision

(13) MOTSA: Multi Object Tracking and Segmentation Accuracy

(14)AMOTA: Average Multiple Object Tracking Precision

5 APPLICATIONS

(1)Autonomous Driving

(2)Pedestrian Tracking

(3)Vehicle Surveillance

(4) Sports Player Tracking

(5)Wild Life Tracking

(6)

6 FUTURE DIRECTIONS

(1)Multiple object tracking under multiple cameras

(2)Class-based tracking system can be integrated with multiple object tracking.

针对性

(3)3D tracking

(4) transformer can be used more specifically in solving different MOT tasks

(5)lightweight architecture

(6)real-time tracking

(7) Quantum computing can be used in MOT as well

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/869949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

品牌策划不只是文案,揭秘背后的策略与创意!

品牌策划,听起来高大上,但其实它远不止是写个策划案那么简单。 这事儿,得用心,得深入,得全面。它涉及到品牌的定位、形象、传播,还有市场分析、竞争对手研究、目标受众识别,每一个环节都是品牌…

昆法尔The Quinfall在Steam上怎么搜索 Steam上叫什么名字

昆法尔The Quinfall是一款全新的MMORPG,在中世纪的深处,参与独特的战斗和沉浸式的故事,有几十个不同的职业。而游戏中的战斗系统更是丰富多彩,无论是陆地激战、海上鏖战还是城堡围攻,都能让玩家感受到前所未有的刺激和…

zdppy + vue3 + antd 实现一个表格编辑行,批量删除功能

编辑单元格和多选的功能 首先是编辑单元格的功能,点击编辑按钮,可以直接在表格中队内容进行编辑,点击保存以后能够同步到数据库。 其次是多选的功能,点击每行前面的多选框按钮,我们可以选中多行。 完整后端代码&am…

[论文笔记] 自对齐指令反翻译:SELF-ALIGNMENT WITH INSTRUCTION BACKTRANSLATION

https://arxiv.org/pdf/2308.06259 这篇论文介绍了一种名为“指令反向翻译”(instruction backtranslation)的方法,用于通过自动标记人类书写的文本和相应的指令来构建高质量的指令跟随语言模型。这里是一个通俗易懂的解释: 一、背景 通常,训练一个高质量的指令跟随语言…

GraphQL在Postman中:释放API查询的强大潜能

🚀 GraphQL在Postman中:释放API查询的强大潜能 Postman作为API开发和测试的领先工具,对GraphQL的支持为开发者提供了一种新的方式来查询和管理数据。GraphQL是一种查询语言,用于API,允许客户端明确指定他们需要哪些数…

【Linux】命令执行的判断依据:;,,||

在某些情况下,很多命令我想要一次输入去执行,而不想要分次执行时,该如何是好? 基本上有两个选择, 一个是通过shell脚本脚本去执行,一种则是通过下面的介绍来一次入多个命令。 1.cmd:cmd&#…

Nuxt框架中内置组件详解及使用指南(五)

title: Nuxt框架中内置组件详解及使用指南(五) date: 2024/7/10 updated: 2024/7/10 author: cmdragon excerpt: 摘要:本文详细介绍了Nuxt框架中和组件的使用方法与配置,包括安装、基本用法、属性详解、示例代码以及高级功能如…

【LeYOLO】嵌入式和移动端的轻量级YOLO模型

代码地址:https://github.com/LilianHollard/LeYOLO 论文地址:https://arxiv.org/pdf/2406.14239 在深度神经网络中,计算效率对于目标检测至关重要,尤其是在新模型更注重速度而非有效计算(FLOP)的情况下。这…

ChatGPT-4o大语言模型优化、本地私有化部署、从0-1搭建、智能体构建技术

在过去几年中,人工智能领域的发展迅猛,尤其是大语言模型的应用,为各行各业带来了前所未有的创新与突破。从ChatGPT-3.5的推出到GPT Store的上线,再到最新的多模态交互ChatGPT-4o,OpenAI不断引领科技潮流,推…

Docker安装BRIA-RMBG-1.4模型,背景去除

目录 前言 模型描述 训练数据 定性评估 docker安装 运行 结论 Tip: 问题1: 问题2: 前言 BRIA 背景去除 v1.4 模型 RMBG v1.4 是我们最先进的背景去除模型,旨在有效地将各种类别和图像类型的前景与背景分开。该模型已在…

STM32空闲中断处理串口接受数据

1、检测到空闲线路中断也叫做空闲中断,意思是串口接收完1字节数据后,数据先保持高电平(空闲)的时间超过1字节数据所用的时间,则被判定为空闲中断。 2、HAL库中操作空闲中断的宏是 (1)_HAL_UAR…

tcp 中的poll机制介绍

加入 poll 或者 select 机制可以使程序更加健壮和高效,特别是在需要处理多个连接时。虽然上面的示例是基于单线程的 accept 和 read,它只能处理一个连接,直到它结束才能处理下一个连接。这种方法在简单应用中可能足够,但在实际生产环境中,通常会遇到需要同时处理多个连接的…

ch552g中使用SPI进行主从机通信时发现的问题

参考 基本硬件准备 两块独立的ch552g的板子,开始连接时数据传输出现数据错误,本来猜想是通信线连接问题,后来用了较短的连接线依然没有改善。 SPI通信的认知 SPI一般都是全双工实时通信,所以在发送数据时一般有短暂的停留使得…

到底哪款护眼大路灯好?五款适合学生用的护眼落地灯分享

到底哪款护眼大路灯好?影响青少年近视的最大“杀手”竟是学习环境光的影响。而对于这种情形,尤其是对于需要长时间用眼的学生群体和伏案工作者来说,护眼大路灯简直就是必备神器,但有人会问,我手机打开一搜就出现了那么…

防火墙综合实验一

目录 实验要求 防火墙准备 IP地址分配 需求一 需求二 需求三 需求四 需求五 需求六 实验要求 1、DMZ区内的服务器,办公区仅能在办公时间内(9:00-18:00)可以访问,生产区的设备全天可以访问。 2、生产区不允许访问互联网,办公区和游客…

qq动态删了怎么恢复?五分钟找回您的QQ动态

在使用QQ空间时,我们经常会发现自己误删了一些重要的动态。这可能是由于手指滑动不慎或者误操作引起的。无论是珍贵的回忆还是重要的信息,一旦被删除,我们都希望能够找回来。那么,qq动态删了怎么恢复? 在本文中&#…

vue2/3代码格式化问题,看着太难受了

1.原本的代码: 格式化后的代码: 太难受了! 2.原本的代码 格式化后的代码 格式化跟有病似的,看着非常难受! 有没有什么插件解决!?

你知道的和你不知道的DOM操作技巧

你知道的和你不知道的DOM操作技巧 亲爱的前端小伙伴们,今天我们来聊聊那些你可能知道或者不知道的DOM操作技巧。作为一名前端开发者,如果你还在为DOM操作头疼,那么这篇文章绝对能让你茅塞顿开。让我们一起来探索一下DOM的奥秘吧!…

2024春秋杯网络安全联赛夏季赛-PWN

文章目录 stdout测试setvbuf(stdout, 0LL, 2, 0LL)绕过或者输出直到缓冲区满使用system("/bin/sh")或者onegadget即使setvbuf(stdout, 0LL, 0, 0LL);也能立即有回显参考[https://starrysky1004.github.io/2024/07/05/2024-shu-qi-xue-xi-ji-lu/#toc-heading-4](https…

搜维尔科技:【研究】Scalefit是一款可在工作场所自动处理3D姿势分析结果的软件

Scalefit是一款可在工作场所自动处理 3D 姿势分析结果的软件。这甚至可以在衡量员工的同时发生。然后,Scalefit 根据国际标准对姿势、压缩力和关节力矩进行分析和可视化。 3D姿势分析 如今,Xsens 技术可让您快速测量工作场所员工的态度。一套带有 17 个…