【MOT】《Multiple Object Tracking in Recent Times: A Literature Review》

在这里插入图片描述

原文

  • Bashar M, Islam S, Hussain K K, et al. Multiple object tracking in recent times: A literature review[J]. arXiv preprint arXiv:2209.04796, 2022.
  • https://arxiv.org/pdf/2209.04796

参考文章

  • 多目标跟踪最新综述(基于Transformer/图模型/检测和关联/孪生网络)

文章目录

  • 1 MOT MAIN CHALLENGES
  • 2 MOT APPROACHES
  • 3 MOT BENCHMARKS
  • 4 MOT METRICS
  • 5 APPLICATIONS
  • 6 FUTURE DIRECTIONS

1 MOT MAIN CHALLENGES

(1)Occlusion

(2)Challenges for Lightweight Architecture

(3)Some Common Challenges

  • inaccurate object detection
  • motion blurring
  • ID Switching

在这里插入图片描述

2 MOT APPROACHES

在这里插入图片描述

(1)Transformer

transformer专门处理序列信息,所以transformer可以完美地完成逐帧处理

在这里插入图片描述
Meinhardt T, Kirillov A, Leal-Taixe L, et al. Trackformer: Multi-object tracking with transformers[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2022: 8844-8854.

在这里插入图片描述

(2)Graph Model

从连续帧中检测到的一组目标被视为一个节点,两个节点之间的链接被视为一个边缘。通常情况下,数据关联是通过应用匈牙利算法来完成的

在这里插入图片描述

Dai P, Weng R, Choi W, et al. Learning a proposal classifier for multiple object tracking[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 2443-2452.

在这里插入图片描述

(3)Detection and Target Association

在这里插入图片描述

(4)Attention Module

在这里插入图片描述

Wan J X, Zhang H, Zhang J, et al. Dsrrtracker: Dynamic search region refinement for attention-based siamese multi-object tracking[J]. arXiv preprint arXiv:2203.10729, 2022.

在这里插入图片描述

(5)Motion Model

在这里插入图片描述

(6)Siamese Network

在这里插入图片描述
Xing D, Evangeliou N, Tsoukalas A, et al. Siamese transformer pyramid networks for real-time UAV tracking[C]//Proceedings of the IEEE/CVF winter conference on applications of computer vision. 2022: 2139-2148.

在这里插入图片描述

(7)Tracklet Association

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
Yu E, Li Z, Han S. Towards discriminative representation: Multi-view trajectory contrastive learning for online multi-object tracking[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022: 8834-8843.

3 MOT BENCHMARKS

在这里插入图片描述
在这里插入图片描述

4 MOT METRICS

(1)MOTP

Multiple Object Tracking Precision

(2)MOTA

Multiple Object Tracking Accuracy

(3)IDF1

The Identification Metric

precision、recall、F1

(4)Track-mAP

(5)HOTA

Higher Order Tracking Accuracy

(6)LocA

Localization Accuracy

(7)AssA: Association Accuracy Score

(8) DetA: Detection Accuracy

(9) DetRe: Detection Recall

(10)DetPr: Detection Precision

(11) AssRe: Association Recall

(12) AssPr: Association Precision

(13) MOTSA: Multi Object Tracking and Segmentation Accuracy

(14)AMOTA: Average Multiple Object Tracking Precision

5 APPLICATIONS

(1)Autonomous Driving

(2)Pedestrian Tracking

(3)Vehicle Surveillance

(4) Sports Player Tracking

(5)Wild Life Tracking

(6)

6 FUTURE DIRECTIONS

(1)Multiple object tracking under multiple cameras

(2)Class-based tracking system can be integrated with multiple object tracking.

针对性

(3)3D tracking

(4) transformer can be used more specifically in solving different MOT tasks

(5)lightweight architecture

(6)real-time tracking

(7) Quantum computing can be used in MOT as well

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/869949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昆法尔The Quinfall在Steam上怎么搜索 Steam上叫什么名字

昆法尔The Quinfall是一款全新的MMORPG,在中世纪的深处,参与独特的战斗和沉浸式的故事,有几十个不同的职业。而游戏中的战斗系统更是丰富多彩,无论是陆地激战、海上鏖战还是城堡围攻,都能让玩家感受到前所未有的刺激和…

zdppy + vue3 + antd 实现一个表格编辑行,批量删除功能

编辑单元格和多选的功能 首先是编辑单元格的功能,点击编辑按钮,可以直接在表格中队内容进行编辑,点击保存以后能够同步到数据库。 其次是多选的功能,点击每行前面的多选框按钮,我们可以选中多行。 完整后端代码&am…

【Linux】命令执行的判断依据:;,,||

在某些情况下,很多命令我想要一次输入去执行,而不想要分次执行时,该如何是好? 基本上有两个选择, 一个是通过shell脚本脚本去执行,一种则是通过下面的介绍来一次入多个命令。 1.cmd:cmd&#…

Nuxt框架中内置组件详解及使用指南(五)

title: Nuxt框架中内置组件详解及使用指南(五) date: 2024/7/10 updated: 2024/7/10 author: cmdragon excerpt: 摘要:本文详细介绍了Nuxt框架中和组件的使用方法与配置,包括安装、基本用法、属性详解、示例代码以及高级功能如…

【LeYOLO】嵌入式和移动端的轻量级YOLO模型

代码地址:https://github.com/LilianHollard/LeYOLO 论文地址:https://arxiv.org/pdf/2406.14239 在深度神经网络中,计算效率对于目标检测至关重要,尤其是在新模型更注重速度而非有效计算(FLOP)的情况下。这…

ChatGPT-4o大语言模型优化、本地私有化部署、从0-1搭建、智能体构建技术

在过去几年中,人工智能领域的发展迅猛,尤其是大语言模型的应用,为各行各业带来了前所未有的创新与突破。从ChatGPT-3.5的推出到GPT Store的上线,再到最新的多模态交互ChatGPT-4o,OpenAI不断引领科技潮流,推…

Docker安装BRIA-RMBG-1.4模型,背景去除

目录 前言 模型描述 训练数据 定性评估 docker安装 运行 结论 Tip: 问题1: 问题2: 前言 BRIA 背景去除 v1.4 模型 RMBG v1.4 是我们最先进的背景去除模型,旨在有效地将各种类别和图像类型的前景与背景分开。该模型已在…

ch552g中使用SPI进行主从机通信时发现的问题

参考 基本硬件准备 两块独立的ch552g的板子,开始连接时数据传输出现数据错误,本来猜想是通信线连接问题,后来用了较短的连接线依然没有改善。 SPI通信的认知 SPI一般都是全双工实时通信,所以在发送数据时一般有短暂的停留使得…

到底哪款护眼大路灯好?五款适合学生用的护眼落地灯分享

到底哪款护眼大路灯好?影响青少年近视的最大“杀手”竟是学习环境光的影响。而对于这种情形,尤其是对于需要长时间用眼的学生群体和伏案工作者来说,护眼大路灯简直就是必备神器,但有人会问,我手机打开一搜就出现了那么…

防火墙综合实验一

目录 实验要求 防火墙准备 IP地址分配 需求一 需求二 需求三 需求四 需求五 需求六 实验要求 1、DMZ区内的服务器,办公区仅能在办公时间内(9:00-18:00)可以访问,生产区的设备全天可以访问。 2、生产区不允许访问互联网,办公区和游客…

qq动态删了怎么恢复?五分钟找回您的QQ动态

在使用QQ空间时,我们经常会发现自己误删了一些重要的动态。这可能是由于手指滑动不慎或者误操作引起的。无论是珍贵的回忆还是重要的信息,一旦被删除,我们都希望能够找回来。那么,qq动态删了怎么恢复? 在本文中&#…

vue2/3代码格式化问题,看着太难受了

1.原本的代码: 格式化后的代码: 太难受了! 2.原本的代码 格式化后的代码 格式化跟有病似的,看着非常难受! 有没有什么插件解决!?

你知道的和你不知道的DOM操作技巧

你知道的和你不知道的DOM操作技巧 亲爱的前端小伙伴们,今天我们来聊聊那些你可能知道或者不知道的DOM操作技巧。作为一名前端开发者,如果你还在为DOM操作头疼,那么这篇文章绝对能让你茅塞顿开。让我们一起来探索一下DOM的奥秘吧!…

2024春秋杯网络安全联赛夏季赛-PWN

文章目录 stdout测试setvbuf(stdout, 0LL, 2, 0LL)绕过或者输出直到缓冲区满使用system("/bin/sh")或者onegadget即使setvbuf(stdout, 0LL, 0, 0LL);也能立即有回显参考[https://starrysky1004.github.io/2024/07/05/2024-shu-qi-xue-xi-ji-lu/#toc-heading-4](https…

搜维尔科技:【研究】Scalefit是一款可在工作场所自动处理3D姿势分析结果的软件

Scalefit是一款可在工作场所自动处理 3D 姿势分析结果的软件。这甚至可以在衡量员工的同时发生。然后,Scalefit 根据国际标准对姿势、压缩力和关节力矩进行分析和可视化。 3D姿势分析 如今,Xsens 技术可让您快速测量工作场所员工的态度。一套带有 17 个…

开源无人机从入门到炸机,共需要几步?

阿木实验室2024年的重磅新品 Prometheus 仿真笔记本已经上架有一段时间了,近日,该产品的研发负责人廖工受邀到直播间与开发者们深度解读了Prometheus仿真笔记本的设计理念。直播过程中,廖工不仅展示了该产品的功能demo,解答技术开…

leetcode:1332. 删除回文子序列(python3解法)

难度:简单 给你一个字符串 s,它仅由字母 a 和 b 组成。每一次删除操作都可以从 s 中删除一个回文 子序列。 返回删除给定字符串中所有字符(字符串为空)的最小删除次数。 「子序列」定义:如果一个字符串可以通过删除原字…

本地部署,图片细节处理大模型Tile Controlnet

目录 什么是 Tile ControlNet? 工作原理 应用场景 优势与挑战 优势 挑战 本地部署 运行结果 未来展望 结论 Tip: 在近年来的深度学习和计算机视觉领域,生成对抗网络(GAN)和扩散模型等技术取得了显著的进展。…

技术文件国产化准备

技术文档的本地化涉及调整内容以满足特定目标市场的文化、语言和技术要求。这一过程超越了简单的翻译,确保文件在文化上适合预期受众,在技术上准确无误。适当的准备对于成功的本地化至关重要,以下步骤概述了一种全面的方法。 分析目标受众 …

在Visutal Studio 2022中完成D3D12初始化

在Visutal Studio 2022中完成DirectX设备初始化 1 DirectX121.1 DirectX 简介1.2 DirectX SDK安装2 D3D12初始化2.1 创建Windwos桌面项目2.2 修改符合模式2.3 下载d3dx12.h文件2.4 创建一个异常类D3DException,定义抛出异常实例的宏ThrowIfFailed3 D3D12的初始化步骤3.1 初始化…