注意力机制可视化_目标跟踪中的(STAM)时空注意力机制

2db535c362bdf79549e8c85c549cb84c.png

目标跟踪分为单目标跟踪和多目标跟踪,单目标跟踪较为简单,这里我们只讨论多目标跟踪。

85b6f9ac87e01f08055191791193de3c.gif

多目标跟踪的遮挡问题

多目标跟踪时特别容易发生目标间的相互遮挡,从而导致严重的预测偏移问题,如下图所示:

2f2338840e3d0f7e96dfe1188904d3cf.png

红色框的行人在和蓝色框行人交错而过时,由于外观模型的持续更新,红色框就学到了另一个人的外观特征,从而导致跟踪错误。这种情况在多目标跟踪中并不少见,所以如何解决遮挡问题就成了重中之重。

这里介绍一种采用时空注意力机制(Spatial-Temporal Attention Mechanism)来尽可能解决目标间遮挡的深度模型。

Online Multi-Object Tracking Using CNN-based Single Object Tracker with Spatial-Temporal Attention Mechanism​arxiv.org

模型总体架构

这种时空注意力深度模型的总体架构如下所示:

6653338a67da3ac71fbcb62fc86ea93a.png

空间注意力对特征进行加权,从而对每个候选框进行分类,而时间注意力通过调节第t帧样本和历史样本的权重,从而辅助损失函数进行参数更新。

空间注意力

我们接下来具体看一看空间注意力机制如何发挥作用。

867232659ac41d8b5895cb428bfdb429.png

输入图片先通过一个共享卷积层,提取高维特征CNN Feature Map,接着各个目标均在此CNN Feature Map上进行预测即可,每个特定目标CNN分支都对应跟踪一个目标,即有多少行人,就有多少CNN分支。

值得一提的是,对于每个目标来说,其候选框BBox由两部分组成,运动模型的预测框和检测模型的检测框组成;接着对此目标的所有候选框进行评分,得分最高的且大于一定阈值的候选框,即为此帧此目标的预测跟踪框。

得到ROI-Pooling特征时注意一个细节:因为BBox框的大小不一样,所以引入ROI池化,统一ROI Features的尺寸,从而保证后序全连接层正常运行。

特定目标分支中,分为空间注意力提取阶段和二分类阶段:

(1)空间注意力使用可视图来得到,ROI-Pooling特征经过卷积层和全连阶层后reshape成可视图,越接近于1即为目标像素,越接近0则为非目标像素,可视化如下:

17e180a3f79443a30515a03523268d1d.png

红色区域为目标,蓝色区域为被遮挡部分。

这里的可视图既辅助产生空间注意力,也在时间注意力中发挥作用,在更新参数时决定使用当前帧的程度;

(2)二分类阶段较为简单明了,每个ROI-Pooling都对应这一个得分,对于一个分支来说,得分最高的且大于一定阈值的ROI-Pooling,即为此帧此目标的预测跟踪框。

时间注意力

时间注意力其实反映的是我们更新参数时,考虑此帧预测跟踪框占总损失的权重。

137bcf3d34f4a730cc8339b3e5a620b3.png

参数就是我们需要学习的权重。

4b59a9e81d631d070c1052ed6f5ee10e.png

其中,

即可视图Visibility Map的均值,
是此目标与其他目标的最大IOU值,其它参数均需要学习。

a28348236bb2423eb196f246980de6e5.png

总损失也就是由第t帧负样本,第t帧正样本,历史正样本三部分构成,均采用交叉熵损失。

实验结果

623e6fb96dad1a2005fcdab28f1911e6.png

消融实验可以得出每个部分都是有效的。

39563a567759dca08c9c2616dcc56fd8.png

时空注意力机制STAM和其他多目标跟踪方法比,效果确实得到了一定的提升。IDS评价指标最优,也体现出此模型能较好地处理遮挡问题,减少了ID错误切换的频率。

总结归纳:

1.前半部分网络使用共享卷积层,减少了参数量;并且参数固定住,减少反向传播的计算量;

2.引入运动模型,相比起其他只使用Detector的MOT算法,增加了稳定性;

3.使用时空注意力机制,更准确地跟踪遮挡情况。

问题讨论:

一般空间注意力都是全连接层进行全局Softmax实现,大家知道空间注意力的局部连接形式是什么样的吗?

52b9f260e6dcbfd6ab5d2ebe25728e5f.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/349342.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

byteman_使用Byteman和JUnit进行故障注入

byteman我们的应用程序独立存在的时间已经很久了。 如今,应用程序是一种非常复杂的野兽,它们使用无数的API和协议相互通信,将数据存储在传统或NoSQL数据库中,通过网络发送消息和事件……例如,您多久考虑一次例如数据库…

java动态扩展_java栈内存动态扩展要怎么理解?要如何实现?

小伙伴们知道如何在java栈中内存动态扩展吗?这是虚拟机中的一个概念,下面让我们一起来看看该如何实现吧。一、内存概念在java中,我们一般会简单把java内存区域划为两种:堆内存与栈内存。其实这种划分是比较粗粒度的。其中栈内存就是指的是虚…

python 爬虫热搜_Python网络爬虫之爬取微博热搜

微博热搜的爬取较为简单,我只是用了lxml和requests两个库1.分析网页的源代码:右键--查看网页源代码.从网页代码中可以获取到信息(1)热搜的名字都在的子节点里(2)热搜的排名都在的里(注意置顶微博是没有排名的!)(3)热搜的访问量都在的子节点里…

优盘复制进来为空_为何电脑上的文件夹一复制到U盘里就变成空文件夹了?

(格式化后的卡在恢复前千万不要往里面存东西,因为这样会覆盖你想恢复的内容,如果你不小心存东西了也不要放弃,只不过恢复的机率会变小),下面开始:::在百度里输入Easy recover 软件找到后下载安装到电脑上,然后将内存卡与电脑连接,打开Easy recover 软件,首次打开时软件会分析系…

Spring Cloud教程–使用Spring Cloud Bus自动刷新配置更改

问题 在上一篇文章Spring Cloud Config Server简介 ( http://sivalabs.in/2017/08/spring-cloud-tutorials-introduction-to-spring-cloud-config-server/ )中,我们已经了解了如何使用Spring Cloud配置服务器。 但是,问题是要重新…

js给标签添加属性和值_jquery节点属性

一.节点操作1.DOM内容节点操作:​ ①innerHTML属性:设置或获取文本的内容(普通文本和标签)。​ ②innerText属性:设置或获取文本的内容(普通文本),存在兼容性问题。2.jQuery内容节点…

sci translate好用吗_228个学科分类对应12000+本SCI和SSCI期刊,总有你要的那款!

最近有很多小伙伴询问选刊的问题,而且都是非常具体的学科方向,我们的小编虽然非常热心且礼貌的回答“近期安排”,但其实我们也感觉到鸭梨山大:根据WOS最新一期(2020/9/21)名单公布,WOS目前总共收录了12266本…

java 反射 属性顺序_java反射得到的方法数组的顺序

展开全部看了下你好像需要set和get方法,如果你知道属性的名字的话不需要遍历可以这样获取,这个是我以前的demo的一个32313133353236313431303231363533e58685e5aeb931333332633561片段:Class clazzClass.forName("com.demo.reflectdemo.Student&quo…

arrays.sort(._Arrays.sort与Arrays.parallelSort

arrays.sort(.我们都使用Arrays.sort对对象和原始数组进行排序。 此API在下面使用合并排序或Tim排序对内容进行排序,如下所示: public static void sort(Object[] a) {if (LegacyMergeSort.userRequested)legacyMergeSort(a);elseComparableTimSort.sor…

python冒泡排序函数_python冒泡排序-Python,冒泡排序

arr[7,4,3,67,34,1,8].defbubble_sort:最近在学习Python,下面是我的一些笔记冒泡排序实现思路: 使用双重for循环,内层变量为i, 外层为j,在内层循环中不断的比较相邻的两个值(i, i1)的大小,如果i1的值大于i的…

适用于Idea的面向现代TDD的Java 8 JUnit测试模板(带有Mockito和AssertJ)

使用类似BDD的语法,Java 8和Mockito-AssertJ二重奏为Idea调整JUnit测试类模板。 本文涵盖的主题似乎很简单。 但是,根据我的培训师经验,我知道(不幸的是)这不是常见的做法。 因此,我决定写这篇简短的博客文…

python编程的基本方法有哪些_Python编程中常用的基础知识有哪些?

今天小编要跟大家分享的文章是关于Python编程中常用的基础知识有哪些?正在从事Python相关工作的小伙伴们,来和小编一起看一看本篇文章,希望本篇文章能够对大家有所帮助。1、正则表达式替换目标: 将字符串 line 中的 overview.gif 替换成其他字符串>&…

java取网页源码_Java获取任意http网页源代码的方法

本文实例讲述了JAVA获取任意http网页源代码。分享给大家供大家参考,具体如下:JAVA获取任意http网页源代码可实现如下功能:1. 获取任意http网页的代码2. 获取任意http网页去掉HTML标签的代码Webpage类:/*** 网页操作相关类*/packag…

python数据结构算法优势_Python数据结构与算法(一)----- 算法效率

一.引入先来看一道题:如果abc1000, 且a2b2c^2(a,b,c为自然数),如何求出所有a,b,c可能的组合?(1) 枚举法import timestart_time time.time()for a in range(0,1001):for b in range(0,1001):for c in range(1,1001):if abc1000 and a**2b**2 …

Java编程字符逆序输出_用JAVA编写一程序:从键盘输入多个字符串到程序中,并将它们按逆序输出在屏幕上。...

展开全部代码如下:import java.util.Scanner;public class ScannerDemo{public static void main(String[] args) throws Exception{Scanner scannew Scanner(System.in);System.out.println("请输入内容:");String strscan.nextLine();char[]…

glassfish 4配置_自己构建GlassFish 4.0快照

glassfish 4配置这篇文章是关于自己发布GlassFish 4.0快照的,其中包括一些黑客。 我找到了GlassFish FullBuild的官方说明,然后决定自己构建服务器。 有时,您可能不想等待团队升级GlassFish构建文件。 在本条目中,我将Artifactory…

julia与python对比_有人说Julia比Python好,还给出了5个理由

选自medium作者:Emmett Boudreau机器之心编译参与:杜伟、张倩、肖清本文作者从速度、通用性、多重派发、适用于 ML 的程度和包管理器 5 个方面阐述了 Julia 语言相较于 Python 的优势所在。Julia 是一种多范式的函数式编程语言,用于机器学习和…

使用Flowable.generate()生成可感知背压的流– RxJava常见问题解答

RxJava缺少创建无限自然数流的工厂。 这样的流很有用&#xff0c;例如&#xff0c;当您想通过压缩两个事件的唯一序列号给可能的无限事件流时&#xff1a; Flowable<Long> naturalNumbers //???Flowable<Event> someInfiniteEventStream //... Flowable<P…

java字符串构造函数的应用_StringTokenizer类的使用

StringTokenizer是一个用来分隔String的应用类&#xff0c;相当于VB的split函数。1.构造函数public StringTokenizer(String str)public StringTokenizer(String str, String delim)public StringTokenizer(String str, String delim, boolean returnDelims)第一个参数就是要分…

linkedhashmap获取第n个元素_机试真题分享——交换链表前后第K个元素

题目描述给定一个编码链表和一个加密条件K&#xff0c;对编码进行加密。加密规则&#xff1a;把编码从前往后开始数第K个元素和从后往前数第K个元素进行交换。注意&#xff1a;编码的长度为0.第一个编码的序号是1.示例&#xff1a;输入&#xff1a;[1 2 3 4 5 6] 2输出&#xf…