论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network

Person Re-identification with Deep Similarity-Guided Graph Neural Network
2018-07-27 17:41:45

 

Paper: https://128.84.21.199/pdf/1807.09975.pdf

本文将 Graph Neural Network (GNN) 应用到 person re-ID 的任务中,用于 model 不同 prob-gallery 之间的关系,将该信息也用于 feature learning,进一步提升了最终的效果。如下图所示:

 

Abstract

行人再识别的任务需要鲁棒的预测行人图片之间的视觉相似度。然而,现有的 re-ID 模型大部分都是独立的进行 different image pairs of prob and gallery images 相似度的学习,但是缺忽略了不同的 prob-gallery pairs 之间的关系信息(the relationships information between different prob-gallery pairs)。这就导致了一些 hard samples 的相似性预测不是很准确。本文,我们提出一种新的 deep learning framework,称为:Similarity-Guided Graph Neural Network(SGGNN)来克服上述缺陷。给定 a prob image and several gallery images, SGGNN 构建一个 graph 来表示不同 gallery pairs 之间的 pairwise relationships,并且利用上述信息来进行end to end 的更新 probe-gallery relation features。通过这种关系特征可以进行更加准确的相似性预测。Graph 上 nodes 的输入feature 是:the relation features of different prob-gallery image pairs. 这种关系 feature 的更新可以通过 SGGNN 上信息的传递来完成,这样就可以考虑到其他 nodes 的信息来进行相似度的学习。跟传统的 GNN 的方法不同,SGGNN 直接利用 rich labels 来学习 edge weights,可以提供更加准确的信息来进行 relation fusion。本文在三个 person re-ID 的数据集上进行了实验,证明了本文方法的有效性。

 

Methods

一般 re-ID 模型的评测是:将 test data 分为两个部分:a prob set and a gallery set

给定 prob 和 gallery 图像对,re-ID 模型的目标是:robustly determining visua similarities between prob-gallery image pairs

在前人的工作中,在一个 minibatch 中,这些 prob-gallery 图像对的评测是独立进行的。但是,不同 gallery images 的相似度却对 prob-gallery 相似度的优化非常有价值(the similarities between different gallery images are valuable for refining simialrity estimation between the prob and gallery)。

 

本文充分利用这种信息来改善 feature learning,如图1 所示。

该方法将同时输入一个 prob 和 多个 gallery image,来构建一个 graph,每一个 node 建模了一个 prob-gallery image pairs,输出的是:每一个图像对的相似度。这样就可以将学习到的信息通过网络进行传递,即:Deeply learned messages will be propagated among nodes to update the relation features associated with each node for more accurate similarity score estimation in the end-to-end training process.  

 

1. Graph Formulation and Node Features

在我们的框架中,我们首先将 person re-ID 看做是 node-focused graph application。给定 prob 和 N 个 gallery image,我们构建一个无向完全图 G(V, E),其中 V = {v1, v2, ... , vn} 代表 nodes 的集合。每一个 node 代表了 prob-gallery images 的图像对。我们的目标是:预测每一个图像对的相似度,所以,把 re-ID 的问题当做是 node classification 的问题。

 

在本文当中,我们采用一种简单的方法来获得:input relation features,如图 2(a)所示。我们将给定的 prob-gallery pairs 输入到一个 Siamese Network 当中,以得到  pairwise relation feature encoding。该 Siamese Network 的设计主要是基于 ResNet-50,后面接进行两个输入图像所提 feature 的相减,然后进行 element-wise square operation,输入到 Batch Normalization layer。该差值衡量了两个输入图像之间的差异性,我们将这个 feature 作为 nodes 的输入特征。由于我们的任务是 node-wise classification,即:预测每一个 pair 之间相似度,一个比较 naive 的方法就是:直接将该 feature 输入到线性分类器当中,直接输出相似度得分,而不考虑不同 nodes 之间的相似度。对于每一个 prob-gallery image pair,可以用二元交叉熵损失函数来完成这个目标:

 

 

2. Similarity-Guided Graph Neural Network:

明显,简单的分类方法忽略了不同 prob-gallery pair 之间的重要信息。为了探索这些信息,我们需要在 nodes 上进行 edge 的构建。在我们的工作中,G 是全连接的,E 代表了不同节点关系的集合,其中 $W_{ij}$ 是 scalar edge weight。它代表了不同节点之间关系的重要性,可以通过如下的公式进行计算:

其中,gi and gj 代表了 第 i 个 和 第 j 个 gallery image。我们通过传递不同连接节点之间的 deep learned messages,来增强 nodes 的 feature。

这个 node features 然后也被更新,作为:a weighted addition fusion of all input messages and the node's original features.   

 

在进行信息传递之前,每一个节点首先编码了  a deep message,以用于传递给与它相连接的 nodes。这个节点的 input relation features $d_i$ 然后被输入到一个 message network,该网络是由 2 fc layers 和 BN 以及 ReLU layers 构成的,以得到 deep message $t_i$,如图2(b)所示。这个过程学习到了更加合适的 messages 用于节点关系特征的更新:

在得到 edge weights $W_{ij}$ 以及 deep message $t_i$ 以后,然后 node relation feature $d_i$ 的更新机制可以表达为:

其中,上式的输出代表了第 i 个节点的优化后的关系特征,d0 代表了第 i 个输入关系特征,tj 代表了 deep message from node j。

 

注意到这种更新机制可以是以一种迭代的方式进行的,即:

但是,作者发现这种迭代的方式进行的提升,效果有限。在进行特征更新之后,我们将该 feature 输入到线性分类器当中,以得到相似性得分,然后照样利用 Binary cross-entropy loss 进行训练。

 

 

 

 

 

== Done !!!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538143.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

双曲函数奇偶性_基本初等函数之奇偶性(强基系列42)

基本初等函数之奇偶性(强基系列4-2)开卷有益初等函数是由幂函数(power function)、指数函数(exponential function)、对数函数(logarithmic function)、三角函数(trigonometric function)、反三角函数(inverse trigonometric function)与常数经过有限次的有理运算(加、减、乘、…

html文件打开系统错误,win7打开word提示“无法打开文件Normal因为内容有错误”的两种解决方法...

win7系统打开Word的时候,弹出提示“无法打开文件Normal.dotm,因为内容有错误”,为什么会出现错误提示呢?小编就按照错误提示寻找文件,最后发现是Word自动生成的模板Normal出错了,知道故障原因后,接下去教程…

超链接跳转到action使用哪个方法_管道疏通剂哪个牌子好 管道疏通机使用方法有哪些...

平时大家不用的水或者一些物品,在处理的时候应该都会倒到下水道之中,而下水道确实具备着这一种效果,但很多时候,下水道往往会因为口比较小,而被一些物品所堵塞,这样一来,影响上其实会非常大&…

linux学习-将seafile启动脚本设置为开机启动服务

有时候,我们安装的linux软件和程序不是通过yum安装,而是通过编译或者其他方式安装。有时需要将程序设置为服务,达到开机启动的目的。我在公有云的与服务器上搭建了seafile网盘,当我重启云服务器的时候,seafile的程序不…

中文整合包_案例 | 美研市场营销和整合营销专业1620Fall 580+申请实例(含MS+PHD)...

关注“留学壹周刊”,回复专业名称,如“金融”,可以自由查询相关资料介绍本篇微信主要包括如下内容:580美研市场营销和整合营销专业16-20Fall申请实例,包括6个文件:1、MS项目申请实例2、PHD项目申请实例3、成…

学计算机的让修电脑搞笑段子精选,搞笑段子:阿姨,我是真的就来给他们修电脑的!...

搞笑段子:阿姨,我是真的就来给他们修电脑的修电脑在上大学的时间,经常用修电脑的名号进入到女生宿舍之中,当时的宿管阿姨人特别好,稍微的问一下就让我进去了。有一天,我刚要进去的时间,她拉着我…

react table里跳转页面_react路由配置基础篇:react-router4.0及以上

随着react路由组件的不断升级,react-router4以下的版本和4以上的版本配置还是有一定的区别,这里就不累赘陈述了,笔者分享下使用react-router4.0以上版本的经验。1、安装react-router-domnpm install react-router-dom --save2、基本配置&…

cad怎么向下位移_CAD制图初学入门教程:阵列功能的使用技巧

阵列在浩辰CAD软件中也是比较常用的功能之一,但是有些CAD制图初学入门者对此并不是很了解。那么在浩辰CAD软件中阵列功能怎么用呢?接下来就给大家分享一些关于阵列功能的CAD制图初学入门技巧吧!首先在浩辰CAD软件中打开CAD图纸,然…

联想g470笔记本开vt_最“发泄”评测!飞刀铁拳暴力输出,联想本结局竟然大亮?(附视频)...

极果潮玩实验室迎来一块新的硬骨头——联想笔记本。喜欢来点新花样的小伙伴们听说它刚到不行,轻薄身板却很耐造,于是大家都想和它较量一番,看看是什么样的刚猛让这款产品名声在外。本期评测还是本着不走寻常路的风格,看看我们为它…

【leetcode】590. N-ary Tree Postorder Traversal

题目如下: 解题思路:凑数题2,做完先序做后序。凑数博2。 代码如下: class Solution(object):def postorder(self, root):""":type root: Node:rtype: List[int]"""if root None:return []res []s…

dubbo控制台安装

为什么要安装这个控制台? 当我们的服务很多的时候,需要监管,查看,当项目变大的时候,会深深感谢它! 管理原理 对注册中心Zookeeper中注册的服务进行管理 安装步骤 1、下载dubbo源码,要与使用的…

dubbo服务的运行方式

1、使用Servlet容器运行(Tomcat、Jetty等)----不可取 缺点:增加复杂性(端口、管理) 浪费资源(内存) 假设1个服务模块时,需要1台tomcat,消耗3个端口,和200M…

插件translator_Zotero Jasminum 插件的更新记录

Jasminum 插件发布后 林知:简单的Zotero CNKI 中文插件​zhuanlan.zhihu.com受到一些同学的关注,同时也收到许多反馈。我写这个插件的初衷就是想让大家在Zotero上能更方便的使用知网,尤其是人文社科相关专业的同学,他们尤其依赖中…

ubuntu18.04 用xhell连接失败

ifconfig命令有用之后,又发现xhell连接不上ubuntu18.04版本的虚拟机,原因是ubuntu18.04默认没有安装ssh服务。 使用以下命令安装 sudo apt-get install openssh-server 安装完成后,启动ssh服务 sudo /etc/init.d/ssh start 查看ssh进程,若出现…

伍德里奇计量经济学第五版第四章计算机操作,伍德里奇计量经济学第四章

伍德里奇计量经济学第四章2016年10⽉25⽇ 星期⼆ 下午10:21 Page 1User: ⺩建英name: log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcllog type: smclopened on: 25 Oct 2016, 22:20:411. do "/var/folders/qt/0wzmrhfd3rb93j2h5hhtcwqr0000gn/T//SD1…

使用maven构建dubbo服务的可执行jar包

maven 项目结构 <build><!-- 使用dubbo推荐的方法&#xff0c;打包成jar&#xff0c;调用main方法启动 --><finalName>admin-service-user</finalName><resources><resource><targetPath>${project.build.directory}/classes</ta…

Linux的标准I/O和管道

标准输入输出与管道 1、标准输入和输出程序&#xff1a;指令数据指令&#xff1a;计算、加减乘除数据&#xff1a;输入数据、输出数据2、在Linux中每一个打开的文件都会分配一个当前进程中唯一的文件描述符&#xff0c;用来标识文件的状态fd:file descripor3、Linux提供给程序…

页面url带参数_微信小程序云开发教程微信小程序的JS高级页面间数据传递

同学们大家好&#xff0c;我是小伊同学&#xff0c;上一节课我们讲解了全局数据的读写方法&#xff0c;那么在页面间同样需要数据交互&#xff0c;今天我们就来学习这部分内容。在微信小程序中&#xff0c;我们常常需要将数据在页面之间进行传递&#xff0c;比如用户的身份信息…

OpenGL——二维几何变换

平移、旋转、缩放的实现 #include<iostream> #include <math.h> #include<Windows.h> #include <GL/glut.h>using namespace std;GLsizei winWidth 600, winHeight 600;GLfloat xwcMin 0.0, xwcMax 225.0; GLfloat ywcMin 0.0, ywcMax 225.0;cla…

在Eclipse 中打开当前文件夹

原文连接&#xff1a;https://www.cnblogs.com/panie2015/p/5985053.html ------------------------------------------------------------------------ 最近试过好多次&#xff0c;安装插件来 在Eclipse 中打开当前文件所在文件夹&#xff0c;结果总是不甚如意。 烦躁了&…