目前行人再识别的数据集比较常用的有:Market-1501、 DukeMTMC-reID、CUHK03,后面有时间会上传如何处理数据集的代码。目前常使用的方式:数据集下有以下几个文件夹:
train:包含n个子文件夹,每个文件夹是对应标签人的所有图片;
val: 包含n个子文件夹,每个文件夹只包含一张对应标签人的图片;
gallery: 查询库的图像,包含m个子文件夹;
query: 待查询的图像
Market-1501:
Market-1501 数据集在清华大学校园中采集,夏天拍摄,在 2015 年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。3368 张查询图像(query/probe)的行人检测矩形框是人工绘制的,而 测试库(gallery) 中的行人检测矩形框则是使用DPM检测器检测得到的。
DukeMTMC-reID:
该数据集采集来自8个不同的摄像头。并且提供了人工标注的bounding box。DukeMTMC-reID包含来自8个摄像机的1812个身份的36411张图像。训练集使用了702个身份的16,522张图像。测试集包含702个身份、2,228个查询图像(probe/query)和17,661个图库图像(gallery)。
CUHK03:
CUHK03包含1467个行人,收集自The Chinese University of Hong Kong校园内的10个(5对)不同的摄像头。常见的使用是将数据集分为包含 767 个行人的训练集和包含 700 个行人的测试集。