本文介绍了人脸相关算法的数据集。
1.人脸数据集详情
1.1.Labeled Faces in the Wild (LFW)
论文
下载地址:LFW Face Database : Main (umass.edu)
是目前人脸识别的常用测试集,其中提供的人脸图片均来源于生活中的自然场景,因此识别难度会增大,尤其由于多姿态、光照、表情、年龄、遮挡等因素影响导致即使同一人的照片差别也很大。并且有些照片中可能不止一个人脸出现,对这些多人脸图像仅选择中心坐标的人脸作为目标,其他区域的视为背景干扰。
LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。
每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。
1.2.Cross age LFW (CA-LFW)
论文:Cross-age lfw: A database for studying cross-age face recognition in unconstrained environments 1708.08197v1 (arxiv.org)
下载地址:Cross-Age LFW (CALFW) Database (whdeng.cn)
数据集构建了一个跨年龄 LFW (CALFW),它故意搜索和选择 3,000 对具有年龄差距的正面面孔对,以添加衰老过程的类内方差。 还选择性别和种族相同的负对,以减少正负对之间属性差异的影响。
1.3.CrossPose LFW (CP-LFW)
论文:Cross-pose lfw: A database for studying cross-pose face recognition in unconstrained environments
下载地址:1708.08197v1 (arxiv.org)
CPLFW是通过众包努力收集的,目的是在互联网上寻找LFW中姿势差异尽可能大的人的照片。 与LFW相比,CPLFW中的正对包含明显的姿态差异。每个人至少有2张照片!
1.4.Celebrities in Frontal-Profile in the Wild
论文:Frontal to Profile Face Verification in the Wild paper.pdf (cfpw.io)
下载地址:CFPW dataset (kaggle.com)
1.5.AgeDB
论文:AgeDB: The First Manually Collected, In-the-Wild Age Database agedb.pdf (ic.ac.uk)
下载地址:i·bug - resources - AgeDB (ic.ac.uk)
数据集共有16488张图像
可视化数据处理过程
1.6.IARPA Janus Benchmark-B (IJB-B)
论文:IARPA Janus Benchmark-B Face Dataset
下载地址:Face Challenges | NIST
IJB-B 数据集是一个基于模板的人脸数据集,包含 1845 个主题、11,754 张图像、55,025 帧和 7,011 个视频,其中模板由来自不同来源的不同数量的静止图像和视频帧组成。这些图像和视频是从互联网上收集的,完全不受限制,在姿势、照明、图像质量等方面差异很大。此外,该数据集还附带了基于模板的 1 对 1 人脸验证、基于模板的 1 对 N 开放集人脸识别和 1 对 N 开放集视频人脸识别的协议。
1.7.IARPA Janus Benchmark-C (IJB-C)
论文:IARPA Janus Benchmark – C: Face Dataset and Protocol ∗ icb2018.pdf (noblis.org)
下载地址:Face Challenges | NIST
IJB-C数据集是一个基于视频的人脸识别数据集。它是 IJB-A 数据集的扩展,包含约 138,000 张人脸图像、11,000 张人脸视频和 10,000 张非人脸图像。
2.数据集的对比
数据集收集年份及数量,类型的简单对比