摘要
https://arxiv.org/pdf/2012.15685v2.pdf
单图像人群计数是一个具有挑战性的计算机视觉问题,在公共安全、城市规划、交通管理等领域有着广泛的应用。近年来,随着深度学习技术的发展,人群计数引起了广泛的关注并取得了巨大的成功。通过系统地回顾和总结2015年以来基于深度学习的人群计数技术的200多篇工作,全面总结了该领域的最新进展。本文的目标是对最近的方法进行最新的回顾,并在该领域教育新的研究人员设计原则和权衡。在介绍了公开的数据集和评估指标后,回顾了最近的进展,对人群计数的三个主要设计模块进行了详细的比较:深度神经网络设计、损失函数和监督信号。使用公开数据集和评估指标对这些方法进行了研究和比较。最后,我们提出了一些未来的方向。
1、简介
单图像人群计数是对无约束场景的图像(即对场景没有任何限制的图像)中物体(人、汽车、细胞等)的数量进行估计。近年来,人群计数因其在公共安全、交通管理、消费者行为、细胞计数等方面的重要应用而受到广泛关注[131,73,12]。在这项调查中,我们主要关注人群,尽管讨论的技术可以扩展到其他领域。
由于人群计数的重要性,人们在该领域开展了广泛的研究,特别是深度学习的使用,在各种应用中表现出优越的性能,如计算机视觉[50,117,118],图像分类[69],多维时间序列[5]。近年来,深度学习在单幅图像人群计数方面取得了成功,大规模公开基准[60,185]。这可能是由于其数据驱动特性[228,80]和基于深度学习的方法从原始数据[103,148]中自我学习的能力。本文主要讨论最近先进的基于深度学习的