DaSiamRPN网络的全称为Distractor-aware SiamRPN,是基于SiamRPN网络结构,提出更好的使用数据,针对跟踪过程的干扰物,利用更好的训练方式是跟踪更加的鲁棒。
DaSiamRPN认识到了现有的目标追踪数据集中存在的不平衡问题,即之前的目标追踪数据集会导致目标追踪算法的判别能力较差,造成这种现象的原因是,在目标周围的背景信息中,非语义背景(即真正的“背景”信息)占据了主要部分,语义背景(背景中的人、狗等实体)占据了极少一部分。这种不平衡的分布使得模型趋向于去学习到一个区分前景(目标+语义背景)和背景(非语义背景)的模型,而不是学习一个实例级别的表示方法。各种不同目标追踪算法的热图如下:
基于上面这个理论,为目标追踪算法添加了一些数据对,用于增强算法的判别能力,其中,Detection pairs:提出使用ImageNet Detection和COCO数据集,通过一些数据增强技术构造出样本对,这类样本对用于提高模型的泛化能力。其次,使用来自相同类别的负样本对。如下图中(b)。最后,使用来自不同类别的负样本对。如下图中(c)。添加这两类负样本可以使模型在超出视线、全遮挡的情况下,避免模型漂移到其他的目标上去。这两类样本对用于提高模型的判别能力。
当模型跟踪失败的时候,模型采取一种“局部-全局”增大search region的策略去重新跟踪目标。如下图所示(红色是ground truth,绿色的是跟踪结果,蓝色的是search region):
detection scores 指的是算法判定追踪质量的分数,
overlaps指的是ground truth与tracking box之间的IOU。至于如何判断模型何时跟踪失败,
由于论文中使用多种策略增强了模型的判别能力,所以可以使用模型的判别分数来估算是否跟丢.