错误正样本(False Positive,FP):整个视频中被预测为正的负样本数。
错误负样本(False Negatives,FN):整个视频中被预测为负的正样本数。
IDs:跟踪过程中目标ID切换总数。
基于这3个基础性指标,构建最常用的多目标跟踪准确度(Multiple Object Ttacking Accuracy,MOTA)和多目标跟踪精度(Multiple Object Ttacking Precision,MOTP)如式(1)和(2)所示:
其中,GT是所有真实值的数目, d t,i 和 c t 分别表示匹配对之间的距离度量和第 t 帧匹配成功的检测框数目。
MOTA基于FN、FP、IDs综合判定跟踪错误次数,体现跟踪算法的准确度,而MOTP则更偏向于检测器,主要根据目标预测框和真实值的边界框重叠度计算跟踪精度。