一.锚框(anchor box)概述
1.1什么是锚框
锚框就是一种进行预测的像素框,通过遍历输入图像上所有可能的像素框,然后选出正确的目标框,并对位置和大小进行调整就可以完成目标检测任务。
对于yolo锚框的建设须基于实际的考量,不可能按照图片输入448x448的规模去设置锚框(那个数量级太大了),所以yolo的锚框原则是先通过对输入图片进行下采样得到SxS的特征图,设置n个尺寸的先验框,这样得到的总先验锚框数就是SxSxn个
最后,再根据IOU(并交比,详见:YOLO拓展-NMS算法-CSDN博客)选出目标框
1.2相关参数大小
尺度:描述基准锚框的大小信息。若尺度为x,那么基准锚框由原图的宽和高分别都缩小x倍所得。 宽高比:生成锚框的形状信息,即最终生成锚框的宽和长的比。在改变宽高比时,应维持最终生成的锚框和基准锚框的面积恒定。
1.3 yolov2的改进
根据上述公式yolov2进行了一点改变:预测边界框中心点相对于该网格左上角坐标( C x , C y )的相对偏移量,将bounding box的中心点约束在当前网格中.
再把每个锚框都放入20个类别的特征,就可以实现多物体识别。