Fast R-CNN算法流程
- 对比与R-CNN其在第二步时并没有将所有的候选区域进行逐个的CNN特征提取,而是直接将整个图片进行一次CNN特征提取,让后再将候选区映射到feature map上。可想而知速度得到了提升。
- 这里的ROI pooling层缩放到7x7就是将候选区域对应的特征图在各个channel上,对横纵坐标进行均分,这样就得到了49个区域,再对每个区域进行maxpooling即得到了7x7的特征图。
分类器
-
经过全连接层后,直接采用softmax进行类别预测。
边界框回归器
- 经过全连接层后,进行边界框参数的回归。
具体如下图
损失函数
损失主要是分类损失和边界框回归损失,是两类损失的平衡参数 。
Fast R-CNN框架
总结:
相比于R-CNN其在对候选区域的特征提取部分进行了优化,并且将R-CNN中的类别预测边界框预测以及边界框预测调整进行了合并,提高了计算速度。