目标检测算法:FPN思想解读
说明
FPN算法一种方法/思想,在许多的模型架构中都经常采用,也是提高模型精度的重要方法。
免责申明
有误写/错写/错误观点/错误解读,或者大家有其它见解,都可以在评论区指出,博主会认真学习的。
原始论文下载链接
FPN。
目录结构
文章目录
- 目标检测算法:FPN思想解读
- 1. 创新点
- 2. 原理
- 2.1 思路来源
- 2.2 原理
- 3. 总结
1. 创新点
多尺度交叉融合。
2. 原理
2.1 思路来源
在以往的经验中发现,浅层特征图:语义信息少,但是几何信息多;而深层特征图:语义信息多,但是几何信息少。
针对这一情况,作者考虑将浅层特征与深层特征进行交叉融合,去探索是否可以提高模型的精度。
2.2 原理
概述
在论文原文中,作者给出了原理图,如下:
其中:
- 图a是先图像金字塔,再分别进行预测
- 其优点是精度高,缺点是计算开销大
- 图b是正常的卷积操作
- 其优点是速度快,但是只关注了最后一层的卷积信息
- 图c是利用每一层的卷积特征进行预测
- 其优点是利用了多层信息,但是并没有很好的利用的各个卷积层信息
- 图d是FPN采用的操作,将不同卷积层进行交叉融合
这里,值得一提的是:FPN采用的融合方式是深层卷积给浅层卷积,并没有考虑到把浅层卷积给深层卷积融合,而在后面的论文有一篇名为PAN,它就是都考虑了。
FPN
作者在论文中给出了FPN的具体操作图,如下:
FPN融合的思路是:先拷贝最深层的特征层,然后将浅层的卷积经历一个1*1卷积改变通道数以实现可以深层卷积合并的目的,同时需要对深层卷积进行上采样,这样才能实现尺寸相同。
3. 总结
FPN思路很简单,但是效果非常好,特别是在目标检测领域中经常使用。