经常可以看到各个论文发出来,加入的各种trick。这些改进点,一般都是在前人的基础上,进行了一些修改。比如FPN到PANet的改进,就是为了改进前者存在的一些问题。
这里就把这些trick,给汇集到一起,看看他们的发展历史,看看他们之间有什么区别,又是在哪些地方做的改进。这些改进很多都是具有替代性质的,更加优秀的存在。
一、FPN(feature pyramid nerwork, 特征金字塔网络)
FPN结构绘制,和细节介绍
- 跨层连接里面的结构细节
- 上采样采用的是什么方法?还有哪些方法能过实现同样的功能?
- 上采样会出现模糊现象,怎么处理
论文地址:Feature Pyramid Networks for Object Detection
- step1:首先对每一个特征层得到的特征图进行一个
1x1卷积
操作,为了让每个特征图在进行融合的使用保持通道(channel)数一致。 - step2:将高层次的特征图进行一次
2倍上采样
,让相邻的两个特征图可以进行融和(上采样方式采用邻近插值算法) - step3,将融和后的特征图通过
3x3卷积
进一步融合(这一步上