目录
- 1.R-CNN(区域卷积神经网络)2014
- 兴趣区域(RoI)池化层
- Fast RCNN 2015
- Faster R-CNN 2015
- Mask R-CNN 2017
- 总结
- 2. SSD(单发多框检测)2016
- SSD模型
- 总结
- 3.YOLO(你只看一次)快!很重要
- 4.目标检测算法性能对比
- 5.SSD代码实现 使用很少,比不上yolo
- 多尺度锚框实现
- SSD代码实现
- 训练模型
- 预测目标
1.R-CNN(区域卷积神经网络)2014
R-CNN首先从输入图像中选取若干(例如2000个)提议区域(如锚框也是一种选取方法),并标注它们的类别和边界框(如偏移量)。 然后,用卷积神经网络对每个提议区域进行前向传播以抽取其特征。 接下来,我们用每个提议区域的特征来预测类别和边界框。
R-CNN包括以下四个步骤:
- 对输入图像使用选择性搜索算法来选取多个高质量的提议区域。这些提议区域通常是在多个尺度下选取的,并具有不同的形状和大小。每个提议区域都将被标注类别和真实边界框;
- 选择一个预训练的卷积神经网络,并将其在输出层之前截断。将每个提议区域变形为网络需要的输入尺寸,并通过前向传播输出抽取的提议区域特征;
- 将每个提议区域的特征连同其标注的类别作为一个样本。训练多个支持向量机对目标分类,其中每个支持向量机用来判断样本是否属于某一个类别;
- 将每个提议区域的特征连同其标注的边界框作为一个样本,训练线性回归模型来预测真实边界框。
总结
- 使用启发式搜索算法来选择锚框
- 使用预训练模型来对锚框抽取特征
- 训练一个SVM来对类别分类
- 训练一个线性回归模型来预测边缘框偏移
兴趣区域(RoI)池化层
- 给定一个锚框&#