主要参考文章:1,从编程实现角度学习Faster R-CNN(附极简实现)
经常是做到一半发现收敛情况不理想,然后又回去看看这篇文章的细节。
另外两篇:
2,Faster R-CNN学习总结 这个主要是解释了18, 36是怎么算的
3,目标检测中region proposal的作用?
主要研究了两个版本的 pytorch 代码,第一篇文章作者的实现,以及其提及的最简实现
两个实现我都深入看了并且修改了。
Faster R-CNN是两阶段检测:rpn + fast rcnn。rpn最前面是个feature_extractor,可以自己选择用哪一个。
rpn在voc2007训练集的2501个样本上跑了40个epoch,cls loss到大概0.10,reg loss到0.05的样子,
和陈云那个误差图在四五十epoch的时候误差基本上是一样的,我就当它收敛了。
反正就是要提取图片的特征,最后我用了squeezeNet 1.0,也还是能收敛的。
2018年3月12日11:04:28
两个用于学习Faster R-CNN的例子:
https://github.com/necroen/examples