faster rcnn在自己的数据集上训练

本文是一个总结,参考了网上的众多资料,汇集而成,以供自己后续参考。

一般说来,训练自己的数据,有两种方法:第一种就是将自己的数据集完全改造成VOC2007的形式,然后放到py-faster-rcnn/data 目录下,然后相应地改变相应模型的参数,比如种类等。 data目录下存放的数据如下:

VOCdevkit2007└── VOC2007├── Annotations│   └── *.xml│├── ImageSets│   └── Main│       ├── train.txt│       └── test.txt└── JPEGImages└── *.jpg
这样做最省事。


第二种,基本上也是改造成VOC2007的形式,然后放到py-faster-rcnn/data 目录下,但是允许Annotations不按照xml的形式。可以是自己的形式

YOUR_DATASET_devkit└── data├── Annotations│   └── *.txt│├── ImageSets│       ├── train.txt│       └── test.txt└── JPEGImages└── *.jpg or *.png

关于第二种,可以参考如下文章:

1. deboc/py-faster-rcnn  这个代码是py-faster rcnn的拷贝,实现了二分类模型。里面的data组织如下:

INRIA_Person_devkit/
|-- data/|-- Annotations/|-- *.txt (Annotation files)|-- Images/|-- *.png (Image files)|-- ImageSets/|-- train.txt
按照教程: https://github.com/deboc/py-faster-rcnn/blob/master/help/Readme.md 可以训练行人检测。

另外《Fast RCNN 训练自己数据集 (2修改数据读取接口)》 也实现了自己的数据读取。


下面重点说一下第一种。

具体的细节可以参考: http://blog.csdn.net/Gavin__Zhou/article/details/52052915

需要注意的是 根据文章<解决faster-rcnn中训练时assert(boxes[:,2]>=boxes[:,0]).all()的问题>   我们对lib/datasets/imdb.py,append_flipped_images()函数修改如下:

 def append_flipped_images(self):num_images = self.num_imageswidths = self._get_widths()for i in xrange(num_images):boxes = self.roidb[i]['boxes'].copy()oldx1 = boxes[:, 0].copy()oldx2 = boxes[:, 2].copy()boxes[:, 0] = widths[i] - oldx2 - 1boxes[:, 2] = widths[i] - oldx1 - 1for b in range(len(boxes)):if boxes[b][2]< boxes[b][0]:boxes[b][0] = 0assert (boxes[:, 2] >= boxes[:, 0]).all()entry = {'boxes' : boxes,'gt_overlaps' : self.roidb[i]['gt_overlaps'],'gt_classes' : self.roidb[i]['gt_classes'],'flipped' : True}self.roidb.append(entry)self._image_index = self._image_index * 2


我们说一说其他的,

  • 关于数据标注:  强烈推荐工具:labelImg :https://github.com/tzutalin/labelImg 这是个图形化界面操作,可以很方便地标注boundingbox,且生成xml格式。
  • VOC2007数据集地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/
  • 图片重命名像VOC2007那样: http://blog.csdn.net/sinat_30071459/article/details/50723212  
  • 根据XML文件生成test.txt(测试集),train.txt(训练集),val.txt(验证集),trainval.txt(训练和验证集),trainval大概是整个数据集的50%,test也大概是整个数据集的50%;train大概是trainval的50%,val大概是trainval的50%。将这四个txt放在ImageSets\Main中,参考:http://blog.csdn.net/sinat_30071459/article/details/50723212  
  • 另外你不想手动地更改那些参数,可以使用这个:https://github.com/Microos/py-faster-rcnn-data-interface-generator

其他参考文档:

1. 使用Faster-Rcnn进行目标检测(实践篇)

2. Faster rcnn 安装、训练、测试、调试

3. matlab训练样本集的制作

4.  制作自己的数据集用于faster-rcnn训练

5. 将数据集做成VOC2007格式用于Faster-RCNN训练   (很重要)

6. Faster-RCNN+ZF用自己的数据集训练模型(Python版本)

7. Training'R CNNs'of'various'velocities    训练faster rcnn的官方文档1

8. 训练faster rcnn的官方文档2

9. Faster-RCNN+ZF用自己的数据集训练模型(Matlab版本)

10. Py-faster-rcnn实现自己的数据train和demo  (很重要)


















本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/258627.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1001种玩法 | 1001种玩法--数据存储(2)

新智云www.enncloud.cn第二趴 Flockdb&#xff1a;一个高容错的分布式图形数据库 FlockDB是一个存储图数据的分布式数据库&#xff0c;图数据库的存储对象是数学概念图论里面的图&#xff0c;而非图片。Twitter使用它来存储人与人之间的关系图&#xff0c;这些关系包括&#xf…

python逻辑量有什么_Python中的逻辑运算符有什么?

逻辑运算符用于组合多个条件测试语句。假设“我今年18岁”和“我身高2米”这两个语句&#xff0c;前一个语句是真的&#xff0c;后一个语句是假的&#xff0c;因此&#xff0c;“我今年18岁&#xff0c;并且我身高2米”这个语句是假的。其中&#xff0c;“并且”可以认为是逻辑…

时区日期处理及定时 (NSDate,NSCalendar,NSTimer,NSTimeZone)

NSDate存储的是世界标准时(UTC)&#xff0c;输出时需要根据时区转换为本地时间 Dates NSDate类提供了创建date&#xff0c;比较date以及计算两个date之间间隔的功能。Date对象是不可改变的。 如果你要创建date对象并表示当前日期&#xff0c;你可以alloc一个NSDate对象并调用in…

Android ListView分页,动态添加数据

1.ListView分页的实现&#xff0c;重点在于实现OnScrollListener接口&#xff0c;判断滑动到最后一项时&#xff0c;是否还有数据可以加载&#xff0c; 我们可以利用listView.addFootView(View v)方法进行提示 自定义一个ListView&#xff08;这里本来想进行一些自定已修改的。…

faster rcnn的测试

当训练结束后&#xff0c;faster rcnn的模型保存在在py-faster-rcnn/output目录下&#xff0c;这时就可以用已有的模型对新的数据进行测试。 下面简要说一下测试流程。 测试的主要代码是./tools/test_net.py&#xff0c;并且使用到了fast_rcnn中test.py。 主要流程就是&…

python重点知识 钻石_python——子类对象如何访问父类的同名方法

1. 为什么只说方法不说属性关于“子类对象如何访问父类的同名属性“是没有意义的。因为父类的属性子类都有&#xff0c;子类还有父类没有的属性&#xff0c;在初始化时&#xff0c;给子类对象具体化所有的给定属性&#xff0c;完全没必要访问父类的属性&#xff0c;因为是一样的…

Android-Universal-Image-Loader 的使用说明

这个图片异步载入并缓存的类已经被非常多开发人员所使用&#xff0c;是最经常使用的几个开源库之中的一个&#xff0c;主流的应用&#xff0c;随便反编译几个火的项目&#xff0c;都能够见到它的身影。但是有的人并不知道怎样去使用这库怎样进行配置&#xff0c;网上查到的信息…

faster rcnn end2end 训练与测试

除了前面讲过的rpn与fast rcnn交替训练外&#xff0c;faster rcnn还提供了一种近乎联合的训练&#xff0c;姑且称为end2end训练。 根据论文所讲&#xff0c;end2end的训练一气呵成&#xff0c;对于前向传播&#xff0c;rpn可以作为预设的网络提供proposal.而在后向传播中&…

jquery ui动态切换主题的一种实现方式

这两天看coreservlets上的jQuery教程&#xff0c;虽然比较老了&#xff0c;不过讲得还是不错。最后一部分讲jQuery ui 主题切换&#xff0c;用他介绍的方法实现不了。于是自己修改了下&#xff0c;可以了。代码如下&#xff1a;html部分&#xff1a;<fieldset class"ui…

[学习总结]7、Android AsyncTask完全解析,带你从源码的角度彻底理解

我们都知道&#xff0c;Android UI是线程不安全的&#xff0c;如果想要在子线程里进行UI操作&#xff0c;就需要借助Android的异步消息处理机制。之前我也写过了一篇文章从源码层面分析了Android的异步消息处理机制&#xff0c;感兴趣的朋友可以参考 Android Handler、Message完…

python字频统计软件_python结巴分词以及词频统计实例

python结巴分词以及词频统计实例发布时间&#xff1a;2018-03-20 14:52,浏览次数&#xff1a;773, 标签&#xff1a;python# codingutf-8Created on 2018年3月19日author: chenkai结巴分词支持三种分词模式&#xff1a;精确模式: 试图将句子最精确地切开&#xff0c;适合文…

html从入门到卖电脑(三)

CSS3中和动画有关的属性有三个 transform、 transition 和 animation。下面来一一说明: transform 从字面来看transform的释义为改变&#xff0c;使…变形&#xff1b;转换 。这里我们就可以理解为变形。那都能怎么变呢&#xff1f; none 表示不进行变换&#xff1b; rotat…

visual studio 2015安装 无法启动程序,因为计算机丢失D3DCOMPILER_47.dll 的解决方法

对于题目中的解决方法&#xff0c;我查到了微软提供的一个方案&#xff1a;https://support.microsoft.com/en-us/help/4019990/update-for-the-d3dcompiler-47-dll-component-on-windows 进入如下页面&#xff1a;http://www.catalog.update.microsoft.com/Search.aspx?qKB4…

UI1_UIView层操作

// // ViewController.m // UI1_UIView层操作 // // Created by zhangxueming on 15/7/1. // Copyright (c) 2015年 zhangxueming. All rights reserved. //#import "ViewController.h"interface ViewController ()endimplementation ViewController- (void)view…

JavaScript Patterns 1 Introduction

1.1 Pattern "theme of recurring events or objects… it can be a template or model which can be used to generate things" (http://en.wikipedia.org/wiki/Pattern). • Design patterns - Elements of Reusable Object-Oriented Software. • Coding patte…

基于像素聚类的分割方法基于slic的方法_博士论文摘要 | 张荣春:数码影像与TLS点云数据融合提取地质结构面方法研究...

《测绘学报》构建与学术的桥梁 拉近与权威的距离数码影像与TLS点云数据融合提取地质结构面方法研究张荣春1,21.南京邮电大学地理与生物信息学院, 江苏 南京 210023;2.河海大学地球科学与工程学院, 江苏 南京 211100收稿日期&#xff1a;2019-03-27基金项目&#xff1a;国家自然…

制作IOS 后台极光推送时,遇到的小问题

推送广义上分为两种&#xff0c; 一种是 程序在前台的时候&#xff0c;不想在任务栏里面显示通知&#xff0c;直接在app中进行某种操作。这个叫做自定义消息。这个是在前台时&#xff0c;app与极光后台建立了一个长链接。 另一种是 程序处于前、后台 或者杀死状态的时候&…

Visual Studio 2008 环境变量的配置(参考设置VS2010)

本文转载自&#xff1a;http://blog.csdn.net/tracyliang223/article/details/21539361COPY FROM&#xff1a;http://www.cnblogs.com/waterlin/archive/2011/10/31/2230341.html 在调试 Visual Studio 2008 程序时&#xff0c;经常有一些动态链接库&#xff08;即 dll 文件&am…

Linq 中 Any与All

昨天突然看到之前写的一个积累文档&#xff0c;其中文档中有一个Linq Any和All的注意事项&#xff1a;注意Any 和 All var list new List<int>(); var aa list.All(n > n > 1); var bb list.Any(n > n > 1); // aa: true bb: false其中List是一个元…

jaxb转xml空值双标签_单品运营思维:标签-词路-聚焦-直搜-超直

非标品标签思维&#xff1a;针对非标品 主要是2.0为主的打法根据搜索入池的关键词&#xff0c;有什么词做什么词。有个细节&#xff1a;不一定进什么词做什么词&#xff0c;这个维度当中加入3.0的思维3.0入手 转2.0再切3.0(检测词路健康度&#xff0c;非严格意义估算单量)举例&…