SSD+caffe︱Single Shot MultiBox Detector 目标检测+fine-tuning(二)

承接上一篇SSD介绍:SSD+caffe︱Single Shot MultiBox Detector 目标检测(一)
如果自己要训练SSD模型呢,关键的就是LMDB格式生成,从官方教程weiliu89/caffe来看,寥寥几行code,但是前面的数据整理真实要了老命。
教程其实就是一种fine-tuning,在VGG基础上进行训练SSD框架。


一般SSD的数据来源,看到好多人都在用这款框架进行数据标注:BBox-Label-Tool 也有人在这基础上进行简单修改,详见博客:SSD框架训练自己的数据集 ,或者用OpenCV重写:深度学习ssd配置并在VGG模型上训练自己的数据
还有一些自己开发的小工具:图像标注VS2013项目

.


0 官方教程训练过程:

(1)下载VGGNet.caffemodel, fully convolutional reduced (atrous) VGGNet
(2)下载VOC2007 and VOC2012两个数据集,放在/caffe/data目录下
(3)创建LMDB文件:

./data/VOC0712/create_list.sh
./data/VOC0712/create_data.sh
  • 1
  • 2
  • 1
  • 2

(4)训练

python examples/ssd/ssd_pascal.py
  • 1
  • 1

以上是官方教程常规训练步骤,并不难。但是自己训练时候的数据处理,比较麻烦。

.


1 数据集准备与形成

1.1 所需准备文件介绍

其中训练所需的文件夹包括三大类:
这里写图片描述
dataset (数据集目录)

  • Annotations

    *.xml (标注的物体信息文件)

  • Images

    *.jpg (图片集)

  • ImageSets
    保存格式为文件名,不带扩展名
    训练集: train.txt
    训练验证集: trainval.txt
    测试集: test.txt
    验证集: val.txt

1.2 训练文件介绍

(1) create_list.sh:用于生成三类文件列表
- test_name_size:测试集图像大小
- test:测试集图像-标签一一对应
- trainval:训练集图像-标签一一对应

这是将数据集做成方便之后生成lmdb的路径信息文件,注意将其中的root_dir和第二个for循环中的变量改为自己的路径就好。
图像-标签一一对应:

Images/000112.png Labels/000112.xml
Images/001365.png Labels/001365.xml
  • 1
  • 2
  • 1
  • 2

同时注意名称的一致。

000800 1241 376
006206 1242 375
  • 1
  • 2
  • 1
  • 2

test_name_size里面,000800就是图片名称,1241*376就是图片尺寸,高 长

(2)create_data.sh:
生成LMDB文件,以上的create_list准备好之后即可

(3)labelmap_voc.prototxt:
目标检测的标签文件
该文件主要记录需要训练识别的n种对象的信息,第一类是background,是不变的,对于Pascal VOC数据集来说,需要识别20种对象,所以后面还有20个label。与传统的机器学习不太一样的是,以前需要输入正负样本,在caffe种,不管是faster rcnn还是ssd,都是只用对训练图像将识别对象的坐标信息标注即可,除了标注信息以外的部分都会当做background去处理。
.


2 数据集生成方案

训练的数据集三种方案:

  • 第一:保持原来的文件目录结构及文件名不变, 只替换里面的数据,通用。
  • 第二:重新新建一个与之前类似的目录结构,改成自己命名的文件夹,第二种方法,有一定的风险性,需要修改程序里涉及数据路径的代码。
  • 第三:txt格式数据变成LMDB,参考github:https://github.com/jinfagang/kitti-ssd
  • 第三种是直接用txt格式保存,就可以生成LMDB的办法,我觉得这个比较好,但是笔者最终没有实验成功…譬如:
class_index xmin ymin xmax ymax
  • 1
  • 1

第一种方案里面的一些小技巧:
(1)还有将txt变成xml格式的小工具:见博客将数据集做成VOC2007格式用于Faster-RCNN训练
(2)将BBox-Label-Tool下的txt格式保存的bounding box信息转换成VOC数据格式下以xml方式表示:,见博客:SSD框架训练自己的数据集
(3)将csv变成xml文件类型
luuuyi/umdfaces2VOC2007

2.1 训练流程

本节参考:SSD框架训练自己的数据集
- 第一步:create_list.sh:生成test_name_size.txt、test.txt、trainval.txt
- 第二步:修改labelmap_voc.prototxt,标签文件,同时需要注意标签文件必须多一个background的标签,作为编号0
- 第三步:create_data.sh:生成LMDB
- 第四步:修改ssd_pascal.py:

主要修改点:(1)train_data和test_data修改成指向自己的数据集LMDBtrain_data = "examples/indoor/indoor_trainval_lmdb"test_data = "examples/indoor/indoor_test_lmdb"2) num_test_image该变量修改成自己数据集中测试数据的数量
(3)num_classes 该变量修改成自己数据集中 标签类别数量数 + 1
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 第五步训练:
    python examples/ssd/ssd_pascal.py

2.2 训练脚本内容存储

会在相应的路径下生成jobs文件夹,其中包含了这一次训练的脚本文件,并且会记录caffe执行只一次训练的日志信息。
参考:Ubuntu上用caffe的SSD方法训练Pascal VOC数据集

jobs文件夹下有:
.log文件:运行记录,时间,迭代次数等信息;
.caffemodel文件,权重文件
deploy.prototxt、train_val.prototxt等
.


参考:
深度学习ssd配置并在VGG模型上训练自己的数据
SSD 安装、训练
Ubuntu上用caffe的SSD方法训练umdfaces数据集
重点参考:
使用faster rcnn训练umdfaces数据集
将数据集做成VOC2007格式用于Faster-RCNN训练
Caffe-SSD 训练自己的数据集教程

SSD框架训练自己的数据集

.


报错一:

cudasucess(10vs0)
  • 1
  • 1

解决:修改pythonssd_pascal.py文件gpus=’0,1,2,3’,如果有一块GPU,则删除123,有两块则删除23

.

延伸一:大致的运算效率

K80-单GPU-一天可以迭代1w+次
6天将近7w次
每1w次迭代之后会计算一个mAP
(数据来源:Ubuntu上用caffe的SSD方法训练umdfaces数据集)

TX.P,笔者自己训练,大概的运算效率是5千/小时(运行官方教程时)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/510301.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sdut 双向队列(STL)

deque<ll>q;//定义一个双向队列q&#xff0c;类型为long long q.push_front(a);//将a从队首插入队列 q.push_back(a);//将a从队尾插入队列 q.pop_front();//队首弹掉一个元素 q.pop_back();//队尾弹出一个元素 aq.front();//返回队首元素 aq.back();//返回队尾元素 aq.si…

pip install scikit-image on windows 失败 解决方案

到官网下载包 http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-image 我们下载 scikit_image‑0.13.0‑cp35‑cp35m‑win_amd64.whl 也可到我的CNDS下载 安装时会出现一下错误 scikit_image-0.13.0-cp34-none-win_amd64.whl is not a supported wheel on this platform…

Caffe训练源码基本流程

苏的专栏 致力于学习计算机视觉、模式识别、机器学习、深度学习相关技术&#xff1a;&#xff1a;&#xff1a;&#xff1a;希望结识更多同道中人。 QQ&#xff1a;2816568984 微信&#xff1a;Suc1011 目录视图 摘要视图 订阅 【活动】2017 CSDN博客专栏评选 【评论送书】…

ubuntu16.04下安装opencv3.2版本

1、下载OpenCV的源码 OpenCV官网上有linux版本的源码包可以下载&#xff0c;不过最好是从git上下载&#xff0c;这样可以保证下载得到的是最新的代码&#xff1a;1 wget -O opencv.zip https://github.com/Itseez/opencv/archive/3.2.0.zip 2 unzip opencv.zip 2、编译安装…

windows 静态IP设置

1.打开cmd&#xff0c;输入ipconfig 记录 IP address 子网掩码 网关 打开 wlan 属性 选中一个网络右键 “属性” 设置 ipv4&#xff0c;选择“使用下面的IP地址” 对应填写 ip地址 子网掩码 网关 tips&#xff1a;DNS建议和网关一样

window 远程linux

1.我们需要在Linux安装ssh服务 sudo apt-get install openssh-server 2.然后开启ssh服务 sudo /etc/init.d/ssh start 3.在window上安装PUTTY 下载网址 4.填写Linux ip 查看ip: 在Linux输入&#xff1a;ifconfig 5.然后填写登陆Linux的账户名和密码 大功告成。。。。。…

赫夫曼编码长度计算问题?

例题&#xff1a;一组字符(a,b,c,d)在文中出现的次数分别为(7,6,3,5),字符&#xff07;d&#xff07;的哈夫曼编码的长度为&#xff1f; 题解&#xff1a; 首先构造huffman树 每一步都将所有数字排序 方法如下: 1: 3 5 6 7 2: 6 7 8 / \ 3 5 3: 8 13 / \ / \ 3 5 6 7 4: 21 /…

windows + cmake + vs2019 编程

1.安装minGW64 2.安装cmake 3.安装vs2019 4.组建代码文件结构&#xff1a; 5.在build 文件下打开git bash&#xff0c;执行一下指令 cmake .. -G"Visual Studio 16 2019" tips( vs2017 对应 cmake .. -G"Visual Studio 15 2017" ) cmake 模板…

所感

记住别太善良了&#xff0c;别太大方了&#xff0c;也别太能干了&#xff0c;时间久了人家会觉得&#xff0c;你做的一切都是应该的。即使有一天你撑不住&#xff0c;哭了累了&#xff0c;也没人心疼你。 因为在他们眼里这都是你愿意的。有时候心眼也别太好了不要什么事都为别人…

享受孤独

今天看见网易云音乐一个 有趣的活动。。。突发其感参与了评论“孤独”这个话题&#xff1a;

使自己的注意力集中方法

英国Kent大学最近有一篇文章对注意力做出了详尽的分析&#xff0c;关于如何保持专心养成好习惯的&#xff0c;其中包括了如下几点建议&#xff1a; 养成好习惯&#xff1a;养成在固定时间、固定地点专心学习工作的好习惯。如果可能&#xff0c;在进入学习或者工作状态前做一些小…

PCL “(”:“::”右边的非法标记 和 E2512 功能测试宏的参数必须是简单标识符

PCL “(”:“::”右边的非法标记 解决方法&#xff1a; 项目属性 ——> C/C ——> 预处理器 ——> 预处理器定义 (此处添加预定义编译开关 NOMINMAX&#xff09; E2512 功能测试宏的参数必须是简单标识符 解决方法&#xff1a; 将SDL 设置为否。

普通本科生应该坚持ACM吗?知乎

这是本人当初学ACM有疑惑从知乎看见这一篇文章&#xff0c;从中解决了自己的疑惑&#xff0c;虽然是粘贴复制&#xff0c;但是我觉得我们可以从里面找出自己想要的答案&#xff01; 非211一本学校&#xff0c;软件工程专业。学校搞ACM的水平不高&#xff0c;最好的大概就是区域…

解决虚拟机打开不了?提示VMware Workstation cannot connect to the virtual machine的问题

解决方法&#xff1a; 从提示消息我们可以看到&#xff0c;问题在于VMware授权服务没有开启&#xff0c;具体处理方法如下&#xff1a; No1. "This PC&#xff08;我的电脑&#xff09;"---右键"manage&#xff08;管理&#xff09;"---"Service and…

Redis-3.2.4服务搭建

1.下载安装包并解压 全部版本地址&#xff1a;http://download.redis.io/releases 安装包下载&#xff1a; http://download.redis.io/releases/redis-3.2.4.tar.gz 我们这里使用3.2.4 2.编译安装 cd redis-3.2.4 make && make install 可能异常&#xff1a;&…

Android Fragment 真正的完全解析(上)

转载请标明出处&#xff1a;http://blog.csdn.net/lmj623565791/article/details/37970961 自从Fragment出现&#xff0c;曾经有段时间&#xff0c;感觉大家谈什么都能跟Fragment谈上关系&#xff0c;做什么都要问下Fragment能实现不~~~哈哈&#xff0c;是不是有点过~~~ 本篇博…

Hbase Import导入数据异常处理-RetriesExhaustedWithDetailsException

CDH显示 问题导致原因&#xff1a; hbase org.apache.hadoop.hbase.mapreduce.Import -Dmapred.job.queue.nameetl crawl:wechat_biz /hbase/test4 执行import时&#xff0c;短时间内写入数据量过大导致写入异常。 18/09/11 09:44:27 INFO mapreduce.Job: Task Id : attempt_…

Android RecyclerView 使用完全解析 体验艺术般的控件

转载请标明出处&#xff1a; http://blog.csdn.net/lmj623565791/article/details/45059587&#xff1b; 本文出自:【张鸿洋的博客】 概述 RecyclerView出现已经有一段时间了&#xff0c;相信大家肯定不陌生了&#xff0c;大家可以通过导入support-v7对其进行使用。 据官方的…

三维刚体变换

1.旋转向量&#xff1a; 满足以下关系 (E单位阵) 进一步得到&#xff1a; p经过旋转和平移得到,公式表达如下&#xff1a; ;(t平移矩阵) 我们可以将上面的式子写成齐次&#xff1a; T也成为变换举证&#xff08;transform Matrix&#xff09; 它的反变换可以表示如下&am…

远程桌面管理工具

链接&#xff1a;https://pan.baidu.com/s/1K_AMitnmpYQkRWSBq9HhVA 提取码&#xff1a;d9eo