YOLOV5目标检测---labelimg图片标注工具(1)

请添加图片描述


前言:在使用YOLO训练自己模型的时候首先要学会对数据进行处理,这里介绍一个常用的本地打标签工具labelimg,如果不想按照的话也可以使用在线标签工具,因为害怕数据泄露,所以本人一直使用的是本地工具进行打标签。在线标注工具网站:https://www.makesense.ai/
在这里插入图片描述


目录结构

  • 1、labelimg标签工具介绍
  • 2、labelimg的安装
  • 3、如何使用labelimg工具
    • 3.1据准备
    • 3.2标注前设置
      • 3.2.1按钮设置
      • 3.2.2常见快捷键
    • 3.3开始标注

1、labelimg标签工具介绍

Labelimg是一款开源的数据标注工具,可以标注三种格式。

  1. VOC标签格式,保存为xml文件。
  2. yolo标签格式,保存为txt文件。
  3. createML标签格式,保存为json格式。

2、labelimg的安装

这里主要讲的是在window系统中的安装,首先打开cmd命令行(快捷键:win+R)。进入cmd命令行控制台。输入如下的命令:

pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

运行如上命令后,系统就会自动下载labelimg相关的依赖。由于这是一个很轻量的工具,所以下载起来很快,当出现如下红色下划线的时候,告诉我们成功安装的时候,说明labelimg安装成功了。
在这里插入图片描述

3、如何使用labelimg工具

3.1据准备

首先这里需要准备我们需要打标注的数据集。这里我建议新建一个名为img_data的文件夹(这个是约定俗成,不这么做也行),里面创建一个名为images的文件夹存放我们需要打标签的图片文件;再创建一个名为labels存放标注的标签文件;最后创建一个名为 classes.txt 的txt文件来存放所要标注的类别名称。
在这里插入图片描述

img_data的目录结构如下:
|—img_data
||──images 存放需要打标签的图片文件
||── labels 存放标注的标签文件
||── classes.txt 定义自己要标注的所有类别(这个文件可有可无,但是在我们定义类别比较多的时候,最好有这个创建一个这样的txt文件来存放类别)

3.2标注前设置

首先在images这个文件夹放置待标注的图片,这里是三类图片,分别是人、狗和猫。
在这里插入图片描述然后再classes.txt 这个txt文档里面输入定义的类别种类;如下图所示。
在这里插入图片描述
进入img_data文件夹当中,在搜索栏里面输入cmd打开终端命令(这一步非常重要,如果不是在这个路径下打开终端将不能利用txt文件中的类别);或者先打开cmd命令终端(快捷键:win+R),再使用cd命令进入到txt文本这个文件夹当中;
在这里插入图片描述
输入如下的命令打开labelimg。这个命令的意思是打开labelimg工具;打开images文件夹,初始化classes.txt里面定义的类。

labelimg images classes.txt

运行上面的命令就会打开这个labelimg工具如下:
在这里插入图片描述

3.2.1按钮设置

下面介绍图中的我们常用的按钮
在这里插入图片描述
点击View,会出现如下选项,尽量和我一样去勾选
在这里插入图片描述

  • Auto Save mode:切换到下一张图的时候,会自动保存标签
  • Display Labels:会显示标注框和标签
  • Advanced Mode:标注的十字架会一直悬浮在窗口

3.2.2常见快捷键

A:切换到上一张图片
D:切换到下一张图片
W:调出标注十字架
del :删除标注框框
Ctrl+u:选择标注的图片文件夹
Ctrl+r:选择标注好的label标签存在的文件夹

3.3开始标注

由于我们设置标注的十字架一直在标注界面上,这就不需要我们按快捷键w,然后选定我们需要标注的对象。按住鼠标左键拖出框框就可以了。如下图所示,当我们选定目标以后,就会加载出来classes.txt 定义自己要标注的所有类别(如果类别多,是真的很方便,就不需要自己手打每个类别的名字了)。打好的标签框框上会有该框框的类别。然后界面最右边会出现打好的类别标签。打好一张照片以后,快捷键D,就会进入下一张,这时候就会自动保存标签文件(voc格式会保存xml,yolo会保存txt格式)。
在这里插入图片描述
在这里插入图片描述
当一张图片上面又多个物体时可以打多个标注:
在这里插入图片描述
打完标签之后进入到labels文件夹当中,可以发现生成了多个txt文件
在这里插入图片描述
点击进去之后会发现生成一些数据文件,第一个0代表我们打标签的种类,第0类为person类,第1为dog类,后面的4个数据记录的是打标注的位置。
在这里插入图片描述
在这里插入图片描述
下篇文章介绍如何进行数据集格式转换和划分;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/648626.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

node.js漏洞总结

js开发的web应用和php/Java最大的区别就是js可以通过查看源代码的方式查看到编写的代码,但是php/Java的不能看到,也就是说js开发的web网页相当于可以进行白盒测试。 流行的js框架有: 1. AngularJS 2. React JS 3. Vue 4. jQuery 5. Backbone…

ppt作品展示能用二维码吗?文件二维码内容可替换怎么做?

当我们需要将自己的作品或者内容做成ppt文件之后,用二维码的方式来做展示,而且生成二维码还可以在图案不变的情况下,能够修改或者替换文件内容,实现二维码的长期使用。在遇到这种要求时,如何生成这种类型的二维码图片呢…

扫雷游戏——数组和函数实现

扫雷游戏的功能说明 使⽤控制台实现经典的扫雷游戏 游戏可以通过菜单实现继续玩或者退出游戏扫雷的棋盘是9*9的格⼦ 默认随机布置10个雷可以排查雷如果位置不是雷,就显⽰周围有⼏个雷如果位置是雷,就炸死游戏结束把除10个雷之外的所有⾮雷都找出来&…

CSS--样式穿透

样式穿透具体可分为css、less以及scss&#xff0c;语法不同&#xff0c;具体语法如下所示。 css样式穿透&#xff1a; <style scoped>父元素 >>> 子元素 {color: red;} </style> less样式穿透&#xff1a; <style lang"less" scoped>父…

HFSS实战(三)——过孔via TDR仿真

文章目录 一、模型的处理二、TDR仿真2.1 修改求解模式2.2增加求解设置 三、查看仿真结果3.1 查看TDR结果3.2 查看S参数结果 四、结果分析4.1上升时间tr对仿真的影响 附&#xff1a;工程链接 在上一讲中&#xff0c;主要是通过观察S参数确定via的优化是否达到目标。但S参数只能看…

k8s 安全机制

k8s的安全机制&#xff1a; 核心&#xff1a;分布式集群管理工具&#xff0c;就是容器编排&#xff0c;安全机制的核心&#xff1a;API server 作为整个集群内部通信的中介&#xff0c;也是外控控制的入口。实验的安全机制都是围绕api server来进行设计&#xff1a; 请求api资…

利用nginx宝塔免费防火墙实现禁止国外IP访问网站

本章教程&#xff0c;主要介绍&#xff0c;如何利用nginx宝塔面板中的插件免费防火墙&#xff0c;实现一键禁止国外IP访问网站。 目录 一、安装宝塔插件 二、 开启防火墙 一、安装宝塔插件 在宝塔面板中的软件商店&#xff0c;搜索防火墙关键词&#xff0c;找到Nginx免费防火…

myql入门

目录 安装修改密码学习资料个人git仓库文章视频官网 安装 #移除以前的mysql相关 sudo apt remove --purge mysql-\* #安装mysql sudo apt install mysql-server mysql-client #查看是否启动 systemctl status mysql #手动启动 systemctl start mysql #查看mysql版本 mysql --v…

(Unity)C#的预处理器指令和条件编译符号

C#的预处理器指令 预处理指令主要用于控制编译器的编译过程。它们在编译时被处理&#xff0c;而不是在运行时。这意味着预处理指令可以用来使编译器只编译满足特定条件的代码&#xff0c;或者在编译时输出特定的警告或错误。 #define&#xff1a;定义一个符号。#undef&#xff…

在线教育系统开发:构建现代化学习平台

随着科技的迅速发展&#xff0c;在线教育系统在教育领域扮演着越来越重要的角色。本文将深入探讨在线教育系统的开发过程&#xff0c;涉及关键技术和代码实现。 技术选型 在开始开发之前&#xff0c;我们首先需要选择适合在线教育系统的技术栈。以下是一些常见的技术选项&am…

常见的持久层框架包括

常见的持久层框架包括&#xff1a; Hibernate&#xff1a;Hibernate是Java的关系数据库持久化框架&#xff0c;通过对象关系映射&#xff08;ORM&#xff09;将对象和关系数据库进行映射。Hibernate提供了丰富的功能和灵活的查询语言&#xff0c;适用于复杂的数据模型和关系查询…

一些常用的数据备份脚本

Elasticsearch备份 #!/bin/shtodaydate %Y%m%dcurl --location --request PUT http://localhost:22063/_snapshot/es_bak --header Content-Type: application/json --data-raw {"type": "fs","settings":{"compress": true,"lo…

代码随想录算法训练营29期|day31 任务以及具体安排

理论基础 关于贪心算法&#xff0c;你该了解这些&#xff01; 题目分类大纲如下&#xff1a; #算法公开课 《代码随想录》算法视频公开课 (opens new window)&#xff1a;贪心算法理论基础&#xff01; (opens new window),相信结合视频再看本篇题解&#xff0c;更有助于大家…

tdesign的使用记录

1、复杂表单校验 复杂类型的数据&#xff08;两级数组&#xff09; const dataForm ref({configTalkTemplateProblemCoList: [{"id":"1744302859557920769","templateId":"1744302859511783426","parentId":null,"l…

大创项目推荐 题目:基于LSTM的预测算法 - 股票预测 天气预测 房价预测

文章目录 0 简介1 基于 Keras 用 LSTM 网络做时间序列预测2 长短记忆网络3 LSTM 网络结构和原理3.1 LSTM核心思想3.2 遗忘门3.3 输入门3.4 输出门 4 基于LSTM的天气预测4.1 数据集4.2 预测示例 5 基于LSTM的股票价格预测5.1 数据集5.2 实现代码 6 lstm 预测航空旅客数目数据集预…

IO多路复用-epoll

IO多路复用-epoll 1. 概述 epoll 全称 eventpoll&#xff0c;是 linux 内核实现IO多路转接/复用&#xff08;IO multiplexing&#xff09;的一个实现。 epoll是select和poll的升级版&#xff0c;相较于这两个前辈&#xff0c;epoll改进了工作方式&#xff0c;因此它更加高效…

P9389 [THUPC 2023 决赛] 烂柯杯 题解

目录 题目背景题目描述输入格式输出格式提示提示题目来源 题目思路AC 代码 题目背景 却说庞统迤逦前进&#xff0c;抬头见两山逼窄&#xff0c;树木丛杂&#xff1b;又值夏末秋初&#xff0c;枝叶茂盛。庞统心下甚疑&#xff0c;勒住马问&#xff1a;“此处是何地&#xff1f;…

问题解决:使用el-upload组件获取File文件,不需要文件上传,action为空会请求本地路径报404

可以自定义上传方法、覆盖默认的上传行为 主要是这个属性 :http-request"uploadFn" <template><span><el-uploadaction"#":on-preview"handlePreview":on-remove"handleRemove":before-remove"beforeRemove"…

WorkPlus AI智能客服解决方案,提升企业服务质量

在当今竞争激烈的商业环境中&#xff0c;提供卓越的客户服务成为企业赢得市场竞争的关键。而AI智能客服技术的不断发展&#xff0c;则成为了提高服务效率和满意度的利器。作为一款领先的AI助理解决方案&#xff0c;WorkPlus AI助理以其出色的性能和智能化的功能&#xff0c;助力…

代码随想录算法训练营打卡day1 |704. 二分查找,27. 移除元素

一、LeetCode 704 二分查找 题目链接&#xff1a;704.二分查找 解法一&#xff1a;左闭右闭 class Solution {public int search(int[] nums, int target) {int left 0, right nums.length-1;while(left < right){ //边界处理&#xff0c;左闭右闭int mid left (right-l…