yolo8 目标检测、鉴黄

省流 看前必读 别浪费时间 :本文只是一个记录,防止自己下次被改需求时浪费时间,在这里就随意的写了一下文章记录整个步骤,但是文章想必肯定没有对应的教程讲的详细,该文章只适合想要快速按照步骤完成一个简单的 demo 的同学,并不适合想完全掌握 yolo 的同学。

一、安装环境

前言预览:

  • 环境的安装分为 anacondapytorchultralytics
  • pytorch安装需要注意自己的显卡版本选择对应的,30、40 系显卡要装 cuda 11版本,16 系显卡安装cuda 102版本(本文没有进行说明,可以搜搜找到适合自己显卡的版本,若是40系显卡跟着我步骤就ok)
  • 注意python版本不在3.8-3.11之间则会报错(以下会有一个解决办法)

1.1 anaconda

在此建议使用Anaconda,不然本地环境配了还要换,贼麻烦,Anaconda真香,我以前是懒得用的,结果现在真香。

首先安装 Anaconda,安装完毕后直接打开,简单吧,咱们 winer 就是喜欢可视化,low 也认了,我懒。

打开后如下,然后找到 create 创建当前项目的环境:
在这里插入图片描述
给予python对应版本号,记得有些版本不支持,我忘记了,就按照这个来吧,你可以自己搜一下会比较清楚:
在这里插入图片描述

1.2 pytorch

接着开始装 pytorch,地址:https://pytorch.org/get-started/locally/

截图如下:

在这里插入图片描述

安装一些老版本会比较兼容稳定,不然太新会寄,这个我就不过多解释了,做开发的都懂:

在这里插入图片描述

对了,这里对你的显卡啥的有版本要求,找到适合你的,我是 4060 ti ,选择了适合的版本(你可以搜,我忘记了,这篇文章就是临时做了一个小项目,顺手做个笔记,防止下次叫我改需求啥啥啥的):
这里我选择的是 cuda 11.8:
https://pytorch.org/get-started/previous-versions/

在这里插入图片描述

接着通过 conda 打开你的命令提示窗,就是 open Terminal:

在这里插入图片描述

输入以下命令:

conda install pytorch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 pytorch-cuda=11.8 -c pytorch -c nvidia

复制命令,enter执行:

在这里插入图片描述
在这里插入图片描述

1.2 ultralytics

yyyyy… 后,然后安装 ultralytics:

pip install ultralytics

注意,在这几步注意你的网络,你是否设置了全局镜像源,不清楚的就切换网络试试,说不定就成了。

随后到 github 的 ultralytics 中下载那个文件,我这里直接下载了压缩包:

进入 ultralytics 解压后的文件夹 -e. 安装,注意,使用 cd 进入目录,不会的搜搜 cd 命令是干啥的用的,就是 cd 后面一个目录就进去了,进不去注意切换盘符,例如默认C盘,你进入了D盘你cd后还需要 d: 才可以(建议学学不然说不明白,从基础说起来又太多了,这里就给小白玩家一个提示。):

pip install -e .

随后就开始安装:
在这里插入图片描述

1.4 有报错的注意

若python版本不在3.8-3.11之间则会报错,找不到指定的模块:\site-packages\torch\lib\fbgemm.dll
在这里插入图片描述
解决办法:将python版本换回

在运行此命令之前尝试执行conda clean --all此操作,否则可能有缓存的原因会导致你安装不了:
在这里插入图片描述
安装完毕后,可以使用 yolo 命令,看看能不能用:

yolo predict model=yolov8n.pt source=ultralytics/assets/bus.jpg

以上命令是 yolo 就是表示使用 yolo ,你可以这样理解,随后 predict 表示预测,连起来就是使用 yolo 预测,model 表示选择模型是 yolov8n.pt 就是后缀就不用理了,source 表示预测的那个图片位置,在这里选择的目录是 ultralytics/assets/ 下的 bus.jpg 文件,随后会直接进行人像的预测。

简而言之:

yolo predict model=模型选择 source=你要预测的图片

1.5 代码预测方式如下:

代码:

from ultralytics import YOLOyolo=YOLO("./yolov8n.pt",task="detect")
res=yolo(source="./ultralytics/assets/bus.jpg")

代码执行:
在这里插入图片描述

二、在线标注网站

2.1 导入文件

咱们在这里使用在线的标注网站,轻松方便直接标注直接使用。
打开标注网站 :
https://www.makesense.ai/

直接选择 start 开始:

在这里插入图片描述
把你的图片拖进来,我这里拖了51张图片:

在这里插入图片描述
选择目标检测 object detection:
在这里插入图片描述

2.2 label 标注

随后的界面会说你的当前 label 标签是空的:
在这里插入图片描述
点击中间创建 标签:

在这里插入图片描述
点击 + 号可以添加标签,我这里直接添加 A 和 B 标签:
在这里插入图片描述
之后点击接受即可:
在这里插入图片描述
唔然后我发现改版了这个网站,以前直接是个十字架你直接画框就好,现在要自己选,选择画框,有可能你不需要选也得:在这里插入图片描述
然后鼠标放到你图片上画个框,就是你需要检测的对象长啥样,你就把他框出来(由于我图片敏感就不做演示,如果你要检测人你就框人,检测某一个特定logo你就框那个 logo):
在这里插入图片描述
框了后在这里选择你框出来的目标的分类:
在这里插入图片描述
有可能我这里标签是男人、女人,那么我这里框出来男人就选择标签为男人的选项,我这里就用A、B表示了。

随后在左上角 Action 操作中选择导出:
在这里插入图片描述
随后弹出来后选择 yolo 格式的 zip 文件,这个看你自己,我是需要 zip 的,txt 格式的文件:
在这里插入图片描述
随后导出后,会下载一个压缩包,解压后里面有 txt 的文件:

在这里插入图片描述

三、模型训练代

进行模型训练和预测我们需要准备好对应的目录以及标注文件,例如 dataset目录,在 dataset目录下创建对应的图片 train 训练文件夹以及验证文件夹 val。当然 dataset 目录下是分不同项目的,不同项目不同文件夹,在这里我用 gjf 表示我的项目名,在 gif 下创建对应的训练目录以及验证目录(继续往下看吧)。

3.1 目录和文件准备

训练前准备,在 yolo 根目录创建一个 dataset:
在这里插入图片描述

打开文件目录,在 datasets 下创建一个 gif,你可以认为 gif 为当前项目的数据集名称,毕竟需要创建不同的名称为数据集分类。

接着 在 gif下创建一个 images 文件夹,用于存放对应的图片数据集,但我们的图片数据集分为训练和验证,再次两个种类分别创建两个目录,一个为 train 用于训练,另一个叫做 val 用于验证。

接着我们需要再创建一个 label 文件夹用于存放对应的标注文件:

在这里插入图片描述
同样,对应的label 有用于训练的以及用于验证的,那么此时在labels 文件夹下创建两个对应的 train 和 val 文件夹:
在这里插入图片描述

此时我们回到存放image 文件夹下,在 train 文件下把我们拿来标注的图片复制过来:
在这里插入图片描述
接着我们选取几张图片进行剪切存放到 val 文件夹下:
在这里插入图片描述
在此我选择6张图片剪贴到 val下:

在这里插入图片描述
随后打开标注文件下的 train 中;
在这里插入图片描述
复制之前下载的标注内容到此文件夹:
在这里插入图片描述

此时你还记得,之前剪切到 val 中的 image 图片吗?我是 6、7、8、66、67、68 这 6 个文件,此时将他们的数据在 labels 下的 train 文件夹中进行剪切,复制到 labels 下的 val 文件夹中,因为我们要做到 labels 于 images 文件夹下的文件一一对应,这是原因:

在这里插入图片描述
此时还差最后一步,我们回到 labels 文件夹下创建一个 classes.txt 文件:

在这里插入图片描述

此文件是说明咱们训练的内容分为几个类别,在此我是两个类别,其中内容为(这里要跟你标注的标签一致,我之前使用 A、B做标签的,所以在这里应该是A、B,这是以前的项目所以就没发改了,就这样了,你理解就ok):
在这里插入图片描述
这个类型请按照你自己的进行自定义。

3.2 配置项

接下来开始做训练前的最后一步,创建我们 gjf 项目的配置文件,在根目录下创建一个 .yaml 文件,当然你可以自命名,我是命名为了 gif,这个文件是配置作用:

在这里插入图片描述
其中编写如下配置信息:
在这里插入图片描述

XML 如下:

path: gjf # datasets 下的哪个项目
train: images/train # 训练图片在哪
val: images/val # 验证目录在哪
test: # test images (optional)# Classes
names:0: GJF1: SQ

随后执行命令:yolo task=detect model=./yolov8n.pt data=gjf.yaml epochs=25 workers=1 batch=16

若出现文件找不到之类的问题或者模型找不到,请使用绝对路径,那样可以暂时解决你的错误,但是你还需要自己调整一下当前你的系统环境,这是另外的问题在此就不再多说,查资料就ok。

解决执行完毕后,顺利无误将会出现以下结果:
在这里插入图片描述

此时结果告诉我保留咋爱了某个目录下的 runs\detect… 中,best.pt 是最好的模型结果,那我们使用 best.pt 检测一下我们目标识别效果如何:

yolo detect predict model= runs/... source= ..... show=true

以上命令记得把哪个 … 啥的 路径 改成你自己的目录

3.3 代码检测某一图片是否有目标

接着我们使用代码运行查看结果 :

import cv2
from ultralytics import YOLO# 加载训练好的模型
model = YOLO("path_to_your_trained_model.pt")
# 读取图片
image_path = "path_to_your_image.jpg"
img = cv2.imread(image_path)
# 进行检测
results = model.predict(source=img, save=False)if len(results[0].boxes) > 0:print("有")
else:print("没有")

结果如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/52991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习之git

github 创建远程仓库 代码推送 Push 代码拉取 Pull 代码克隆 Clone SSH免密登录 Idea集成GitHubGitee码云 码云创建远程仓库 Idea集成Gitee码云 码云连接Github进行代码的复制和迁移GitLab gitlab服务器的搭建和部署 Idea集成GitLabgit概述 一切皆本地 版本控制工具 集中…

win10配置adb环境变量

初始状态: 最简单的配置方案,直接复制adb所在路径: 粘贴进来确定即可: 然后打开 cmd 查看已经配置成功了:

【c++】cout打印char * 或者char[]的细节详解

目录 char* 类型 1.打印指向的字符串 2.打印指针指向的地址 问题描述 解决方法 char型数组 1. 想要输出字符串 2. 想输出字符数组的地址 printf 和cout 的对比 1.打印首字符 2.打印字符串 3.打印字符串首地址 💗感谢阅读!💗 char*…

用powermock编写单元测试

1、pom文件引入jar包 <!-- 单元测试 start --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId><scope>test</scope> </dependency> <dependency>&…

基于ZYNQ SOC的软件无线电处理平台

板载SOC实时处理器&#xff1a;XC7Z020-2CLG484I板载2片AD9361射频收发芯片&#xff0c;兼容AD80305具有1路千兆以太网口具有1个USB串口、1个USB OTG、1个SD卡ADC/DAC采集位宽&#xff1a;12位2路TX、2路RX&#xff0c;可实现全双工或者半双工 基于Xilinx ZYNQ SOC的软件无线电…

第 4 章 第 4 章 卷积神经网络-datawhale ai夏令营

独热向量 y ′ 的长度决 定了模型可以识别出多少不同种类的东西。我们希望 y ′ 和 yˆ 的交叉熵越小越好。 为了避免过拟合&#xff0c;在做图像识别的时候&#xff0c;考虑到图像本身的特性&#xff0c;并不一定 需要全连接&#xff0c;即不需要每个神经元跟输入的每个维度都…

Python中排序算法之插入排序

1 插入排序算法原理 插入排序算法与《Python中排序算法之选择排序》中提到的选择排序算法类似&#xff0c;也是将要排序的数列分为两个子数列&#xff08;红色框数列和绿色框数列&#xff09;&#xff0c;不同之处在于插入排序算法从绿色框子数列中逐个选择数字&#xff0c;之…

单片机内存区域划分

目录 一、C 语言内存分区1、栈区2、堆区3、全局区&#xff08;静态区&#xff09;4、常量区5、代码区6、总结 二、单片机存储分配1、存储器1.1 RAM1.2 ROM1.3 Flash Memory1.4 不同数据的存放位置 2、程序占用内存大小 一、C 语言内存分区 C 语言在内存中一共分为如下几个区域…

【生日视频制作】农村大马路绿色墙体广告标语喷漆AE模板修改文字软件生成器教程特效素材【AE模板】

生日视频制作教程农村大马路墙体广告标语喷漆AE模板改文字素材 怎么如何做的【生日视频制作】农村大马路绿色墙体广告标语喷漆AE模板修改文字软件生成器教程特效素材【AE模板】 生日视频制作步骤&#xff1a; 安装AE软件 下载AE模板 把AE模板导入AE软件 修改图片或文字 渲染出…

【最新消息】211高校,拟撤销测绘工程专业

近日&#xff0c;中国石油大学&#xff08;北京&#xff09;教务处发布《关于公示2024年度拟撤销本科专业的通知》&#xff0c;拟撤销音乐学、建筑学、测绘工程等9个本科专业。 通知内容如下&#xff1a; 根据《教育部高等教育司关于开展2024年度普通高等学校本科专业设置工作的…

【STM32】IIC

超级常见的外设通信方式&#xff0c;一般叫做I方C。 大部分图片来源&#xff1a;正点原子HAL库课程 专栏目录&#xff1a;记录自己的嵌入式学习之路-CSDN博客 目录 1 基本概念 1.1 总线结构 1.2 IIC协议 1.3 软件模拟IIC逻辑 2 AT24C02 2.1 设备地址与…

一次VUE3 使用axios调用萤石云OpenAPI踩坑经历

通过调用萤石云的获取设备列表功能&#xff0c;我们可以根据 ACCESS_TOKEN 获取该用户下的设备列表。 Python 调用接口 根据接口文档[1]&#xff0c;使用Python&#xff0c;很轻松就能获取到该列表&#xff0c;代码如下&#xff08;该代码用于拼接生成vue代码&#xff0c;这是…

Codeforces Round 969 (Div. 2) 题ABC详细题解,包含(C++,Python语言描述)

前言&#xff1a; 首先让我们恭喜tourist创造历史 他是第一&#xff0c;他又是第一&#xff0c;他总是第一&#xff0c;第一个codefores上4000分的&#xff0c;创造一个新的段位:Tourist&#xff0c;他的名字就是一个新的段位&#xff0c;他就是最高的山&#xff0c;最长的河 本…

访问win10共享文件夹:用户或密码不正确 以及 未授予用户在此计算机上的请求登录类型

因为安装的是神州网信政府版&#xff0c;该版本通常包含更严格的安全策略和访问控制&#xff0c;设置了共享文件夹后&#xff0c;访问共享文件夹时出现错误。 1、首先报错&#xff1a;用户或密码不正确 将》网络访问&#xff1a;本地账户的共享和安全模型&#xff0c;修改为&a…

开源通用验证码识别OCR —— DdddOcr 源码赏析(二)

文章目录 前言DdddOcr分类识别调用识别功能classification 函数源码classification 函数源码解读1. 分类功能不支持目标检测2. 转换为Image对象3. 根据模型配置调整图片尺寸和色彩模式4. 图像数据转换为浮点数据并归一化5. 图像数据预处理6. 运行模型&#xff0c;返回预测结果 …

Python测试之测试覆盖率统计

本篇承接上一篇 Python测试框架之—— pytest介绍与示例&#xff0c;在此基础上介绍如何基于pytest进行测试的覆盖率统计。 要在使用 pytest 进行测试时检测代码覆盖率&#xff0c;可以使用 pytest-cov 插件。这个插件是基于 coverage.py&#xff0c;它能帮助你了解哪些代码部…

人工智能和机器学习5 (复旦大学计算机科学与技术实践工作站)语言模型相关的技术和应用、通过OpenAI库,调用千问大模型,并进行反复询问等功能加强

前言 在这个日新月异的AI时代&#xff0c;自然语言处理&#xff08;NLP&#xff09;技术正以前所未有的速度改变着我们的生活方式和工作模式。作为这一领域的佼佼者&#xff0c;OpenAI不仅以其强大的GPT系列模型引领风骚&#xff0c;还通过其开放的API接口&#xff0c;让全球开…

哈工大-操作系统L30

文件使用磁盘的实现 fd文件描述符 buf内存缓冲区 count读写字符的个数 file->inode获得inode file_write写文件 inode映射表 读写的内存缓冲区buf,file字符流的位置200-212,根据inode提供的索引号找到块号,根据buf形成请求队列&#xff0c;再放入电梯队列 fseek调整读…

Jenkins安装使用详解,jenkins实现企业级CICD流程

文章目录 一、资料1、官方文档 二、环境准备1、安装jdk172、安装maven3、安装git4、安装gitlab5、准备我们的springboot项目6、安装jenkins7、安装docker8、安装k8s&#xff08;可选&#xff0c;部署节点&#xff09;9、安装Harbor10、准备带有jdk环境的基础镜像 三、jenkins实…

力扣1235.规划兼职工作

力扣1235.规划兼职工作 动态规划 二分 将所有工作按照结束时间排序f[i]表示前i个工作可获取的最大收益状态转移&#xff1a;取第i个工作&#xff0c;f[i] profit[i] f[j]&#xff0c;其中j为结束时间小于i的开始时间的最大数不取第i个工作&#xff0c;f[i] f[i-1]可以通过二…