yolov8训练初体验

最近在爬一些数据,有些网址的验证码比较难搞,于是使用yolov8来解决。

一、数据打标签并转为txt

使用的软件为X-AnyLabeling。内置各种模型,方便打标。

打标完成后由于是json格式,所以我们使用python转换即可


import json
import os#矩形框时def labelme_to_yolo(label_me_json_file, cls2id_dict):label_me_json = json.load(open(label_me_json_file, mode='r', encoding='UTF-8'))shapes = label_me_json['shapes']img_width, img_height = label_me_json['imageWidth'], label_me_json['imageHeight']img_path = label_me_json['imagePath']img_data = label_me_json['imageData'] if 'imageData' in label_me_json else ''labels = []for s in shapes:s_type = s['shape_type']s_type = s_type.lower()if s_type == 'rectangle':pts = s['points']x1, y1 = pts[0]  # left cornerx2, y2 = pts[1]  # right cornerx = (x1 + x2) / 2 / img_widthy = (y1 + y2) / 2 / img_heightw = abs(x2 - x1) / img_widthh = abs(y2 - y1) / img_heightcid = cls2id_dict[s['label']]labels.append(f'{cid} {x} {y} {w} {h}')return labelsdef write_label2txt(save_txt_path, label_list):f = open(save_txt_path, "w", encoding="UTF-8")for label in label_list:temp_list = label.split(" ")f.write(temp_list[0])f.write(" ")f.write(temp_list[1])f.write(" ")f.write(temp_list[2])f.write(" ")f.write(temp_list[3])f.write(" ")f.write(temp_list[4])f.write("\n")if __name__ == '__main__':# 原始图片文件夹路径img_dir = r"D:\pic\pic"# 原始JSON标签文件夹路径json_dir = r"D:\pic\label_json"# 生成保存TXT文件夹路径save_dir = r"D:\pic\label_txt"# 类别和序号的映射字典cls2id_dict = {"building1": "0"}if not os.path.exists(save_dir):os.makedirs(save_dir)for json_name in os.listdir(json_dir):json_path = os.path.join(json_dir, json_name)txt_name = json_name.split(".")[0] + ".txt"save_txt_path = os.path.join(save_dir, txt_name)labels = labelme_to_yolo(json_path, cls2id_dict)write_label2txt(save_txt_path, labels)
# 处理 X-Anylabeling 多边形矩阵的标注 json 转化 txt,提取点
import json
import osname2id = { '球体'  : 0,'立方体': 1,'圆锥体': 2,'圆柱体': 3,'多面体': 4}  # 修改你的类别并且赋与 indexdef decode_json(json_floder_path, txt_outer_path, json_name):txt_name = os.path.join(txt_outer_path,json_name[:-5]) + '.txt'with open(txt_name, 'a') as f:json_path = os.path.join(json_floder_path, json_name)data = json.load(open(json_path, 'r', encoding='utf8', errors='ignore'))img_w = data['imageWidth']img_h = data['imageHeight']isshape_type = data['shapes'][0]['shape_type']print(isshape_type)dw = 1. / (img_w)dh = 1. / (img_h)for i in data['shapes']:label_name = i['label']if (i['shape_type'] == 'polygon'):point = []for lk in range(len(i['points'])):x = float(i['points'][lk][0])y = float(i['points'][lk][1])point_x = x * dwpoint_y = y * dhpoint.append(point_x)point.append(point_y)try:formatted_line = f"{name2id[label_name]} {' '.join(str(a) for a in point)}\n"f.write(formatted_line)except KeyError:print(f"Warning: Label name '{label_name}' not found in name2id mapping.")f.close()if __name__ == "__main__":json_floder_path = r'D:\pic\label_json'  # 存放 json 的文件夹的绝对路径txt_outer_path = r'D:\pic\label_txt'  # 存放 txt 的文件夹绝对路径json_names = os.listdir(json_floder_path)flagcount = 0for json_name in json_names:decode_json(json_floder_path, txt_outer_path, json_name)flagcount += 1print('-----------转化完毕------------')

二、使用yolov8训练

2.1 将图片和标签分别放在datasets目录下

2.2创建yaml文件

trian为训练的图片

val为预测的图片


train: D:\\software\\PyCharm\\workspace\\ultralytics\\datasest\\mypic\\images 
val: D:\\software\\PyCharm\\workspace\\SomeTry\\yanzhengma\\val names:0: '球体'1: '立方体'2: '圆锥体'3: '圆柱体'4: '多面体'

2.3 创建训练代码

YOLOv8文档

from ultralytics import YOLOmodel = YOLO('yolov8n.pt')
model.train(data='mypic.yaml', epochs=100, imgsz=640, batch=8)#用训练后的模型进行预测
yolo predict model=runs/detect/train/weights/best.pt source=D:\\software\\PyCharm\\workspace\\SomeTry\\yanzhengma\\val\\1719060455810geetest_image.jpg

训练结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/32389.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

awdawdad

作者主页: 作者主页 本篇博客专栏:C 创作时间 :2024年6月20日 最后: 十分感谢你可以耐着性子把它读完和我可以坚持写到这里,送几句话,对你,也对我: 1.一个冷知识: …

阿赵UE引擎C++编程学习笔记——C++自定义蓝图函数

大家好,我是阿赵。   使用UE引擎,大部分功能都可以使用蓝图的自带节点去完成。但有时候我们也需要扩展一些蓝图没有的功能。这一篇主要学习一下怎样用C给蓝图新增自定义的函数节点。 一、 新建蓝图函数库 在添加C类的时候,选择蓝图函数库&…

指纹浏览器与虚拟机的区别及在跨境电商中的应用

在如今数字化世界中,隐私和安全变得愈发重要。许多人在网络上进行敏感操作,如网上购物、在线银行、社交媒体管理等。为了保护自己的隐私,人们常常会寻求一些额外的工具,比如指纹浏览器和虚拟机。这两种工具在保护个人隐私方面都有…

Thinkphp5内核流浪猫流浪狗宠物领养平台H5源码

Thinkphp5内核流浪猫流浪狗宠物领养平台H5源码 可封装APP,适合做猫狗宠物类的发信息发布,当然懂的修改一下,做其他信息发布也是可以的。 Thinkphp5内核流浪猫流浪狗宠物领养平台H5源码

Linux常用命令(14)—查看文件内容(有相关截图)

写在前面: 最近在学习Linux命令,记录一下学习Linux常用命令的过程,方便以后复习。仅供参考,若有不当的地方,恳请指正。如果对你有帮助,欢迎点赞,关注,收藏,评论&#xf…

JavaScript 冷知识大赏:带你领略不一样的编程乐趣

个人主页:学习前端的小z 个人专栏:JavaScript 精粹 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 💯JavaScript 中的小 tips📧1 严格模式💞…

ython机器学习分类算法(六)-- 逻辑回归(Logistic Regression)

逻辑回归原理 逻辑回归虽然名为“回归”,但实际上是一种用于处理二分类或多分类问题的分类算法。其核心思想是,利用线性回归模型的预测结果逼近真实标记的对数几率(log odds),因此得名“逻辑回归”。具体来说&#xff…

一个简单的UDP客户端和服务端的完整C++示例

下面是一个简单的UDP客户端和服务端的完整C示例。这个示例展示了如何创建一个UDP客户端和服务端&#xff0c;并在它们之间发送和接收消息。 cpp UDP 服务端 cpp // udp_server.cpp #include <iostream> #include <cstring> #include <sys/types.h> #include …

Spring之IoC(容器配置、Spring坐标导入、获取bean)

这里的话&#xff0c;因为博主学习时间有限&#xff0c;并没有实际去操作&#xff0c;只是学习和了解一个大概的流程。 目录 一、引言 1、管理什么&#xff1f;&#xff08;对象&#xff1a;Service、Dao ...&#xff09; 2、如何将被管理的对象告知 IoC 容器?&#xff08;用…

【ARM 安全系列介绍 3.7 -- SM4 对称加密算】

请阅读【嵌入式开发学习必备专栏 Cache | MMU | AMBA BUS | CoreSight | Trace32 | CoreLink | GCC | CSH | Armv8/v9 系统异常分析】 文章目录 SM4 加密算法简介SM4 工作模式算法步骤加密举例注意事项 Principle of SM4 encryption algorithm SM4 加密算法简介 SM4是一种分组…

如何基于Redis实现分布式锁?

分布式锁介绍 对于单机多线程来说&#xff0c;在 Java 中&#xff0c;我们通常使用 ReetrantLock 类、synchronized 关键字这类 JDK 自带的 本地锁 来控制一个 JVM 进程内的多个线程对本地共享资源的访问。 下面是我对本地锁画的一张示意图。 本地锁 从图中可以看出&#xf…

Unity 限时免费资源 - FANTASTIC万圣节资源包

Unity 资源 - FANTASTIC - Halloween Pack 万圣节包 前言资源包内容领取兑换码 前言 亲爱的 Unity 游戏开发者们&#xff0c;今天要给大家介绍一款限时免费的优质资源包 - FANTASTIC - Halloween Pack 万圣节资源包。 这个资源包为您的游戏创作带来了丰富的万圣节主题元素。其…

开关阀(3):Fisher DVC6200定位器原理及调试

Fisher DVC6200---Digital Valve Controllers&#xff08; 数字阀门控制器&#xff09;简写 DVC,而6200是Fisher DVC定位器发展的一个系列型号&#xff0c;是Fisher结合DVC2000、DVC6000系列&#xff0c;取其特点发展的有着高适用性和高可靠性的阀门定位器。 DVC6200 原理&…

线性代数|机器学习-P17矩阵A逆和奇异值的导数

文章目录 1. A 2 A^2 A2关于时间的导数2. 奇异值 σ \sigma σ 关于时间的导数3. 迭代特征值3.1 交替特征值3.2 ST 矩阵最大特征值 4. 瑞利商的思考4.1 瑞利商的定义4.2 性质1 1. A 2 A^2 A2关于时间的导数 我们在已知 d A d t \frac{\mathrm{d}A}{\mathrm{d}t} dtdA​的情…

Apriori 处理ALLElectronics事务数据

通过Apriori算法挖掘以下事务集合的频繁项集&#xff1a; 流程图 代码 # 导入必要的库 from itertools import combinations# 定义Apriori算法函数 def apriori(transactions, min_support, min_confidence):# 遍历数据&#xff0c;统计每个项的支持度 item_support {}for tr…

AI数据分析:根据时间序列数据生成动态条形图

动态条形竞赛图&#xff08;Bar Chart Race&#xff09;是一种通过动画展示分类数据随时间变化的可视化工具。它通过动态条形图的形式&#xff0c;展示不同类别在不同时间点的数据排名和变化情况。这种图表非常适合用来展示时间序列数据的变化&#xff0c;能够直观地显示数据随…

移动端vue+vant4选择日期+时间,返回结果是:2024-07-23 10:27格式

环境&#xff1a;vue3、 vant4、vite <van-popup v-model:show"showPicker" round position"bottom"><van-picker-grouptitle"预约日期":tabs"[选择日期, 选择时间]"next-step-text"下一步"confirm"onConfir…

亚马逊卖家注册业务类型怎么选?VC账号能申请?

在亚马逊卖家注册时&#xff0c;业务类型的选择是非常重要的&#xff0c;因为它将直接影响您的销售策略、费用结构以及您在平台上的权限。目前&#xff0c;亚马逊主要的卖家业务类型包括专业卖家和个人卖家&#xff0c;而VC&#xff08;Vendor Central&#xff09;账号和VE&…

Camtasia2024中文版最新电脑录屏剪辑神器!

大家好&#xff0c;今天我要安利一个我最近超级喜欢的工具——Camtasia2024中文版&#xff01;这款软件真的太棒了&#xff0c;它让我的视频编辑工作变得更加轻松和高效。如果你也对视频制作感兴趣&#xff0c;那么一定要尝试一下这款神器哦&#xff01; Camtasia2024win-正式…

那在中国,版权保护方面还有哪些缺陷?能否运用区块链技术解决?

目录 一、主要缺陷 1. 版权确权困难 2. 侵权行为难以追踪 3. 维权难度大 4. 中介机构效率低下 5. 盗版问题严重 二、 区块链技术的具体应用 1. 版权确权与存证 2. 智能合约 3. 作品追踪与溯源 4. 分布式存储 5. 数字身份认证 三、 结论 中国在版权保护方面虽然已经…