深度学习——离线数据增强——图片resize

因为有一批数据有点儿小,数据质量不佳,为了标注方便使用数据增强将数据固定在1080P,方便标注,

# -*- coding: UTF-8 -*-
"""
@Project :yolov5_relu_fire_smoke_v1.4 
@IDE     :PyCharm 
@Author  :沐枫
@Date    :2024/4/2 20:28添加白条,做数据增强,最后所有的图片尺寸固定在1080P
"""
import os
import multiprocessing
from concurrent import futures
from copy import deepcopyimport cv2
import numpy as np
import xml.etree.ElementTree as ET
import xml.dom.minidom as minidomdef xyxy2xywh(x):"""Convert nx4 boxes from [x1, y1, x2, y2] to [x, y, w, h] where xy1=top-left, xy2=bottom-right:param x::return:"""y = np.copy(x)y[..., 0] = (x[..., 0] + x[..., 2]) / 2  # x centery[..., 1] = (x[..., 1] + x[..., 3]) / 2  # y centery[..., 2] = x[..., 2] - x[..., 0]  # widthy[..., 3] = x[..., 3] - x[..., 1]  # heightreturn ydef xywh2xyxy(x: np.ndarray):"""Convert nx4 boxes from [x, y, w, h] to [x1, y1, x2, y2] where xy1=top-left, xy2=bottom-right:param x::return:"""y = np.copy(x)y[..., 0] = x[..., 0] - x[..., 2] / 2  # top left xy[..., 1] = x[..., 1] - x[..., 3] / 2  # top left yy[..., 2] = x[..., 0] + x[..., 2] / 2  # bottom right xy[..., 3] = x[..., 1] + x[..., 3] / 2  # bottom right yreturn ydef decodeVocAnnotation(voc_xml_path, class_index_dict):"""voc数据集格式的文件解析,将一个文件解析成一个list,使用空格间隔不同对象注意:返回的类别不是整型,而是字符串的类别名称注意判断返回值是否为 空,如果是空说明没有目标,是一张背景图:param voc_xml_path: xml路径:param class_index_dict: 类别字典:return: [(cls_index, x1, y1, x2, y2), ...]"""assert voc_xml_path.endswith(".xml"), "voc_xml_path must endswith .xml"with open(voc_xml_path, 'r', encoding='utf-8') as xml_file:# 打开xml文件,并返回根节点root = ET.ElementTree().parse(xml_file)# 定义一个列表,专门保存目标information = []# 查找root节点下所有目标信息for obj in root.iter('object'):# 目标的名称name = obj.find('name').text# 目标的bbox坐标,一般voc是保存的corner格式的bboxbox = obj.find('bndbox')xmin = box.find('xmin').textymin = box.find('ymin').textxmax = box.find('xmax').textymax = box.find('ymax').text# 添加一个目标的信息# NOTE:返回值的listinformation.append((class_index_dict[name], int(xmin), int(ymin), int(xmax), int(ymax)))return informationdef create_voc_xml(image_folder, image_filename, width: int, height: int, labels,save_root, class_name_dict, conf_thresh_dict=None):""":param image_folder: 图片的相对路径:param image_filename: 000001.jpg:param width: 图片宽:param height: 图片高:param labels: 目标框:[[class_index, xmin, ymin, xmax, ymax], ...]:param save_root: 保存xml的根目录:param class_name_dict: cls_index:cls_name,根据index获取正确的类别name:param conf_thresh_dict: cls_index:conf_thresh,根据不同类别设置的阈值获取对应的目标,如果设置为None,则表示保存的txt没有置信度:return:"""# 创建 XML 文件的根元素root = ET.Element("annotation")# 添加图片信息folder = ET.SubElement(root, "folder")folder.text = str(image_folder)# 图片名字filename = ET.SubElement(root, "filename")filename.text = os.path.join(image_filename)# 图片大小size = ET.SubElement(root, "size")width_element = ET.SubElement(size, "width")width_element.text = str(width)height_element = ET.SubElement(size, "height")height_element.text = str(height)depth = ET.SubElement(size, "depth")  # 通道数depth.text = "3"# 添加目标框信息for label in labels:# 如果该参数设置为None,表示保存的txt没有Noneif conf_thresh_dict is None:# 保证这几项是整数class_index, x1, y1, x2, y2 = label.astype(dtype=np.int32)else:class_index, x1, y1, x2, y2, conf = label# 保证这几项是整数class_index, x1, y1, x2, y2 = np.array([class_index, x1, y1, x2, y2], dtype=np.int32)# 根据置信度过滤是否保存项if conf < conf_thresh_dict[class_index]:continueobj = ET.SubElement(root, "object")name = ET.SubElement(obj, "name")name.text = class_name_dict[int(class_index)]pose = ET.SubElement(obj, "pose")pose.text = "Unspecified"truncated = ET.SubElement(obj, "truncated")truncated.text = "0"difficult = ET.SubElement(obj, "difficult")difficult.text = "0"bndbox = ET.SubElement(obj, "bndbox")xmin = ET.SubElement(bndbox, "xmin")xmin.text = str(x1)ymin = ET.SubElement(bndbox, "ymin")ymin.text = str(y1)xmax = ET.SubElement(bndbox, "xmax")xmax.text = str(x2)ymax = ET.SubElement(bndbox, "ymax")ymax.text = str(y2)# 创建 XML 文件并保存xml_str = ET.tostring(root, encoding="utf-8")xml_str = minidom.parseString(xml_str)# 设置缩进为4个空格,xml可读性提高pretty_xml = xml_str.toprettyxml(indent=" " * 4)save_path = os.path.join(save_root, f"{os.path.splitext(image_filename)[0]}.xml")os.makedirs((os.path.dirname(save_path)), exist_ok=True)with open(save_path, "w") as xmlFile:xmlFile.write(pretty_xml)def resize_and_pad(image: np.ndarray, labels: np.ndarray, width=1920, height=1080):""":param image::param labels: (cls_id, x, y, w, h):param width::param height::return:"""def _resize(image: np.ndarray, labels: np.ndarray, width, height):""":param image::param labels: (cls_id, x, y, w, h):param width::param height::return:image: 最后的图片labels: (cls_id, x, y, w, h)"""# 判断图片的尺寸,如果尺寸比目标尺寸大,就等比例缩放,斌使用纯白色填充,如果尺寸比目标尺寸小就直接填充到目标尺寸img_h, img_w = image.shape[:2]if img_w < width and img_h < height:# 直接填充# 填充的宽度和高度dw = (width - img_w) // 2dh = (height - img_h) // 2# 创建一个新的蒙版new_image = np.ones(shape=(height, width, 3), dtype=np.uint8) * 255# 将图片填充到里面new_image[dh:dh + img_h, dw:dw + img_w, :] = image[:, :, :]# 标签平移,(cls_id, x, y, w, h)labels[..., 1] += dwlabels[..., 2] += dhelse:# 等比例缩放后再填充# 计算宽度和高度的缩放比例ratio = min((width / img_w), (height / img_h))# 计算缩放后的宽度和高度new_width = int(img_w * ratio)new_height = int(img_h * ratio)# 等比例缩放图像resized_img = cv2.resize(image, (new_width, new_height))# 计算需要填充的宽度和高度dw = (width - new_width) // 2dh = (height - new_height) // 2# 创建一个新的蒙版new_image = np.ones(shape=(height, width, 3), dtype=np.uint8) * 255# 将图片填充到里面new_image[dh:dh + new_height, dw:dw + new_width, :] = resized_img[:, :, :]# 标签缩放,平移;(cls_id, x, y, w, h)labels[..., 1:] *= ratio  # 坐标和宽高都需要缩放# 只有中心点需要平移,不影响宽高labels[..., 1] += dwlabels[..., 2] += dhreturn new_image, labelsSCALE = 2# 原图的宽高img_h, img_w = image.shape[:2]# NOTE:先在外面扩大一次,写和内部函数,在判断,如果图片比目标尺寸大,就等比例缩放,如果图片比目标尺寸小,就直接填充# 比较小,先扩大再等比例缩放;比较大,直接等比例缩放if img_w < width and img_h < height:new_w = img_w * SCALEnew_h = img_h * SCALE# 图片扩大为原来的2倍image = cv2.resize(image, (new_w, new_h))# labels也扩大,因为图片扩大2倍,所以目标的中心点和宽高都会扩大同样的倍数labels[..., 1:] *= SCALE# 缩放和填充new_image, new_labels = _resize(image, labels, width=width, height=height)return new_image, new_labelsdef run(image_path, xml_root,image_root, save_image_root, save_xml_root,class_index_dict, class_name_dict):image_file = os.path.basename(image_path)image_name, suffix = os.path.splitext(image_file)xml_path = image_path.replace(image_root, xml_root).replace(suffix, ".xml")if not os.path.exists(xml_path):print(f"\n{image_path} no xml\n")returntry:# 读图image = cv2.imread(image_path)if image is None:return# (cls_id, x, y, w, h)labels = decodeVocAnnotation(xml_path, class_index_dict)if len(labels) == 0:print(f"\n{image_path} no label\n")returnlabels = np.array(labels, dtype=np.float64)if labels.ndim < 2:labels = labels[None, ...]# 坐标框转成xywhlabels[..., 1:] = xyxy2xywh(labels[..., 1:].copy())# resize and padnew_image, new_labels = resize_and_pad(image, labels.copy(), width=1920, height=1080)new_img_h, new_img_w = new_image.shape[:2]# 坐标框转成xyxynew_labels[..., 1:] = xywh2xyxy(new_labels[..., 1:].copy())# 开始保存# save_image_path = image_path.replace(image_root, save_image_root)save_image_path = os.path.join(save_image_root,os.path.basename(os.path.dirname(image_path)),f"aug_{image_file}")save_xml_path = save_image_path.replace(save_image_root, save_xml_root).replace(suffix, ".xml")os.makedirs(os.path.dirname(save_image_path), exist_ok=True)os.makedirs(os.path.dirname(save_xml_path), exist_ok=True)# 保存图片cv2.imwrite(save_image_path, new_image)# 创建xmlcreate_voc_xml(image_folder=save_image_path.replace(save_image_root + os.sep, ""),image_filename=os.path.basename(save_image_path),width=new_img_w,height=new_img_h,labels=np.array(new_labels, dtype=np.int32),save_root=os.path.dirname(save_xml_path),class_name_dict=class_name_dict, )print(f"\r{image_path}", end='')except Exception as e:print(f"{image_path} {run.__name__}:{e}")def run_process(root_file_list,image_root, xml_root, save_image_root, save_xml_root,class_index_dict, class_name_dict):# 使用线程池控制程序执行with futures.ThreadPoolExecutor(max_workers=5) as executor:for root, file in root_file_list:# 向线程池中提交任务,向线程池中提交任务的时候是一个一个提交的image_path = os.path.join(root, file)executor.submit(run,*(image_path, xml_root,image_root, save_image_root, save_xml_root,class_index_dict, class_name_dict))if __name__ == '__main__':class_index_dict = {"fire": 0,"smoke": 1,}class_name_dict = {0: "fire",1: "smoke",}data_root = r"Z:\Datasets\FireSmoke_v4"data_root = os.path.abspath(data_root)# 数据的原图根目录image_root = os.path.join(data_root, "images")# xml标注文件根目录xml_root = os.path.join(data_root, "annotations")# 保存根目录save_image_root = os.path.join(image_root, "aug-pad")save_xml_root = os.path.join(xml_root, "aug-pad")# 过滤点不想用的目录exclude_dirs = [os.sep + r"background",os.sep + r"candle_fire",os.sep + r"AUG",os.sep + r"smoke",os.sep + r"val",os.sep + r"aug-merge",os.sep + r"candle_fire",os.sep + r"cut_aug",os.sep + r"miniFire",os.sep + r"net",os.sep + r"new_data",os.sep + r"realScenario",os.sep + r"smoke",os.sep + r"TSMCandle",]max_workers = 10  # 线程/进程 数print(f"max_workers:{max_workers}")# 一个进程处理多少图片max_file_num = 3000# 保存root和file的listroot_file_list = list()# 创建进程池,根据自己的设备自行调整,别太多,否则会变慢pool = multiprocessing.Pool(processes=max_workers)for root, _, files in os.walk(image_root):# 只要其中有一个,就跳过if any(map(lambda x: x in root, exclude_dirs)):continuefor file in files:file_name, suffix = os.path.splitext(file)if suffix.lower() not in (".jpg", ".jpeg", ".bmp", ".png"):continueroot_file_list.append((root, file))if len(root_file_list) > max_file_num:pool.apply_async(run_process,(deepcopy(root_file_list),image_root, xml_root, save_image_root, save_xml_root,class_index_dict, class_name_dict))# 清除列表中的存储root_file_list.clear()else:pool.apply_async(run_process,(deepcopy(root_file_list),image_root, xml_root, save_image_root, save_xml_root,class_index_dict, class_name_dict))# 清除列表中的存储root_file_list.clear()# 关闭进程池pool.close()# 等待所有子进程执行结束pool.join()print("\nFinish ...")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/809154.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32电机控制SDK介绍

目录 一、STM32 MC SDK包含以下项目&#xff1a; 二、电机控制应用流程 三、 MC 软件应用程序设计工作流程 四、STM32 MC固件 五、PMSM FOC 库 一、STM32 MC SDK包含以下项目&#xff1a; STM32 MC firmwareSTM32 MC WorkbenchSTM32 MC Board ManagerSTM32 Motor PilotTh…

项目从 Mysql切换 PostgreSQL 改造及踩坑记录

0、前言 原项目框架 SpringBoot MybatisPlus Mysql 1、切换流程 1.1、项目引入postgresql驱动包 由于我们要连接新的数据库&#xff0c;理所当然的要引入该数据库的驱动包&#xff0c;这与mysql驱动包类似 <dependency><groupId>org.postgresql</groupId…

MongoDB常用命令总结

《【快捷部署】017_MongoDB&#xff08;6.0.14&#xff09;》 讲述了如何快捷部署MongoDB&#xff0c;今天我们来总结一下MongoDB常用的shell命令。 一、基本操作&#xff08;CRUD&#xff09; #创建集合&#xff0c;名为 users db.createCollection("users")# 插入…

免费搭建幻兽帕鲁服务器(Palworld免费开服教程)

随着互联网技术的不断发展和普及&#xff0c;网络游戏已经成为了人们休闲娱乐的重要方式之一。而在众多网络游戏中&#xff0c;幻兽帕鲁以其独特的游戏设定和玩法&#xff0c;吸引了大量玩家的关注。为了满足广大玩家的需求&#xff0c;本文将介绍如何免费搭建幻兽帕鲁服务器&a…

Green Hills 自带的MULTI调试器查看R7芯片寄存器

Green Hills在查看芯片寄存器时需要导入 .grd文件。下面以R7为例&#xff0c;演示一下过程。 首先打开MULTI调试器&#xff0c;如下所示View->Registers&#xff1a; 进入如下界面&#xff0c;选择导入寄存器定义文件.grd&#xff1a; 以当前R7芯片举例&#xff08;dr7f7013…

Python+Appium自动化测试(ios+Android)

一、软件安装 安装清单&#xff1a; JDKPythonnode.jsandroid-sdk(作者通过Android Studio安装)iOS-deploybrewlibimobiledevice依赖库ideviceinstallercarthage依赖库 appium-doctor&#xff08;安装后可在命令行中通过命令:appium-doctor检查还少啥&#xff09; WebDriverAg…

应急响应-战中反制对抗上线CSGoby蚁剑Sqlmap等安全工具

知识点 战中-反制-安全工具篇CS反制(有版本限制) Goby反制&#xff08;有版本限制&#xff0c;新版goby已修复&#xff09; Antsword反制(有版本限制&#xff0c;别人也不一定用蚁剑) AWVS反制(有版本限制&#xff0c;在awvs 10版本存在&#xff09; BURP反制(有版本限制&…

基于python的天气数据可视化系统、Flask框架,爬虫采集天气数据,可视化分析

系统介绍 基于Python的天气预测可视化分析系统&#xff0c;该项目的主要流程和功能包括&#xff1a; 数据获取&#xff1a; 使用Python的pandas库从2345天气网&#xff08;http://tianqi.2345.com/Pc/GetHistory&#xff09;抓取山东省各市区县在2021年至2023年间的天气历史数…

C语言 | Leetcode C语言题解之第21题合并两个有序链表

题目&#xff1a; 题解&#xff1a; /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/typedef struct ListNode ListNode; struct ListNode* mergeTwoLists(struct ListNode* list1, struct ListNode* list2) {/…

钉钉和金蝶云星空接口对接实战

钉钉和金蝶云星空接口对接实战 对接源平台:钉钉 钉钉&#xff08;DingTalk&#xff09;是阿里巴巴集团打造的企业级智能移动办公平台&#xff0c;是数字经济时代的企业组织协同办公和应用开发平台。钉钉将IM即时沟通、钉钉文档、钉闪会、钉盘、Teambition、OA审批、智能人事、钉…

django 模板js文件为什么最后引入

<!-- 引入Bootstrap JS --> <script src"https://cdn.jsdelivr.net/npm/bootstrap5.3.0/dist/js/bootstrap.bundle.min.js"></script> 为什么最后引入例子 <!-- templates/inspection_records.html --><!DOCTYPE html> <html lang…

ShardingSphere再回首

概念&#xff1a; 连接&#xff1a;通过协议 方言及库存储的适配&#xff0c;连接数据和应用&#xff0c;关注多模数据苦之间的合作 增量&#xff1a;抓取库入口流量题提供重定向&#xff0c; 流量变形(加密脱敏)/鉴权/治理(熔断限流)/分析等 可插拔&#xff1a;微内核 DDL:cr…

【C#】C#匹配两个相似的字符串莱文斯坦距离

文章目录 一、问题描述二、代码三、解释 一、问题描述 需要匹配多个类似的内容&#xff0c;并且要求相似度在70%以上并且长度相近&#xff0c;可以在处理每个匹配项时&#xff0c;将其与所有目标进行比较&#xff0c;并筛选出符合条件的匹配项。 二、代码 using System; usi…

2024最新AI系统【SparkAI】,ChatGPT商业运营版系统源码/ai问答/ai绘画/GPTs,SunoAI音乐生成大模型/带分销AIGC搭建部署教程

一、文章前言 SparkAi创作系统是基于ChatGPT进行开发的ai智能问答系统和Midjourney-AI绘画系统&#xff0c;支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美&#xff0c;那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图文教程吧。已…

vue 插槽使用

父控件 使用子控件时&#xff0c;为了能让子控件 在控件上面使用灵活多变&#xff0c;这里使用插槽。 简单插槽使用 <script>// 创建 vue实例const app Vue.createApp({ data() { return {text: 提交 } },// slot 插槽// slot 中使用的数据&#xff0c;作用域的问题&…

如何在 OpenLDAP 服务器上更改账户密码

简介 LDAP 系统通常用于存储用户账户信息。事实上&#xff0c;一些最常见的 LDAP 认证方法涉及存储在 LDAP 条目中的账户信息。 无论您的 LDAP 条目是被外部服务用于账户信息还是仅用于 LDAP 特定的授权绑定&#xff0c;密码管理都变得很重要。在本指南中&#xff0c;我们将讨…

MySQL进阶一

目录 1.使用环境 2.条件判断 2.1.case when 2.2.if 3.窗口函数 3.1.排序函数 3.2.聚合函数 ​​​​​​​3.3.partiton by ​​​​​​​3.4.order by 4.待续 1.使用环境 数据库&#xff1a;MySQL 8.0.30 客户端&#xff1a;Navicat 15.0.12 2.条件判断 2.1.ca…

手机银行客户端框架之EMAS介绍

EMAS简介 阿里巴巴应用研发平台&#xff08;Enterprise Mobile Application Studio&#xff0c;简称EMAS&#xff09;&#xff0c;是面向全端场景&#xff08;移动App、H5应用、小程序、Web应用、PC应用等&#xff09;的一站式应用研发平台。EMAS基于广泛的云原生技术&#xf…

5G智慧港口简介(一)

引言 港口作为交通运输的枢纽,在促进国际贸易和地区发展中起着举足轻重的作用,全球贸易中约 90% 的贸易由海运业承载,作业效率对于港口至关重要。在“工业 4.0”、“互联网 +”大发展的时代背景下,港口也在进行数字化、全自动的转型升级。随着全球 5G 技术浪潮的到来,华为…

Django域名根目录文件验证

以文件 MP_verify_QtVCdC7027HW9cjA.txt 为例 在Django项目中&#xff0c;为了让特定文件如MP_verify_QtVCdC7027HW9cjA.txt能够被访问&#xff0c;你需要将文件放置在Django项目的某个位置&#xff0c;并确保在URL配置中有相应的路由指向该文件。一种简单的方法是将其放置在你…