Pytorch语义分割(1)-----加载数据

在语义分割中用到的数据无非就是原始图片(image)和标注后得到的mask图片,所以在读取数据的时候只要返回图片和标签信息就OK 了。

import torch
import os
import numpy as np
from torch.utils.data import Dataset
from utils_func import seg_utils as ut
import cv2
from torchvision.transforms.functional import rotate as tensor_rotate
from torchvision.transforms.functional import vflip, hflip
from torchvision.transforms.functional import adjust_brightness
import random
import base64
import json
import os
import os.path as ospdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")class train_data(Dataset):def __init__(self, image_folder, img_size, category_types):self.image_folder = image_folderself.img_size = img_sizeself.category_types = category_typesself.num_classes = len(category_types)self.data_list = self.generate_mask()# print(self.data_list)self.img_and_mask = []for idx, data in enumerate(self.data_list):img_tensor, mask_tensor = self.get_image_and_label(data[0], data[1], self.img_size)self.img_and_mask.append([img_tensor, mask_tensor])def __len__(self):return len(self.img_and_mask)def __getitem__(self, index):img_tensor = self.img_and_mask[index][0].to(device)mask_tensor = self.img_and_mask[index][1].to(device)# 如果有数据增强就在这里处理return img_tensor, mask_tensordef data_augment(self, img_tensor, mask_tensor, aug_flag):if aug_flag[0] == 0:angel = random.choice(aug_flag[1])img_tensor = tensor_rotate(img_tensor, int(angel))mask_tensor = tensor_rotate(mask_tensor, int(angel))elif aug_flag[0] == 1:factor = aug_flag[1]img_tensor = adjust_brightness(img_tensor, factor)elif aug_flag[0] == 2:flip_type = random.choice(aug_flag[1])if flip_type == 1:img_tensor = vflip(img_tensor)mask_tensor = vflip(mask_tensor)else:img_tensor = hflip(img_tensor)mask_tensor = hflip(mask_tensor)return img_tensor, mask_tensordef generate_mask(self):data_lists = []for file_name in os.listdir(self.image_folder):if file_name.endswith("json"):json_path = os.path.join(self.image_folder, file_name)img_path = osp.join(self.image_folder, "%s.jpg" % file_name.split(".")[0])data_lists.append([img_path, json_path])return data_listsdef get_image_and_label(self, img_path, labelme_json_path, img_size):# print("==================================================")# print(img_path)# print("==================================================")img = ut.p2i(img_path)h, w = img.shape[:2]img = cv2.resize(img, (img_size[0], img_size[1]))# cv2.imwrite(r"C:\Users\HJ\Desktop\test\%s.jpg"%img_path.split(".")[0][-7:], img)img_tensor = ut.i2t(img)mask_array = np.zeros([self.num_classes, h, w, 1], dtype=np.uint8)with open(labelme_json_path, "r") as f:json_data = json.load(f)shapes = json_data["shapes"]for shape in shapes:category = shape["label"]category_idx = self.category_types.index(category)points = shape["points"]points_array = np.array(points, dtype=np.int32)temp = mask_array[category_idx, ...]mask_array[category_idx, ...] = cv2.fillPoly(temp, [points_array], 255)mask_array = np.transpose(mask_array, (1, 2, 0, 3)).squeeze(axis=-1)mask_array = cv2.resize(mask_array, (self.img_size[0], self.img_size[1])).astype(np.uint8)mask_tensor = ut.i2t(mask_array, False)return img_tensor, mask_tensorif __name__ == '__main__':img_folder = r"D:\finish_code\SegmentationProject\datasets\data2"img_size1 = [256, 512]category_types = ["background", "person", "car", "road"]t = train_data(img_folder, img_size1, category_types)t.__getitem__(1)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22218.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode学习

回文数 反转一半数字 第一个想法是将数字转换为字符串,并检查字符串是否为回文。 但是,这需要额外的非常量空间来创建问题描述中所不允许的字符串。 第二个想法是将数字本身反转,然后将反转的数字与原始数字比较,如果它们是相同…

【计算机毕设】基于SpringBoot的中小企业设备管理系统设计与实现 - 源码免费(私信领取)

免费领取源码 | 项目完整可运行 | v:chengn7890 诚招源码校园代理! 1. 研究目的 在中小企业中,设备管理是确保生产和运营效率的重要环节。传统的设备管理通常依赖于手工记录和人工管理,容易导致数据不准确、…

近屿OJAC带你解读:什么是ML?

概念定义 ML是机器学习(Machine Learning)的缩写。机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习和改进,而无需进行明确的编程指令。简单来说,机器学习涉及到开发算法和统计模型,让计算机…

PySpark JDBC 读写 MySQL 数据库保姆级指南

目录 1. 环境准备 1.1 安装 PySpark 1.2 MySQL JDBC 驱动 2. PySpark JDBC 连接配置 2.1 JDBC URL

UE4 使用自带的插件制作音频可视化

1.插件默认为开启 2.新建共感NRT,选择要使用的音频 3.添加音频组件,添加共感NRT变量,选择新建的共感NRT对象 4.编写蓝图

Binder机制详解

Binder机制详解 Binder 是什么Binder 原理Binder IPC 实现原理IPC 通信过程 Binder 运行机制Binder 通信模型Binder 通信过程Binder 通信的四个角色Binder 驱动Binder 中使用的设计模式什么是内存映射Binder 与 内存映射mmap为什么使用 Binder为什么要用多进程进程隔离ServiceM…

基础—SQL—DQL(数据查询语言)分页查询

一、引言 上一篇博客学习了排序查询,这次来讲查询的最后一个部分:分页查询。 涉及到的关键字是:LIMIT 。 二、DQL—分页查询 对于分页,不管以后做的是传统的管理系统还是做互联网的项目,基本上都会遇到分页查询的操…

计网ppt标黄知识点整理第(4)章节——谢希仁版本、期末复习自用

路由器:查找转发表,转发分组。 IP网的意义:当互联网上的主机进行通信时,就好像在一个网络上通信一样,看不见互连的各具体的网络异构细节。如果在这种覆盖全球的 IP 网的上层使用 TCP 协议,那么就…

每天坚持写java锻炼能力---第一天(6.4)

今天的目标是菜单: B站/马士兵的项目菜单 package java1;import java.util.Scanner;public class Test {public static void main(String[] args) {while(true){ //3.加入死循环,让输入一直有System.out.println();System.out.println("--->项…

Matlab笔记

quit/exit 退出Matlab pause(x) 停止x秒 标识符最多63位--namelengthmax who/whos显示变量信息 double--64bit(双精度) single--32bit(单精度) format long/short/compact 改变格式 2017后matlab默认double--single(pi)变…

Linux 系统怎么快速「批量重命名」文件

如果需要对文件批量重命名,怎么办,是不是要找个工具,下载看这么使用。其实在 Linux、macOS 系统上使用脚本可以轻松搞定。 如,这里有一批图片文件,后缀名可能是jpg、jpeg、png 等,名称如 “我是待重命名的…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] K小姐的寻宝之旅(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 在线评测链接 K小姐的寻宝之旅(100分) 🌍 评测功能需要订阅专栏后私信联系清…

【WRF调试运行第一期】安装WRF模型所需平台

WRF实践实操第一期:安装WRF模型所需平台 1 操作系统2 先决条件软件3 程序流(Program Flow)4 文件说明软件安装1-Cygwin参考 安装 WRF(Weather Research and Forecasting)模型需要准备适当的硬件和软件平台。 相关介绍可…

【linux根分区扩容】

前言: 今天在安装软件的时候发现我的linux的根分区空间不足了,在网上搜索哈资料解决了。 解决根分区空间不足的问题方法: 第一:用lsblk命令查看 发现还有一些空间不在了。 第二:安装扩容工具: yum inst…

【C++集群聊天服务器(二)】|json简单入门

Json是一种轻量级的数据交换格式(也叫数据序列化方式)。 也就是说,我们在数据的传输上其实已经被序列化了,等发到服务器或者是发到客户端的时候,我们需要把它反序列化成json。 json长什么样子可以直接去百度即可。 …

springCloud中将redis共用到common模块

一、 springCloud作为公共模块搭建框架 springCloud 微服务模块中将redis作为公共模块进行的搭建结构图&#xff0c;如下&#xff1a; 二、redis 公共模块的搭建框架 如上架构&#xff0c;代码如下pom.xml 关键代码&#xff1a; <dependencies><!-- SpringBoot Boo…

Thread Local六连问,你扛得住吗?

一、Thread Local 是什么? 线程本地变量。当使用ThreadLocal维护变量时&#xff0c;ThreadLocal为每个使用该变量的线程提供独立的变量副本&#xff0c;所以每个线程都可以独立地改变自己的副本&#xff0c;而不影响其他线程&#xff0c;做到了线程隔离。 二、Thread Local …

windows hash简介

一、hash简介 1、Windows系统使用两种方法对用户的密码进行哈希处理。它们分别是LAN Manager(LM)哈希和 NT LAN Manager(NTLM)哈希 2、所谓哈希(hash)&#xff0c;就是使用一种加密函数进行计算后的结果。这个加密函数对一个任意长度的 字符串数据进行一次数学加密函数运算…

电厂三维人员定位系统的应用与优势有哪些?

在电力行业的快速发展中&#xff0c;电厂的安全生产和管理显得尤为重要。近年来&#xff0c;随着信息技术的不断进步&#xff0c;电厂三维人员定位系统逐渐成为电厂安全管理的新利器。该系统利用三维技术&#xff0c;实现对电厂内部人员位置的实时监控与定位&#xff0c;大大提…

图像操作的基石Numpy

OpenCV中用到的矩阵都要转换成Numpy数组 Numpy是一个经高度优化的Python数值库 创建矩阵 检索与赋值[y,x] 获取子数组[:,:] 一 创建数组array() anp.array([2,3,4]) cnp.array([1.0,2.0],[3.0,4.0]]) import numpy as npanp.array([1,2,3])bnp.array([[1,2,3],[4,5,6]])pr…