遥感影像-语义分割数据集:2021年昇腾杯复赛数据集详细介绍及训练样本处理流程

原始数据集详情

简介:细粒度语义分割赛道依据现有的遥感地物分类要求, 结合现有的地物分类实际需求,参照地理国情监测、 “三调”等既有地物分类标准,依据遥感地物“所见即所得”原则, 设计地物要素分类体系,共涉及二级子类(47类),数据为0.8米-2米分辨率的遥感图像。

KeyValue
卫星类型GaoFen-1、ZiYuan-3
覆盖区域未知
场景未知
分辨率0.8m-2m
数量35000张
单张尺寸512*512
原始影像位深8位
标签图片位深8位
原始影像通道数四通道
标签图片通道数单通道

标签类别对照表

像素值类别名(中文)像素值类别名(中文)
0背景24公路
1旱地25铁路
2果园26硬化地表
3茶园27水工设施
4桑园28城墙
5橡胶园29温室、大棚
6苗圃30固化池
7花圃31工业设施
8其他经济苗木32沙障
9乔木林33其他构筑物
10灌木林34露天采掘场
11乔灌混合林35堆放物
12竹林36建筑工地
13疏林37其他人工堆掘地
14绿化林地38盐碱地表
15人工幼林39泥土地表
16稀疏灌草丛40沙质地表
17天然草地41砾石地表
18人工草地42岩石地表
19多层及以上房屋建筑区43河渠
20低矮房屋建筑区44水面
21废弃房屋建筑区45冰川与常年积雪
22多层及以上独立房屋建筑46水田
23低矮独立房屋建筑

数据处理部分

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
在这里插入图片描述

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:

在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示


├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val├── images│   ├── 2522_512_512.tif│   ├── 2523_0_0.tif│   └── ......└── labels├── 2522_512_512.tif├── 2523_0_0.tif└── ......

需要原始数据集、预处理后数据集、裁剪后可训练数据集、数据处理完整代码的小伙伴可私信哦!

表1:地物要素分类说明
一级分类二级分类参考说明
种植土地水田综合考虑农情信息,水田主要为水稻。
种植土地旱地旱地与水田相比,通常丘陵平原地区的旱地地块较水田田块大, 在机械化水平较高的地区旱地地块一般呈长条状。 山区半山区由于地形原因常常不规则,种植作物种类较多,色调多样。
种植土地果园指被人工种植的果树覆盖的连片区域。果树主要是指能生产人类食用果实的木本或多年生草本植物。
种植土地茶园指被人工种植的茶树覆盖的连片区域。
种植土地桑园指被人工种植的桑树覆盖的连片区域。
种植土地橡胶园指被人工种植的橡胶树覆盖的连片区域。
种植土地苗圃指被人工繁殖、培育的苗木成片覆盖的地表。
种植土地花圃指以生产草本花卉为目的,由人工繁殖、培育的草本花卉成片覆盖的地表。
种植土地其他经济苗木指被人工种植的其他多年生藤本经济作物覆盖的连片区域。
林草覆盖乔木林由具有高大明显主干的非攀缘性多年生木本植物为主体(乔木树冠覆盖面积占65%以上) 构成的片林或林带,高度一般大于5米。
林草覆盖灌木林由生长低矮的多年生灌木型木本植物为主体 (灌木树冠覆盖面积占木本植物总覆盖面积65%以上) 构成的植被,覆盖度大于30%,高度一般低于5米。
林草覆盖乔灌混合林由乔木和灌木交替生长混合覆盖但两者林冠覆盖面积各自都不超过65%(含), 且树木总体覆盖度大于30%的地表。
林草覆盖竹林全部由各类竹子组成的纯林或仅混生少量针阔叶树种的植被类型。
林草覆盖疏林指由各类林木组成但覆盖度较低,郁闭度在0.1~0.2的林地。
林草覆盖绿化林地城镇等人口集中居住范围内的街巷、零星地块、 街心花园以及道路隔离绿化带等范围内人工种植的 绿化树木覆盖形成的小面积片状或带状区域(不包括楼顶种植的树木)。 仅适用于城镇等人口集中居住范围内的街巷、零星地块、 街心花园以及道路隔离绿化带等范围内为绿化环境而种植的树木形成的小面积林地, 不包括公园内大片的长期自然生长林地。
林草覆盖人工幼林以造林为目的,人工种植不久、处于初长阶段、树木矮小、枝叶稀少且树冠覆盖度低于20%的未成林。
林草覆盖稀疏灌草丛在荒漠或植被稀疏地区丘团状生长的低矮灌木或灌草丛,成群分布,但平均覆盖度低于30%、大于10%的地表。
林草覆盖天然草地以天然生长或半人工培育的草本植物为主覆盖的地表。 一般未经改良或经过不破坏天然植被条件下的改良,用于放牧或割草, 包括以牧为主的树木覆盖度在10%以下的疏林草地和灌丛草地。
林草覆盖人工草地通过耕翻、完全破坏、清除原有天然植被后,人为播种、 栽培建植的以草本植物为主体的人工植被及其生长的土地, 包含人工栽植林木覆盖度小于10%的人工疏灌丛群落或疏林群落及其生长的土地。 包括饲用为主要目的的人工牧草地和特殊用途如改善环境的绿化草地。
房屋建筑多层及以上房屋建筑区层高在4层或以上,或楼高10米以上,或在高分辨率遥感影像上有明显阴影的房屋建筑为主的区域。
房屋建筑低矮房屋建筑区层高在1-3层、或楼高10米以下、或在高分辨率遥感影像上无明显阴影的房屋建筑为主的区域。
房屋建筑废弃房屋建筑区人口整体迁移、无人居住、废弃的农村地区连片房屋建筑区。
房屋建筑多层及以上独立房屋建筑层高在4层及以上、或楼高10米以上的独立房屋建筑。
房屋建筑低矮独立房屋建筑层高在3层及以下、或楼高10米以下的独立房屋建筑。
铁路与道路铁路铁路指被火车行车轨道及路基覆盖的地表。
铁路与道路公路连接城市间的道路,又称城际公路,包括国道、省道、县道、乡道、 专用公路以及公路之间的连接道。专用公路包括但不限于林区公路、 厂矿道路、边境巡逻道路等供专业车辆通行有专门用途的道路。
构筑物硬化地表使用水泥、沥青、砖石、夯土等材料连片露天铺设的地表, 或由于人类社会经济活动经常性碾压、踩踏形成的裸露地表。 包括人工长期堆积的各种矿物、尾矿、弃渣、垃圾、沙土、岩屑等(人工堆积物)覆盖的地表等。
构筑物水工设施为消除水害和开发利用水资源而修建的工程设施。
构筑物城墙古代城墙,包括长城和城市古城墙。
构筑物温室、大棚用来栽培植物或用于养殖的能透光和保温(或加温)的设施, 农业大棚为具有一定规模、排列紧密整齐,条状浅蓝绿色或白色窄形。
构筑物固化池用建筑材料修建的具有规则几何形态(多呈方形或圆形)的露天池沼覆盖的地表。 包括游泳池、污水处理池、晒盐池及其他类型固化池。
构筑物工业设施露天安置的大型工业设备设施包括采油、炼油、储油、炼钢、发电、输电等设施。
构筑物沙障为消减风速、固定流动或半流动沙丘,用柴草、秸秆、粘土、树枝、板条、卵石等物料在沙面上连片建构的障蔽物。
构筑物其他构筑物其他未分类的人工构筑物。
人工堆掘地露天采掘场露天开采对原始地表破坏后长期出露形成的地表, 如露天采掘煤矿、铁矿、铜矿、稀土、石料、沙石以及取土等活动人工形成的裸露地表。
人工堆掘地堆放物人工长期堆积的各种矿物、尾矿、弃渣、垃圾、沙土、岩屑等(人工堆积物)覆盖的地表。
人工堆掘地建筑工地自然地表被破坏,正在进行土木建筑工程施工的场地区域,城镇中的房屋拆迁待建区域也算。
人工堆掘地其他人工堆掘地未分类的其他人工堆掘地。
荒漠与裸露地盐碱地表指表层裸露物以盐碱为主的地表。
荒漠与裸露地泥土地表指表层裸露物以泥质或裸土为主的地表。
荒漠与裸露地沙质地表指表层裸露物以沙质为主的地表,包括沙漠、沙滩等。
荒漠与裸露地砾石地表指表层裸露物以块状砾石为主的地表。
荒漠与裸露地岩石地表指表层裸露物以基岩为主的地表。
水域河渠带状或线状水域。
水域水面湖盆及其承纳的水体、海面等水表面。
水域冰川与常年积雪常年被冰雪覆盖的地表。包括粒雪原和冰川的范围。
背景背景没有人工标注的区域。

需要原始数据集、预处理后数据集、裁剪后可训练数据集、数据处理完整代码的小伙伴可私信哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/597921.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Excel技巧之【如何修改密码】

我们知道,Excel可以设置多种密码来保护文件,那想要修改密码,要如何操作呢?下面小编来分享一下Excel常用的3种密码的修改方法,一起来看看吧! 1. “打开密码” 想要修改Excel表格的“打开密码”&#xff0c…

scratch给数据清单排序 2023年12月中国电子学会图形化编程 少儿编程 scratch编程等级考试四级真题和答案解析

目录 scratch给数据清单排序 一、题目要求 1、准备工作 2、功能实现 二、案例分析

Web前端篇——ElementUI之el-scrollbar + el-backtop + el-timeline实现时间轴触底刷新和一键返回页面顶部

ElementUI之el-scrollbar el-backtop el-timeline实现时间轴触底刷新和一键返回页面顶部。 背景:ElementUI的版本(vue.global.js 3.2.36, index.css 2.4.4, index.full.js 2.4.4) 废话不多说,先看动…

VSCode远程开发配置和SSH免密登录

目录 概要远程开发插件安装开始连接SSH免密登录开发环境配置 概要 现在很多公司都是直接远程到服务器上写代码,使用远程开发,可以在与生产环境相同的环境中开发、测试和部署代码,减少因环境不同而导致的问题。本文将详细介绍如何通过VSCode连…

MS713/MS713T:CMOS 低压、4Ω四路单刀单掷开关,替代ADG713

产品简述 MS713/MS713T 是一款单芯片 CMOS 4 路可选择开关,具有低 功耗、高开关速度、低导通阻抗、低漏电和高带宽特性。其工作 电压范围是 1.8V 到 5.5V ,可以广泛应用在电池供电仪器仪表、新 一代的模数转换和数模转换系统中。其高带宽特性可用在 …

【React系列】网络框架axios库的使用

本文来自#React系列教程:https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. axios库的基本使用 1.1. 网络请求的选择 目前前端中发送网络请求的方式有很多种: 选择一:传统的Aj…

【K8S 云原生】Pod资源限制、Pod容器健康检查(探针)

目录 一、docker的重启方式和K8S重启方式 1、Pod的重启方式: 2、docker的重启策略: 二、yaml文件快速生成: 三、pod的状态: 四、Pod的资源限制 1、限制的方式和种类 2、CPU的限制的格式: 五、K8S拉取镜像的策…

一文讲透使用SPSS统计分析软件如何处理缺失值?

推荐采用《SPSS统计分析入门与应用精解(视频教学版)》 杨维忠、张甜 清华大学出版社“1.9 缺失值处理” 的解答。 本节内容选自《SPSS统计分析入门与应用精解(视频教学版)》 杨维忠、张甜 清华大学出版社“1.9 缺失值处理”&#…

C++完成使用map Update数据 非二进制

1、在LXMysql.h和LXMysql.cpp分别定义和编写关于pin语句的代码 //获取更新数据的sql语句 where语句中用户要包含where 更新std::string GetUpdatesql(XDATA kv, std::string table, std::string where); std::string LXMysql::GetUpdatesql(XDATA kv, std::string table, std…

数据结构与算法教程,数据结构C语言版教程!(第二部分、线性表详解:数据结构线性表10分钟入门)七

第二部分、线性表详解:数据结构线性表10分钟入门 线性表,数据结构中最简单的一种存储结构,专门用于存储逻辑关系为"一对一"的数据。 线性表,基于数据在实际物理空间中的存储状态,又可细分为顺序表&#xff…

leetcode贪心(单调递增的数字、监控二叉树)

738.单调递增的数字 给定一个非负整数 N&#xff0c;找出小于或等于 N 的最大的整数&#xff0c;同时这个整数需要满足其各个位数上的数字是单调递增。 &#xff08;当且仅当每个相邻位数上的数字 x 和 y 满足 x < y 时&#xff0c;我们称这个整数是单调递增的。&#xff…

Oracle导出CSV文件

利用spool spool基本格式&#xff1a; spool 路径文件名 select col1||,||col2||,||col3||,||col4 from tablename; spool off spool常用的设置&#xff1a; set colsep ;    //域输出分隔符 set echo off;    //显示start启动的脚本中的每个sql命令&#xff0c;缺…

Python 可视化 web 神器 streamlit

官网&#xff1a;https://streamlit.io/ github&#xff1a;https://github.com/streamlit/streamlit API 参考&#xff1a;https://docs.streamlit.io/library/api-reference 1、streamlit 简介 streamlit 简介 Streamlit 是Python可视化 web 神器 &#xff0c;是一个开箱即…

宇宙最快最高级且开源的密码破解利器 —— Hashcat

目录 一. 前言 二. Hashcat 安装 2.1. Hashcat 官网下载 2.2. hash 类型识别工具 HashIdentifier 2.3. John The Ripper 三. Hashcat 全部参数 3.1. Hashcat 的攻击模式&#xff08;-a 参数&#xff09; 3.2. 输出格式&#xff08;--outfile-format 参数&#xff09; …

【算法专题】回溯算法

回溯 回溯算法1. 全排列2. 子集3. 找出所有子集的异或总和再求和4. 全排列Ⅱ5. 电话号码的字母组合6. 括号生成7. 组合8. 目标和9. 组合总和10. 字母大小写全排列11. 优美的排列12. N皇后13. 有效的数独14. 解数独15. 单词搜索16. 黄金矿工17. 不同路径III 回溯算法 什么是回溯…

Unity 使用 Plastic 同步后,正常工程出现错误

class Newtonsoft.Json.Linq.JToken e CS0433:类型"JToken"同时存在于"Newtonsoft.Json.Net20,Version3.5.0.0,Cultureneutral,,PublicKeyToken30ad4fe6b2a6aeed"和"Newtonsoft.Json, Version12.0.0.0,Cultureneutral,PublicKeyToken30ad4fe6b2a6aeed…

初始Java

目录 前言&#xff1a; 配置环境变量&#xff1a; Java程序的执行&#xff1a; JDK、JRE、JVM之间的关系&#xff1a; 一些概念&#xff1a; 基础语法&#xff1a; main方法&#xff1a; 快捷方法&#xff1a; 注释方法&#xff1a; 符号&#xff1a; 编码格式&am…

打包与解包:Go 中 archive 库的实战应用

打包与解包&#xff1a;Go 中 archive 库的实战应用 引言archive 库概览支持的文件格式archive 库与其他 Go 标准库的协同 使用 archive/tar 打包与解包打包文件到 Tar 归档从 Tar 归档解包文件 使用 archive/zip 进行压缩与解压缩创建 Zip 压缩文件从 Zip 归档解压文件 总结与…

PythonStudio=vb7国人写的python可视化窗体设计器IDE,可以替代pyqt designer等设计器了

【免费】PythonStudio-1.1.5-x86最新版国人开发的python界面ide&#xff0c;可以制作窗体资源-CSDN文库https://download.csdn.net/download/xiaoyao961/88688447 【免费】PythonStudio-1.1.5-x64-Setup.exe国人开发的python界面ide&#xff0c;可以制作窗体资源-CSDN文库https…

VM中安装Linux以及Win系统

目录 准备条件 安装RHEL9.3 步骤一&#xff1a;按照图片进行操作 步骤二&#xff1a;选择配置方式 步骤三&#xff1a;选择虚拟芯片 步骤四&#xff1a;安装镜像 步骤五&#xff1a;选择操作系统 步骤六&#xff1a;名字以及存储位置 步骤七&#xff1a;配置虚拟机参数…