语义分割介绍

语义分割介绍

pingmian/2025/7/13 9:19:47/文章来源:https://blog.csdn.net/Life1213/article/details/140694327

1. 定义

语义指具有人们可用语言探讨的意义，分割指图像分割。
语义分割(semantic segmentation)能够将整张图的每个部分分割开，使每个部分都有一定类别意义（语义），让计算机可以理解图像。
语义分割是以描边的形式，将整张图不留缝隙地分割成每个区域，每个区域是一个类别，没有类别的默认为背景background。
在这里插入图片描述
此外，有两个与语义分割类似的说法，但不是同一个概念：

实例分割： 实例分割会对同一类的不同对象进行分割。比如说，语义分割会将车分为一类，人分为另一类。而实例分割会将车继续进行分类，每一辆车都是一个实例类别。
全局分割： 简单地来讲，全景分割是实例分割与语义分割的结合。全景分割中的每一个像素点都会分成对应的语义标签和实例标签。如果一种类别里有多个实例，会用不同的颜色进行区分

在这里插入图片描述

2 常用的数据集

2.1 PASCAL VOC

介绍
使用一系列PNG图片，图片中的每个像素都记录了所属的类别索引，也就是像素值，不同的像素值代表不同的类别。
注意，这些PNG是使用调色板的方式进行存储，通过像素值来表示颜色，如像素1对应(127,0,0)。因此这些图片是单通道的图片。

由下图可知，对于边缘与不确定的像素会使用特殊的颜色来标记，使用了像素值为255进行填充。而背景则使用像素值0来填充。
在这里插入图片描述

2.2 MS COCO

使用该数据集进行语法分割时，会针对图像中的每个目标都记录了一个多边形的坐标，这个多边形框柱了目标。
这个数据可以用于语义分割与实例分割。
在这里插入图片描述

3. 结果的表现形式

不同像素值代表不同的类别，属于同一类别的像素有相同的像素值。利用像素值来代表各个类别
在这种形式中使用了调色板，也就是每个像素值都对应着一个颜色。

在这里插入图片描述

4. 评价指标

首先是一些标识：

$n_{ij}$ :类别 $i$ 被预测为类别 $j$ 的像素个数
$n_{cls}$ :类别的个数，包含背景
$t_i=\textstyle \sum_{j}^{}n_{ji}$ :类别 $i$ 有多少个像素（真实标签）

4.1 Pixel Accuracy (Global Acc)

正确预测的像素个数 / 总像素个数
在这里插入图片描述

4.2 mean Accuracy

先求出每个类别的得分：对于当前类别，预测正确的个数/当前类别的总个数。
然后将这些得分求和。
最后除于类别的个数

在这里插入图片描述

4.3 IoU

分母为真实类型为 $i$ 的像素和被预测类型为 $i$ 的像素的并集。
分子为预测正确的像素个数，两者消除得到类别 $i$ 的IoU得分
在这里插入图片描述

4.4 mean IoU

对全部类别的IoU得分求和，然取平均值。
在这里插入图片描述

4.5 例子

真实标签与预测标签的分布情况如图所示，并且结合两个情况得到预测正确与错误的情况，这里用一个矩阵表示，对象线上的总和为预测正确的个数，其余为预测错误的。
在这里插入图片描述
通过上述数据，可以计算出性能评分：

① global accuracy：
在这里插入图片描述
② mean accuracy：
这里计算了每个类别的得分

③ IoU

5. 标注工具

① Labelme

② EISeg

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/50947.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【初阶数据结构篇】顺序表和链表算法题

【初阶数据结构篇】顺序表和链表算法题

文章目录顺序表算法题移除元素删除有序数组中的重复项合并两个有序数组链表算法题移除链表元素反转链表链表的中间结点合并两个有序链表链表分割链表的回文结构顺序表算法题不熟悉顺序表的可以先了解一下顺序表实现方法移除元素给你一个数组 nums 和一个值 val&#x…

阅读更多...

基于Xejen框架实现的C# winform鼠标点击器、电脑按键自动点击器的软件开发及介绍

基于Xejen框架实现的C# winform鼠标点击器、电脑按键自动点击器的软件开发及介绍

功能演示文章开始之前，仍然是先来个视频，以便用户知道鼠标连点器的基本功能软件主界面多功能鼠标连点器快速点击： 痕即鼠标点击器可以设定每秒点击次数，让您轻松应对高频点击需求。切换时长，即每次动作之间的间…

阅读更多...

【安卓】Android Studio简易计算器（实现加减乘除，整数小数运算，正数负数运算）

【安卓】Android Studio简易计算器（实现加减乘除，整数小数运算，正数负数运算）

目录前言运算效果一、创建一个新的项目二、编写xml文件（计算器显示页面） 三、实现Java运算逻辑编辑完整代码 xml文件代码： Java文件代码： 注： 前言随着移动互联网的普及，手机应用程序已…

阅读更多...

Linux_基础

Linux_基础

文件结构 Linux的文件结构是一个倒的树状图，具体结构如下： bin：存放二进制文件 boot：存放系统启动文件 dev：存放设备文件 etc：存放系统管理时要用到的各种配置文件和子目录 lib：存放系统动…

阅读更多...

【Vue2】3-使用Vue脚手架

【Vue2】3-使用Vue脚手架

目录初始化脚手架说明具体步骤模板项目的结构关于不同版本的Vue vue.config.js配置文件 ref属性配置项props mixin（混入） 插件 scoped样式总结TodoList案例 webStorage（浏览器本地存储） TodoList本地存储组…

阅读更多...

UE4Editor.exe运行与调试 “-run=XX” 命令行

UE4Editor.exe运行与调试 “-run=XX” 命令行

如果看到这么一条工作命令： %EnginePath%\Binaries\Win64\UE4Editor-Cmd.exe %ClientPath%\%ProjectName%.uproject -runHotPatcher {其它配置} 它意味着命令行，“-run” 后面接的内容是命令行， class UHotPatcherCommandlet :public UComma…

阅读更多...

【初阶数据结构篇】栈的实现（赋源码）

【初阶数据结构篇】栈的实现（赋源码）

文章目录栈1 代码位置2 概念与结构1.1概念1.2结构 2 栈的实现2.1 栈的初始化和销毁2.1.1 初始化2.1.2 销毁 2.2 栈顶插入和删除数据2.2.1 栈顶插入数据（压栈）2.2.2 栈顶删除数据（出栈） 2.3 返回栈顶数据2.4 返回栈的有效数据个数…

阅读更多...

C++类型强转

C++类型强转

C(四)类型强转新类型的强制转换可以提供更好的控制强制转换过程，允许控制各种不同种类的强制转换。C提供了四种转化 static_cast，reinterpret_cast，dynamic_cast 和 const_cast 以满足不同需求，C风格的强制转换好处是&#xff…

阅读更多...

【深度学习】语音合成，TTS，PaddleSpeech

【深度学习】语音合成，TTS，PaddleSpeech

https://paperswithcode.com/task/text-to-speech-synthesis https://github.com/PaddlePaddle/PaddleSpeech https://github.com/coqui-ai/TTS https://github.com/keonlee9420/Expressive-FastSpeech2 https://github.com/TensorSpeech/TensorflowTTS docker镜像&#x…

阅读更多...

【笔记】人工智能大模型在电力系统运行控制中的应用综述及展望

【笔记】人工智能大模型在电力系统运行控制中的应用综述及展望

据统计，截至 2019 年底，我国风电和光伏的装机容量已经达到 415 GW，美国的可再生能源全年发电量已超过燃煤发电，同时欧洲计划在 2050 年完成 100% 可再生能源互联电网的建设。为了响应国家提出的“碳达峰”“碳中和”政策，国家电网公司提出在有效保障能源安全供应的前提下，…

阅读更多...

嵌入式人工智能（31-基于树莓派4B的气压传感器-BMP280）

嵌入式人工智能（31-基于树莓派4B的气压传感器-BMP280）

1、气压传感器气压传感器（Pressure Sensor）是一种用于测量气体压力的装置。它可以将气体压力转换为电信号输出，进而实现对气体压力的监测和控制。气压传感器广泛应用于工业自动化、气象观测、建筑监测、航空航天等领域。气压传感器的工作…

阅读更多...

未来的智能农业：智能合约如何提升农业生产效率和可持续性

未来的智能农业：智能合约如何提升农业生产效率和可持续性

随着全球人口的增长和资源的有限性，农业生产面临着越来越大的挑战。如何在提高生产效率的同时保障可持续发展成为全球农业发展的关键问题。智能合约作为一种基于区块链技术的自动化执行合约，正在逐渐应用于农业领域，为农业生产带来了新的机遇…

阅读更多...

Redis：RDB持久化

Redis：RDB持久化

1. 简介实现类似照片记录效果的方式，就是把某一时刻的数据和状态以文件的形式写到磁盘上，也就是快照。这样一来即使故障宕机，快照文件也不会丢失，数据的可靠性也就得到了保证。这个快照文件就称为RDB文件(dump.rdb)&#xff0c…

阅读更多...

从代码层面熟悉UniAD，开始学习了解端到端整体架构

从代码层面熟悉UniAD，开始学习了解端到端整体架构

0. 简介最近端到端已经是越来越火了，以UniAD为代表的很多工作不断地在不断刷新端到端的指标，比如最近SparseDrive又重新刷新了所有任务的指标。在端到端火热起来之前，成熟的模块化自动驾驶系统被分解为不同的独立任务，例如感知、…

阅读更多...

数据倾斜优化思路实践

数据倾斜优化思路实践

数据倾斜，顾名思义，就是在计算过程中数据分散度不够，导致某个节点数据过于集中，从而导致任务执行效率大大降低。参照对比下MR的整体流程和ODPS，整体结合理解数据倾斜发生的几个生命周期的节点，如下图&#…

阅读更多...

WordPress设置固定连接后提示404

WordPress设置固定连接后提示404

WordPress设置固定链接后出现404错误通常是因为服务器的伪静态规则没有正确设置。以下是几种常见的服务器环境下的解决方案： 宝塔面板：如果服务器安装了宝塔面板，可以在宝塔面板中选择对应的WordPress伪静态规则并保存设置。 Apache服务器&a…

阅读更多...

Linux——DNS服务搭建

Linux——DNS服务搭建

（一）搭建nginx 1.首先布置基本环境要求能够ping通外网，有yum源 2.安装nginx yum -y install nginx 然后查看验证 3.修改网页配置文件修改文件，任意编写内容，然后去物理机测试 （二）创建一…

阅读更多...

C++知识点总结：2.类和对象（自用）

C++知识点总结：2.类和对象（自用）

类和对象 1. 类和对象的关系2. 对象指针3. 在堆上创建对象4. 成员访问限定符5. 名字编码（Name Mangling）6.构造函数7.构造函数的重载8.初始化列表8. 成员变量初始化的顺序（通过初始化列表）9. 初始化 const 成员变量10. 析构函数11…

阅读更多...

【机器学习】pytorch 常用函数解析

【机器学习】pytorch 常用函数解析

目录一、基本函数介绍 1.1 nn.Module 类 1.2 nn.Embedding 1.3 nn.LSTM 1.4 nn.Linear 1.5 nn.CrossEntropyLoss 1.6 torch.save 1.7 torch.load 1.8 nn.functional 1.9 nn.functional.softmax 本文主要对 pytorch 中用到的函数进行介绍，本文会不断更新~…

阅读更多...

C语言内存函数精讲

C语言内存函数精讲

目录引言 1.内存分配函数malloc 2.内存释放函数free 3.内存拷贝函数memcpy 4.内存移动函数memmove 5.内存设置函数memset 6.内存比较函数memcmp 总结引言在C语言编程中，内存管理是核心技能之一。C语言提供了一系列内存操作函数，这些函数在动…

阅读更多...

最新文章