视觉分割的定义与性能度量

视觉分割的定义与性能度量

bicheng/2025/7/13 23:08:37/文章来源:https://blog.csdn.net/smile__everydays/article/details/139998685

文章目录

- - 视觉分割的定义
  - - 语义分割(Semantic Segmentation)
    - 实例分割(instance Segmentation)
    - 全景分割(Panoptic Segmentation)
    - 视频语义分割(Video Semantic Segmentation)
    - 视频实例分割(Video instance Segmentation)
    - 视频全景分割(Video Panoptic Segmentation)
    - 各任务对比
  - 视觉分割任务的指标与度量
  - - Intersection over Union (IoU)交并比
    - Mean Average Precision(mAP,平均精度)
    - 在常见的分割论文中使用的有关数据集、任务和度量标准的精彩总结

视觉分割的定义

下图来自李飞飞教授和其学生讲授的CS-231N

在这里插入图片描述

在transformer时代，目标检测和实例分割其实基本上可以看作是一个东西了。

语义分割(Semantic Segmentation)

其实是对输入图像进行像素级分类。

语义分割

语义分割不仅能分辨出图像中的物体，还能在像素级理解这些物体的边界，在深度学习时代，语义分割问题其实是一个密集预测问题。

实例分割(instance Segmentation)

在这里插入图片描述

不仅为每个像素分配一个类别标签，还能将同一类别的不同对象区分开来。

既能识别每个物体的类别，又能识别这些物体的单个实例。

理解不同物体之间的关系。

比语义分割和目标检测都更具挑战性。

全景分割(Panoptic Segmentation)

全景分割

结合语义分割和实例分割，提供对场景的全面理解。
为每个像素贴上类别标签和实例标签。
全景分割法分配一个语义标签（如 “车”、“树”、“路”），并区分同一类别的多个实例（如车 1、车 2）。这意味着所有像素都会被赋予一个类别标签，属于 "事物 "类别（可数对象，如人、汽车等）的像素还会被区分为不同的实例。
"全景 "指的是 “看到一切”，反映了这项任务的目的是整合语义分割（能很好地处理 "物 "类，如天空、道路、草地等）和实例分割（能很好地处理 "物 "类）的优势，前者是无定形的，不可数的，而后者是可数的。

视频语义分割(Video Semantic Segmentation)

classifies each pixel in an image into a certain class along the video.
explore the temporal segmentation consistency

视频实例分割(Video instance Segmentation)

在像素级别分割和跟踪前景物体。
探索时间一致性(temporal consistency)和实例 ID 一致性(instance ID consistency)。
比图像实例分割更复杂，因为它需要处理物体运动、外观变化、遮挡以及各帧标签的时间一致性等问题。
算法还需要将当前帧中的分割实例与之前帧中的实例联系起来，以确保它们在不同帧的实例ID一致性。

视频全景分割(Video Panoptic Segmentation)

视频全景分割

识别视频序列中每一帧中的每个像素并对其进行分类，并在不同帧中保持实例（单个对象）ID的一致性。
这是一项复杂的任务，因为需要处理运动、外观变化、遮挡以及保持各帧标签的时间一致性(temporal consistency )。
在视频的每一帧中，视频全景分割的目的是为每个像素分配一个类别标签（语义分割），区分同一类别的不同实例（实例分割），并在视频序列的不同帧中保持这些实例标签的一致性。这包括识别哪些像素属于 "物 "类（如天空、草地、道路），哪些属于 "事 "类（如人、车、狗），并在整个视频中跟踪 "事 "类的各个实例。

各任务对比

在这里插入图片描述

参考论文

Transformer-Based Visual Segmentation: A Survey, arxiv, 2023.
Largescale video panoptic segmentation in the wild: A benchmark, CVPR-2022.

视觉分割任务的指标与度量

Intersection over Union (IoU)交并比

IoU是一种量化预测分割与实况（实际）分割之间重叠程度的指标。对于给定类别，IoU 的计算方法是将预测分割与实际分割之间的重叠面积除以结合面积（即预测分割或实际分割所覆盖的总面积）。

当语义分割包含多个类别，而不仅仅是一个类别时，要用到 mIoU。
平均联合交叉（mIoU）就是所有类别的平均 IoU。
要计算 mIoU，首先要分别计算每个类别的 IoU，然后将这些 IoU 值相加，再除以类别数。

mIoU 分值从 0 到 1 不等，1 表示所有类别的预测分割与实际分割完全重合，0 表示完全没有重合。mIoU 值越高，表示分割性能越好。

Mean Average Precision(mAP,平均精度)

mAP 是Mean Average Precision的缩写，是用于评估目标检测和实例分割模型性能的常用指标。

准确率(Precision)：准确率是模型识别的实例中正确识别实例的比例。
召回率(Recall)： Recall 是在所有相关实例（本应被识别的实例）中被正确识别的实例的比例。

在实例分割任务中，对于每个预测对象，我们都会计算其与真实对象的交并比（IoU）。如果 IoU 大于某个阈值（如 0.5），则预测结果被视为真阳性；反之，则为假阳性。

mAP

然后，我们绘制不同 IoU 阈值下的精度-召回曲线。平均精度（AP）就是精度-召回曲线下的面积。如果我们计算不同 IoU 阈值下的 AP，并取这些值的平均值，就得到了 mAP。

11点法求AP:

在这里插入图片描述

从本质上讲，mAP 量化了实例分割模型在不同 IoU 阈值下的性能。mAP 越高，说明模型性能越好。这一指标既考虑了分割的准确性（通过 IoU），也考虑了模型正确识别对象的能力（通过精确度和召回率）。

在常见的分割论文中使用的有关数据集、任务和度量标准的精彩总结

有关数据集、任务和度量标准的总结

参考论文：Transformer-Based Visual Segmentation: A Survey, arxiv, 2023.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/35639.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

云计算【第一阶段（21）】引导过程与服务控制

云计算【第一阶段（21）】引导过程与服务控制

目录一、linux操作系统引导过程 1.1、开机自检 1.2、MBR引导 1.3、GRUB菜单 1.4、加载 Linux 内核 1.5、init进程初始化 1.6、简述总结 1.7、初始化进程centos 6和7的区别二、排除启动类故障 2.1、修复MBR扇区故障 2.1.1、实验 2.2、修复grub引导故障 2.2.1、实…

阅读更多...

基于redisson实现tomcat集群session共享

基于redisson实现tomcat集群session共享

目录 1、环境 2、修改server.xml 3、修改context.xml 4、新增redisson配置文件 5、下载并复制2个Jar包到Tomcat Lib目录中 6、安装redis 7、配置nginx负载均衡 8、配置测试页面 9、session共享测试验证前言： 上篇中，Tomcat session复制及ses…

阅读更多...

【UE5.3】笔记3-静态网格体，BSP

【UE5.3】笔记3-静态网格体，BSP

静态网格体组件主要有两个属性一个是静态网格体：对应的也就是模型，比如fbx，maya，obj等格式一个是材质：由各种贴图、渲染设置等，比如unity里的shader BSP画刷： 打开放置Actor选项卡&#…

阅读更多...

pandas 查看数据集中某个特征（列）为 NA 的所有行

pandas 查看数据集中某个特征（列）为 NA 的所有行

要查看数据集中某个特征（列）为 NA 的所有行，可以使用 Pandas 库中的 isna() 或 isnull() 函数来识别缺失值，然后使用布尔索引来筛选这些行。以下我举个例子： 假设数据集存储在一个名为 data.csv 的 CSV 文件中&#x…

阅读更多...

做到这九点，工作就无后顾之忧

做到这九点，工作就无后顾之忧

大家好，今天又跟大家分享一篇，怎么在职场上做到挺起腰杆做事。全文共分9点，尤其最后一点最为重要。篇幅有点长，全文共计三千多字，请耐心看完。如果您觉得对您有些帮助，点赞收藏关注。谢谢您的支持。在职场…

阅读更多...

Apache Doris主要应用场景和一些实际案例

Apache Doris主要应用场景和一些实际案例

Apache Doris 是一个现代化的分布式分析型数据库，具备高性能、实时性和高并发性等特点，被广泛应用于多种场景。以下是Doris的主要应用场景和一些实际案例。应用场景 1. 实时数据分析数据流处理：Doris可以实时 ingest（引入&am…

阅读更多...

嵌入式项目分享| 终极智能手表，全过程+全开源分享

嵌入式项目分享| 终极智能手表，全过程+全开源分享

这是一个非常完整的智能手表开源项目，功能齐全，且资料开源，如果你是：自己平时喜欢diy的工程师，想要提升开发技能的学生，马上要做毕设的大四学生，这个手表很值得一做，别错过了~~ 所有开源的资料以及原文链接见文末。先来看下这个手表的功能：首先，是一个可以佩戴的手…

阅读更多...

windows10 无法识别双频合一的5Gwifi

windows10 无法识别双频合一的5Gwifi

windows10 无法识别双频合一的5Gwifi 在网络配置中指定 wireless mode 为802.11a 或802.11ac 这两个是 5G网络的协议，如果不存在则说明无线网卡不支持5G网络

阅读更多...

使用goroutine开多个协程交替打印1234，使用channel实现

使用goroutine开多个协程交替打印1234，使用channel实现

使用goroutine开多个协程交替打印1234，使用channel实现 package mainimport ("fmt""sync""time" )var (chNum chan intwg sync.WaitGroup )func main() {chNum make(chan int, 4)chNum <- 1for i : 1; i < 4; i {wg.Add(1…

阅读更多...

wss客户端请求(python websocket)

wss客户端请求(python websocket)

import asyncio import websockets import jsonasync def connect_to_wss(uri):# 连接到WSS服务器async with websockets.connect(uri) as websocket:# 执行一些操作，例如发送和接收消息data {"脱敏处理"}await websocket.send(json.dumps(data))while 1…

阅读更多...

MySQL时间转换

MySQL时间转换

1. bigint类型的时间戳 1.1 将bigint转为datetime FROM_UNIXTIME(时间戳 / 1000) 1.2 将bigint转为date 方式一： DATE(FROM_UNIXTIME(时间戳 / 1000)) 方式二：字符串隐式转换 FROM_UNIXTIME(时间戳 / 1000, %Y-%m-%d) 1.3 将bigint转为指定格式的…

阅读更多...

修改docker中mongodb容器的时区

修改docker中mongodb容器的时区

假设容器名称为mongodb，设置时区为上海时区的命令为： docker exec -it mongodb bash -c "ln -snf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && echo Asia/Shanghai > /etc/timezone"验证时区更改： docker e…

阅读更多...

51单片机STC89C52RC——9.1 DS1302涓流充电计时芯片

51单片机STC89C52RC——9.1 DS1302涓流充电计时芯片

目录目的/效果一，STC单片机模块二，DS1302计时器 2.1 特性/板子位置 2.1.1 特性 2.1.2 板子上的位置 2.2 针脚定义 2.3 数据传输 2.3.1 读数据 2.3.2 写数据 2.4 BCD码 2.5 可编程涓流充电器 2.6 时钟动态设置三，创建Keil项目…

阅读更多...

《数据赋能：一本书讲透数字化营销与运营》—— 从正确的数据观开始

《数据赋能：一本书讲透数字化营销与运营》—— 从正确的数据观开始

基于数据打通的“全链路”营销是当下的“时髦”，应用它的前提是什么？深度营销和运营的关键数据如何获得？如何利用数据进行更精准的营销投放？如何利用数据优化投放的效果？如何促进消费者的转化，以及激活留存…

阅读更多...

在 Postman 中使用 Body 进行 POST 请求

在 Postman 中使用 Body 进行 POST 请求

Postman 是开发者日常工具箱中不可缺少的一部分，特别是在 API 开发和调试环节中。为什么使用 POST 请求 POST 请求用于向服务器发送数据，这些数据通常被处理后存储。与 GET 请求不同，POST 请求将数据嵌入请求体（Body&#xff0…

阅读更多...

005 数据结构

005 数据结构

文章目录线性结构树结构图结构在计算机科学中，数据结构（Data Structure）是一种组织和存储数据的方式，它定义了数据的逻辑关系（数据的连接方式）以及物理存储（数据的存储方式）。数据…

阅读更多...

项目经验之农业技术交流平台

项目经验之农业技术交流平台

文章目录一、请你介绍一下你这个项目吧？二、如何使用 Elasticsearch 实现内容资源检索功能，并合理的设计索引Mapping 规则，引入IK中文分词器，详细介绍一下？1. 安装和配置 Elasticsearch 和 IK 分词器2. 配置 Elasticsearch 索引和 Mapping3. 插入数据4. 搜索数据三、整合…

阅读更多...

算法刷题日志 hot100 数组分类

算法刷题日志 hot100 数组分类

文章目录 [169. 多数元素](https://leetcode.cn/problems/majority-element/)旋转图像215. 数组中的第K个最大元素](https://leetcode.cn/problems/kth-largest-element-in-an-array/description/)238. 除自身以外数组的乘积](https://leetcode.cn/problems/product-of-array-e…

阅读更多...

HQChart使用教程30-K线图如何对接第3方数据40-日K叠加股票增量更新

HQChart使用教程30-K线图如何对接第3方数据40-日K叠加股票增量更新

HQChart使用教程30-K线图如何对接第3方数据40-日K叠加股票增量更新叠加股票叠加日K更新Request 字段说明Data.symbol 协议截图返回json数据结构stock HQChart代码地址交流叠加股票示例地址:https://jones2000.github.io/HQChart/webhqchart.demo/samples/kline_index_edit.…

阅读更多...

等保相关总结

等保相关总结

等级划分准则等保2.0基本框架等保2.0变化解读等级测评 3保1评分保工作简介分保工作流程等保等保工作流程：定级 -》备案 -》整改 -》测评 -》复核关保密评

阅读更多...

最新文章