最近在研究自动驾驶视觉语义地图
构建,因为要使用到语义分割技术
,趁此机会学习了百度飞桨的图像分割课程,课程蛮好的,收获也蛮大的。
课程地址:https://aistudio.baidu.com/aistudio/course/introduce/1767
1. 课程简要介绍
首先给出了图像分割
的定义,如下面两张图所示,本质是对图像进行像素级分类
。
下面是课程安排,本次课程总共有7节课,理论学习主要集中在前6节,最后一节是课程总结与前沿技术介绍。前面6节课安排如下:
- 在本次课程中,会学习到
FCN、U-Net、PSPNet、DeepLabv1-3
等算法,这是课程的主要学习内容。 - 后面两节课会介绍
图分割
和实例分割
经典算法。
2. 语义分割初探
根据任务和数据类型的不同,图像分割可以分为以下几类:
- semantic segmentation(
语义分割
):给图像中每个像素进行分类 - instance segmentation(
实例分割
):给每个框中的物体对应像素进行分类,不同的instance有不同的mask
- panoptic segmentation(
全场景分割
):每个框中的物体对应像素进行分类 + 背景像素分类
此外,还有视频目标分割
与视频实例分割
。
semantic / instance / panoptic segmentation | Video Object Segmentation | Video Instance Segmentation |
---|---|---|
3. 深度学习分割算法
下面是语义分割算法的基本流程,输入为图像与标签,输出为分类结果(与输入图像大小相同的单通道图)。
语义分割常用性能指标主要有两种:mIoU
和mAcc
。