七天入门图像分割（1）：图像分割综述

七天入门图像分割（1）：图像分割综述

news/2025/7/4 13:54:52/文章来源:https://blog.csdn.net/cg129054036/article/details/120713569

在这里插入图片描述
最近在研究自动驾驶视觉语义地图构建，因为要使用到语义分割技术，趁此机会学习了百度飞桨的图像分割课程，课程蛮好的，收获也蛮大的。

课程地址：https://aistudio.baidu.com/aistudio/course/introduce/1767

1. 课程简要介绍

首先给出了图像分割的定义，如下面两张图所示，本质是对图像进行像素级分类。

下面是课程安排，本次课程总共有7节课，理论学习主要集中在前6节，最后一节是课程总结与前沿技术介绍。前面6节课安排如下：

在本次课程中，会学习到 FCN、U-Net、PSPNet、DeepLabv1-3等算法，这是课程的主要学习内容。
后面两节课会介绍图分割和实例分割经典算法。

2. 语义分割初探

根据任务和数据类型的不同，图像分割可以分为以下几类：

semantic segmentation（语义分割）：给图像中每个像素进行分类
instance segmentation（实例分割）：给每个框中的物体对应像素进行分类，不同的instance有不同的mask
panoptic segmentation（全场景分割）：每个框中的物体对应像素进行分类 + 背景像素分类

此外，还有视频目标分割与视频实例分割。

semantic / instance / panoptic segmentation	Video Object Segmentation	Video Instance Segmentation

3. 深度学习分割算法

下面是语义分割算法的基本流程，输入为图像与标签，输出为分类结果（与输入图像大小相同的单通道图）。

在这里插入图片描述
语义分割常用性能指标主要有两种：mIoU和mAcc。

4. 代码实践

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/439573.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

一步步编写操作系统 59 cpu的IO特权级1

一步步编写操作系统 59 cpu的IO特权级1

在保护模式下，处理器中的“阶级”不仅体现在数据和代码的访问，还体现在指令中。一方面将指令分级的原因是，有些指令的执行对计算机有着严重的影响，它们只有在0特权级下被执行，因此被称为特权指令（Privile…

阅读更多...

重读经典：《ImageNet Classification with Deep Convolutional Neural Networks》

重读经典：《ImageNet Classification with Deep Convolutional Neural Networks》

9年后重读深度学习奠基作之一：AlexNet【下】【论文精读】这两天偶然间在B站看了李沐博士对AlexNet论文的重新解读，收获满满。AlexNet是当今深度学习浪潮奠基作之一，发表在2012年。在视频中，李沐博士主要是分享了他的三步法快速读论…

阅读更多...

一步步编写操作系统 60 cpu的IO特权级2 什么是驱动程序

一步步编写操作系统 60 cpu的IO特权级2 什么是驱动程序

用户程序可以在由操作系统加载时通过指定整个eflags设置，操作系统如何设置自己的IOPL呢，即使内核IOPL为0也得写进去eflags寄存器中才生效。可惜的是，没有直接读写eflags寄存器的指令，不过可以通过将栈中数据弹出到eflags寄存器中来…

阅读更多...

详解惯性导航论文 RINS-W: Robust Inertial Navigation System on Wheels

详解惯性导航论文 RINS-W: Robust Inertial Navigation System on Wheels

本文介绍一篇惯性导航定位论文 RINS-W，论文发表于 IROS2019。在本论文中作者提出了仅使用一个IMU进行长时间惯性导航的方法。方法主要包括两个部分： 检测器使用循环神经网络来检测IMU的运动状况，如零速或零横向滑移；使用Invarian…

阅读更多...

【HDU - 5988】Coding Contest（网络流费用流，改模板）

【HDU - 5988】Coding Contest（网络流费用流，改模板）

题干： A coding contest will be held in this university, in a huge playground. The whole playground would be divided into N blocks, and there would be M directed paths linking these blocks. The i-th path goes from the uiui-th block to the vivi-t…

阅读更多...

一步步编写操作系统 61 任务状态段 TSS

一步步编写操作系统 61 任务状态段 TSS

I/O位图是位于TSS中的，它可以存在也可以不存在，它只是用来设置对某些特定端口的访问，没有它的话便默认为禁止访问所有端口。正是由于它可有可用，所以TSS的段界限TSS limit（即实际大小-1）并不固定。当TSS中不…

阅读更多...

重读经典：《Deep Residual Learning for Image Recognition》

重读经典：《Deep Residual Learning for Image Recognition》

ResNet论文逐段精读【论文精读】这是李沐博士论文精读的第二篇论文，这次精读的论文是ResNet。ResNet 是 CVPR2016 的最佳论文，目前谷歌学术显示其被引用数已经达到了90000。 ResNet论文链接为：https://arxiv.org/abs/1512.03385。 1.第一遍 …

阅读更多...

【CodeForces - 1131F 】Asya And Kittens（并查集，思维）

【CodeForces - 1131F 】Asya And Kittens（并查集，思维）

题干： Asya loves animals very much. Recently, she purchased nn kittens, enumerated them from 11 and nn and then put them into the cage. The cage consists of one row of nncells, enumerated with integers from 11 to nn from left to right. Adjacent…

阅读更多...

关于Xldown和Xlup的用法（Excel VBA）

关于Xldown和Xlup的用法（Excel VBA）

Xldown和xlup是一对组合，用于寻找某个区间中的非空单元格。首先我们在单元格的前7行填入如下数据： A1单元格： A2单元格：2 A3单元格：3 A4单元格：4 A5单元格： A6单元格：6 A7单元格&am…

阅读更多...

详解道路标记数据集 CeyMo: See More on Roads -- A Novel Benchmark Dataset for Road Marking Detection

详解道路标记数据集 CeyMo: See More on Roads -- A Novel Benchmark Dataset for Road Marking Detection

本文介绍一个新的道路标记检测数据集，论文收录于 WACV2022。Ceymo数据集总共包含2887张图片，标注了11类共4706个道路标记实例，图片分辨率为 192010801920\times108019201080。其中，对于每一个道路标记实例，作者采用了三…

阅读更多...

VBA类之一(初识类)

VBA类之一(初识类)

第一章开头篇 ——认识类 Visual Basic是基于对象的编程(注：本文所有的代码和讨论将都以VB为基础模型，不过我会尽量使用一些大家在VBA中常见的例子来做说明的。)，所以我们常见的一些东西其实都与类有关。不…

阅读更多...

【HDU - 5009】Paint Pearls（dp，链表优化dp）

【HDU - 5009】Paint Pearls（dp，链表优化dp）

题干： Lee has a string of n pearls. In the beginning, all the pearls have no color. He plans to color the pearls to make it more fascinating. He drew his ideal pattern of the string on a paper and asks for your help. In each operation, he sele…

阅读更多...

动手学无人驾驶（7）：车道线检测

动手学无人驾驶（7）：车道线检测

最近在研究视觉语义地图，需要进行车道线检测，发现这篇车道线检测论文效果蛮好的 （Ultra Fast Structure-aware Deep Lane Detection）。论文作者在知乎上已经介绍过了：https://zhuanlan.zhihu.com/p/157530787&#xff…

阅读更多...

Coursera自动驾驶课程第16讲：LIDAR Sensing

Coursera自动驾驶课程第16讲：LIDAR Sensing

在第15讲《Coursera自动驾驶课程第15讲：GNSS and INS Sensing for Pose Estimation》我们学习了自动驾驶定位中常用的两种传感器：IMU（惯性测量单元） 和GNSS（全球导航卫星系统）。本讲我们将学习自动驾驶汽…

阅读更多...

DB、ETL、DW、OLAP、DM、BI关系结构图

DB、ETL、DW、OLAP、DM、BI关系结构图

在此大概用口水话简单叙述一下他们几个概念： （1）DB/Database/数据库——这里一般指的就是OLTP数据库，在线事物数据库，用来支持生产的，比如超市的买卖系统。DB保留的是数据信息的最新状态，只有一…

阅读更多...

Tarjan 算法常用模板

Tarjan 算法常用模板

可以求每个点属于第几个强连通分量：https://blog.csdn.net/dellaserss/article/details/8267192 int Tarjan(int u){int v;dfn[u]low[u]Index;stack[Top]u;Instack[u]1;for(int i0;i<G[u].size();i){vG[u][i];if(!dfn[v]){Tarjan(v);low[u]min(low[u],low[v]);}…

阅读更多...

【HDU - 5012】Dice（模拟，bfs）

【HDU - 5012】Dice（模拟，bfs）

题干： There are 2 special dices on the table. On each face of the dice, a distinct number was written. Consider a 1.a 2,a 3,a 4,a 5,a 6 to be numbers written on top face, bottom face, left face, right face, front face and back face of dice A. S…

阅读更多...

重读经典：《Generative Adversarial Nets》

重读经典：《Generative Adversarial Nets》

GAN论文逐段精读【论文精读】这是李沐博士论文精读的第五篇论文，这次精读的论文是 GAN。目前谷歌学术显示其被引用数已经达到了37000。GAN 应该是机器学习过去五年上头条次数最多的工作，例如抖音里面生成人物卡通头像，人脸互换以及自动驾驶中…

阅读更多...

一步步编写操作系统 62 函数调用约定

一步步编写操作系统 62 函数调用约定

由于我们要将c语言和汇编语言结合编程啦，所以一定会存在汇编代码和c代码相互调用的问题，有些事情还是要提前交待给大家的，本节就是要给大家说下函数调用规约中的那些事儿。函数调用约定是什么？ 调用约定，calling co…

阅读更多...

重读经典：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

重读经典：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

ViT论文逐段精读【论文精读】这次李沐博士邀请了亚马逊计算机视觉专家朱毅博士来精读 Vision Transformer（ViT），强烈推荐大家去看本次的论文精读视频。朱毅博士讲解的很详细，几乎是逐词逐句地讲解，在讲解时把 ViT 相关…

阅读更多...

最新文章