语义分割概念及应用介绍

近年来,以深度学习为中心的机器学习技术引起了人们的关注。比如自动驾驶汽车已经逐渐成为可能,但在整个深度学习过程,需要算法识别和学习作为原始数据提供的图像,在这一过程中,应用到了语义分割技术。下面让我们来看看语义分割的需求是如何演变的。
       早期,计算机视觉的初始应用需求只是识别基本元素,例如边缘(线和曲线)或渐变。然而,仅仅通过全像素语义分割的创造来理解像素级的图像,它将属于同一目标的图像部分聚集在一起,从而扩展了语义分割的应用场景。
       识别每个像素或分组像素一起分配类别的过程可以通过以下过程:

  • 图像分类(image classification)——识别图像中存在的内容;
  • 物体识别和检测(object recognition and detection)——识别图像中存在的内容和位置(通过边界框);
  • 语义分割(semantic segmentation) ——识别图像中存在的内容以及位置(通过查找属于它的所有像素)

       下面进入本文的主要内容:

什么是语义分割?

       语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(例如,平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。许多人使用术语全像素语义分割(full-pixel semantic segmentation),其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。
       早期的计算机视觉问题只发现边缘(线条和曲线)或渐变等元素,但它们从未完全按照人类感知的方式提供像素级别的图像理解。语义分割将属于同一目标的图像部分聚集在一起来解决这个问题,从而扩展了其应用领域。
       注意,与其他基于图像的任务相比,语义分割是完全不同的且先进的,例如,

  • 图像分类:识别图像中存在的内容。
  • 物体识别和检测 :识别图像中的内容和位置(通过边界框)。
  • 语义分割: 识别图像中存在的内容以及位置(通过查找属于它的所有像素)。

       你设计的机器学习模型是否需要识别输入原始平面图像中的每个像素?在这种情况下,全像素语义分割标注是机器学习模型的关键。全像素语义分割根据其所属的感兴趣对象分配图像中的每个像素具有的类别ID。
       下面定义语义分割的类型,以便更好地理解其相关概念。

语义分割的类型

  • 标准语义分割(standard semantic segmentation)也称为全像素语义分割,它是将每个像素分类为属于对象类的过程;
  • 实例感知语义分割(instance aware semantic segmentation)是标准语义分割或全像素语义分割的子类型,它将每个像素分类为属于对象类以及该类的实体ID。

       下面探索语义分割的一些应用领域,以便更好地理解这种过程的需要。

语义分割的特征

       为了理解图像分割的特征,我们还要与其他常见的图像分类技术相比较。
       这一次将介绍以下三类技术领域,包括图像分割:

  • 1)图像分类:识别图像是什么;
  • 2)图像检测和识别:识别图像中的位置;
  • 3)图像分割:理解图像的意义;
    1.图像分类

       这类技术主要是识别图像。例如,例如分类数字手写体,例如“手写一个数字,这个数字是0~9中的哪一个数字”。最初从亚马逊发布的Amazon Rekognition也属于此图像分类,需要反区分“杯子、智能手机和瓶子”等,但现在,亚马逊Rekognition已经将杯子和咖啡杯作为整个图像的标签,这样处理后,它将不能用于分类图像中有多个物体的场景。在这种情况下,应该将使用“图像检测”技术。
2.图像检测
       这类技术主要是识别图像中“有什么”和“它在哪里”。
3.图像分割
       这类技术主要是识别图像区域。称为语义分割的图像分割标记由每个像素的像素指示的含义,而不是检测整个图像或图像的一部分。
       下面,让我们看看语义分割具体的使用例子:

语义分割的应用

  • 1.地质检测——土地使用

     


       语义分割问题也可以被认为是分类问题,其中每个像素被分类为来自一系列对象类中的某一个。因此一个使用案例是利用土地的卫星影像制图。土地覆盖信息是重要的各种应用,如监测地区的森林砍伐和城市化等。
       为了识别卫星图像上每个像素的土地覆盖类型(例如,城市、农业、水等区域),土地覆盖分类可以被视为多级语义分割任务。道路和建筑物检测也是交通管理,城市规划和道路监测的重要研究课题。
       目前,几乎没有大规模公开可用的数据集(例如:SpaceNet),数据标记始终是分割任务的瓶颈。

  • 2.用于自动驾驶

       自动驾驶是一项复杂的机器人任务,需要在不断变化的环境中进行感知、规划和执行。由于其安全性至关重要,因此还需要以最高精度执行此任务。语义分割提供有关道路上自由空间的信息,以及检测车道标记和交通标志等信息。

  • 3.用于面部分割

 


       面部的语义分割通常涉及诸如皮肤、头发、眼睛、鼻子、嘴巴和背景等的分类。面部分割在计算机视觉的许多面部应用中是有用的,例如性别、表情、年龄和种族的估计。影响人脸分割数据集和模型开发的显著因素是光照条件、面部表情、面部朝向、遮挡和图像分辨率的变化等。

  • 4.时尚——分类服装

 


       由于服装数量众多,服装解析与其他服务相比是一项非常复杂的任务。这与一般的物体或场景分割问题不同,因为细粒度的衣物分类需要基于衣服的语义、人体姿势的可变性和潜在的大量类别的更高级别判断。服装解析在视觉领域中得到了积极的研究,因为它在现实世界的应用程序即电子商务中具有巨大的价值。Fashionista和CFPD数据集等一些公开的数据集促进了服装领域的语义分割研究。

  • 5.精准农业

 


       精确农业机器人可以减少需要在田间喷洒的除草剂的数量,作物和杂草的语义分割可以帮助他们实时触发除草行为,这种先进的农业图像视觉技术可以减少对农业的人工监测,提高农业效率和降低生产成本。


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520905.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(需求实战_终章_08)SSM集成RabbitMQ 订阅模式 关键代码讲解、开发、测试

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200208221057640.png?x-oss-processimage/watermark,type_Z 首先,confirm确认机制和return确认机制都是相对于生产者而言的, 生产者发送消息一般会有消息发送成功和消息发送失败两种场景。 生产者…

新零售基础设施 看阿里巴巴如何打“地基”

经过两年探索,“新零售”从星星之火已发展到现在的燎原之势,许多原有的传统模式正在被打破,先进的智能技术和数据正在给传统的零售赋予更多的能力,带来更大的想象空间。 在2018年杭州云栖大会的电商平台专场中,阿里巴…

华为自研5G关键芯片PA:明年量产不再依赖美国;1999元!苹果发布AirPods Pro ;腾讯云勇推自研服务器“星星海”……...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周两次,打卡即read更快、更全了解泛云圈精彩newsgo go go小米CC9 Pro概念图&#xff0…

Work@Alibaba 阿里巴巴的企业应用构建之路

作为一个拥有数万名员工的企业,阿里巴巴的企业信息化是怎么做的? 在上周的云栖大会上,来自阿里巴巴信息平台的资深技术专家叶建辉为大家揭开了谜底。 阿里员工是怎么工作的? 可以通过阿里巴巴这三个案例了解: 人脸门禁。今年云…

windows server 2019 服务器搭建的方法步骤(图文)

一、windows server 2019 安装 Vmware 下安装 windows server 2019 。 二、服务器配置 1、 先启用远程功能 右键点击【此电脑】–【属性】,进入“【控制面板\系统和安全\系统】”,点击-【远程设置】 计算机找不到就使用【winE】快捷键 2、在“远程…

传统企业装上“智慧大脑” 看阿里巴巴如何实践AI赋能

“我们找了8位专业律师,和我们的AI机器人做了一个对比,我们的召回率与8位律师相当,但我们的准确率更高些”。 在不久前刚结束的杭州云栖大会上,来自阿里巴巴信息平台事业部的资深算法专家李波,正在向观众展示阿里巴巴…

如何交付机器学习项目:一份机器学习工程开发流程指南

随着机器学习(ML)成为每个行业的重要组成部分,对机器学习工程师(MLE)的需求急剧增长。MLE需要将机器学习技能与软件工程专业知识相结合,为特定应用程序找到高性能的模型,并应对出现的实施挑战—…

国际顶级学界业界大咖云集,9 场技术论坛布道,2019 嵌入式智能国际大会强势来袭!...

2019 嵌入式智能国际大会即将来袭!购票官网:https://dwz.cn/z1jHouwE2019年12月6日-8日,2019嵌入式智能国际大会将在深圳华侨城洲际大酒店举行。本次大会由哈尔滨工业大学(深圳)、清华大学国际研究生院、CSDN、嵌入式视…

qtcreator下拉列表怎么制作_设置EXCEL动态下拉菜单,只需要一个组合键,新手也能快速掌握...

操作版本:OFFICE365在EXCEL制作一级下拉菜单有4种方法,你掌握几种?一文中,我提到了一级下拉菜单的制作方法,其中用公式法来制作下拉菜单可以实现内容增减后下拉菜单的内容也自动增减,这个方法涉及OFFSET函数…

使用Numpy和Opencv完成图像的基本数据分析(Part III)

引言 本文是使用python进行图像基本处理系列的第三部分,在本人之前的文章里介绍了一些非常基本的图像分析操作,见文章《使用Numpy和Opencv完成图像的基本数据分析Part I》和《使用Numpy和Opencv完成图像的基本数据分析 Part II》,下面我们将…

Microsoft Windows Server 2019 1809 iso镜像 企业版本

企业版本 标准版本 默认页面,关闭即可 参考链接: Microsoft Windows Server 2019 1809 iso镜像 http://www.ddooo.com/softdown/131736.htm

【程序猿必备】数据结构与算法精选面试题

有很多计算机科学技术专业的毕业生和程序员申请在Uber和Netflix这样的初创公司、谷歌和阿里巴巴这样的大公司以及Infosys或Luxsoft等以服务为基础的公司从事编程、编码和软件开发工作,但他们中的许多人都不知道,当你申请这些公司的职位时,你会…

技术干货 | 详谈AI芯片分类和关键技术

戳蓝字“CSDN云计算”关注我们哦!作者 | 架构师技术联盟责编 | 阿秃人工智能芯片目前有两种发展路径:一种是延续传统计算架构,加速硬件计算能力,主要以 3 种类型的芯片为代表,即 GPU、 FPGA、 ASIC,但 CPU依…

AI+服务 阿里巴巴如何做智能服务转型?

AI下围棋、AI写作文、AI看病……在智能时代,通过新技术的赋能,行业已经发展到了一个新的高度。那么在服务领域,尤其是企业服务中,智能技术的加入会带来哪些新的想象? 在阿里巴巴,智能服务已经成为企业发展…

tfidf关键词提取_基于TextRank提取关键词、关键短语、摘要,文章排序

之前使用TFIDF做过行业关键词提取,TFIDF仅从词的统计信息出发,而没有充分考虑词之间的语义信息。TextRank考虑到了相邻词的语义关系,是一种基于图排序的关键词提取算法。TextRank的提出TextRank由Mihalcea与Tarau于EMNLP04提出来,…

AliOS Things手势识别应用演示

1. 概述 手势识别作为一种辅助的人机交互方式,在人机脱离的场景下可以提供方便的交互体验。本文介绍基于AliOS Things STM32F413H Discovery开发板实现手势交互功能的演示。 2. 环境搭建 开发板:STM32F413H Discovery(附带麦克风阵列板&a…

idea 个性化定制快捷键

添加和修改快捷键 先找到相应的快捷键 鼠标右击,上面add开头是添加,下面remove是移除快捷键

i 智慧 | 回首30年存储演进之路 再看新数据时代阿里云存储如何革故鼎新?

戳蓝字“CSDN云计算”关注我们哦!作者 | 刘丹 责编 | 阿秃 出品 | CSDN云计算(ID:CSDNcloud)人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史。自文明诞生以来&#xff0…