【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf

【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf

文章目录

  • 【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf
    • 一、介绍
    • 二、联系工作
    • 三、方法
      • 3.1 整体结构
      • 3.2 使用空间金字塔池的多尺度图像表示
      • 3.3 基于完全连通条件随机场(CRF)的结构预测精确边界恢复
    • 四、实验结果

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

深度学习解决了语义图像分割的任务

做出了三个主要贡献,这些贡献在实验中被证明具有实质性的实际价值

  • 强调卷积与上采样滤波器,或“空洞卷积”,作为一个强大的工具在密集预测任务

    作用:卷积实现不增加参数数量或计算量的情况下有效地扩大过滤器的视野,以纳入更大的上下文**

  • 空间金字塔池(ASPP)的多尺度目标鲁棒分割方法

    作用:在多个尺度上捕获对象和图像上下文

  • 结合DCNNs和概率图模型的方法,改进了目标边界的定位

    作用:条件随机场(CRF)相定性和定量地展示了定位性能

提出的DeepLab系统在PASCAL VOC -2012语义图像分割任务

一、介绍

以端到端方式训练的DCNNs比依赖手工制作特征的系统提供了明显更好的结果

DCNNs对局部图像变换的内置不变性,这使得它们能够学习越来越抽象的数据表示

可能会妨碍语义分割等密集的预测任务,因为在这些任务中不需要对空间信息进行抽象

DCNN应用于语义图像分割的三个挑战:

  • 特征分辨率降低
  • 多个尺度上存在目标
  • 由于DCNN的不变性而降低了定位精度


当DCNN以完全卷积的方式使用时,这将导致显著降低空间分辨率的特征图

DCNNs的最后几个最大池化层中去除下采样算子,并在随后的卷积层中对滤波器进行上采样

采用空洞卷积作为上采样滤波器卷积

空洞卷积允许我们在不增加参数数量或计算量的情况下有效地扩大滤波器的视场

相当于用具有互补有效视场的多个滤波器探测原始图像,从而在多个尺度上捕获物体以及有用的图像上下文

我们的工作探索了一种我们认为非常有效的替代方法。

采用完全连接的条件随机场(CRF)来提高模型捕获精细细节的能力

crf已广泛用于语义分割,将多路分类器计算的类分数与像素和边缘的局部相互作用捕获的低级信息相结合

越来越复杂的工作来模拟层次依赖关系

使用了完全连接的成对CRF,它具有高效的计算能力,并且能够捕捉精细的边缘细节,同时还能满足长距离依赖关系

DeepLab模型的高级说明如图

重新用于语义分割任务:

  • 将所有全连接层转换为卷积层(即全卷积网络[14])
  • 通过亚卷积层增加特征分辨率
  • 双线性插值将分数图上采样8倍,以达到原始图像分辨率
  • 输入输出到一个完全连接的CRF

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

双线性插值阶段将特征映射扩大到原始图像分辨率。然后应用全连接的CRF来细化分割

二、联系工作

大多数成功的语义分割系统依赖于手工制作的特征与平面分类器相结合

但这些系统的性能一直受到特征表达能力有限的影响

  • 第一类基于dcnn的语义分割系统通常采用自下而上的级联图像分割
  • 第二类工作依赖于使用卷积计算的DCNN特征进行密集图像标记
  • 第三类作品使用DCNNs直接提供密集的类别级像素标签


本文工作建立在这些工作的基础上,,通过控制特征分辨率、引入多尺度池化技术和在DCNN之上集成密集连接的CRF[22]来扩展它们

DCNN与CRF的结合当然并不新鲜,但之前的研究都是尝试局部连接的CRF模型


我们采用的全连接CRF模型[22]中的高斯CRF电位可以捕获远程依赖关系

大部分方法成功地对DCNN和CRF进行了联合学习

对整个训练集都可以使用像素级语义注释的假设


空洞卷积还允许我们扩大过滤器的视野,以纳入更大的环境

三、方法

3.1 整体结构

DCNNs进行语义分割或其他密集预测任务

被证明可以通过以全卷积方式部署DCNNs来简单而成功地解决

最近的DCNNs中,每个方向的分辨率通常是32倍。部分补救措施是使用“反卷积”层

在这里插入图片描述

图中的公式表明卷积的速度和扩展的快慢

速率参数r对应于我们对输入信号进行采样的步幅

在这里插入图片描述

在低分辨率输入特征映射上进行标准卷积稀疏特征

在高分辨率的输入特征映射上,使用率为r¼2的亚历斯卷积进行密集特征提取。
在这里插入图片描述

操作:

  • 分辨率降低2倍
  • 使用核进行卷积-这里是垂直高斯导数
  • 特征映射植入到原始图像坐标


将全分辨率图像与“带孔”滤波器进行卷积,我们可以计算所有图像位置的响应

因此过滤器参数的数量和每个位置的操作次数都保持不变


相反,我们采用了一种混合方法,在效率和精度之间取得了良好的平衡,使用空洞卷积将计算特征图的密度增加了4倍,然后使用8倍的快速双线性插值来恢复原始图像分辨率的特征图

3.2 使用空间金字塔池的多尺度图像表示

cnn已经显示出一种非凡的隐式表示规模的能力

第一种方法相当于标准的多尺度处理。我们使用共享相同参数的并行DCNN分支

多尺度处理显著提高了性能,但代价是计算多尺度输入的所有DCNN层的特征响应

该方案使用多个具有不同采样率的并行空洞卷积层。每个采样率提取的特征在单独的分支中进一步处理并融合以产生最终结果。

在这里插入图片描述

3.3 基于完全连通条件随机场(CRF)的结构预测精确边界恢复

在定位精度和分类性能之间的权衡似乎是DCNNs固有的

具有多个最大池化层的更深模型在分类任务中被证明是最成功的

DCNN得分图可以预测物体的存在和大致位置,但不能真正描绘出它们的边界


在这里插入图片描述

工作追求两个方向来解决这个挑战

  • 利用卷积网络中的多层信息,以便更好地估计目标边界
  • 采用超像素表示

基于耦合DCNNs的识别能力和全连接crf的细粒度定位精度来追求另一个方向,并表明它在解决定位挑战方面非常成功

并在远远超出现有方法范围的细节水平上恢复对象边界

作用:

  • CRFs被用于平滑噪声分割映射
  • 模型对相邻节点进行耦合,倾向于对空间近端像素进行相同标签分配
  • 短期crf的主要功能是清除建立在局部手工设计特征之上的弱分类器的虚假预测

为了克服短程CRF的这些局限性,我们将的全连接CRF模型集成到我们的系统中

在这里插入图片描述

表达式在不同的特征空间中使用两个高斯核

  • 第一个内核强制具有相似颜色和位置的像素具有相似的标签
  • 第二个内核在强制平滑时仅考虑空间接近性

四、实验结果

我们对Imagenet-pretrained VGG-16或ResNet-101网络的模型权值进行微调,使其以一种简单的方式适应语义分割任务

SGD过程

解耦了DCNN和CRF的训练阶段

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/725775.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

弹性地基梁matlab有限元编程 | 双排桩支护结构 | Matlab源码 | 理论文本

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

mysql bug( InnoDB: Error number 22),表突然不能读取

mysql bug( InnoDB: Error number 22),表突然不能读取 bug最开始的bug:表突然不能读取关闭mysql容器,再次重启失败 解决方案不重建容器的几种可能措施重建容器重建如果懒得打命令或者忘记命令可能的run bug&#xff1a…

打破界限,释放创新:一键将HTML转化为PDF

在互联网时代,HTML作为网页的标准语言,承载着无数的信息与创意。然而,有时我们需要将这些在线内容转化为可打印、可分享的PDF格式。这时,一款高效、便捷的转换工具就显得尤为重要。 首先,我们要进入首助编辑高手主页面…

react高阶组件:如何同时兼容class类组件和函数式组件。

场景: 每个页面都要实现分享功能,但是页面有些是用class类,有些又直接是函数式。 方案1: 写2套方法。各自引用。(维护不太好,改要改2遍) 方案2: 可以封一个 jsx的组件&#xff0c…

中国制造走向世界wordpress外贸建站模板主题

水泵阀门wordpress外贸网站模板 水泵、阀门、管材、管件wordpress外贸网站模板,适合外贸独立站的网站模板。 https://www.jianzhanpress.com/?p3748 保健器械wordpress外贸网站主题 保健、健身器械wordpress外贸网站主题,适合做外贸网站的wordpress模…

【QT C++实践】Qt 项目中一个界面动态处理多张数据库中的表|附源码

一、前言 在之前那篇讲如何使用QT连接数据库时(QT C实践|超详细数据库的连接和增删改查操作|附源码),做了一个简单的对数据库进行增删改查的界面(如下)。 但是存在一个问题就是:这个界面只是对一张表进行操作,但是我…

2023年CSP-J认证 CCF信息学奥赛C++ 中小学初级组 第一轮真题-选择题解析

2023年 中小学信息学奥赛CSP-J真题解析 1、在C中,下面哪个关键字用于声明一个变量,其值不能被修改 A、unsigned B、const C、static D、mutable 答案:B 考点分析:主要考查变量声明相关知识,const是声明常量&…

0基础跨考408|一战上岸复盘及经验分享

基础阶段‼️ 王道的四本书的选择题部分要都做完、订正完。 王道的四门视频课要一轮刷完(或者题主在B站看了其他的老师,这其实也是算一轮的,只要题主是认真学习了的,题主说自己不知道看什么课,王道就好了)…

Go程序是如何编译并运行起来的(图文详解)

Go程序是如何编译的 从hello RdrB1te开始 package main import "fmt" func main() { fmt.Println("hello RdrB1te") }不实际编译它,只输出它的编译过程: go build -n简单的编译过程分析: 上面的过程确认了两个…

Cookie和Session(会话技术)

文章目录 Cookie和Session(会话技术)一、Cookie1、Cookie概述1.1、Cookie简介1.2、Cookie的使用场景1.3、Cookie底层原理 2、Cookie的基本使用3、Cookie实现显示用户上次访问时间4、Cookie编码与解码5、Cookie总结 二、Session1、Session概述1.1、Sessio…

FPGA高端项目:FPGA基于GS2971的SDI视频接收+OSD动态字符叠加,提供1套工程源码和技术支持

目录 1、前言免责声明 2、相关方案推荐本博已有的 SDI 编解码方案本方案的SDI接收转HDMI输出应用本方案的SDI接收图像缩放应用本方案的SDI接收纯verilog图像缩放纯verilog多路视频拼接应用本方案的SDI接收HLS图像缩放HLS多路视频拼接应用本方案的SDI接收HLS多路视频融合叠加应用…

基于Matlab实现免疫荧光图像中的区域定位算法

基于Matlab实现免疫荧光图像中的区域定位算法 免疫荧光法。以荧光染料为标记物,试纸条为载体,发生抗原抗体特异性反应,根据免疫复合物被激发的荧光强度对待测物进行定量分析[。该方法具有环境要求不高、操作简单快速、无污染且荧光染料丰富等优点。 常用于食品安全检测过程中…

vue3+element plus 实现百度地图显示路径

添加依赖 <!-- index.html --><script type"text/javascript" src"//api.map.baidu.com/getscript?v3.0&akyI6kBeC9G4LntEWXklE2iNHwRUrmFEQc"></script><script type"text/javascript" src"//api.map.baidu.co…

【golang】26、retry-go 使用示例和源码解析

文章目录 一、使用方法1.1 http 示例1.1.1 retry.Do1.1.2 retry.DoWithData1.1.3 OnRetry1.1.4 根据 error 的类型&#xff0c;决定 delay 的时长1.1.5 自定义 retry function 二、API2.1 Do 执行2.1.1 Do2.1.2 DoWithData 2.2 Delay 策略2.3 错误处理2.3.1 Unwrap2.3.2 Unwrap…

idea手动导入插件

idea有时候连接不上 我们去手动下载压缩包 插件网址 选择下载的压缩包导入 导入成功

算力调度和云计算有何区别

Canalys发布的研究报告显示&#xff0c;2023年第二季度&#xff0c;全球云基础设施服务支出增长16%&#xff0c;达到724亿美元。 此前云厂商们的高速增长&#xff0c;主要归功于大规模的企业数字化转型和上云。当前市场的增速放缓&#xff0c;除了上云普及带来的市场增量见顶&…

centos7 部署kibana

先决条件参考 虚拟机部署elasticsearch集群-CSDN博客 这里使用elk101服务器安装kibana 下载rpm包(这里添加了-c参数用到wget的断点续传功能) #下载kibana-rpm包以及校验文件 wget -c https://artifacts.elastic.co/downloads/kibana/kibana-7.17.18-x86_64.rpm wget -c htt…

continue、break 和 return 的区别是什么?

continue、break和return同样是用于控制程序流程的关键字&#xff0c;它们有不同的作用和用法。 continue: 在Java中&#xff0c;continue语句同样通常用于循环结构&#xff08;如for循环、while循环&#xff09;。当程序执行到continue时&#xff0c;会立刻跳过当前循环中剩…

02_Git

文章目录 GitGit的核心流程Git的命令clone指令status指令add指令commit指令push指令pull指令log指令 Git中处理冲突协同合作Git中回退的措施忽略文件 Git git的特点&#xff1a; 分布式 比如说&#xff1a;同事A、同事B、同事C都能对远程仓库进行操作&#xff0c;就是分布式 …

微服务分布式中为什么要分库分表呢?

什么是分库分表&#xff1f; 概念&#xff1a; 分库分表是一种数据库水平扩展的方法&#xff0c;通过将数据分散存储在多个数据库实例或多张表中&#xff0c;以提高系统的性能和扩展性。在Java应用中&#xff0c;可以使用一些数据库中间件或框架来实现分库分表。 为什么要分…