图像语义分割_图像语义分割(9)-DeepLabV3: 再次思考用于图像语义分割的空洞卷积...

731bbd019328e6118a9db02126c1716e.png

论文地址 :Rethinking Atrous Convolution for Semantic Image Segmentation

论文代码:Github链接

1. 摘要

文章主要的工作:

  • 使用空洞卷积来调整滤波器的感受野并控制特征图分辨率
  • 使用不同空洞率的空洞卷积的串联或者并行操作来分割不同尺度的目标,捕获不同尺度的语义信息
  • 扩展的ASPP
  • 实现和训练的细节
  • 没有了DesneCRF的后处理

2. 介绍

使用DCNN做语义分割取得了一定的效果但是存在两个问题。其一,为了使DCNN学习到更加抽象的特征,采用了多次池化操作和带步长的卷积,使得特征图分辨率降低,但同时这不利于密集预测任务,因为后者需要空间位置信息。为了克服这个问题,引入空洞卷积——通过去掉最后几层的上采样和下采样来获得更加密集的特征图,这样还能在不适用额外参数的情况下控制分辨率。
其二,如何捕获不同尺度的目标。目前主要有四种不同的方法,如下图:

8c422f8224f8c62f9b2ce616433140da.png
  • Image Pyramid:对输入图像进行缩放分别输入网络最后合在一起:小的输入用于捕获long-range context,大的输入用于捕获小物体。但是这样做会使得深层的DCNN计算代价高
  • 编解码结构:在编码结构中获取不同尺度的特征并在解码结构中复原
  • 额外的后处理以精细画边框,比如DenseCRF
  • 空间金字塔池化

3. 方法

在模块串联合金子塔池化的框架中应用带有不同空洞率的空洞卷积和BN层。空洞卷积作为语义模块和SPP的工具,论文提出的模型具有较好的通用性,可以移植到其他网络中。这个模型将ResNet最后一个block多次复制并串联,然后联通ASPP模块,ASPP模块中包含几个并行的空洞卷积,这几个空洞卷积直接应用在特征图而不是信念图上。训练时层上加上BN层。而且,为了捕获全局语义,ASPP还叠加了了图像级别的特征。

3.1 用于密集特征提取的空洞卷积

克服多次池化和带步长的卷积对密集预测任务的影响。

3.2 使用空洞卷积设计更深的模型

77eaefc52beb77c8b1a31fa7571c098a.png


如上图,简单地复制ResNet最后一个block几次并且并行起来并不利于网络获取深层语义信息,因为这样使得图像的特征集中在最后几层比较小的特征图中,但是连续的带步长卷积不利于语义分割,所以使用了空洞卷积来设计最终的output_stride(原始图像尺寸之于输出特征图尺寸的倍数),如下图所示:

24b9d1e9e882c1faed0258f706f7a8ff.png


初次之外还引入了Multi-grid Method,上图中Block4至7,采用Multi-grid来描述这三层的空洞率,比如,当output_stride=16时,Multi_Grid=(1,2,4),相应的空洞率为(2,4,8)。

3.3 ASPP

ASPP中虽然包含几个不同的空洞率的卷积操作,但是当空洞率越来越大时,有效的滤波器的权重数越来越小。比如在65 X 65的特征图上应用3 X 3的滤波器,非但不能捕获全局图像语义,其效果还退化到与1 X 1滤波器效果一致,因为仅有中心的滤波器权重是有效的。
因此,ASPP模块中包含几个并行的空洞卷积,这几个空洞卷积直接应用在特征图而不是信念图上。训练时层上加上BN层。而且,为了捕获全局语义,ASPP还叠加了了图像级别的特征。

4dcdab8c828bb0fbea8bd9e52a950df2.png


如上图所示,ASPP模块中有一个1x1的卷积层和三个3x3的卷积层,空洞率分别为6,12,18,output_stride为16(每一层都有256个滤波器并且后跟BN层);而且ASPP中还增加了image-level特征,最后在模型输出的特征图上进行1x1的卷积(256个滤波器并且后跟BN层)并进行插值上采样至所需的空间维度尺寸。

4. 实验

4.1 ResNet50 v.s. ResNet101

7c3f4873eaae62356592c8dcc6f7063e.png

4.2 block4中应用不同的Multi-grid

b3525d9e529bc334a3f6bd6471c1a063.png

4.3 ASPP

在block4中应用Multi-grid以及ASPP中使用不同的空洞率:

30594076c8e1e6847585706637b73fb5.png

4.4 FINAL

66258a57ac40e8db9a7d6e85c7b0df05.png

欢迎关注 深度学习与数学 [每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾]

fbd1485b9bae3833bfdb44b115a37240.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/528874.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sql replace 双引号变单引号_sql-汇总、排序以及分析思路

一、汇总函数注:汇总函数,如果输入是列名,计算会把null 排除在外,count(*)对所有的行进行计数二、如何用sql解决业务问题注1:空值(null)的排序,排序是最小的,例如select * from tea order by tea_name注2&a…

openwrt是嵌入式linux,非常方便的OpenWrt的嵌入式Linux开发环境

今天听中央经济广播电台说,今年有559万大学毕业生,大学生的就业形式严峻.我想那些精通Linux开发的毕业大学生们,估计一点也不用担心,因为他们已经不再是一颗大白菜了.最近在帮一个朋友把OpenWrt移植到一块单板上,有一些心得,分享给大家.OpenWrt是一个很好的学习Linux的平台,而且…

php多个表中查找数据_HeidiSQL 免费的可视化数据库管理工具

HeidiSQL是一款免费的软件,并且易于学习和使用。HeidiSQL让你从数据库内可视化的读写数据、结构体。它支持MariaDB、MySQL、Microsoft SQL、PostgreSQL等数据库。功能免费且开源内置中文在同个窗口连接多个服务支持以命令行形式连接服务连接支持SSH、SSL创建修改表、…

嵌入式linux启动根文件系统,嵌入式Linux根文件系统制作和挂载

嵌入式Linux系统由三部分组成: uboot、kernel、根文件系统, 还是这张老图这里的根文件系统可以说是包含两个部分: 一个是根,一个是文件系统那么什么是根呢?哈哈 其实根表示的就是第一个的意思下面贴张图看看整个根文件…

sqlite 查询 支持多用户同时_SQLite支持多进程同时操作数据库文件吗?

多个进程可以同时打开同一个数据库。多个进程可以同时执行SELECT。但是,只有一个进程可以随时对数据库进行更改。SQLite使用读/写锁来控制对数据库的访问。(在Win95 / 98 / ME下,缺少对读写锁的支持,而是使用概率模拟。)但请注意:…

pgsql 查询每天的最后一条_Qamp;A | 如何允许他人查询表单数据?

小金Q&A来啦!这一期小金Q&A中,小金收集到近期大家关注最多的几个问题。小金将定期为小金人们答疑解惑,帮助你每天用好小金一点。●Q&A●问:如何批量设置新数据微信提醒?答:点击右上角头像 个人…

linux 解压tar.jz,linux系统压缩文件和解压缩命令

linux系统压缩文件和解压缩命令tar命令   解包:tar zxvf FileName.tar打包:tar czvf FileName.tar DirName gz命令   解压1:gunzip FileName.gz解压2:gzip -d FileName.gz压缩:gzip FileName.tar.gz 和 .tgz解压&a…

linux fall delay 10,Cell的Rise delay和Fall delay、Rise transition和fall transition

Cell的Rise delay和Fall delay、Rise transition和Fall transition介绍:如下图所示为一个Cell的lib中关于cell_rise/cell_fall、rise_transition/fall_transition的描述:在NLDM模型的.lib中,cell_rise/cell_fall它描述的是Cell从输入到输出的…

keil流水灯c语言程序两个一起亮,我用keil c51编了一个流水灯程序,编译无误却只有第一和第二个灯亮了,最后停在第一个灯处不动...

满意答案zJ张俭2014.02.09采纳率:43% 等级:12已帮助:10469人你有几个错误:1 你的定时器没有重装,导致第一次中断和后面的中断时间不一样,第一次时间短,后面的时间一直是以65536个周期中断的.2 你在中断函数里用了 for 循环,for循环是一下子…

pyquery获取不到网页完整源代码_python动态网页爬取:爬取pexel上的图片

前言同样的,我们在写一个爬虫前要明确自己想要爬取的东西是什么,明确下载目标数据在浏览器的操作如何对于动态网页的爬取,在网页地址不变的情况下,我们首先要明确如何获取AJAX请求首先我们看看这个网站pexel打开页面后再Chrome浏览…

W ndows找不到explorer,windows找不到explorer.exe的处理教程

很多网友入手windows过程里找不到explorer.exe,很是烦恼,为了帮助大家排忧解难,这里小编就分享了windows找不到explorer.exe的处理教程,希望可以帮助到大家。windows找不到explorer.exe的处理教程1、按winr打开运行窗口&#xff0…

极光推送 android 最新,Android——快速集成极光推送-Go语言中文社区

集成极光推送1,首先肯定是注册,添加应用2,开始自动集成比手动集成简单第一步 在 build.gradledefaultConfig {multiDexEnabledtrueapplicationId rootProject.ext.cfg.applicationIdminSdkVersionrootProject.ext.cfg.minSdkVersiontargetSdk…

华为云服务怎么弄金卡会员_万科牵手华为终端云服务,共建松山湖智慧商圈

12月18日,坐落在东莞松山湖南华为旁的44000㎡的开放式商业mall——滨湖万科里正式启幕。现场华为终端云服务部还与万科南方区域商业事业部签署了战略合作协议,开启共建智慧商圈的新版图。值得一提的是,这也是华为终端云服务与万科在商业板块的…

cad2014打开文件崩溃_CAD玩的再牛,崩溃了咋办?

导读前几天,一入职新人晚上加班画完的图纸在最后一刻CAD崩溃了!好在最后在临时保存文件夹中找到了完整的图纸。这才免于通宵。CAD崩溃是我们画图中经常遇到的问题。对于CAD崩溃后的处理,相信老司机都已经游刃有余。但也有防不胜防的时候&…

android 弹窗ui,Android 弹出窗口与对话框 UI设计

左图: Android 自带的日期选择弹窗; 右图: Android 自带的时间选择弹窗.左图: Android 日历中的重复选择; 右图: Chrome 中的打印.干净简洁的布局与有趣儿又引人注目的交互让操作变得轻松而愉快, 尤其是那在时间选择器中出现的双环.同样的, 也有很多人试图在自己的应用中给他们…

vim反向删除_VIM之操纵缓冲区列表

引子昨天遇到了一个奇怪的问题,一条在Sublime里面看着十分正常的SQL语句,执行了也是正常的,导出的Insert语句也是看着没毛病的,但是在查询出来,传递到下游的时候,说多了一个乱码。WTF,然后就开始…

卸载 windows_Windows 10可能很快会自动卸载有问题的Windows更新

看起来微软已经悄悄地向Windows 10添加了一项新功能,该功能将允许操作系统自动删除导致问题的任何有问题的Windows更新。这是一个好消息,因为Windows 10最近有一些有问题的更新,其中一些阻止了Windows 10的加载。根据微软刚刚发布的一份新支持…

android /data/system/dropbox,Android导出dropbox日志

文章内容已重新排版:Android导出dropbox日志,请到该链接浏览,谢谢支持。大项目中出现anr几乎是必然事件,这里我就不再去赘述怎么分析anr日志了。但是作为分析anr重要依据的必然离不开dropbox日志。问题来了,dropbox文件…

android蓝牙串口 hc06,Android手机通过蓝牙模块HC-06连接Arduino串口输出

通过手机进行通信是可以实现很多遥控功能,虽然距离是比较短,一般是10米,但对于我这种新手做测试,比起买一个几百块的多通道遥控器成本要低很多。实验目的:用Android实现蓝牙连接通过Arduino串口输出信息这次使用的是蓝…

esrgan_港中文-商汤联合实验室:ECCV2018 PIRM-SR 超分辨率比赛冠军:ESRGAN(已开源)...

Summary:中科院和京东AI研究院提出:改进SRN人脸检测算法,目前业界最强!Author:AmusiDate:2019-02-09微信公众号:CVer原文链接:香港中文大学-商汤联合实验室:ECCV2018 PIR…