cnn输入层_多尺度CNN特征图的分析与应用

本文适用于那些参与CNN架构设计的工程师和研究人员,他们厌倦了盲目尝试和错误,可以从CNN主干中选择哪些特征图以改善其模型的性能,而宁愿从早期开始设计过程的步骤,以使特征图的空间比例轮廓与训练数据集中的对象尺寸相匹配。

抽象

在这篇文章中,我们使用派生的数学框架,对卷积层的接收场(感受野)和多尺度卷积特征图的特征进行了形式化处理。

使用发达的数学框架,我们在不同的卷积和合并操作下计算特征图的接受场和空间比例。

我们展示了池化操作的重要性,以确保特征图的空间比例作为层深度的函数呈指数增长。

此外,我们观察到,没有将池化操作嵌入到CNN中,特征图空间比例只会随着层深度的增加而线性增长。我们介绍空间尺度轮廓作为CNN的分层空间尺度表征,可用于评估特征图与训练数据集中的对象尺寸直方图的兼容性。通过计算ResNet-50的空间比例轮廓来说明此用例。

另外,我们解释了特征金字塔模块如何生成富含增强语义表示的多尺度特征图。最后,它显示了虽然扩张的卷积滤波器保留了特征图的空间尺寸,但与常规的卷积滤波器对应物相比,它们保持了更大的空间比例指数增长率。

阅读此文,您将对最近提出的用于各种视觉任务的CNN架构中的多尺度卷积特征图的用例背后的直觉有更深入的了解。以了解更多有关不同类型的图层如何影响特征图的空间比例和接受范围的信息。

介绍

通常的假设和理解是,由CNN的早期卷积层生成的特征图对基本语义表示(例如边和角)进行编码,而较深的卷积层在其输出特征图中对更复杂的语义表示(例如复杂的几何形状)进行编码。CNN生成具有多个语义级别的特征图的这种特性是其基于多层深度结构的分层表示学习能力的结果。具有不同语义级别的特征图对于CNN至关重要,原因有以下两个:

(1)复杂语义特征图是在基本语义特征图的基础上构建的,它们是其构建基块。

(2)许多视觉任务(例如实例和语义分段)都受益于基本语义特征图和复杂语义特征图。

基于视觉CNN的体系结构将图像作为输入,并将其通过几个卷积层,以生成与输入图像相对应的语义表示。特别地,每个卷积层都输出一个特征图,其中该特征图中的编码语义范围取决于该卷积层及其先前的卷积层的表示学习能力。并使其经过多个卷积层,以生成与输入图像相对应的语义表示。特别地,每个卷积层都输出一个特征图,其中该特征图中的编码语义范围取决于该卷积层及其先前的卷积层的表示学习能力。并使其经过多个卷积层,以生成与输入图像相对应的语义表示。特别地,每个卷积层都输出一个特征图,其中该特征图中的编码语义范围取决于该卷积层及其先前的卷积层的表示学习能力。

CNN特征图具有空间差异

CNN特征图的一个重要特征是它们是空间方差,这意味着CNN特征图具有空间尺寸,并且由给定特征图编码的特征可能仅对特征图的空间区域的子集有效。为了更好地了解CNN特征图的空间方差属性,首先,我们需要了解为什么由完全连接的图层生成的特征图不是空间方差。

全连接层生成的特征图(您可以将给定的全连接层的神经元激活视为其输出特征图)不具有空间维度,因为全连接层的每个神经元都连接到图的所有输入单元。全连接层。因此,不可能为神经元激活输出定义和考虑空间方面。

另一方面,CNN特征图的每次激活仅连接到几个输入单元,它们彼此在空间上相邻。

CNN特征图的这种特性引起了它们的空间方差特性,并且是由卷积滤波器的空间局部结构及其空间受限的接收场引起的。

下图显示了完全连接的层和卷积层之间的差异,其中一个导致空间上的不变,另一个导致空间上的差异,其中下图以绿色矩形表示输入图像,棕色矩形表示卷积特征图。同样,具有两个输出神经元的完全连接层由两个蓝色和灰色圆圈表示。如你看到的,

096a6822f1a52063e5f502e6a1d6e702.png

该图说明了为什么由完全连接的图层生成的特征不是空间方差,而卷积层生成空间方差特征图的原因。绿色矩形表示输入图像,棕色矩形表示由CNN的卷积层生成的尺寸为5 x 7 x 1的特征图。另一方面,两个蓝色和灰色圆圈表示具有两个输出神经元的完全连接层的激活输出。

假设如果输入图像中有自行车,则完全连接层的蓝色神经元(特征)将变为活动状态,而如果输入图像中有汽车,则其灰色神经元(特征)将变为活动状态。换句话说,蓝色神经元是自行车特征,而灰色神经元是汽车特征。由于全连接层的性质,每个神经元的输出都会受到所有输入图像像素的影响,因此,全连接层的生成特征无法即开即用地编码任何定位信息,以告诉我们输入图像中的位置如果输入图像中有自行车。

另一方面,由卷积层生成的特征图是空间方差,因此,除了对象的存在信息外,它们还对定位信息进行编码。特别是,通过卷积层生成的尺寸为W x H x C的特征图包含C个不同特征的存在信息(每个通道,特征图的第三维,编码一个唯一特征的存在信息),其中特征的空间尺寸W x H告诉我们在输入图像的哪个位置激活了特征。在此示例中,棕色卷积特征图仅编码一个特征,因为它只有一个通道(其第三维等于一个)。假设此棕色特征图是自行车特征图,则仅当输入图像中该条目的接受域中有自行车时,此特征图的条目才会激活。换句话说,如果输入图像中有自行车,但在其特定的接收域中没有自行车,则该条目不会变为活动状态。卷积特征图的这种特性使它们不仅可以对有关输入图像中对象存在的信息进行编码,还可以对对象的定位信息进行编码。该功能已激活。在此示例中,棕色卷积特征图仅编码一个特征,因为它只有一个通道(其第三维等于一个)。假设此棕色特征图是自行车特征图,则仅当输入图像中该条目的接受域中有自行车时,此特征图的条目才会激活。换句话说,如果输入图像中有自行车,但在其特定的接收域中没有自行车,则该条目不会变为活动状态。

卷积特征图的这种特性使它们不仅可以对有关输入图像中对象存在的信息进行编码,而且可以对对象的定位信息进行编码。

在此示例中,棕色卷积特征图仅编码一个特征,因为它只有一个通道。假设此棕色特征图是自行车特征图,则仅当输入图像中该条目的接受域中有自行车时,此特征图的条目才会激活。换句话说,如果输入图像中有自行车,但在其特定的接收域中没有自行车,则该条目不会变为活动状态。卷积特征图的这种特性使它们不仅可以对有关输入图像中对象存在的信息进行编码,而且可以对对象的定位信息进行编码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489493.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从5G落地看2020年科技产业投资机会

来源:兴业证券015G 商用开展,通信建设、智能终端、云端服务等领域,出现周期性机遇2019 年全球 5G 移动网络陆续商用,将直接拉动通信行业资本开支,同时刺激联网终端的需求,为 AI 及云计算等应用铺路&#xf…

cat命令详解_需要!Linux常用监视和故障排查命令详解

作者:老油条IT记公众号:老油条IT记#命令预览1.top2.ps3.nice4.kill5.iostat6.mpstat7.vmstat8.df9.du10.netstat11.ss#首先我们先来了解一下什么是进程#进程:是Linux用来表示正在运行的程序的一种抽象概念,Linux系统上所有运行的东…

C语言二维数组找出交集,【leetcode C语言实现】剑指 Offer 04. 二维数组中的查找...

题目描述在一个 n * m 的二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。示例:现有矩阵 matrix 如下&#xf…

知识图谱从哪里来:实体关系抽取的现状与未来

来源:知乎(zibuyu9)作者:韩旭、高天宇、刘知远最近几年深度学习引发的人工智能浪潮席卷全球,在互联网普及带来的海量数据资源和摩尔定律支配下飞速提升的算力资源双重加持下,深度学习深入影响了自然语言处理…

线条边框简笔画图片大全_超治愈萌系手帐素材大全 美食旅游花草人物花边都备齐了...

现代人每天都生活在一个充满焦灼感的空气中,成年人的世界里,每个人都不容易。不论是生活还是工作,都充满了各种挫折。很少有人能一帆风顺,为学习、为工作、为家庭、为感情、我们总会在坎坎坷坷中成长,难免会觉得焦虑。…

红米android版本,微信红米低版本下载

微信红米低版本是适用于红米手机的低版本微信软件,此版本为7.0.0版,安装包不到一百兆,该有的功能也都挺齐全,很多用户对于微信新版本的内存占用不堪重负,那么这个历史低版本就很适合你,红米手机也能轻松兼容…

《2018-2019世界智能手机AI智商测试报告》发布会将在京举办

《2018-2019世界手机AI智商测试报告》发布会将于2019年11月21日在北京举行,本次发布会由中国科学院虚拟经济与数据科学研究中心、中国科学院大数据挖掘与知识管理重点实验室和天府大数据国际战略与技术研究院联合主办。智能手机作为人们与外界即时连接的终端设备&am…

软件需求分析文档模板_小议管理软件需求分析

从事管理软件设计,一般都是从用户需求分析开始。从事软件工作的,大概谁都知道需求分析的重要性,可能大部分人都吃过需求分析不充分的亏。兵法云,“谋定而后动”。对一个项目而言,需求分析应该是“谋”的一部分&#xf…

python日期格式转换_python中有关时间日期格式转换问题

每次遇到pandas的dataframe某列日期格式问题总会哉坑,下面记录一下常用时间日期函数.... 1、字符串转化为日期 str—>date import datetime date_str 2006-01-03 date_ datetime.datetime.strptime(date_str,%Y-&m-%d) 这是单个字符串的转化,其…

38页PPT深度解析:半导体设备产业链全景图

来源:平安证券要点摘要:1、我国半导体设备市场空间大,增长动力强劲。半导体设备主要用于半导体制造和封测流程,分为晶圆加工设备(核心为光刻机、刻蚀机、薄膜沉积设备)、封装设备和检测设备。2018年全球半导…

XGBoost参数调优完全指南(附Python代码)

XGBoost参数调优完全指南(附Python代码):http://www.2cto.com/kf/201607/528771.html https://www.zhihu.com/question/41354392 【以下转自知乎】 https://www.zhihu.com/question/45487317 为什么xgboost/gbdt在调参时为什么树的深度很少就…

科技基建,自主创芯——详解全球半导体制造行业格局

来源:芯潮今天推荐一份报告,详解全球半导体制造行业格局,本报告从以下几个角度进行分析:一、全球半导体制造市场规模及竞争格局全球半导体制造市场及行业格局中国半导体制造行业情况二、半导体制造制程技术分析28纳米是生命周期相…

python按行读取文件取消空白行_python去掉空白行的多种实现代码

测试代码 jb51.txt 1:www.jb51.net 2:www.jb51.net 3:www.jb51.net 4:www.jb51.net 5:www.jb51.net 6:www.jb51.net 7:www.jb51.net 8:www.jb51.net 9:www.jb51.net 10:www.jb51.net 11:www.jb51.net 12:www.jb51.net 13:www.jb51.net 14:www.jb51.net 15:www.jb51.net 16:www.…

android 大视图风格通知栏,Android中使用Notification实现宽视图通知栏(Notification示例二)...

Notification是在你的应用常规界面以外展现的消息。当app让系统发送一个消息的时候,消息首先以图表的形式显示在通知栏。要查看消息的详情须要进入通知抽屉(notificationdrawer)中查看。通知栏和通知抽屉html(notificationdrawer)都是系统层面控制的,你能…

计算机、数学、运筹学等领域32个重要算法

来源: 深度学习与机器视觉奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机…

怎么用python表白_如何正确使用Python进行表白?这是个值得思考的问题!

提到程序员, 可能每个同学都认识一个—— 爱穿格子衬衫、冲锋衣,爱宅着敲代码的程序员或者准程序员, 他们仿佛永远在bug和debug的路上, 还总爱自黑自己是“单身狗”,如何正确使用Python进行表白?这是个值得…

iOS 高阶

1.UIStoryBoard 2. segue跳转传值 3. UIColor配色 //1. 十进制配色 [UIColor colorWithRed:163.0/255.0 green:148.0/255.0 blue:128.0/255.0 alpha:1.0]; //2. 设置16进制颜色(同上) [UIColor colorWithRed:0xba/255.0 green:0x21/255.0 blue:0xd5/255.0 alpha:1.0]; 4. XML解…

android 顶部标签切换,Android实现底部切换标签

本文实例为大家分享了Android实现底部切换标签的具体代码,供大家参考,具体内容如下实现底部通用切换标签 ,嵌套Fragment,方便自定义布局自定义控件:widget_tab_view.xmlandroid:layout_width"match_parent"a…

simulink显示多个数据_Matlab/Simulink与自动驾驶(ADAS)算法开发

Simulink是如何存在自动驾驶的开发过程中?废话少讲,让咱们开始娓娓道来!自动驾驶的开发架构是什么?自动驾驶软件开发基础的架构,逃不出我们经常所说的三大法宝,感知--- 决策(规划)--- 执行(控制)&#xff0…

数字孪生智慧城市建设加速5G+产业AI的应用,全流程数据透明化及实时可控成为升级的大方向,构建智慧城市生态圈在路上!...

本视频为深圳市副市长和IDG领导在高交会智慧城市论坛上的讲话。来源:北京物联网智能技术应用协会 本期正文Digital Twin数字孪生:是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程&#xff0…