分类网络总结

 欢迎大家订阅我的专栏一起学习共同进步,主要针对25届应届毕业生

祝大家早日拿到offer! let's go

http://t.csdnimg.cn/dfcH3

目录

4. 经典分类网络与发展

4.1 AlexNet

4.2 VGGNet

4.3 GoogLeNet

Inception

4.4 ResNet

4.5 DenseNet

4.6 MobileNet

4.7 ShuffleNet

4.8 SENet(ImageNet最后一届竞赛的冠军,提出了SE结构)


经典分类网络与发展

pipeline:LeNet->AlexNet->Network in Network->VGGNet->GoogLeNet->ResNet->Inception->DenseNet->Xception->MobileNet->ShffleNet->SENet

每个标题上的超链接都是对应的论文,详细了解可以阅读论文

4.1 AlexNet

AlexNet模型有以下特点:

  1. 所有卷积层都使用ReLU作为非线性映射函数,使模型收敛速度更快
  2. 在多个GPU上进行模型训练,不但可以提高模型的训练速度,还能提升数据的使用规模
  3. 使用LRN对局部特征进行归一化,结果作为ReLU激活函数的输入能有效降低错误率
  4. 重叠最大池化(Overlapping max pooling),即池化范围z与步长s存在关系z > s ,避免平均池化(Average pooling)的平均效应
  5. 使用随机丢弃技术(Dropout)选择性地忽略训练中的单个神经元,避免模型的过拟合
4.2 VGGNet

VGGNet有以下特点:

  1. 整个网络使用同样大小的卷积核尺寸3 ×3和最大池化尺寸2 × 2 。
  2. 1 × 1卷积的意义主要在于线性变换,没有发生降维。
  3. 两个3 × 3 的卷积层串联相当于15 × 5 的卷积层。同样地,3个3 × 3 的卷积层串联效果相当于1个7 × 7 的卷积层。使得网络参数量更小,而且多层的激活函数使网络对特征学习能力更强。
  4. VGGNet先训练浅层的的简单网络,再复用该权重来初始化更深层网络,如此反复训练并初始化VGG,能够使训练时收敛的速度更快。
  5. 使用多尺度的变换对原始数据做数据增强,使得模型不易过拟合
4.3 GoogLeNet

GoogLeNet与VGG不同,该网络主要工作是探索了增加网络的宽度。论文提出了名为Inception 的结构来实现既能保持网络结构的稀疏性,又能利用密集矩阵的高计算性能。

GoogLeNet有以下特点:

  1. 提出了Inception 结构
  2. 任意nxn的卷积都可以通过1xn卷积后接nx1卷积来替代。实际上,作者发现在网络的前期使用这种分解效果并不好,还有在中度大小的feature map上使用效果才会更好。
  3. 挖掘了网络宽度可以降低网络计算量同时表现优异。GoogLeNet的计算效率明显高于VGGNet,大约只有500万参数,只相当于Alexnet的1/12(GoogLeNet的caffe model大约50M,VGGNet的caffe model则要超过600M)。
  4. Average pooling代替全连接层,有效减少参数
  5. 探索了1x1卷积的作用,用于升维和降维信息。
Inception

Inception_v1

输入被拷贝四份,在四条路径上进行传递。特点如下:

 采用大小不同的三种卷积核使得感受野大小不同,得到不同尺度的特征。

 使用1*1卷积核降低维度,减少计算瓶颈,增加网络层数,提高非线性。

 视觉信息在不同尺度上进行处理聚合,这样下一步可以从不同尺度提取特征。

 “Inception的作用就是替代了人工确定卷积层中过滤器的类型或者是否创建卷积层和池化层,让网络自己学习它具体需要什么参数。”

Inception_v2特点如下:

 把Inception-v1中5 ∗ 5 的卷积用2个3 ∗ 3的卷积替换,保持相同感受野的同时减少参数,加强非线性的表达能力。

 提出了Batch Normalization,如果激活函数是sigmoid,对于每个神经元,可以把逐渐向非线性映射的两端饱和区靠拢的输入分布,强行拉回到0均值单位方差的标准正态分布,即激活函数的兴奋区,在sigmoid兴奋区梯度大,即加速网络训练,还防止了梯度消失。

Inception_v3 特点如下:

 分解卷积核尺寸。一个是分解为对称的小的卷积核,即5 ∗ 5 的卷积核替换成2个3 ∗ 3 的卷积核。另一个是分解为不对称的卷积核,即将n ∗ n 的卷积核替换成1 ∗ n 和 n ∗ 1 的卷积核堆叠。

 上述结构使得:1. 降低计算量,2. 增加一层非线性,3. 可以处理更丰富的空间特征,增加特征的多样性。

 改变降低特征图尺寸的方式。分卷积通道与池化通道。

Inception-v4
 最大特点是与Resnet进行结合。

4.4 ResNet

 从VGG与GoogLeNet诞生后,实验研究发现深度CNN网络达到一定深度后再一味地增加层数并不能带来进一步地分类性能提高,反而会招致网络收敛变得更慢,分类准确率也变得更差。排除数据集过小带来的模型过拟合等问题后,发现过深的网络仍然还会使分类准确度下降。
 ResNet作者提出可能是因为更深的网络会伴随梯度消失/爆炸问题,从而阻碍网络的收敛。这种加深网络深度但网络性能却下降的现象被称为退化问题。于是ResNet提出了res-block结构,对于更深层次的模型:添加恒等映射(identity mapping)(就是跳跃结构,直接把信息恒等传递到下一层)。在这种情况下,更深的模型不应该产生比其对应的较浅的网络更高的训练误差。

原先网络输入x,希望输出H(x)。令H(x)=F(x)+x,网络只需学习输出一个残差F(x)=H(x)-x。当残差为0时,此时堆积层仅仅做了恒等映射,实际上残差不会为0,使得堆积层在输入特征基础上学习新的特征从而拥有更好性能。简化了学习过程,增强了梯度传播。

4.5 DenseNet

论文中提出的架构为了确保网络层之间的最大信息流,将所有层直接彼此连接。为了保持前馈特性,每个层从前面的所有层获得额外的输入,并将自己的特征映射传递到后面的所有层。该论文基于这个观察提出了以前馈的方式将每个层与其他层连接的密集卷积网络(DenseNet)
 
 DenseNet 是一种具有密集连接的卷积神经网络。在该网络中,任何两层之间都有直接的连接,也就是说,网络每一层的输入都是前面所有层输出的并集,而该层所学习的特征图也会被直接传给其后面所有层作为输入。

DenseNet有以下特点:

 1.相比ResNet 拥有更少的参数数量

 2.旁路加强了特征的重用

 3.网络更易于训练,并具有一定的正则效果

 4.缓解了梯度消失(gradient vanishing)和模型退化(model degradation)的问题

4.6 MobileNet

MobileNet V1

 谷歌在2017年提出,专注于移动端或者嵌入式设备中的轻量级CNN网络。
 该论文最大的创新点是,提出了深度可分离卷积(depthwise separable convolution)。【DW卷积】
 使用RELU6作为激活函数,这个激活函数在float16/int8的嵌入式设备中效果很好,能较好地保持网络的鲁棒性。

MobileNet V2

在2018年,谷歌的又一力作。V2在V1的基础上,主要解决了V1在训练过程中非常容易特征退化的问题,引入了Inverted Residuals和Linear Bottlenecks。
所谓倒置残差块,如图所示,与残差块做对比。

残差块是先降维再升维,两头胖,中间瘦。倒残差结构就是 两头瘦,中间胖;
Linear Bottlenecks:在V1中 depthwise 中有0卷积的原因就是 Relu 造成的,换成 Linear 解决了这个问题;

MobileNet V3

v3版本结合了v1的深度可分离卷积、v2的Inverted Residuals和Linear Bottleneck、SE模块,提出了h-switch作为激活函数,利用NA(神经结构搜索)来搜索网络的配置和参数(NAS就是不需要人工调参,自动搜索,要先给出搜索空间和搜索方式)。

4.7 ShuffleNet

ShuffleNet是Face++提出的一种轻量化网络结构,主要思路是使用Group convolution和Channel shuffle改进ResNet,可以看作是ResNet的压缩版本。

Channel Shuffle
 
ShuffleNet的本质是将卷积运算限制在每个Group内,这样模型的计算量取得了显著的下降。然而导致模型的信息流限制在各个Group内,组与组之间没有信息交换,如图下图,这会影响模型的表示能力。因此,需要引入组间信息交换的机制,即Channel Shuffle操作。同时Channel Shuffle是可导的,可以实现end-to-end一次性训练网络。

4.8 SENet(ImageNet最后一届竞赛的冠军,提出了SE结构)

对于CNN网络来说,核心计算是卷积算子,通过卷积核从输入特征图学习到新特征图。从本质上讲,卷积是对一个局部区域进行特征融合,这包括空间上(H和W维度)以及通道间(C维度)的特征融合。

对于卷积操作,很大一部分改进工作是提高感受野,即空间上融合更多特征,或者是提取多尺度空间信息,如Inception网络的多分支结构。对于channel维度的特征融合,卷积操作基本上默认对输入特征图的所有channel进行融合。而MobileNet网络中的组卷积(Group Convolution)和深度可分离卷积(Depthwise Separable Convolution)对channel进行分组也主要是为了使模型更加轻量级,减少计算量。
SENet网络的创新点在于关注channel之间的关系,希望模型可以自动学习到不同channel特征的重要程度。为此,SENet提出了Squeeze-and-Excitation (SE)模块,如下图所示

SE模块首先对卷积得到的特征图进行Squeeze操作,得到channel级的全局特征(SENet提出Squeeze操作,将一个channel上整个空间特征编码为一个全局特征,采用global average pooling来实现),然后对全局特征进行Excitation操作(这里采用sigmoid形式的gating机制),学习各channel间的关系,得到不同channel的权重,最后乘以原来的特征图得到最终特征。本质上,SE模块是在channel维度上做attention或者gating操作,这种注意力机制让模型可以更加关注信息量最大的channel特征,而抑制不重要的channel特征。另外一点是SE模块是通用的,意味着其可以嵌入到现有的网络架构中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/1594.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基础04-操作系统中的文件与目录操作

在与操作系统交互时,我们经常需要执行文件和目录的操作。Python提供了丰富的库来帮助我们完成这些任务。以下是一些常见的操作,以及如何使用Python代码来实现它们。 1. 导航文件路径 在不同的操作系统中,文件路径的格式可能不同。Python的o…

提取出图像的感兴趣区域

这是我们的原图像 将图像的数值统计后进行条形图展示 import matplotlib.pyplot as plt from PIL import Image import numpy as np# 图像路径 image_path r"D:\My Data\Figure\OIP.jpg"# 打开图像 image Image.open(image_path)# 将图像转换为numpy数组 image_ar…

关于实验报告添加题注为0以及页面断层的解决办法

1.事情起源于最近在写实验报告和课设说明书时出现图的题注是图0-1等不遵循设置的章节标号,于是我在查询和个人尝试后发现必须设置多级编号并且自定义设置对应的样式为标题几 另外注意设置后必须题注也要设置对应的样式,否则还是0-1,不用编辑域…

全球30米100%水陆覆盖高程

数据是GIS的血液。 熟悉水经注的朋友都应该知道,我们可以为大家提供全球30米和全球12.5米的高程数据,但这两种数据都无法达到全球覆盖。 你可以从《40TB全球12.5米高程DEM原始数据》与《700G全球30米高程DEM原始数据》等文中了解这两种数据的详细说明。…

git简介及安装

Git | Git简介与安装 文章目录 Git | Git简介与安装一、Git简介二、Git安装Linux-centosLinux-ubuntu 一、Git简介 存在需求:对于一个文档,由于编写思路或者当前文档丢失,可能存在想要历史版本的需求,并且需要知道每个版本都修改了…

忘记宝塔账号密码 如何解决

cd /www/server/panel && btpython tools.py panel testpasswd参考 https://www.bt.cn/bbs/thread-1172-1-1.html

(C++) 树状数组

目录 一、介绍 二、一维树状数组 2.1 区间长度 2.2 前驱和后继 2.3 查询前缀和 2.4 点更新 三、一维数组的实现 3.1 区间长度函数 3.2 前缀和 3.3 插入/更新 3.4 封装成类 一、介绍 树状数组(Binary Indexed Tree,BIT),又称为 …

39. UE5 RPG角色释放技能时转向目标方向

在上一篇,我们实现了火球术可以向目标方向发射,并且还可以按住Shift选择方向进行攻击。技能的问题解决,现在人物释放技能时,无法朝向目标方向,接下来我们解决人物的问题。 实现思路: 我们将使用一个官方的…

大一考核题解

在本篇中,将尽力使用多种解法,来达到一题多练的效果。 1: 1.原题链接: 238. 除自身以外数组的乘积 - 力扣(LeetCode) 这道题首先一眼肯定想到拿整体的积除以当前元素,将结果作为ans,…

Redis的主从复制

引入:分布是系统涉及到一个非常关键的问题:单点问题(如果摸个服务器程序,只有一个节点(只搞一个物理服务器,来部署这个服务器程序)会出现: 1.可用性问题,如果这个机器挂…

轧铝机液压站比例阀控制器

轧铝机液压站是用于铝材轧制过程中提供动力和控制的系统,它对于确保铝材的质量至关重要。轧铝机液压站通常包含以下几个关键组成部分: 液压泵:为系统提供压力油,是液压系统的动力源。 控制阀组:包括方向控制阀、压力控…

由于磁盘空间不够导致服务无法访问的情况

昨天服务出现了一些“小状况”,这里做下记录,为了以后类似的问题,可以作为参考。 具体情况是,如下: 本来一直访问都好好的服务突然间访问不到了,首先确定了下服务器上的 docker 服务是否正常运行。确认正…

【触摸案例-触摸事件介绍 Objective-C语言】

一、触摸事件 1.接下来,我们来说这个,触摸事件, iOS当中的事件,可以分为三大类: 1)触摸事件 2)加速计事件 3)远程控制事件 事件呢,这个里面呢,使用app的过程当中呢,产生各种各样的事件,事件呢,分为三大类,在iOS里边儿啊,分为三大类,首先,有一个叫做触摸事…

MySQL中的“IS NULL”优化

MySQL中的“IS NULL”优化 在MySQL数据库中,查询性能的优化是保持应用高效运行的关键。一个常见的情况是处理空值(NULL),尤其是在查询条件中使用IS NULL时。 理解IS NULL 在MySQL中,IS NULL运算符用于检查列中的值是…

2024年学浪视频怎么保存到本地相册

2024年已至,学浪应用上的视频购买人数持续攀升,然而一些课程已不再提供永久回放,这对那些在学浪购买了课程的人来说确实是一大困扰。在这里,我将为大家提供一种方法,让我们能够将学浪视频中那些非永久回放的内容下载到…

游戏录屏软件免费使用,超高清画质,让你爱不释手!

“最近迷上了一款动作冒险游戏,里面的剧情和打斗场面简直太燃了!就想通过录屏的方式,把我自己的游戏过程保存下来。可是我发现市面上的录屏软件不是免费的就是功能有限,你们有没有用过什么好用又免费的游戏录屏软件啊?…

教科系统诗词大会竞赛活动方案

本次诗词大会竞赛由个人追逐赛、亲友团淘汰赛、冠军争霸赛三部分组成。 一、个人追逐赛 由每个参赛团选出一位挑战者,共六位挑战者首先参加个人追逐赛的比拼,每位挑战者最多可答九道题,题型可为识别诗句题、对句题、填字题,题目可…

【数据结构项目】通讯录

个人主页点这里~ 原文件在gitee里~ 通讯录的实现 基于动态顺序表实现通讯录项目1、功能要求2、代码实现file.hfile.cList.hList.ctest.c 基于动态顺序表实现通讯录项目 准备:结构体、动态内存管理、顺序表、文件操作 1、功能要求 ①能够存储100个人的通讯信息 ②…

arm版Linux下安装大数据集群各种组件

背景:由于本人是用的Macbookpro m2来进行开发的,很多环境和Intel芯片的都不一样,期间安装各种软件遇到各种问题,为了以后不走之前的老路,现记录各种软件的安装步骤。 系统安装组件说明 序号组件名称组件版本1jdkjdk-…

如何部署npm私有仓库以及在项目中如何使用

如何部署npm私有仓库以及在项目中如何使用 为什么要部署npm私有仓库? 安全性:私有仓库允许团队存放内部研发的、不宜公开发布的代码包,只对特定用户或者团队可见和可用,从而保护公司的知识产权和商业秘密。模块的复用性&#xf…