神经网络-SENet

SENet是一种用于图像分类的卷积神经网络模型,由Jie Hu等人在2018年提出。SENet的全称是“Squeeze-and-Excitation Network”,其核心思想是通过自适应地调整每个通道的特征图权重,来增强卷积神经网络对于不同特征的感知能力。

SENet的设计灵感源于人类大脑对于不同信息的处理方式。人类大脑会在视觉信息进入时,自动地对不同特征进行加权处理,以提高对于重要特征的感知能力。SENet试图通过类似的方式,对于不同通道的特征图进行加权处理,从而提高卷积神经网络的分类性能。

具体来说,SENet引入了一个称为“Squeeze-and-Excitation Module”的模块,该模块可以自适应地学习每个通道的重要性,并根据重要性对特征图进行重新加权。Squeeze操作将每个通道的特征图压缩成一个数值,Excitation操作则将这个数值映射到一个新的权重向量中,用于加权特征图。这个权重向量是通过一个全连接层和激活函数来计算得到的,其中激活函数可以是sigmoid或relu等。

SENet的优点是可以显著提高卷积神经网络的分类性能,同时具有较小的计算和参数量。SENet在多个图像分类任务上取得了优异的表现,例如ImageNet、CIFAR-10、CIFAR-100等。

总的来说,SENet是一种基于自适应加权的卷积神经网络模型,通过对于每个通道的特征图进行加权处理,提高了模型对于不同特征的感知能力,从而显著提高了分类性能。

SENet

卷积神经网络(CNN)是一种用于处理图像任务的模型。它通过在网络中的每个卷积层使用一组滤波器来捕捉图像中的空间模式和通道信息。通过多次卷积、激活函数和下采样操作,CNN能够生成一种层次化的图像表示,以捕捉全局的特征。

近年来,研究人员致力于寻找更强大的网络架构来提高图像任务的性能。一种流行的方法是在网络中引入学习机制,以帮助捕捉特征之间的空间相关性。另一方面,也有研究关注于改进网络中通道之间的关系。

SENet介绍了一种名为"Squeeze-and-Excitation(SE)"块的新型网络单元,旨在通过明确地建模卷积特征中通道之间的相互依赖关系来提高网络生成的表示质量。通过这种机制,网络可以根据全局信息有选择地强调重要的特征并抑制不太有用的特征,从而提高网络的性能。

简单来说,这篇论文提出了一种改进卷积神经网络的方法,通过更好地考虑通道之间的关系,使网络能够更准确地捕捉图像中的重要特征,从而提高图像任务的表现。

SENet 模型在处理结构化输入数据方面具有以下优点:

能够处理复杂关联关系:SENet 通过学习方程组,能够捕捉输入数据之间的复杂关联关系,从而提高预测和推断的准确性。

适用于多种任务:SENet 可以应用于多种不同类型的任务,如分类、回归、链接预测等。

参数共享:SENet 模型中的参数可以在不同输入数据之间共享,从而降低模型的复杂性。

可扩展性:SENet 模型可以随着输入数据规模的增大而扩展,从而适应大规模的结构化数据。

  • SE模块

如下图所示,流程如下:

  • 对于输入的图像X,经过Ftr变化,得到新的特征图U

  • 对特征图U,进行squeeze操作,即Fsq()操作,对每个通道的全局信息建模,生成一组通道描述符 1*1*C

  • 再经过excitation操作,对通道之间的依赖关系建模,即Fex(),生成一组权重信息,这些权重可以看作是对每个通道在特征图中的重要性的度量。

  • 最后将新特征图U重新加权,即Fscale,以生成经过重新校准的输出。

通过堆叠多个SE块,我们可以构建一个SE网络(SENet)。SE块可以在网络的不同深度上使用,并且在不同深度上具有不同的功能。在较早的层中,SE块以类别无关的方式激发有用的特征,加强共享的低级表示。而在后续层中,SE块变得越来越专门化,对于不同的输入以高度类别特定的方式进行响应。

总的来说,SE块通过特征重新校准,帮助网络更好地理解和利用输入数据,从而提升网络的性能。

Squeeze

当我们处理图像或特征时,每个通道都负责提取不同的特征信息。然而,传统的方法只能在局部区域内进行特征提取,无法利用整个图像的上下文信息。

为了解决这个问题,我们提出了一种方法,将全局的空间信息转化为通道描述符。具体来说,我们通过对每个通道上的特征值取平均,得到一个通道描述符。这个描述符表示了整个图像在每个通道上的平均特征值。

通过这个通道描述符,每个通道就能够利用整个图像的信息,而不仅仅局限于局部区域。这样做可以帮助提高特征的表达能力。

总的来说,我们通过将全局的空间信息转化为通道描述符,使得每个通道能够利用整个图像的上下文信息,从而提高特征的表达能力和模型的性能。

作者在讨论中提到了一些过去的特征工程方法,这些方法也使用了类似于本文中提出的方法,将局部特征的统计信息转化为全局特征。作者选择了最简单的方法——全局平均池化,但也指出其他更复杂的方法也可以使用。这表明了本文提出的方法不仅简单有效,而且可以通过进一步的改进得到更好的结果。

Excitation

为了利用在Squeeze挤压操作中聚合的信息,我们紧接着使用第二个操作来充分捕捉通道间的依赖关系。为了实现这个目标,该函数必须满足两个条件:首先,它必须是灵活的(特别是,它必须能够学习通道之间的非线性相互作用),其次,它必须学习到非互斥的关系,因为我们希望允许多个通道被强调(而不是强制一个通道激活)。为了满足这些条件,我们选择使用具有sigmoid激活的简单门控机制。

简单来说,我们使用sigmoid函数作为门控机制的激活函数。对于每个通道,我们通过一个全连接层将输入特征向量映射为一个标量值。然后,我们将该标量值通过sigmoid函数进行激活,得到一个0到1之间的值。这个值表示了每个通道在最终输出中的权重或重要性。

通过这种门控机制,我们可以学习到通道之间的非线性相互作用,并且可以灵活地调整每个通道的权重。这样,我们可以强调重要的通道,并允许多个通道同时被强调,而不是限制在一个通道上。

总而言之,通过使用具有sigmoid激活的简单门控机制,我们可以满足灵活学习通道间非线性相互作用的需求,并且允许多个通道同时被强调。这样,我们可以更好地捕捉通道间的依赖关系,提高网络的性能。

最终将得到的s与特征图相乘,得到新的特征输出,公式如下:

SE示例

如下图所示,左侧普通网路中加入了SE结构,右侧是在残差网络中,加入了SE结构;SE结构中使用了两层FC网络和一个ReLU激活、sigmoid函数;其中第一层FC起到了降维作用,第二个FC起到了升维作用。

我们考虑提出的SE块引入的额外参数。这些额外参数仅由门控机制的两个全连接层产生,因此构成了网络总容量的一小部分。具体而言,这些全连接层的权重参数引入的总数为:

其中,r表示缩减比例,S表示阶段的数量(阶段是指在具有相同空间维度的特征图上操作的块的集合),Cs表示输出通道的维度,Ns表示阶段s中重复的块的数量(当FC层中使用偏置项时,引入的参数和计算成本通常可以忽略不计)。

SE-ResNet-50是一种基于ResNet-50的改进模型,它引入了额外的参数来增强网络的性能。具体来说,SE-ResNet-50引入了大约250万个额外参数,相当于ResNet-50所需参数的约10%。

这些额外参数主要集中在网络的最后一个阶段,该阶段对最多的通道执行激励操作。激励操作有助于网络更好地学习特征表示,提高模型的性能。

然而,在实践中,研究人员发现可以以很小的性能代价来删除这个相对昂贵的最后一个阶段的SE块。通过删除这部分操作,可以将相对参数增加降低到约4%。这对于那些对参数使用量非常敏感的情况可能会很有用。

下面是SE在各种网络中添加的尝试,其中fc[16,256]表示两个全连接层输出的维度,具体结论如下:

下图是各网络的结果展示,其中original是原始论文中展示的结论,re-implementation是重新训练后得到的结论,SENet是加入SE结构的网络。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/65658.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【spring】参数校验Validation

前言 在实际开发中,我们无法保证客户端传来的请求都是合法的。比如一些要求必传的参数没有传递,传来的参数长度不符合要求等,这种时候如果放任不管,继续执行后续业务逻辑,很有可能就会出现意想不到的bug。 有人可能会…

sentinel-请求限流、线程隔离、本地回调、熔断

请求限流:控制QPS来达到限流的目的 线程隔离:控制线程数量来达到限流的目录 本地回调:当线程被限流、隔离、熔断之后、就不会发起远程调用、而是使用本地已经准备好的回调去提醒用户 服务熔断:熔断也叫断路器,当失败、…

github提交不上去,网络超时问题解决

问题出现的原因: DNS服务器数据不同步,github的服务器发送迁移,在本地缓存的ip地址现在无效了。 解决方案: 1)点击这里,查询github.com最新的ip地址 2.0)编辑linux系统地址缓存文件&#x…

C++和OpenGL实现3D游戏编程【连载19】——着色器光照初步(平行光和光照贴图)(附源码)

1、本节要实现的内容 我们在前期的教程中,讨论了在即时渲染模式下的光照内容。但在我们后期使用着色器的核心模式下,会经常在着色器中使光照,我们这里就讨论一下着色器光照效果,以及光照贴图效果,同时这里知识会为后期的更多光照效果做一些铺垫。本节我们首先讨论冯氏光照…

如何恢复永久删除的PPT文件?查看数据恢复教程!

可以恢复永久删除的PPT文件吗? Microsoft PowerPoint应用程序是一种应用广泛的演示程序,在人们的日常生活中经常使用。商人、官员、学生等在学习和工作中会使用PowerPoint做报告和演示。PowerPoint在人们的学习和工作生活中占主导地位,每天都…

基于Spark的共享单车数据存储系统的设计与实现_springboot+vue

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

mysql高频面试题

1. mysql里的索引类型 2. 聚簇索引和非聚簇索引的区别 聚簇索引适合场景: 主键、唯一性要求高的字段。需要对数据进行范围查询时。对数据的读取频繁,并且数据行的插入和删除较少时。非聚簇索引适合场景: 较多的查询条件,或者需要基于某些非主键字段进行查询时。需要创建多个…

MySQL第二弹----CRUD

笔上得来终觉浅,绝知此事要躬行 🔥 个人主页:星云爱编程 🔥 所属专栏:MySQL 🌷追光的人,终会万丈光芒 🎉欢迎大家点赞👍评论📝收藏⭐文章 ​ 一、修改表 使用ALTER …

c++解决常见内存泄漏问题——智能指针的使用及其原理

目录 前言: 1. 智能指针的使用及其原理 1. 1 智能指针的使用场景分析 1.2 RAII和智能指针的设计思路 1.3 C标准库智能指针的使用 1.3 1 auto_ptr 1.3 2 unique_ptr 1.3 3 shared_ptr(重) 1.3 4 weak_ptr 1.3 5 模拟实现删除器 2.智能指针的原…

NVR管理平台EasyNVR设备通过ONVIF接入出现404访问错误是什么原因?

如今,视频监控在各行各业都得到了广泛应用,成为现代社会不可或缺的一部分。随着技术的不断进步,视频监控系统已经从传统的模拟监控发展到高清化、网络化和智能化阶段,其应用领域也从最初的安防扩展到智慧城市、智能家居、交通管理…

CANape 新建工程和连接

文章目录 简介1、新建工程1.1 打开 CANape1.2 新建工程1.3 新建 Device1.3.1 添加NEW DEVICE1.3.2 添加 NEW From Database1.4 配置 Memory Segment1.5 新建trace窗口和观测窗口 2、硬件连接2.1 更改与canape盒子通道一致的通道编号,选择驱动配置2.2 选择硬件配置 问…

[Qt] Qt介绍 | 搭建SDK

目录 1. Qt 简介 什么是 Qt? 1.1 引入 1.2 GUI 1.3 Qt 介绍 2. Qt 发展史 3. Qt 支持的平台 4. Qt 版本信息 5. Qt 的优点 6. Qt 应用场景 7. Qt 成功案例 8. Qt 发展前景及就业分析 二. Qt 开发环境搭建 1. 开发工具概述 2.Qt SDK 安装 3.使用 1. …

ES 磁盘使用率检查及处理方法

文章目录 1. 检查原因2. 检查方法3. 处理方法3.1 清理数据3.2 再次检查磁盘使用率 1. 检查原因 磁盘使用率在 85%以下,ES 可正常运行,达到 85%及以上会影响 PEIM 数据存储。 在 ES 磁盘分配分片控制策略中,为了保护数据节点的安全&#xff0…

NLP自然语言处理——使用飞桨实现基于LSTM的情感分析

任务说明: 通过对电影评论历史数据分析,构建深度学习分类模型,最终完成对新的数据样本的识别分类。 任务要求: 运用神经网络算法,创建、训练、评估模型,完成对电影评论的情感分类任务。 数据集说明&#xf…

LabVIEW条件配置对话框

条件配置对话框(Configure Condition Dialog Box) 要求:Base Development System 当右键单击**条件禁用结构(Conditional Disable Structure)**并选择以下选项时,会显示此对话框: Add Subdiagr…

为什么MoE推理效率更高:精简FFN

MoE全称是“混合专家”,它由多个专家网络和一个门控网络组成……整个MoE完全复用了Transformer的结构,只是将其中的FFN层替换成了MoE层。MoE层里的门控网络其实就是个专家分类器,每次根据输入Token生成专家的概率分布,然后选择排序靠前的K个专家进行Token处理,最后再将K个…

线段树例题题解

卫星覆盖(NOI1997) 题面: SERCOI(Space-Earth Resource Cover-Observe lnstitute) 是一个致力于利用卫星技术对空间和地球资源进行覆盖观测的组织。现在他们研制成功一种新型资源观测卫星 -SERCOI-308。这种卫星可以…

超详细!一文搞定PID!嵌入式STM32-PID位置环和速度环

本文目录 一、知识点1. PID是什么?2. 积分限幅--用于限制无限累加的积分项3. 输出值限幅--用于任何pid的输出4. PID工程 二、各类PID1. 位置式PID(用于位置环)(1)公式(2)代码使用代码 2. 增量式…

STM32 SPI读取SD卡

七个响应类型: R1 Response (Normal Response): R1响应是最基本的响应,包含一个字节的状态位,用于指示命令是否成功执行。常用。最高位为0。最低位为1表示是空闲状态。其他位是各种错误提示。 R1b Response (Normal with Busy): 类似于R1&a…

玩转OCR | 腾讯云智能结构化OCR初体验

随着数字化进程的加速,光学字符识别(OCR)技术已逐渐成为提高企业生产力、优化工作流的重要工具。腾讯云智能结构化OCR凭借其领先的技术、广泛的应用场景和灵活的定制化能力,正在帮助各行业客户更高效地进行文档处理与数据提取。本…