Squeeze-and-Excitation Networks阅读笔记一

文章目录

    • Abstract
    • 1 INTRODUCTION

Abstract

卷积算子(convolution operator)是卷积神经网络(cnn)的核心组成部分,它使网络能够通过融合每层局部接受域内的空间和通道信息来构建信息特征。广泛的先前研究已经调查了这种关系的空间组成部分,寻求通过增强整个特征层次的空间编码质量(enhancing the quality of spatial encodings throughout its feature hierarchy)来加强CNN的表示能力。在这项工作中,我们将重点放在通道关系(channel relationship)上,并提出了一种新的架构单元,我们称之为 “Squeeze-and-Excitation”(SE)块,该单元通过明确建模通道之间的相互依赖性,自适应地重新校准通道特征响应。这些块可以堆叠在一起,形成SENet架构,可在不同的数据集上极其有效地泛化。我们进一步证明,SE块在略微增加计算成本的情况下,为现有最先进的cnn带来了显著的性能改进。Squeeze-and-Excitation Networks 构成了我们2017年ILSVRC分类提交的基础,该分类提交获得了第一名,并将前5名的误差降低到2.251%,比2016年的获奖作品相对提高了25%。模型和代码可在 https://github.com/hujie-frank/SENet 上获得。



1 INTRODUCTION

在本文中,我们研究了网络设计的另一个方面——通道之间的关系。我们引入了一个新的架构单元,我们称之为挤压和激励(SE)块,其目标是通过显式地模拟其卷积特征通道之间的相互依赖性(by explicitly modelling the interdependencies between the channels of its convolutional features)来提高网络产生的表示的质量。为此,本文提出了一种机制,允许网络进行特征重校准(feature recalibration),通过这种机制,网络可以学习使用全局信息来有选择性地强调有信息量的特征,并抑制不太有用的特征。


SE 构建块的结构如图1所示。对于任意给定的将输入 X \mathbf{X} X 映射到 U \mathbf{U} U ,其中 U ∈ R H × W × C \mathbf{U} \in \mathbb{R}^{H \times W \times C} URH×W×C 的特征映射的变换 F t r \mathbf{F}_{tr} Ftr,例如卷积,我们可以构造一个相应的 SE 块来执行特征重新校准(feature recalibration)。特征 U \mathbf{U} U 首先通过 squeeze 操作进行传递,该操作通过跨其空间维度( H × W H × W H×W)聚合特征图来产生通道描述符(channel descriptor)。这个描述子的功能是产生一个通道级特征响应的全局分布的嵌入(embedding),允许来自网络的全局感受野的信息被其所有层使用。聚合之后是一个 excitation 操作,该操作采取简单的自门控(self-gating mechanism)机制的形式,将嵌入作为输入,并产生每个通道调制权重(per-channel modulation weights)的集合。这些权重被应用于特征映射 U \mathbf{U} U 以生成SE块的输出,随后可以直接馈送到网络的后续层。




通过简单地堆叠SE块的集合,可以构建一个SE网络(SENet)。此外,这些SE块还可以在网络架构的一定深度范围内作为原始块的 drop-in replacement 。虽然构建模块的模板是通用的,但它在不同深度上所扮演的角色在整个网络中是不同的。在较早的层中,它以一种与类别无关的方式激发信息特征,加强共享的低级表示(strengthening the shared low-level representations)。在后面的层中,SE块变得越来越专门化,并以高度类特定的方式响应不同的输入(第7.2节)。因此,SE块执行的特征重新校准的好处可以通过网络积累。

在网络的较早层,模型通常专注于学习并提取更为通用和基础的特征,如边缘、颜色和纹理等。这些特征是多个类别共享的,不具有很强的类别特异性。在这一阶段,SE模块以一种类别无关的方式工作,激发有信息的特征,增强这些共享的低级表示。


然而,在网络的较深层,模型开始专注于学习更具类别特异性的特征,如特定物体的部分或者更复杂的形状。这是因为对于更深层的模型来说,它需要从更为抽象和高级的角度理解输入数据,以便进行准确的分类或预测。在这一阶段,SE模块开始变得更为专门化,响应不同类别的输入,使网络有能力捕捉并处理类别特定的信息。


在这里插入图片描述


个人的简要理解以及概括就是,虽然就是卷积层中的参数是可以学习的,但是不同卷积核得到的结果重要性肯定是不一样的,所以可以通过加入通道注意力机制来提高性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/24799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VC9、VC10、VC11等等各对应什么版本的Visual Studio,以及含义

文章目录 1、_MSC_VER 定义编译器的版本2、示例 1、_MSC_VER 定义编译器的版本 MS VC 15.0 _MSC_VER 1910 (Visual Studio 2017) MS VC 14.0 _MSC_VER 1900 (Visual Studio 2015) MS VC 12.0 _MSC_VER 1800 (VisualStudio 2013) MS VC 11.0 _MSC_VER 1700 (VisualStudio…

Crescent QuickPak Crack

Crescent QuickPak Crack Crescent QuickPak是一个32位ActiveX组件的综合集合,用于使用Visual Basic开发应用程序,这将减少开发时间并提高生产力。Crescent QuickPak包含Internet功能,用于打开、读取和解析IIS日志文件,将日志文件…

K8s operator从0到1实战

Operator基础知识 Kubernetes Operator是一种用于管理和扩展Kubernetes应用程序的模式和工具。它们是一种自定义的Kubernetes控制器,可以根据特定的应用程序需求和业务逻辑扩展Kubernetes功能。 Kubernetes Operator基于Kubernetes的控制器模式,通过自…

Stephen Wolfram:嵌入的概念

The Concept of Embeddings 嵌入的概念 Neural nets—at least as they’re currently set up—are fundamentally based on numbers. So if we’re going to to use them to work on something like text we’ll need a way to represent our text with numbers. And certain…

PAT乙题1011

答案 #include<iostream> #include<cstdio> using namespace std; typedef long long int ll; int main() {int n,cnt1;cin >> n;while (n--){ll a, b, c; cin >> a >> b >> c;printf("Case #%d: ", cnt);a b > c ? puts(…

FPGA优质开源项目 – PCIE通信

本文介绍一个FPGA开源项目&#xff1a;PCIE通信。该工程围绕Vivado软件中提供的PCIE通信IP核XDMA IP建立。Xilinx提供了XDMA的开源驱动程序&#xff0c;可在Windows系统或者Linux系统下使用&#xff0c;因此采用XDMA IP进行PCIE通信是比较简单直接的。 本文主要介绍一下XDMA I…

复习之selinux的管理

一、什么是selinux? SELinux&#xff0c;Security Enhanced Linux 的缩写&#xff0c;也就是安全强化的 Linux&#xff0c;是由美国国家安全局&#xff08;NSA&#xff09;联合其他安全机构&#xff08;比如 SCC 公司&#xff09;共同开发的&#xff0c;旨在增强传统 Linux 操…

针对java程序员的了解细节操作系统与进程

一、&#x1f49b; 操作系统&#xff08;浅浅概念&#xff09;&#xff1a;是用来搞管理软件的 1.对下,要管理各种硬件设备 2.对上,要给应用程序提供一个稳定的运行环境 二、&#x1f499; 进程&#xff1a;正在运行的程序&#xff0c;假如程序没有运行就不叫程序&#xff0c;…

质检工具(FindBugs、CheckStyle、Junit、Jmeter、Apifox)

1、Findbugs IDEA软件中可以装该插件,2018版本以前主要搜索FindBugs-IDEA 、2018版本以后主要搜索 SpotBugs。 1.1、FindBugs-IDEA安装及使用流程: 1.2、SpotBugs安装及使用流程: 2、Checkstyle IDEA软件中可以装该插件,所有版本的插件一致:CheckStyle 2.1、安装流程…

-bash: ./startup.sh: Permission denied解决

今天在Linux上启动Tomcat&#xff0c;结果弹出&#xff1a;-bash: ./startup.sh: Permission denied 的提示。 这是因为用户没有权限&#xff0c;而导致无法执行。用命令chmod 修改一下bin目录下的.sh权限就可以了。 在Tomcat的bin目录下 &#xff0c;输入命令行 &#xff1a;c…

IEEE SystemVerilog Chapter13 : Tasks and functions (subroutines)

13.2 Overview 任务和函数提供了从描述中的几个不同位置执行通用过程的能力。它们还提供了一种将大型过程分解为小型过程的方法&#xff0c;以便更容易地阅读和调试源代码描述。本小节讨论了任务和函数之间的区别&#xff0c;描述了如何定义和调用任务和函数&#xff0c;并给出…

echarts lineStyle 宽度(width)和颜色(color)动态处理

假如&#xff0c;我们想要在飞线图中根据后台返回数据的不同来动态显示飞线的颜色&#xff0c;我们该怎么设置呢&#xff1f;我们要控制颜色&#xff0c;自然就需要设置color&#xff0c;另外根据ECharts的API介绍&#xff0c;color是支持Function函数的。下面&#xff0c;我们…

通过C语言设计的推箱子(控制台终端)

一、项目介绍 推箱子游戏是一款经典的益智小游戏&#xff0c;玩家需要控制主角角色将几个木箱按照要求推到指定位置。在控制台终端中&#xff0c;可以使用字符来表示不同的游戏元素&#xff0c;例如 ‘#’ 表示墙壁&#xff0c; ’ ’ 表示空地&#xff0c; ‘$’ 表示木箱&am…

14-4_Qt 5.9 C++开发指南_QUdpSocket实现 UDP 通信_UDP组播

文章目录 1. UDP组播的特性2. UDP 组播实例程序的功能3. 组播功能的程序实现4. 源码4.1 可视化UI设计4.2 mainwindow.h4.3 mainwindow.cpp 1. UDP组播的特性 下图简单表示了组播的原理。UDP 组播是主机之间“一对一组”的通信模式&#xff0c;当多个客户端加入由一个组播地址定…

FPGA优质开源项目 - UDP RGMII千兆以太网

本文介绍一个FPGA开源项目&#xff1a;UDP RGMII千兆以太网通信。该项目在我之前的工作中主要是用于FPGA和电脑端之间进行图像数据传输。本文简要介绍一下该项目的千兆以太网通信方案、以太网IP核的使用以及Vivado工程源代码结构。 Vivado 的 Tri Mode Ethernet MAC IP核需要付…

接口自动化测试Mock Get和Post请求

Mock可以模拟一个http接口的后台响应&#xff0c;可以模拟request&#xff0c;response 下载 moco-runner-0.11.0-standalone.jar 下载链接: https://pan.baidu.com/s/1bmFzvJPRnDlQ-cmuJ_3iRg 提取码: kpjv 确保安装了jdk,cmd下可以运行java -version 一、模拟不带参的get请求…

数据结构:双向链表的实现(C实现)

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》 文章目录 前言 一、实现思路1.节点的结构(ListNode)2.新节点的创建(BuyListNode)3.头结点的创建(ListCreate)4.双向链表的销毁(ListDestroy)5.双向链表的打印(ListPrint)6.双向链表的尾插(ListPu…

6.5.tensorRT高级(1)-alphapose模型导出、编译到推理(无封装)

目录 前言1. alphapose导出2. alphapose推理3. 讨论总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程&#xff0c;之前有看过一遍&#xff0c;但是没有做笔记&#xff0c;很多东西也忘了。这次重新撸一遍&#xff0c;顺便记记笔记。 本次课程学习 tensorRT 高级-alphap…

ROS添加节点

1 下载项目源码 &#xff08;1&#xff09;这里我使用是哔哩哔哩的博主源码机器人工匠王杰 https://github.com/6-robot/wpr_simulation.git &#xff08;2&#xff09;建立工作空间 在主目录下载建立如下文件夹 catkin_ws----       ----src &#xff08;3&#xff09;…

MySQL — InnoDB介绍

文章目录 InnoDB 主要特点InnoDB 架构In-Memory StructuresBuffer PoolChange BufferAdaptive Hash IndexLog Buffer On-Disk StructuresSystem TablespaceFile-Per-Table TablespacesGeneral TablespacesUndo TablespacesTemporary TablespacesDoublewrite BufferRedo LogUndo…