Selective Kernel Networks(CVPR-2019)

摘要

提出了一种动态选择机制,允许每个神经元根据输入信息的多个尺度自适应调整感受野大小。设计了一种称为选择核(SK)单元的结构块,利用softmax attention 对不同核大小的多个分支进行融合。对这些分支的不同attention产生融合层神经元有效感受野的不同大小。多个SK单元被堆叠成一个称为选择性核的网络SKNets。
文章提出了一种非线性方法,从多个内核中聚合信息,实现神经元的自适应RF大小。我们引入了 “选择性内核”(SK)卷积,它由三组运算符组成:Split, Fuse and Select。分裂运算符产生具有不同内核大小的多个路径,对应于神经元的不同RF大小。融合运算符结合并汇总来自多条路径的信息,以获得选择权重的全局和综合表示。选择运算符根据选择权重聚合不同大小的内核的特征图。
为了验证所提出的模型是否具有调节神经元感受野大小的能力,我们通过在自然图像中放大目标对象并缩小背景以保持图像大小不变来模拟刺激。研究发现,当目标对象越来越大时,大多数神经元越来越多地从较大的kernel apth中收集信息。这些结果表明,所提出的SKNet中的神经元具有自适应的RF大小,这可能是该模型在目标识别方面的优越性能的基础。
在这里插入图片描述

首先split:

对给定特征图x,用卷积核大小为3和5的卷积执行两个转换。
在这里插入图片描述
注意F都是有深度卷积、批处理规范化和relu函数按顺序组成的。为了进一步提高效率,将传统的55核卷积替换为33核卷积,dilation大小为2.

Fuse操作:

将分支中的信息通过元素求和进行融合:
在这里插入图片描述
然后通过全局平均池化来嵌入全局信息,从而生成channel-wise的信道统计信息:
在这里插入图片描述
接着建立一个紧凑的特征,使之能够进行精确的自适应选择,这通过简单的全连接层实现:
在这里插入图片描述
其中δ是ReLU函数[ 29 ],B是批归一化[ 15 ],W∈Rd × C
。为了研究d对模型效率的影响,我们使用一个折减比率r来控制它的值:
在这里插入图片描述
式中:L为d ( L = 32是我们实验中的典型设置)的最小值。

select操作

跨通道的软注意力用于自适应地选择不同空间尺度的信息,由紧凑的特征描述子z引导。具体地,在通道数字上应用softmax算子:

其中A,B分和a,b分别代表在这里插入图片描述的软注意力向量。在这里插入图片描述,是A的第c行,是a的第c个元素。在两个分支中,B是冗余的因为在这里插入图片描述,特征图V由以下在各个核上的注意力权重得到。在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/27218.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

yolov10主要特点

在我们探讨YOLOv10之前,让我们回顾一下YOLO的发展历程。YOLO在实时目标检测领域一直是先驱,兼顾速度和准确性。从YOLOv1到YOLOv9,每个版本在架构、优化和数据增强方面都引入了显著的改进。然而,随着模型的发展,某些限制…

磁盘管理 磁盘介绍 MBR

track:磁道,就是磁盘上同心圆,从外向里,依次1号、2号磁道..... sector:扇区,将磁盘分成一个一个扇形区域,每个扇区大小是512字节,从外向里,依次是1号扇区、2号扇区... cy…

你真的了解java线程中断吗?

前言 java.lang.Thread类有一个 interrupt 方法,该方法直接对线程调用。当被interrupt的线程正在sleep或wait时,会抛出 InterruptedException 异常。事实上, interrupt 方法只是改变目标线程的中断状态(interrupt status&#xf…

【Python】Flask问答系统Demo项目

学习视频 我是跟着知了传课学的Flask,起初了解Flask还是GPT告诉我的,现在可以说用Flask做后端是真的方便! https://www.bilibili.com/video/BV17r4y1y7jJ 项目结构与下载 FlaskOA(项目文件夹) │ app.py │ conf…

web前端黑马下载:探索学习资源的海洋

web前端黑马下载:探索学习资源的海洋 在数字化时代,Web前端技术日益成为互联网行业的核心驱动力。为了跟上这一趋势,众多学习者纷纷投身于Web前端的学习之中。而在这个过程中,“黑马”作为一个备受瞩目的品牌,其Web前…

docker镜像被墙,docker镜像拉不下来 docker镜像拉取失败 如何拉取docker镜像 docker镜像无法提供拉取服务怎么办?最新拉取镜像方式

1. 推荐github仓库提出得解决方案,且每日在更新: https://gist.github.com/y0ngb1n/7e8f16af3242c7815e7ca2f0833d3ea6 2. 我是如何解决的: 用阿里云提供给每个人的镜像,即可解决拉取镜像问题!!&#xff0…

智慧公安指挥中心大数据信息化两中心两基地系统方案

1.1 系统建设目标 本系统是一个汇接全市的报警求助的大型通信指挥系统,技术难度较高、可靠性要求高,技术路线的选择至关重要。 在充分考虑XX市公安局的业务需要,利用现代通信及计算机网络技术的基础上,最大程度地实现资源整合、…

如何开发一款安全高效的Android网络库(详细教程)

根据很多网友及项目需要,我们针对Retrofit做了一层简单封装,包含了很多可插拔的功能,能够适应大多数项目的需要,这一期我们来分析以下如何设计一款安全高效的Android网络库——FlexNet 1. 网络框架模块 在设计网络之前&#xff…

深度学习的舌象诊断:从舌头上了解系统性疾病!

首先 深度学习算法能否解决东方医学中依靠医生经验的诊断问题?而要实现这个目标,需要什么呢? 用舌头诊断被称为口腔健康的指标,但在东方医学中,舌头也被用来评估全身的状况。换句话说,通过分析舌头的图像…

几个阶段性的面试难点整理

一、JVM篇 1、如何排查CPU、内存飙升的问题? 2、是否处理过线上问题?是怎么解决的? 3、谈谈G1收集器对比CMS收集器的优点?什么情况下适合用G1? 4、JVM调优的参数主要指哪方面的调优? 5、堆、栈中分别存放了…

队列 使用链表实现

#include <stdio.h> #include <stdlib.h> // 队列&#xff0c;入队从尾巴入&#xff0c;出队从头出 // 占用第一个位置记录人数 typedef struct Node{int data;struct Node* next; }Node; Node* init_node() {Node* Queue (Node*)malloc(sizeof(Node));Queue->…

【leetcode--单词规律】

题目要求&#xff1a; 跟上一个字符串的思路一致&#xff0c;只是要进行单词的拆分&#xff0c;用.split()函数即可。 class Solution:def wordPattern(self, pattern: str, s: str) -> bool:word s.split()if(len(pattern) ! len(word)):return Falsereturn len(set(patt…

火爆全网《pvz植物大战僵尸杂交版》最新安装包,支持Android、Windows、iOS!

我是阿星&#xff0c;今天跟大家聊聊最近在B站火得一塌糊涂的老游戏——《植物大战僵尸》。你没听错&#xff0c;就是那个曾经让我们熬夜奋战&#xff0c;一关又一关的游戏。 话说回来&#xff0c;这游戏怎么就突然又火起来了呢&#xff1f; 原来&#xff0c;是因为它的最新整…

关于2024年第一批计算机程序设计员(Python)四级、三级职业技能等级证书认证考试的通知

计算机程序设计员&#xff08;Python&#xff09;详细介绍 报名详细信息&#xff1a; 报名截止时间&#xff1a;2024年6月05日 ~ 2024年6月18日 准考证下载时间&#xff1a;2023年6月24日 ~ 6月28日 考试时间&#xff1a;2024年6月29日 四级&#xff1a;08:30~12:30&#…

除了广告和卖货,还有这12种盈利方式

如何让产品赚得更多的钱是永恒的话题&#xff0c;产品的盈利方式也层出不穷。目的是让我们的产品走向商业化&#xff0c;达到变现&#xff0c;不断地更新迭代&#xff0c;发展下去。 本文介绍了产品的12种盈利方式&#xff1a;延迟、便利、图像清晰度、界面、操作速度、灵活性、…

【CS.AL】算法复杂度分析 —— 渐进符号表示法

文章目录 1 概述2 渐进符号详解2.1 大O符号&#xff08;O&#xff09;2.2 Ω符号&#xff08;Ω&#xff09;2.3 Θ符号&#xff08;Θ&#xff09;2.4 o符号&#xff08;o&#xff09;2.5 ω符号&#xff08;ω&#xff09; 3 具体例子3.1 插入排序&#xff08;Insertion Sort…

【论文阅读】《Sketch and Refine: Towards Fast and Accurate Lane Detection》

Abstract 车道检测是指确定道路上车道的精确位置和形状。尽管目前的方法已经做出了努力&#xff0c;但由于现实世界场景的复杂性&#xff0c;这仍然是一项具有挑战性的任务。无论是基于建议的方法还是基于关键点的方法&#xff0c;现有方法都无法有效、高效地描绘车道。基于建…

程序猿大战Python——容器——知识补充

字典遍历方法 目标&#xff1a;了解遍历字典的遍历方法。 当要遍历字典的元素内容&#xff0c;即获取字典的键、值。 常用方法&#xff1a; 函数名含义keys()以列表的形式&#xff0c;返回一个字典所有的键。values()以列表的形式&#xff0c;返回一个字典所有的值。items()返…

腾讯测试开发<ieg 实验室>

3.26 40min 自我介绍实习经历有无遇到什么难点&#xff0c;你是如何克服的在这个项目中你大概做了多少个测试用例&#xff0c;这么多测试用例你平时用什么工具进行管理的&#xff0c;每一次跑全部还是每次只跑一部分现在假设给你一个新的项目&#xff0c;需要你这边去做测试&a…