2d 蓝图_“蓝图”卷积--对深度可分离卷积的再思考

2d 蓝图_“蓝图”卷积--对深度可分离卷积的再思考

news/2025/7/4 1:13:10/文章来源:https://blog.csdn.net/weixin_39743511/article/details/112502453

论文：Rethinking Depthwise Separable Convolutions: How Intra-Kernel Correlations Lead to Improved MobileNets

https://arxiv.org/pdf/2003.13549.pdfarxiv.org

代码地址：

zeiss-microscopy/BSConvgithub.com

一、背景

一些轻量级的网络，如MobileNet中，会有深度可分离卷积Depthwise Separable Convolution（DSCs），由depthwise(DW)和pointwise(PW)两个部分结合起来，用来提取特feature map，相比常规的卷积操作，其参数数量和运算成本比较低。

Joe.Zhao：深度可分离卷积zhuanlan.zhihu.com

作者对其进一步的研究，发现基于深度可分离卷积的体系结构，例如MobileNets隐式地依赖于跨内核的相关性。作者经过定性和定量的研究发现基于核内部的相关性可以更有效地分离标准卷积。

二、启发来源

定性分析：作者可视化了三个基础网络VGG-19、Inception V2、ResNet-50的卷积核，将128*3*3的卷积核沿深度轴划分成128张小图片，每张都是3*3（如图）。图中可以看出，很多卷积核呈现相同的“视觉结构”。就好比这些卷积核是照着一个模子，然后加点线性变换产生的。然后作者就将这个模子称为“蓝图”（高大上的名字）。

定量研究：

为了进一步说明沿深度轴卷积核的相关性，作者用以下方式分析了几个训练过的CNNs:

把M*K*K的卷积核划分成M个K*K的样本；
对这M个样本进行PCA分析
确定由第一个主成分(PC1)解释的过滤器的方差

可以看到，平均每个过滤器内核的方差的50%左右可以用这个简单的模型来解释，这表明使用“蓝图”改进的潜力很大。

三、“蓝图”卷积

“蓝图”即一个卷积核的模板，那么一个普通的卷积核就可以从一个蓝图卷积的各种线性变换而来。

如图第一行，是一个标准卷积，卷积核大小是K*K*M；

第二行是蓝图卷积，卷积核由蓝图（一个K*K的卷积核）和一个M*1的权重向量组成。

四、“蓝图”卷积的两种变形和实现

作者是对深度可分离卷积的一个再思考，那么到底与深度可分离卷积有什么不同呢？

Unconstrained BSConv (BSConv-U):无限制蓝图卷积

从上图的第二列和第三列可以看出，

深度可分离卷积是先逐通道卷积，再对深度方向上加权组合。

无限制蓝图卷积是先对深度方向上加权组合，再卷积。

简单说，就是交换了depthwise(DW)和pointwise(PW)的顺序。

那么这个简单的交换有什么作用？

如下图，DSCs隐式地假设一个用于所有内核的3d蓝图，而BSConv则是依赖于每个内核的单独2d蓝图。

所以，深度可分卷积实际上执行的是跨内核的相关性，而不是内核内部的相关性。而研究发现内核内部的相关性占主导地位，因此有更大的潜力进行有效分离。

Subspace BSConv (BSConv-S) ：子空间蓝图卷积

作者进一步研究发现，在BSConv-U中1*1卷积层所使用的参数矩阵W=（Wn,M）行与行之间存在高度关联。（注：每一行有M个参数，对应一个输出通道）。

所以作者进一步将这个卷积核矩阵分解，即因式分解来实现W的低秩近似，然后通过添加正交约束来减少参数之间的相互关联。

上述的结果就是，1个1*1卷积被分解成两个1*1卷积。

五、实验

1、作者在CIFAR10、CIFAR100、StanforDogs、StanforCars等多个数据集上，使用MobileNetV1-V3网络，进行了实验，发现使用蓝图卷积代替标准卷积后，分类准确率都有所提升。

2、作者在CIFAR10、CIFAR100等数据集上，使用ResNet作为基础网络，发现参数量明显减少，性能也有所提升。

在大规模和细粒度分类数据集上的大量实验表明，BSConvs可以很好地改进MobileNets等网络结构，而不会引入任何复杂性。

六、总结

本论文提出了一种新的卷积核的分离方法BSConv，该方法是基于核内部的相关性，因此可以更有效地分离标准卷积。大量实验表明，该方法在减少参数量，提升模型性能方面有明显效果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/467662.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Node.js 得到当前目录下文件修改文件名

Node.js 得到当前目录下文件修改文件名

博客园第一篇,平时都用 .net ,现在 node.js 比较火，就用它做一些小工具，比较方便 Node.js 得到当前目录下文件修改文件名,把 .txt 修改为.md var fs require(fs); var fileDirectory __dirname if (fs.existsSync(fileDirectory)) {fs.readdir(fileDir…

阅读更多...

原来你也在写公众号

原来你也在写公众号

现在凌晨1点，我睡不着，因为今天打球了，每次打球回来我总是睡得很奇怪，奇怪有时候打球回来一躺下就睡着了，有时候打球回来就会习惯性失眠。脑海里总是浮现各种打球的进球动作，然后各种幻想，再加上…

阅读更多...

中的数组怎么转成结构体_PLC知识，什么是数组和结构体？

中的数组怎么转成结构体_PLC知识，什么是数组和结构体？

今天给大家介绍一下什么是数组，什么是结构体，关于数组我们会介绍数组的定义、它的使用方法，关于结构体我们会介绍结构体的使用、怎么去建立一个结构体等知识，之前也是有部分学员有问过这些问题的，那么都一块儿给大家讲…

阅读更多...

MMU那些事儿

MMU那些事儿

最近在重新看这部分知识点，内存管理和进程调度应该是Linux下最核心的两个东西，不管你做得多牛逼了，这两点拿出来讨论，总是会让人眼前一亮，或者是可以讨论很久很久，这篇文章，读完后可能也可以让大…

阅读更多...

51Nod 1530 稳定方块

51Nod 1530 稳定方块

瓦西亚和皮台亚摆放了m个方块。方块被编号为0到m-1(每个号码出现恰好一次)。现在建立一个座标系OX表示地面，OY的方向是竖直向上的。每一方块的左下角有一个座标而且是整点座标。摆放好的方块一定要是稳定的。稳定的含意是每一个不在地面上的方块在他的下面至少有一…

阅读更多...

C语言、嵌入式中几个非常实用的宏技巧

C语言、嵌入式中几个非常实用的宏技巧

宏打印函数在我们的嵌入式开发中，使用printf打印一些信息是一种常用的调试手段。但是，在打印的信息量比较多的时候，就比较难知道哪些信息在哪个函数里进行打印。特别是对于异常情况的打印，我们需要快速定位到异常情况的位置。这时…

阅读更多...

canvas 多次画图效果_canvas练习之终极的奔跑小人

canvas 多次画图效果_canvas练习之终极的奔跑小人

这次做一个终极的练习，先看一下最后的效果。一个不停奔跑的小人，点击鼠标后会让他跑到目的地，并且呈现不同的角度。下面来看一下如何一步步来实现它的。准备网上下载了一张图片，其中包含了小人面向不同角度奔跑的各个分解动作。新…

阅读更多...

loadrunner11安装，提示少了Microsoft Visual c++2005 sp1运行时组件解决办法

loadrunner11安装，提示少了Microsoft Visual c++2005 sp1运行时组件解决办法

解决方法：1、进入loadrunner-11\Additional Components\IDE Add-Ins\MS Visual Studio .NET2、安装：LRVS2005IDEAddInSetup.exe3、再安装loadrunner破解方法：1、把loadrunner相关程序全部退出；2、把lm70.dll、mlr5lprg.dll放到安装…

阅读更多...

C语言的爱你永不悔

C语言的爱你永不悔

#前言今天是520节，昨天晚上睡觉的时候，我家地瓜一直说520,520，我不知道要干啥，我就说，要睡就睡，不睡就起来。今天我看了朋友圈，我才知道原来520就是「我爱你」的意思。今天在朋友圈看到的一个小…

阅读更多...

服务网关zuul之二：过滤器--请求过滤执行过程（源码分析）

服务网关zuul之二：过滤器--请求过滤执行过程（源码分析）

Zuul的核心是一系列的过滤器，这些过滤器可以完成以下功能： 身份认证与安全：识别每个资源的验证要求，并拒绝那些与要求不符的请求。审查与监控：在边缘位置追踪有意义的数据和统计结果，从而带来精确的生成视图…

阅读更多...

l4 l7 代理_什么是四层(L4 proxy)和七层负载均衡(L7 proxy)?区别是什么? 翻译自Nginx官网...

l4 l7 代理_什么是四层(L4 proxy)和七层负载均衡(L7 proxy)?区别是什么? 翻译自Nginx官网...

阅读前的小说明：由于工作需要，本人正在研究微服务架构。而微服务的服务网格( Service Mesh )架构中，需要选择一种 proxy 作为每个微服务之间通讯的代理。因此为了定夺微服务中常用的两种代理，即： Nginx 和 Envoy 如何选…

阅读更多...

Linux 下的0 1 2特殊文件描述符~

Linux 下的0 1 2特殊文件描述符~

最近在做项目的时候遇到的几个知识点，我觉得非常有意思，以前学Linux的时候也有接触到管道方面的，但是在应用中却基本没有遇到过。还有Linux下的几个特殊的文件描述符，用这几个文件描述符可以做很多事情，能做什么事情决…

阅读更多...

攻防比赛_2020年度泉州市大学生网络安全攻防比赛在黎明职业大学圆满落幕

攻防比赛_2020年度泉州市大学生网络安全攻防比赛在黎明职业大学圆满落幕

10月16日下午，作为2020年国家网络安全宣传周泉州市系列活动之一，“泉州市大学生网络安全攻防比赛”在黎明职业大学智慧教学中心成功举办并圆满落幕。此次比赛由泉州市互联网信息办公室、泉州市教育局主办，黎明职业大学和泉州市网络与信息安全…

阅读更多...

17-9--18：了解Linux的命令格式，今天复习的已知命令和新命令

17-9--18：了解Linux的命令格式，今天复习的已知命令和新命令

熟悉的命令： cp -r 需要复制的文件夹复制文件夹到指定文件夹复制文件夹到文件夹、复制文件到文件夹 cat 需要复制的文件 > > 复制到指定文件复…

阅读更多...

gitlab 如何关闭force push

gitlab 如何关闭force push

把不允许force push的分支设置成保护分支，Push的时候就会提示不能force psuh。

阅读更多...

camera中文版软件 ip_ip camera网络摄像机

camera中文版软件 ip_ip camera网络摄像机

IP Camera Viewer是一个方便可靠能够通过IP地址监控多台摄像头的软件。需要的朋友们赶紧下载试试吧！你可以在几分钟之内设置一个免费的IP摄像监控系统， 保持在家里，办公室，停车场或任何地方，你都可以监控。同时查看多…

阅读更多...

Ubuntu16.04通过GPT挂载硬盘

Ubuntu16.04通过GPT挂载硬盘

一般而言，服务器上挂载的硬盘都是比较大的，传统的对硬盘进行分区需要在终端敲sudo fdisk进行操作，但是， 当挂载的硬盘的容量大于2T的时候，是无法通过sudo fdisk进行挂载的，这个时候必须要进行GPT进行挂载&a…

阅读更多...

Mplayer后台播放没有声音

Mplayer后台播放没有声音

昨天的文章，我觉得虽然不是很复杂，但是我自认为很多人应该是不懂的，不过好像阅读量不是很好，今天转发我师弟的一篇文章，我觉得这个也是大家没有注意到的。Linux 下的0 1 2特殊文件描述符~一、平台Ubuntu16.04(64位)二、…

阅读更多...

python输出程序运行时间_叨叨 Python 性能优化工具

python输出程序运行时间_叨叨 Python 性能优化工具

虽然Python是一个”慢慢的“语言，但是不代表我们对性能没有任何的追求，在程序运行过程中，如果发现程序运行时间太长或者内存占用过大，免不了需要对程序的执行过程进行一些监测，找到有问题的地方，进行优化。…

阅读更多...

链接学习之obj文件探索

链接学习之obj文件探索

Windows的gcc环境，往官网http://sourceforge.net/project/showfiles.php?group_id2435 下载MinGW，安装，安装完毕后按照包配置环境变量 a.在PATH的值中加入"C:\Program Files\MinGWStudio\MinGW\bin"。这是寻找gcc编译器的路径。…

阅读更多...

最新文章