Xception,Inception-ResNet,SENet(Squeeze-and-Excitation)

一.Xception

Xception是在InceptionV3基础上修改的,主要引入了深度可分离卷积,将空间和通道的操作进行解耦合。

与“extreme” Inception两个区别:

1,1×1卷积的顺序,Xcption用于3×3之后,而Inception用于之前

2,Xception在1×1和3×3之后都没用relu,而Inception都用了。

3*3做空间相关性,1×1做通道相关性。

       

用Relu会损失一部分信息。

二.Inception-ResNet

证明了Residual learning并非深度网络走向更深的必需条件,其只是可以使得深度网络的训练速度加快而已。为了表明这一点,他们更是造出了更为复杂、精巧的Inception v4网络,在不使用residual learning的情况下也达到了与Inception-Resnet v2近似的精度。

如果通道数超过1000,那么Inception-resnet等网络都会开始变得不稳定,并且过早的就“死掉了”,即在迭代几万次之后,平均池化的前面一层就会生成很多的0值。作者们通过调低学习率,增加BN都没有任何改善。实验发现如果对inception-resnet网络中的residual模块的输出进行scaling(如乘以0.1-0.3),那么可以让它的整个训练过程更加地稳定。如下图为scaling的具体做法示意。

三.SENet

SEnet最终目的是给各个channel增加权重,注意于通道之间的关系,2017年ILSVRC分类第一。

通过精确的建模卷积特征各个通道之间的作用关系来改善网络模型的表达能力。为了达到这个期望,提出了一种能够让网络模型对特征进行校准的机制,使网络从全局信息出发来选择性的放大有价值的特征通道并且抑制无用的特征通道。 

模型复杂度:当r=16时,SE-ResnNet相比ResNet-50参数量仅增加0.26%。

本节我们研究SE-ResNet-50模型的样本激活,并考察它们在不同块不同类别下的分布情况。具体而言,我们从ImageNet数据集中抽取了四个类,这些类表现出语义和外观多样性,即金鱼,哈巴狗,刨和悬崖。然后,我们从验证集中为每个类抽取50个样本,并计算每个阶段最后的SE块中50个均匀采样通道的平均激活(紧接在下采样之前),并在图7中绘制它们的分布。作为参考,我们也绘制所有1000个类的平均激活分布。

我们对SENets中Excitation的作用提出以下三点看法。首先,不同类别的分布在较低层中几乎相同,例如,SE_2_3。这表明在网络的最初阶段特征通道的重要性很可能由不同的类别共享。然而有趣的是,第二个观察结果是在更大的深度,每个通道的值变得更具类别特定性,因为不同类别对特征的判别性值具有不同的偏好。SE_4_6和SE_5_1。这两个观察结果与以前的研究结果一致[21,46],即低层特征通常更普遍(即分类中不可知的类别),而高层特征具有更高的特异性。因此,表示学习从SE块引起的重新校准中受益,其自适应地促进特征提取和专业化到所需要的程度。最后,我们在网络的最后阶段观察到一个有些不同的现象。SE_5_2呈现出朝向饱和状态的有趣趋势,其中大部分激活接近于1,其余激活接近于0。在所有激活值取1的点处,该块将成为标准残差块。在网络的末端SE_5_3中(在分类器之前紧接着是全局池化),类似的模式出现在不同的类别上,尺度上只有轻微的变化(可以通过分类器来调整)。这表明,SE_5_2和SE_5_3在为网络提供重新校准方面比前面的块更不重要。这一发现与第四节实证研究的结果是一致的,这表明,通过删除最后一个阶段的SE块,总体参数数量可以显著减少,性能只有一点损失(<0.1%0.1%的top-1错误率)。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493293.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

物联网白皮书【2018】重磅发布|今年的物联网产业交出了一张怎样的答卷

来源&#xff1a;中国信息通信研究院摘要&#xff1a;物联网白皮书&#xff08;2018&#xff09;由中国信息通信研究院、中国信息通信研究院西部分院、物联网智库、上海市物联网行业协会、杭州市物联网行业协会、中信建投证券股份有限公司、国家智能传感器创新中心联合撰写发布…

Deep Alignment Network(人脸对齐)

一&#xff0c;DAN 由于使用了关键点热力图的可视化信息&#xff0c;故可以将整张图输入网络。 网络分为多个阶段&#xff08;STAGE&#xff09;&#xff0c;每个阶段的结构都是相同的&#xff08;STAGE 1除外&#xff09;。第一阶段的输入仅有原始图片&#xff0c;和S0。面部…

斯坦福全球AI报告:人才需求两年暴增35倍,中国机器人部署量涨500%

来源&#xff1a;量子位作者&#xff1a;安妮 栗子 乾明 一璞刚刚&#xff0c;斯坦福全球AI报告正式发布。从去年开始&#xff0c;斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授&#xff0c;组建了一个小组&#xff0c;每年发布AI index年度报告&#xf…

ubuntu安装nvidia显卡驱动+cuda9.0+cudnn7.0+查看cuda版本+安装tensorrt+python查看gpu显存

一,驱动安装 显卡驱动和cuda版本关系 卸载原先驱动 sudo apt-get remove --purge nvidia-\*ubuntu-drivers devices 查看显卡类型 Nvidia驱动下载地址&#xff1a;https://www.geforce.com/drivers选择对应的显卡和Linux 64 系统&#xff0c;可以下载最新版本。 要注意的是…

英特尔发布全新CPU架构 称摩尔定律未死 中国研究院迎20周年

来源&#xff1a;网易智能摘要&#xff1a;英特尔分别在大洋两岸&#xff0c;几乎同时上演了两个大秀。在中国&#xff0c;研究院院长宋继强与各实验室负责人详细阐述了团队构成以及目前的四大研究领域&#xff0c;在彼岸&#xff0c;英特尔举行架构日活动&#xff0c;英特尔处…

2018 年最引人注目的科学时刻,《科学》杂志选出14 张年度最佳科学照片

来源&#xff1a;Deeptech深科技摘要&#xff1a;2018 年 12 月 11 日&#xff0c;《科学》杂志从 2018 年发表的科学报道中&#xff0c;筛选出 14 张年度最佳照片&#xff0c;记录了 2018 年最引人注目的科学时刻。伊瓜苏大瀑布INGE JOHNSSON/ALAMY STOCK PHOTO伊瓜苏瀑布位于…

Linked dylibs built for GC-only but object files built for retain/release for architecture x86_64

编译开源Xcode 插件 SCXcodeSwitchExpander 源码地址&#xff1a; https://github.com/stefanceriu/SCXcodeSwitchExpander 编译环境&#xff1a;Xcode5.1 系统版本&#xff1a;OSX 10.8.5 提示下面错误 考虑是不是ARC引起的&#xff0c;发现building setting 已经设置了开启ar…

不平等加剧与问责机制:纽约大学AI Now研究所2018 AI现状报告 | 报告

来源&#xff1a;AI NOW Institute编译&#xff1a;机器之心 微胖摘要&#xff1a;纽约大学 AI Now 研究所发布了第三份关于人工智能现状的年度报告。2018 年 AI Now 报告重点关注行业 AI 丑闻和不平等加剧等主题&#xff0c;还评估了人工智能道德与有意义的问责制之间的差距&a…

二叉树的基础知识

一,树 E为根节点,BCD互称为兄弟节点,G、H、I、J、K、L互称为叶子节点(没有子节点) 树的高度,深度,层数. 高度从下往上数(0开始),深度从上往下数(0开始). 二,二叉树 2为满二叉树,二叉树中除了叶子结点&#xff0c;每个结点的度都为 2. 3为完全二叉树,如果二叉树中除去最后一层…

C# GDI+绘图介绍

最近查阅网上资料&#xff0c;将GDI的基本知识汇总如下&#xff1a; 一、基本的知识 GDI&#xff1a;Graphics Device Interface Plus也就是图形设备接口,提供了各种丰富的图形图像处理功能; 在C#.NET中&#xff0c;使用GDI处理二维&#xff08;2D&#xff09;的图形和图像&…

统计学第二章--感知机

感知机是一种较为简单的二分类模型&#xff0c;感知机旨在学习能够将输入数据划分为1/-1的线性分离超平面&#xff0c;所以说整体而言感知机是一种线性模型。 查看数据集 import pandas as pd import numpy as np from sklearn.datasets import load_iris import matplotlib.…

你坐飞机时可能意识不到,AI已经全流程为你保驾护航

作者 &#xff1a;Alyson Behr编译&#xff1a;机器之能 高璇、微胖摘要&#xff1a;AI在航空领域的应用比你目前所知的还要丰富。除了自动驾驶&#xff0c;从驾驶舱到后勤部门乃至客户体验&#xff0c;对于AI应用的探索几乎遍及整个行业。当「人工智能」和航空业结合在一起时…

pytorch基础知识+构建LeNet对Cifar10进行训练+PyTorch-OpCounter统计模型大小和参数量+模型存储与调用

整个环境的配置请参考我另一篇博客。ubuntu安装python3.5pycharmanacondaopencvdockernvidia-dockertensorflowpytorchCmake3.8_智障变智能-CSDN博客 中文文档:torch - PyTorch中文文档 github简单示例&#xff1a;多卡分布式教程&#xff0c;带有多卡mnist分布式训练和单卡训…

量子计算

来源&#xff1a;博客丨政策管理作者&#xff1a;贺飞&#xff08;北京大学&#xff09;摘要&#xff1a;量子计算&#xff1a;前途光明 道路曲折量子计算&#xff1a;前途光明 道路曲折&#xff08;一&#xff09;本周&#xff0c;美国国家科学院、工程院和医学院的一个由13…

深度学习可视化的一些工具+pytorch实现回归与卷积可视化

一.深度学习可视化的一些工具 1.深度学习网络结构画图工具:https://cbovar.github.io/ConvNetDraw/ 2.将.onnx放入即可,可视化网络结构:https://lutzroeder.github.io/netron/ 3.结构可视化工具:https://github.com/HarisIqbal88/PlotNeuralNet 二.回归 线性回归的损失函数…

《人工智能转型手册》,吴恩达 著

来源&#xff1a;量子位AI大者&#xff0c;为国为民。从今往后&#xff0c;市值5亿美元至5000亿美元的企业&#xff0c;都能用得上、用得会、用得好吴恩达的AI转型经验了。这是他在谷歌和百度带队AI的核心总结&#xff0c;也是他见得广、听得多、被咨询无数后的精华提炼。一册《…

Android Studio开发入门-引用jar及so文件

作者&#xff1a;王先荣 最近初学安卓开发&#xff0c;因为以前从未用过JAVA&#xff0c;连基本的语法都要从头开始&#xff0c;所以不太顺利。在尝试使用百度语音识别引擎时遇到了如何引用jar及so文件的问题。在GOOGLE加多次尝试之后&#xff0c;找到了一个比较简单的方法&…

腾讯杰出科学家写给2029的信:计算机视觉AI技术的爆点在哪里?

文 |腾讯杰出科学家、腾讯优图实验室负责人 贾佳亚 腾讯优图实验室总监 戴宇荣博士 郑冶枫博士近年来&#xff0c;计算机视觉AI技术发展迅速&#xff0c;尤其是人工智能的引入大大提升了算法的能力和实用性。在数不清的视觉AI应用中&#xff0c;我们认为未来技术的爆发点可能来…

pytorch实现Dropout与正则化防止过拟合

numpy实现dropout与L1,L2正则化请参考我另一篇博客 https://blog.csdn.net/fanzonghao/article/details/81079757 pytorch使用dropout与L2 import torch import matplotlib.pyplot as plt torch.manual_seed(1) # Sets the seed for generating random numbers.reproduc…

“蚁人”不再是科幻!MIT最新研究,能把任何材料物体缩小1000倍 | Science

来源&#xff1a;量子位科学加速&#xff0c;科幻成真也在加速。漫威世界中&#xff0c;蚁人是蚂蚁大小的超级英雄&#xff0c;靠一件“变身服”&#xff0c;人类就能在更微观的世界里大干一场。现在&#xff0c;类似的科幻想象&#xff0c;被MIT变成现实。丨小小小&#xff0c…