机器学习——深度学习之卷积神经网络(CNN)——AlexNet卷积神经网络结构

目录

一、AlexNet卷积神经网络结构模型

1、数据库ImageNet

2、AlexNet第一层卷积层

二、AlexNet卷积神经网络的改进

1、非线性变化函数的改变——ReLU

2、最大池化(Max Pooling)概念的提出——卷积神经网络通用

1)池化层

2)最大池化

问题1:在AlexNet中,后向传播时,池化后特征图像的梯度怎么传给池化前的图像?——赢者通吃法

3)池化过程的功能和效果

3、随机丢弃(Drop Out)

问题2:为什么参数要乘以(1-p)?

4、增加训练样本

5、利用2片GPU进行加速

​ 三、AlexNet的效果

四、AlexNet中的参数


一、AlexNet卷积神经网络结构模型

1998年LeNet卷积神经网络

2013年AlexNet卷积神经网络

AlexNet卷积神经网络相较于LeNet卷积神经网络其实本质上没有改变,只是在一些细节上进行了改善

1、数据库ImageNet

数据库:ImageNet

样本数据:120万

类别:1000类

2、AlexNet第一层卷积层

第一层卷积层的相关参数

图像大小:227*227*3

卷积核大小:11*11*3

卷积核个数:96个

步长:【4,4】

特征图像大小:55*55*96,图上看起来是48,实际上是96,将96分成两个48给两个GPU进行处理

二、AlexNet卷积神经网络的改进

1、非线性变化函数的改变——ReLU

2、最大池化(Max Pooling)概念的提出——卷积神经网络通用

1)池化层

在LeNet中这一层叫做降采样层,Alex将其改名为池化层Pooling

2)最大池化

LeNet中这一层所做的事情是将红色区域的所有值的平均值作为输出,变成右边的一个蓝色像素格子

但是在AlexNet中,是将红色区域中最大的像素值作为输出,变成右边的一个蓝色像素格子的值

问题1:在AlexNet中,后向传播时,池化后特征图像的梯度怎么传给池化前的图像?——赢者通吃法

答:在LeNet中前向传播是平均池化,后向传播时将池化后的特征每一个格子的梯度平均分给池化前的图像

但是在AlexNet中由于是最大池化得到的池化后的特征图像,因此在后向传播的梯度处理上,也是基于此。将上图中蓝色格子的梯度直接传播赋值给池化前红色区域的像素值最大的格子,其余的格子的梯度设置为0,这就是赢者通吃法则

3)池化过程的功能和效果

功能:

降采样

非线性操作——因此池化用的是最大池化,和RULE函数进行非线性转换的效果是一样的

效果:

只有最大像素值有关,其余像素的梯度均设置为0,这样导致的结果就是参与前向计算的神经元减少,降低了过拟合的可能

3、随机丢弃(Drop Out)

训练用丢弃神经元后的神经网络,测试的时候需要用完整的神经网络

注:随机丢弃可以随机地激活一部分神经元,会使得参数稳定化,避免了过拟合

问题2:为什么参数要乘以(1-p)?

答:望赐教

4、增加训练样本

有的时候参数过多,训练样本不够,这样就会导致待测参数的不准确,使得性能不够

5、利用2片GPU进行加速

三、AlexNet的效果

 

四、AlexNet中的参数

参数个数可参考:《机器学习——深度学习之卷积神经网络(CNN)——LeNet卷积神经网络结构》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/256347.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#委托——基础2

在上一篇随笔中,简要说明了怎样定义委托,定义事件,订阅事件,最后也实现了效果,就是当员工类的某个对象,执行某个事件时,委托事件被触发,后面也得到了结果,但是想象一下实…

机器学习——深度学习之编程工具、流行网络结构、卷积神经网络结构的应用

目录 一、编程工具 caffe实现LENET-5 二、流行的网络结构 1、VGGNET 2、Googlenet ​ 3、ResNet​ ​ 三、卷积神经网络的应用 1、人脸识别 ​ 2、人脸验证 3、人脸特征点检测 4、卷积神经网络压缩 一、编程工具 caffe的优点:模型标准化,源代码…

Halcon例程详解(激光三角系统标定)—— calibrate_sheet_of_light_calplate.hdev

前言 1 激光三角测距 激光三角测距法原理很简单,是通过一束激光以一定的入射角度照射被测目标,激光在目标表面会产生漫反射,在另一角度利用透镜对反射激光汇聚成像,光斑成像在CCD(Charge-coupled Device,感光耦合组件)位置传感器上。当被测物体沿激光方向发生移动时,…

【tenserflow】——数据类型以及常用属性

目录 一、什么是Tensor? 二、Tensorflow常见数据类型 三、Tensorflow常见属性device\cpu\gpu\ndim\shape\rank等 1、创建一个tensor 1)tf.constant() 2)tf.Variable() 2、判断一个变量是否为tensor张量 3、生成不同设备(cpu,gpu&#x…

网页开发浏览器兼容性问题

1、在ie6下的双margin问题 在ie6下,设置了float的元素,以float:left为例,如图所示。会出现第一个浮动元素,即相对于父级元素浮动的,会出现双倍margin的问题。 注意仅仅是相对于父级元素浮动的,即第一个会出…

【tensorflow】——创建tensor的方法

目录 1、tf.constant() 2、tf.Variable() 3、tf.zeros():用0去填充指定形状的数组 4、tf.convert_to_tensor(a,dtypetf.int32) 5、tf.ones():用1去填充指定形状的数组 6、tf.fill():用指定的元素去填充指定形状的数组 7、随机化初始化进行创建 1)normal正态分…

Halcon —— 图像像素类型与转换

图像类型 就目前工业领域主流的图像处理工具halcon来讲,有以下几种图像类型:‘byte’, ‘complex’, ‘cyclic’, ‘direction’, ‘int1’, ‘int2’, ‘int4’, ‘int8’, ‘real’, ‘uint2’,具体含义如下图所示。 ‘byte’ 每像素1字节…

Halcon例程详解(基于卡尺工具的匹配测量方法) —— measure_stamping_part.hdev

前言 1卡尺工具介绍 Halcon中的Metrology方法即为卡尺工具,可用来拟合线,圆,这种方法对于目标比背景很明显的图像尺寸测量是很方便的,不需要用blob进行边缘提取等,但缺点也很明显,需要目标的相对位置基本…

【TensorFlow】——不同shape的tensor在神经网络中的应用(scalar,vector,matrix)

目录 ​ 1、scalar——标量 1)在神经网络中存在的场景 2)one_hot编码 3)举例应用 2、vector——向量 ​ 3、matrixs——矩阵 4、dim3的tensor 5、dim4的tensor 6、dim5的tensor 本文主要的目的是让初学者对tensor的各种形式的使用场…

Java - I/O

File类 java.io操作文件和目录,与平台无关。具体的常用实例方法: File file new File("."); // 以当前路径创建名为 "." 的 File 对象   文件目录信息函数     -   String getName/Path/Parent(): 文件名/路径…

Halcon —— 边缘检测算子详解

一、算子介绍 1.1 种类 halcon内常用的边缘检测算子包括如下几种: 1.edges_image: 提取2D 图像边缘 2.edges_sub_pix:提取2D图像亚像素边缘 3.edges_object_model_3d :提取3D图像边缘 4.edges_color和edges_color_sub_pix:提取彩…

【TensorFlow】——索引与切片

目录 1、利用index进行索引 2、利用“:”和“...”进行索引与切片 3、tf.gather()——对一个维度进行乱序索引 优势: 缺点: 例子 4、tf.gather_nd()——同时对多个维度进行索引 5、tf.boolean_mask()——通过布…

华硕(ASUS)X554LP笔记本一开机就进入aptio setup utility 问题的解决

某次因大意一直未插电,华硕(ASUS)X554LP笔记本后来没电关机。后来每次一开机就进入aptio setup utility界面,按F9调入默认配置,F10保存后退出,重启仍然进入aptio setup utility。 网上查了一下,…

【TensorFlow】——broadcast_to(在不复制内存的情况下自动扩张tensor)

目录 作用: 内在的思路 优点 什么时候可以broadcast ​ tf.boradcast_to .VS tf.tile 作用: 在不会实际意义上复制数据的情况下进行tensor的维度和形状的扩张,使得两个tensor维度和形状一致 对两个维度不一致的tensor进行加减前进行br…

20145212 《信息安全系统设计基础》第2周学习总结

20145212 《信息安全系统设计基础》第2周学习总结 教材学习内容总结 Vim基本操作 1.使用vim命令进入vim界面vim后面加上你要打开的已存在的文件名或者不存在(则作为新建文件)的文件名。 打开Xfce终端,输入以下命令$ vim practice_1.txt 直接使…

Opencv—— 拟合直线

概念 最小二乘法是勒让德( A. M. Legendre)于1805年在其著作《计算慧星轨道的新方法》中提出的。 最小二乘法就是通过最小化误差的平方和,使得拟合对象无限接近目标对象。在图像处理中主要用于拟合线,通过求采样点距离误差最小的线,可以是直…

本地搭建Dubbo监控中心的安装步骤

Dubbo监控中心的安装步骤 参考链接:http://blog.csdn.net/lichunan/article/details/40349645 一、从github上下载dubbo源码进行编译: 1、下载地址为: https://github.com/alibaba/dubbo.git2、编译源码命令:首先进入~/dubbo&am…

【TensorFlow】——实现minist数据集分类的前向传播(常规神经网络非卷积神经网络)

目录 一、常规神经网络模型 二、TensorFlow实现前向传播步骤 1、读取数据集 2、batch划分 3、根据神经网络每一层的神经元个数来初始化参数w,b 4、进行每一层输入输出的计算 5、对每一层的输出进行非线性relu函数变换 6、计算一个batch训练后的误差loss 7、计算每一次…

神经网络(11)--具体实现:unrolling parameters

我们需要将parameters从矩阵unrolling到向量,这样我们就可以使用adanced optimization routines. unroll into vectors costFunction与fminunc里面的theta都是n1维的向量,costFunction的返回值gradient也是n1维的向量。 但是当我们使用神经网络时&#x…