卷积神经网络(CNN:Convolutional Neural Network)

1、感知器(perceptron)

感知器是卷积神经网络的基本单元,下图展示了其工作原理,为了方便理解,图中只显示了3个输入。

向量w为输入向量x的权重,b为偏差,最后对x的线性组合(w\cdot x+b)的值进行判断,

如果值大于0,输出1.

如果值小于0,输出0.

感知器的不同组合产生不同神经网络

增加层次

增加深度

为什么感知器可以运用于图像处理领域?

图像滤波通过图像的卷积运算来实现,其公式如下:

其实卷积运算也是像素值的线性组合,权重为滤波器对应像素位置的值。

图像的卷积运算也可以通过感知机来表示。

下面的内容先介绍是什么,然后讲如何理解,最后说为什么。

2、卷积神经网络(CNN)

卷积神经网络中常见的一种架构如下图所示。

图中的每一stage可以视为图像的特征提取,图中只显示了3个stage的特征提取。

如果希望提取到更多的细节,可以增加 stage。

每一个stage由3小步骤组成,

第一为卷积层,提取特征;

第二为LCN(Local Contrast Normalization,局部对比度归一化),归一化局部图像的对比度。

第三为Pooling,池化,缩小图片大小。

2.1 卷积层(convolutional layer)

假设一张图像32*32*3(3为RGB颜色通道),滤波器为5*5*3,卷积后得到特征图像(28*28*1),这里默认stride 为1。

如果使用6个不同的滤波器进行卷积后,将会得到6个不同的特征图像

如果步长(stride)为1,滤波器每隔一个像素点移动(向右移动,或向下移动)。

如果步长为2,滤波器每隔两个像素点移动,如下图所示。

若原图大小为N*N,滤波器大小为F*F,步长为S,则卷积后的图像大小为:

\frac{N-F}{S}+1

2.2 局部对比度归一化(LCN)

图像归一化公式

其中

N(x,y) 表示将图像中的像素值建模成为的正态分布。

m为均值,\sigma为标准差。

2.3 池化(Pooling)

池化的主要功能是缩小图片,减少计算量。

池化有两种一种是最大值池化,一种是均值池化,较常用的为最大值池化。

其公式如下:

如果公式很难看懂,可以如下图方式理解最大值池化;

一张4*4的图像,每2*2个像素组成一个小方格,

取小方格中四个像素中最大的那个值,然后扔掉其它值,

这样就形成一个新的2*2的图像,图片变小了。

2.4 全连接层

全连接层的第一步需要flattening图像,

如下3*3图像,可视为二维矩阵

flattening后成为1*9的向量:

然后进行全连接,关于全连接的原理,需要另外用一章来说,涉及很多知识。

 

3 关于卷积神经网络的直观理解

这一小结的内容发现大牛‘沉迷学习的糕糕’发表在其知乎的个人专栏了,非常详细,整个内容分为两个部分:

卷积神经网络CNN完全指南终极版(一)

卷积神经网络CNN完全指南终极版(二)

 

4 关于卷积神经网络的一些问题

4.1 为什么要使用LCN(local contrast normaliz)

对于两张图片(仅仅只是对比度不同),如下图所示。

在提取特征过程中,希望眼睛这个部位的特征不受对比度影响,所以使局部对比度归一化

4.2 为什么使用最大值池化

对于滤波后的图片,无论是求边缘或是实现其它功能,最有用的是哪些高亮度值的像素点,

非极大值抑制也是利用亮度值最高的像素。

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492179.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

性能调优:理解Set Statistics Time输出

性能调优:理解Set Statistics Time输出 原文:性能调优:理解Set Statistics Time输出在性能调优:理解Set Statistics IO输出我们讨论了Set Statistics IO,还有如何帮助我们进行性能调优。这篇文章会讨论下Set Statistics Time&…

Nature Communications:实时记录神经系统,解开大脑秘密

来源:神经科技人的大脑中大概有一千亿个神经元,每一个神经元都连接到数以百计的神经元邻居。分析大脑中的神经活动和致此活动的原因,一直是科学家们研究的目标。现在,一组科学家设计出整个神经系统高速映射神经元放电的成像技术&a…

JDK内置的进制转换

十进制转成十六进制 Integer.toHexString(int i) 十进制转成八进制 Integer.toOctalString(int i) 十进制转成二进制 Integer.toBinaryString(int i) 十六进制转成十进制 Integer.valueOf("FFFF", 16).toString() 八进制转成十进制 Integer.valueOf("376",…

图像变换(Image transformations)

1 图像变换和图像滤波(image filtering)的区别 1.1 图像滤波 图像滤波改变像素点的灰度值,不改变像素点的坐标,如下图所示。 用函数可表示为: 其中f(x)表示原图,h(x)表示滤波器 1.2 图像变换 图像变换改…

图像对齐(image alignment)

1、图像对齐的步骤 已知图像A和B,图像对齐的步骤: 提取图像A和B的特征匹配图像A和B中的特征求解图像A和B的对齐矩阵2 使用最小二乘求解对齐矩阵的问题 使用最小二乘求解对齐矩阵容易受到outliers的影响, 误差会很大。 3 RANSAC(random sa…

ipython 学习笔记 2 network graph--NetworkX

如果NetworkX不好用&#xff0c;pip uninstall 然后install 1) 看每个node的social情况 In [1]: import networkx as nx In [2]: nx.read<点击TAB看选项> 比如 nx.read_adjlist nx.read_dot nx.read_edgelist这个时候应该在有一系列edges和dot的文件夹 fbdata里 In [3]: …

巴黎不哭!十亿点数据“重建”巴黎圣母院

来源&#xff1a;大数据文摘摘要&#xff1a;目前&#xff0c;尽管现实中的大教堂已经无法恢复&#xff0c;但被数字化的“巴黎圣母院”仍然精确地留存在人类世界。而通过这一数据留存&#xff0c;重建巴黎圣母院成为可能&#xff0c;后人也仍然可以一览它曾经的雄伟。即使这一…

照相机的成像变换

1 变换过程 照相机的成像变换过程可以分为3步&#xff1a;世界坐标系——>相机坐标系——>图像坐标系——>像素坐标系 2 世界坐标系——>相机坐标系 景物从世界坐标系转换到相机坐标系需要使用到刚体变换&#xff08;物体不发生变形&#xff0c;对一个几何物体做…

翻译题(map使用)

What Are You Talking About 点我 Problem DescriptionIgnatius is so lucky that he met a Martian yesterday. But he didnt know the language the Martians use. The Martian gives him a history book of Mars and a dictionary when it leaves. Now Ignatius want to tra…

我国芯片各细分领域龙头名单

来源&#xff1a;机械前沿芯片的分类&#xff1a;日常生活中&#xff0c;我们可以发现芯片的种类比如有通信芯片、人工智能芯片、LED芯片、电脑芯片等等。芯片的产业链是这样的&#xff1a;根据产业链划分&#xff0c;芯片从设计到出厂的核心环节主要包括 6 个部分&#xff1a;…

求解相机参数Camera Calibration

1 主要思想 使用黑白棋盘格&#xff0c;记录世界坐标系中关键点的坐标&#xff0c;然后使用手机拍照&#xff0c;记录相应点像素点的坐标。 这样就得到了许多3D-2D的配对点 2 详细过程 由 上一篇博客 内容可知&#xff0c; 其中 P‘ 为像素坐标&#xff0c; Pw为世界坐标系的…

Flash Media Server 4.5下载

http://fms45.fmsx.org/转载于:https://www.cnblogs.com/tangxiacun/p/4549051.html

超壮观!10只波士顿动力机器狗,拖动大卡车,步伐整齐划一如同仪仗队

来源&#xff1a;量子位整整10只SpotMini机器狗&#xff0c;可以做什么&#xff1f;波士顿动力的答案是&#xff1a;拉卡车。对&#xff0c;不是狗拉雪橇&#xff0c;是狗拉体积大得多、质量重得多的大卡车。画面中&#xff0c;出现了并排走的一对机器狗。后面还有另一对机器狗…

立体视觉(Stereo Vision)-本征矩阵(essential matrix)和基本矩阵(fundamental matrix)

1 物体深度 问题描述&#xff1a;从不同的位置拍摄相同物体的两张图片&#xff0c;恢复其深度 这里假设摄像机的镜头平行 由相似三角形&#xff1a; 由上面第一、二等式可得&#xff1a; 深度与视差成反比 2 如何配对左右图片的点 问题描述&#xff1a;已知两张图像&#xff…

PHP操作数据库,不推荐使用mysql函数,而推荐使用mysqli和PDO函数

PHP操作数据库&#xff0c;不推荐使用mysql函数&#xff0c;推荐使用mysqli和PDO函数。转载于:https://www.cnblogs.com/npk19195global/p/4550013.html

重磅:苹果高通和解!英特尔退出5G基带市场,高通股价暴涨超20%,华为依然淡定...

来源&#xff1a;新浪、量子位等&#xff0c;物联网智库整理摘要&#xff1a;没有永恒的朋友&#xff0c;只有永恒的利益。前一阵子还是“牛夫人”&#xff0c;今天就变成“小甜甜”了。没有永恒的朋友&#xff0c;只有永恒的利益。前一阵子还是“牛夫人”&#xff0c;今天就变…

计算图像的景深

在 上一篇 博客中&#xff0c;景深与视差成反比&#xff0c;其公式为&#xff1a; 为焦距&#xff0c; 为左右相机的距离&#xff0c;分别为两张图像的点距离各自中心点的距离。 对于左图像的每一个像素点 &#xff0c;求图像景深可以分为以下几步&#xff0c; 在右图中&…

求一个数字中1的个数

输入一个整数n&#xff0c;求从1到n这n个整数的十进制表示中1出现的次数。 如18出现了1 10 11 12 13 14 15 16 17 18 总计10次 例如一个5位数x48292 万位数 10000-19999共有10000个 千位数 5*&#xff08;1000&#xff09;此时万位数的取值可以是0 1 2 3 4 共5个所以有5种 …

地球是否健康,最新“诊断报告”来了

中国南极中山站附近的冰盖、冰川与冰山。新华社发来源&#xff1a;光明日报4月13日&#xff0c;河北安平&#xff0c;游客在畅游油菜花海。新华社发对地球气候变化的科学诊断&#xff0c;要依赖一些数据指标&#xff1a;全球平均温度、海平面高度、南极冰川厚度等。4月初&#…

linux笔记-硬链接和符号链接

硬链接&#xff1a;指多个路径名&#xff08;不同目录下的不同文件名&#xff09;指向同一个硬盘数据&#xff0c;用其中的随便哪个文件打开修改数据&#xff0c;都会在其他文件打开中更新&#xff0c;原因就是硬链接和“原”文件inode相同&#xff0c;每增加或者删除一个链接&…