卷积神经网络(CNN:Convolutional Neural Network)

1、感知器(perceptron)

感知器是卷积神经网络的基本单元,下图展示了其工作原理,为了方便理解,图中只显示了3个输入。

向量w为输入向量x的权重,b为偏差,最后对x的线性组合(w\cdot x+b)的值进行判断,

如果值大于0,输出1.

如果值小于0,输出0.

感知器的不同组合产生不同神经网络

增加层次

增加深度

为什么感知器可以运用于图像处理领域?

图像滤波通过图像的卷积运算来实现,其公式如下:

其实卷积运算也是像素值的线性组合,权重为滤波器对应像素位置的值。

图像的卷积运算也可以通过感知机来表示。

下面的内容先介绍是什么,然后讲如何理解,最后说为什么。

2、卷积神经网络(CNN)

卷积神经网络中常见的一种架构如下图所示。

图中的每一stage可以视为图像的特征提取,图中只显示了3个stage的特征提取。

如果希望提取到更多的细节,可以增加 stage。

每一个stage由3小步骤组成,

第一为卷积层,提取特征;

第二为LCN(Local Contrast Normalization,局部对比度归一化),归一化局部图像的对比度。

第三为Pooling,池化,缩小图片大小。

2.1 卷积层(convolutional layer)

假设一张图像32*32*3(3为RGB颜色通道),滤波器为5*5*3,卷积后得到特征图像(28*28*1),这里默认stride 为1。

如果使用6个不同的滤波器进行卷积后,将会得到6个不同的特征图像

如果步长(stride)为1,滤波器每隔一个像素点移动(向右移动,或向下移动)。

如果步长为2,滤波器每隔两个像素点移动,如下图所示。

若原图大小为N*N,滤波器大小为F*F,步长为S,则卷积后的图像大小为:

\frac{N-F}{S}+1

2.2 局部对比度归一化(LCN)

图像归一化公式

其中

N(x,y) 表示将图像中的像素值建模成为的正态分布。

m为均值,\sigma为标准差。

2.3 池化(Pooling)

池化的主要功能是缩小图片,减少计算量。

池化有两种一种是最大值池化,一种是均值池化,较常用的为最大值池化。

其公式如下:

如果公式很难看懂,可以如下图方式理解最大值池化;

一张4*4的图像,每2*2个像素组成一个小方格,

取小方格中四个像素中最大的那个值,然后扔掉其它值,

这样就形成一个新的2*2的图像,图片变小了。

2.4 全连接层

全连接层的第一步需要flattening图像,

如下3*3图像,可视为二维矩阵

flattening后成为1*9的向量:

然后进行全连接,关于全连接的原理,需要另外用一章来说,涉及很多知识。

 

3 关于卷积神经网络的直观理解

这一小结的内容发现大牛‘沉迷学习的糕糕’发表在其知乎的个人专栏了,非常详细,整个内容分为两个部分:

卷积神经网络CNN完全指南终极版(一)

卷积神经网络CNN完全指南终极版(二)

 

4 关于卷积神经网络的一些问题

4.1 为什么要使用LCN(local contrast normaliz)

对于两张图片(仅仅只是对比度不同),如下图所示。

在提取特征过程中,希望眼睛这个部位的特征不受对比度影响,所以使局部对比度归一化

4.2 为什么使用最大值池化

对于滤波后的图片,无论是求边缘或是实现其它功能,最有用的是哪些高亮度值的像素点,

非极大值抑制也是利用亮度值最高的像素。

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492179.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

性能调优:理解Set Statistics Time输出

性能调优:理解Set Statistics Time输出 原文:性能调优:理解Set Statistics Time输出在性能调优:理解Set Statistics IO输出我们讨论了Set Statistics IO,还有如何帮助我们进行性能调优。这篇文章会讨论下Set Statistics Time&…

Nature Communications:实时记录神经系统,解开大脑秘密

来源:神经科技人的大脑中大概有一千亿个神经元,每一个神经元都连接到数以百计的神经元邻居。分析大脑中的神经活动和致此活动的原因,一直是科学家们研究的目标。现在,一组科学家设计出整个神经系统高速映射神经元放电的成像技术&a…

图像变换(Image transformations)

1 图像变换和图像滤波(image filtering)的区别 1.1 图像滤波 图像滤波改变像素点的灰度值,不改变像素点的坐标,如下图所示。 用函数可表示为: 其中f(x)表示原图,h(x)表示滤波器 1.2 图像变换 图像变换改…

图像对齐(image alignment)

1、图像对齐的步骤 已知图像A和B,图像对齐的步骤: 提取图像A和B的特征匹配图像A和B中的特征求解图像A和B的对齐矩阵2 使用最小二乘求解对齐矩阵的问题 使用最小二乘求解对齐矩阵容易受到outliers的影响, 误差会很大。 3 RANSAC(random sa…

巴黎不哭!十亿点数据“重建”巴黎圣母院

来源:大数据文摘摘要:目前,尽管现实中的大教堂已经无法恢复,但被数字化的“巴黎圣母院”仍然精确地留存在人类世界。而通过这一数据留存,重建巴黎圣母院成为可能,后人也仍然可以一览它曾经的雄伟。即使这一…

照相机的成像变换

1 变换过程 照相机的成像变换过程可以分为3步:世界坐标系——>相机坐标系——>图像坐标系——>像素坐标系 2 世界坐标系——>相机坐标系 景物从世界坐标系转换到相机坐标系需要使用到刚体变换(物体不发生变形,对一个几何物体做…

我国芯片各细分领域龙头名单

来源:机械前沿芯片的分类:日常生活中,我们可以发现芯片的种类比如有通信芯片、人工智能芯片、LED芯片、电脑芯片等等。芯片的产业链是这样的:根据产业链划分,芯片从设计到出厂的核心环节主要包括 6 个部分:…

求解相机参数Camera Calibration

1 主要思想 使用黑白棋盘格,记录世界坐标系中关键点的坐标,然后使用手机拍照,记录相应点像素点的坐标。 这样就得到了许多3D-2D的配对点 2 详细过程 由 上一篇博客 内容可知, 其中 P‘ 为像素坐标, Pw为世界坐标系的…

超壮观!10只波士顿动力机器狗,拖动大卡车,步伐整齐划一如同仪仗队

来源:量子位整整10只SpotMini机器狗,可以做什么?波士顿动力的答案是:拉卡车。对,不是狗拉雪橇,是狗拉体积大得多、质量重得多的大卡车。画面中,出现了并排走的一对机器狗。后面还有另一对机器狗…

立体视觉(Stereo Vision)-本征矩阵(essential matrix)和基本矩阵(fundamental matrix)

1 物体深度 问题描述:从不同的位置拍摄相同物体的两张图片,恢复其深度 这里假设摄像机的镜头平行 由相似三角形: 由上面第一、二等式可得: 深度与视差成反比 2 如何配对左右图片的点 问题描述:已知两张图像&#xff…

重磅:苹果高通和解!英特尔退出5G基带市场,高通股价暴涨超20%,华为依然淡定...

来源:新浪、量子位等,物联网智库整理摘要:没有永恒的朋友,只有永恒的利益。前一阵子还是“牛夫人”,今天就变成“小甜甜”了。没有永恒的朋友,只有永恒的利益。前一阵子还是“牛夫人”,今天就变…

计算图像的景深

在 上一篇 博客中,景深与视差成反比,其公式为: 为焦距, 为左右相机的距离,分别为两张图像的点距离各自中心点的距离。 对于左图像的每一个像素点 ,求图像景深可以分为以下几步, 在右图中&…

地球是否健康,最新“诊断报告”来了

中国南极中山站附近的冰盖、冰川与冰山。新华社发来源:光明日报4月13日,河北安平,游客在畅游油菜花海。新华社发对地球气候变化的科学诊断,要依赖一些数据指标:全球平均温度、海平面高度、南极冰川厚度等。4月初&#…

Structure from motion 问题

1 问题描述 已知一个图像库,里面有很多从不同角度不同具体拍摄同一物体的照片,求 构建该物体的3D模型找出这些图像的拍照位置 如下图所示: 2 用数学语言描述问题 输入:一批图像,隐含着许多对应点 输出:…

Nature新研究:猪脑死亡4小时后,科学家成功恢复脑细胞功能

来源:DeepTech深科技4 月 18 日 Nature 发表了耶鲁大学研究人员的一篇最新成果,科学家们成功在猪脑死亡 4 小时后恢复其脑循环和部分细胞功能。这一发现挑战了长期以来关于死后某些脑功能停止的时间和不可逆转性质的假设。哺乳动物大脑对于供氧水平下降极…

集成方法Ensemble Method(bagging, AdaBoost)

1 主要思想 将原始数据分成几个组训练一组分类器,里面有很多种弱分类器每个分类器的标签看作一次投票,投票最多的标签为最终标签 其架构如下所示: 2 为什么集成方法可行 假设这里有25个训练的弱分类器,且这些分类器独立工作&…

深度解析“中国制造2025”VS德国“工业4.0”,一场没有硝烟战争

来源:世界科技创新论坛摘要:“中国制造2025”与德国“工业4.0”都是在新一轮科技革命和产业变革背景下针对制造业发展提出的一个重要战略举措。比较两个战略可以看出各有特点,除了技术基础和产业基础不同之外,他们还存在战略思想等…

Imbalanced class problem(ROC, Confusion Matrix)

1 何为 Imbalanced class problem 在分类问题中,有时候一种类别的数据会远远的多于另外一种类别, 但正是这些少量的类别的数据,往往又是极其重要的。 比如信用卡欺诈事件,该事件远远地小于信用卡未被欺诈的事件。 要从信用卡操…

浅谈 EHT 黑洞照片拍摄原理

来源:东晓科学网博客前几天,EHT (Event Horizon Telescope)(事件水平线望远镜)研究团队发布重大新闻,公布了人类首次拍到的黑洞“照片“”,同时公布了7篇由200多名科学家署名的相关论文。所谓黑…

积分图像(Integral image)

1 问题起源 给定一幅灰度图像,其灰度值如下图所示, 要计算图中深色区域的所有像素点的灰度值之和。 最直接,简单的方法就是将这9个像素值直接相加。 如果深色区域扩大,里面包含成千上万个像素,这种算法的时间复杂度…