04.卷积神经网络 W1.卷积神经网络

文章目录

    • 1. 计算机视觉
    • 2. 边缘检测示例
    • 3. 更多边缘检测
    • 4. Padding
    • 5. 卷积步长
    • 6. 三维卷积
    • 7. 单层卷积网络
    • 8. 简单卷积网络示例
    • 9. 池化层
    • 10. 卷积神经网络示例
    • 11. 为什么使用卷积?
    • 作业

参考:
吴恩达视频课
深度学习笔记

1. 计算机视觉

举例:图片猫🐱识别,目标检测(无人驾驶),图像风格转换(比如转成素描)等等

面临的挑战:

  • 数据的输入可能会非常大
  • 一张1000×1000的图片,特征向量的维度达到了1000×1000×3(RGB,3通道) = 300万
  • 在第一隐藏层中,你也许会有1000个隐藏单元,使用标准的全连接网络,这个矩阵的大小将会是1000×300万,矩阵会有30亿个参数
  • 在参数如此大量的情况下,难以获得足够的数据防止神经网络发生过拟合,处理30亿参数的神经网络,巨大的内存需求也受不了

你希望模型也能处理大图。为此,你需要进行卷积计算,下节将用边缘检测的例子来说明卷积的含义

2. 边缘检测示例


例如 6x6 的单通道灰度图像,检测垂直边缘,构造一个矩阵[10−110−110−1]\left[\begin{array}{rrr}1 & 0 & -1 \\ 1 & 0 & -1 \\ 1 & 0 & -1\end{array}\right]111000111 (过滤器 / 核),进行卷积运算*(convolve)

在这里插入图片描述

import numpy as np
image = np.array([[3,0,1,2,7,4],[1,5,8,9,3,1],[2,7,2,5,1,3],[0,1,3,1,7,8],[4,2,1,6,2,8],[2,4,5,2,3,9]])
print(image)
print('-------')
filter_ = np.array([[1,0,-1],[1,0,-1],[1,0,-1]])
print(filter_)
print('-------')
from scipy import signal
convolution = -signal.convolve2d(image, filter_, boundary='fill',mode='valid')
print(convolution)
[[3 0 1 2 7 4][1 5 8 9 3 1][2 7 2 5 1 3][0 1 3 1 7 8][4 2 1 6 2 8][2 4 5 2 3 9]]
-------
[[ 1  0 -1][ 1  0 -1][ 1  0 -1]]
-------
[[ -5  -4   0   8][-10  -2   2   3][  0  -2  -4  -7][ -3  -2  -3 -16]]

为什么可以检测边缘?

卷积运算检测边缘

image = np.array([[10,10,10,0,0,0],[10,10,10,0,0,0],[10,10,10,0,0,0],[10,10,10,0,0,0],[10,10,10,0,0,0],[10,10,10,0,0,0]])
filter_ = np.array([[1,0,-1],[1,0,-1],[1,0,-1]])
print(-signal.convolve2d(image, filter_, boundary='fill',mode='valid'))
[[ 0 30 30  0][ 0 30 30  0][ 0 30 30  0][ 0 30 30  0]]

3. 更多边缘检测

可以检测明暗变化方向

竖直,水平的过滤器

在这里插入图片描述
把这9个数字当成参数,通过反向传播学习,边缘捕捉能力会大大增强(可以检查任意角度)

4. Padding

上面 6x6 的图片,经过一次过滤以后就变成 4x4 的,如果经过多层,最后的图像会变得很小。

假设原始图片是 n×nn \times nn×n,过滤器是 f×ff \times ff×f,那么输出大小是 (n−f+1)×(n−f+1)(n-f+1) \times(n-f+1)(nf+1)×(nf+1)

  • 缺点1,图像每做一次卷积,缩小一点,最后变得很小
  • 缺点2,在角落或边缘区域的像素点在输出中采用较少,丢失了图像边缘位置的许多信息

解决上面的问题:

  • 进行卷积操作前,沿图像边缘填充 p 层像素,令 (n+2∗p)−f+1=n⇒p=f−12(n+2*p)-f+1 = n \Rightarrow p = \frac{f-1}{2}(n+2p)f+1=np=2f1, 这样可以保持图像大小不变
  • 还使得边缘信息发挥作用较小的缺点被削弱

ppp 填充多少层,怎么选?

  • Valid 卷积:p=0p=0p=0
  • Same 卷积:p=f−12p = \frac{f-1}{2}p=2f1fff 通常是奇数(对称填充,有中心点)

5. 卷积步长

每次过滤器在图片中移动 s 步长(上面的 s = 1)

输出尺寸为 (n+2p−fs+1)×(n+2p−fs+1)(\frac{n+2p-f}{s}+1) \times (\frac{n+2p-f}{s}+1)(sn+2pf+1)×(sn+2pf+1),向下取整

数学中的卷积,需要在操作之前对过滤器顺时针旋转90度 + 水平翻转,深度学习里省略了该步骤,但是不影响,简化了代码

6. 三维卷积

三维卷积
输出是一个二维的,每个格子里是对应着 27个元素求和

如果希望对不同的通道进行检测边缘,对 filter 的相应层设置不同的参数就可以了

想要多个过滤器怎么办?(竖直的、水平的,各种角度的)
多个过滤器

7. 单层卷积网络

单层卷积网络

参数的个数跟图片大小无关,跟过滤器相关,假如有10个过滤器,上面每个过滤器有 27 个参数,加上 偏置 b,28个再乘以10,共计280个参数

即使图片很大,参数却很少,这就是卷积神经网络的一个特征,叫作“避免过拟合”。

维度关系

8. 简单卷积网络示例


除了 卷积层(convolution),还有 池化层(pooling),全连接层(fully connected)

9. 池化层

除了卷积层,卷积网络也经常使用池化层缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性

最大池化
Max 运算的实际作用:

  • 如果在过滤器中提取到某个特征,那么保留其最大值
  • 如果没有提取到这个特征,可能在右上象限中不存在这个特征,那么其中的最大值也还是很小

池化,它有一组超参数 f,sf, sf,s,但没有参数需要学习,不需要梯度下降更新

平均池化
最大池化比平均池化更常用

常用的参数值为 f=2or 3,s=2f=2 \text{ or } 3, s= 2f=2 or 3,s=2
最大池化时,很少用到 padding(p=0p=0p=0
输入输出通道数一样
最大池化只是计算神经网络某一层的静态属性,没有需要学习的参数

10. 卷积神经网络示例

卷积NN
尽量不要自己设置超参数,而是查看文献中别人采用了哪些超参数,选一个在别人任务中效果很好的架构,它也有可能适用于你的应用程序

11. 为什么使用卷积?

和只用全连接层相比,卷积层 的两个主要优势在于参数共享稀疏连接

  • 全连接层的参数巨大,卷积层需要的参数较少

原因:

  1. 参数共享,特征检测如果适用于图片的某个区域,那么它也可能适用于图片的其他区域
  2. 使用稀疏连接,一个输出仅依赖少部分的输入
    稀疏连接
    神经网络可以通过这两种机制减少参数,以便我们用更小的训练集来训练它,从而预防过度拟合

作业

作业:手动/TensorFlow 实现卷积神经网络


我的CSDN博客地址 https://michael.blog.csdn.net/

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!
Michael阿明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/474038.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

httpClient学习笔记1

客服端以post请求输入xml的输入流,来到服务器端,服务器端接到输入流,进行处理,处理完毕后,返回xml信息的返回输出流,来告诉对方成功与否。 htppClient的使用至少需要commons-httpclient-3.1.jar&#xff0c…

JAVA基础学习预科部分 (Markdown + dox)2021/2/22持续更新中

javaSE从 2021/02/22开始,预计到2021/02/28,原本预计的算法题解先鸽一下。 -博客Blog的重要性 & Markdown语法 基础markdown语法 标题, 直接使用 ‘#’,一级二级…五级字体,斜体(左右个一个∗*∗),加…

元素(块、行内、行内块

块元素的特点 1.支持所有样式 2.块级元素 独占一行 3.块级元素默认宽度和父元素一样 常用块元素块级元素 一般 div p ol ul h1-h6 li dl dt dd 等都是 初始化(样式重置) 1.实际开发中,我们会把这些默认的样式在样式定义开头清除掉,清除掉这些默认样式&…

LeetCode 1031. 两个非重叠子数组的最大和(一次遍历,要复习)*

文章目录1. 题目2. 解题2.1 暴力枚举2.2 一次遍历1. 题目 给出非负整数数组 A ,返回两个非重叠(连续)子数组中元素的最大和,子数组的长度分别为 L 和 M。(这里需要澄清的是,长为 L 的子数组可以出现在长为…

资料合集

cocos2d-x http://www.microoh.com/index.php 杂谈 http://www.yixieshi.com/ as3读excel https://github.com/childoftv/as3-xlsx-reader 提问 http://stackoverflow.com/转载于:https://www.cnblogs.com/chenhongyu/p/3282918.html

Java入门篇 2021/02/22

Java入门篇 2021/02/22 Java的三大版本 java三大版本主要包括 JavaSE, JavaME, JavaEE,其中现如今的JavaME已经是很少见了,JavaSE是JavaEE的基础。 JDK、JER、JVM三个关系 JDK, JRE, JVM具体的关系可以参照下图,是名副其实的包含关系。 J…

iOS 开发者必不可少的 75 个工具

如果你去到一位熟练的木匠的工作室,你总是能发现他/她有一堆工具来完成不同的任务。软件开发同样如此。你可以从软件开发者如何使用工具中看出他水准如何。有经验的开发者精于使用工具。对你目前所使用的工具不断研究,同时了解一些替代品的使用&#xff…

LeetCode 911. 在线选举(二分查找)

文章目录1. 题目2. 解题1. 题目 在选举中,第 i 张票是在时间为 times[i] 时投给 persons[i] 的。 现在,我们想要实现下面的查询函数: TopVotedCandidate.q(int t) 将返回在 t 时刻主导选举的候选人的编号。 在 t 时刻投出的选票也将被计入…

定位position(前面布局无法实现

文档流 文档流,是指盒子按照html标签编写的顺序依次从上到下,从左到右排列,块元素占一行,行内元素在一行之内从左到右排列,先写的先排列,后写的排在后面,每个盒子都占据自己的位置。 定位&…

java 流程控制篇 2021/02/26持续更新中

1. 用户交互Scanner 1.1 简单的Scanner用法 首先,需要 import java.util.Scanner其次,需要创建一个 Scanner 类的对象, Scanner s new Scanner(System.in);通过调用Scanner对象的方法来完成, 一定要注意有开有关,最…

从Ubuntu12.04LTS到Foreda19再到Foreda8

装Ubuntu的初衷是以为它能识别我的PCI无线网卡,但装了两遍没有做到。 昨天在Ubuntu装jdk7,其过程与正常Linux安装jdk差别不小,有点背离的意思。另外VI的用法也和正常Unix/Linux不一样,有点别扭。 昨晚又下了一个Foreda19&#xff…

04.卷积神经网络 W1.卷积神经网络(作业:手动/TensorFlow 实现卷积神经网络)

文章目录作业1:实现卷积神经网络1. 导入一些包2. 模型框架3. 卷积神经网络3.1 Zero-Padding3.2 单步卷积3.3 卷积神经网络 - 前向传播4. 池化层5. 卷积神经网络 - 反向传播5.1 卷积层反向传播5.1.1 计算 dA5.1.2 计算 dW5.1.3 计算 db5.2 池化层 - 反向传播5.2.1 最…

tabel表格制作及操作

表格的基本用法 l table表示表格开始表格结束 l tr表示表格中的行标签一个表格中有多少行就应该书写多少对tr标签 l td表示表格中的单元格标签一行中有多少个单元格就应该书写多少对td标签 l表格中所有的内容都必须在放置在td标签里面 也就是说只有td标签才能存放内容 l t…

html的实战性介绍

Html 简介 超文本结构语言 html并非一种编程语言, 而是一种描述超文本文档的标记语言,用html编写的超文本文档成为html文档。 超文本文档指的是,可以加入图片、声音、动画、影视等内容,并可以利用超链接方便的从一个文件跳转到网…

前端:background背景图

background背景图 属性解释 background属性是css中应用比较多,且比较重要的一个属性,它是负责给盒子设置背景图片和背景颜色的,background是一个复合属性,它可以分解成如下几个设置项: background-color 设置背景颜色…

LeetCode 808. 分汤(动态规划)

文章目录1. 题目2. 解题1. 题目 有 A 和 B 两种类型的汤。一开始每种类型的汤有 N 毫升。有四种分配操作: 提供 100ml 的汤A 和 0ml 的汤B。提供 75ml 的汤A 和 25ml 的汤B。提供 50ml 的汤A 和 50ml 的汤B。提供 25ml 的汤A 和 75ml 的汤B。 当我们把汤分配给某…

JavaScript入门介绍 1 2021/02/27

一、JavaScript简介一 1.1 javascript 简介 JavaScript是Web页面中的一种脚本编程语言,可用于Web系统的客户端和服务器端编程前身叫做LiveScript,是Netscape公司开发的脚本语言。在Sun公司推出Java语言后, Netscape公司和Sun公司于1995年一…

css权重值

CSS权重指的是样式的优先级,有两条或多条样式作用于一个元素,权重高的那条样式对元素起作用,权重相同的,后写的样式会覆盖前面写的样式。 权重的等级 可以把样式的应用方式分为几个等级,按照等级来计算权重 !important&#xf…

LeetCode 848. 字母移位(前缀和+取模)

文章目录1. 题目2. 解题1. 题目 有一个由小写字母组成的字符串 S,和一个整数数组 shifts。 我们将字母表中的下一个字母称为原字母的 移位(由于字母表是环绕的, ‘z’ 将会变成 ‘a’)。 例如,shift(a) b&#xff…

jsp:setProperty

类声明&#xff1a; package test; public class Student { private int age; public int getAge() { return age; } public void setAge(int age) { this.age age; } } jsp代码&#xff1a; <jsp:useBean id"student"…