CNN卷积神经网络(吴恩达《卷积神经网络》笔记一)

CNN 卷积网络

  • 说明
    • 卷积 Convolution
    • 填充 Padding
    • 步长 Stride
    • RGB图像卷积
    • 池化 Pooling
    • 完整CNN
    • 为什么人们喜欢用卷积神经网络?
    • 实例分析

说明

关于CNN的基础知识:卷积、填充、步长、池化、完整的深度CNN网络可以参考
链接: AI学习笔记——卷积神经网络(CNN).
本文主要侧重介绍这些操作背后的具体含义并且记录一下吴恩达老师课程的知识点。

卷积 Convolution

卷积层主要就是通过filter来过滤图片中的边缘(线条),如下图为“垂直边缘检测”的例子,矩阵中数字1代表亮度,0代表灰度,-1代表黑度。第一个输入矩阵代表的图案如下面的小图片所示,图片中间会产生一个由亮到暗的竖直线条,使用从亮到暗的垂直边缘过滤器进行过滤后,结果可以表示原图片中间有一个竖直线条(且该线条是由亮处到暗处的线条),第二个输入矩阵经相同过滤器过滤后,结果可以表示原图片中间有一个竖直线条(且该线条是由暗处到亮处的线条):

当然会有不同类型的过滤器:水平过滤器、垂直过滤器、sobel filter、schar filter ···
使用不同的过滤器可以过滤图片中不同类型的边缘(线条)
同时,由于过滤器本身是参数,在反向传播过程中,网络可以自己学习参数,使过滤器更好的过滤图片。
在这里插入图片描述

填充 Padding

填充指在原图片矩阵的周围填充元素0
解决的问题:1、卷积之后图片尺寸变小 2、原图片边缘信息的丢失

根据是否进行填充,将卷积分为:
Valid convolutions:不进行填充,卷积后图片尺寸变为(n-f+1)*(n-f+1)
Same convolution:填充p=(f-1)/2,卷积后图片尺寸和原来一样
在这里插入图片描述

步长 Stride

当过滤器不能按照指定步长将图片完整过滤时,最后一个步长变小,以完成图片过滤。
所以最终图片的尺寸公式将如下所示:
在这里插入图片描述过滤器f一般等于奇数,不用偶数原因:
1、不对称填充(左边填充两列,右边填充一列)
2、奇数过滤器会有一个中心点,在计算机视觉里,如果有一个中心像素会更方便,便于指出过滤器的位置

RGB图像卷积

过滤器的通道(channel)要与其所过滤的图片通道在数量上保持一致,每个通道的过滤器可以是不同类型的,并且可以有多个过滤器进行过滤,最后将结果整合到一起
在这里插入图片描述
在这里插入图片描述

池化 Pooling

功能:缩减模型、提高计算速度、提高所提取特征的鲁棒性(robust)
Max-PoolingAverage-Pooling两种池化方式,一般常用的是最大池化。
第一个图片中紫色、蓝色、绿色和红色4*4的矩阵都可以看作是某些特征的集合,大的数字意味着可能提取了某些特定特征。最大化操作的的功能就是只要在任何一个象限内提取到某个特征,他都会保留在最大池化的输出里面(如紫色象限的9),如果没有提取到某个特征,那么其中的最大值也还是很小(如蓝色象限的2)。
在这里插入图片描述

完整CNN

一般完整的CNN网络由 卷积-池化-全连接 组成
在这里插入图片描述在这里插入图片描述

为什么人们喜欢用卷积神经网络?

参数共享:可以在输入图片的不同区域使用同样的参数(同一个过滤器进行全图扫描)
稀疏连接:举例,输出左上角的0,是通过3 * 3的卷积计算得到的,他只依赖于输入矩阵左上角3*3的单元格。(即一个输出与9个输入连接,对比FC,一个输出与所有的输入连接)

1、神经网络可以通过这两种机制减少参数,以便我们用更小的训练集来训练它,从而预防过拟合。
2、卷积神经网络善于捕捉平移不变,通过观察可以发现,像右移动两个像素,图片中的猫依旧清晰可见,因为神经网络的卷积结构,即使移动几个像素,这张图依然具有非常相似的特征,应该属于同样的输出标记。
在这里插入图片描述

实例分析

为什么进行实例分析?
因为在计算机视觉任务中表现良好的神经网络框架,往往也适用于其他任务。

LeNet-5:针对灰度图像训练的
在这里插入图片描述
AlexNet:
在这里插入图片描述
VGG-16: 16指这个网络包含了16个卷积层和全连接层,参数挺多的,但是网络结构比较规整。
文中揭示了,随着网络的加深图像的高度和宽度都以一定的规律不断缩小,每次池化后刚好缩小一半。信道的数量在不断增加,而且刚好也是在每组卷积操作后增加一倍。也就是说,图像缩小的比例和信道增加的比例是有规律的。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480222.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

字符串匹配算法(BM)

文章目录1. BM(Boyer-Moore)算法1.1 坏字符规则1.2 好后缀规则1.3 两种规则如何选择2. BM算法代码实现2.1 坏字符2.2 好后缀2.3 完整代码2.4 调试3. 总结1. BM(Boyer-Moore)算法 思想:有模式串中不存在的字符&#xf…

SQL 数据分析常用语句

1 基础查询 • 2 字符串数字日期时间 • 3 聚合数据查询 • 4 子查询 • 5 联接组合查询 • 6 高级查询 • 7 更新数据 阅读提醒:点击图片放大可看清晰的 1 基础查询 2 字符串数字日期时间 3 聚合数据查询 4 子查询 5 联接组合查询 6 高级查询 7 更新数据 参考资料 …

开源词法分析工具LAC重大升级!打造属于自己的个性化分词器!

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 匿名大佬编 | 北大小才女小轶本文将为大家介绍如何使用百度开源的词法分析工具LAC实现个性化分词(附代码),并展示LAC在各数据集上惊艳的性能表现。背景介绍分词是中文…

老刘说NLP:这几年的NLP历程回顾,以及关于NLP(知识图谱等)落地的思考

得语言者,得天下。得语言资源者,分天下。得语言逻辑者,争天下。 前言 只有把自己所思考的,所认识的东西,以文字的方式记录下来,才是对自己成长最好的记录方式。 是的,距离上一次动手写博客或者…

Redis系列教程(一):Redis缓存的设计、性能、应用与数据集群同步

Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库。Redis本质上是一个Key-Value类型的内存数据库,很像memcached,整个数据库统统加载在内存当中进行操作,定期通过异步操作把数据库数据flush到硬盘上…

论文浅尝 | 提取计数量词丰富知识库

OpenKG 祝各位读者新年快乐!论文标题:Enriching Knowledge Bases with Counting Quantifiers论文链接:https://link.springer.com/content/pdf/10.1007%2F978-3-030-00671-6_11.pdf发表会议:ISWC 2018论文源码:https:/…

RNN循环神经网络(吴恩达《序列模型》笔记一)

1、为什么选择序列模型 2、数学符号 用1来代表人名,0来代表非人名,句子x便可以用y[1 1 0 1 1 0 0 0 0]来表示 3、循环网络模型 值得一提的是,共享特征还有助于减少神经网络中的参数数量,一定程度上减小了模型的计算复杂度。 …

字符串匹配算法(KMP)

文章目录1. KMP由来2. KMP算法基本原理3. 代码4. Leetcode 28. 实现 strStr()1. KMP由来 上一节说的BM算法是最高效、最常用的字符串匹配算法。最知名的却是KMP,它3位作者(D.E.Knuth,J.H.Morris,V.R.Pratt)&#xff0…

常用的SQL语句

常用的SQL语句 一、基础 1、说明:创建数据库 CREATE DATABASE database-name 2、说明:删除数据库 drop database dbname 3、说明:备份sql server 1 --- 创建 备份数据的 device 2 3   USE master 4 5   EXEC sp_addumpdevice disk, te…

论文浅尝 | 用对抗学习做知识表示(NAACL2018)

论文链接:https://arxiv.org/pdf/1711.04071.pdf代码链接:https:// github.com/cai-lw/KBGAN 本文针对在生成负样本时有大部分负样本可以很好地和正样本区分开,对训练的影响不大,提出了使用生成对抗网络(GANs&#xff…

为什么搜索与推荐场景用AUC评价模型好坏?

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 吴海波在互联网的排序业务中,比如搜索、推荐、广告等,AUC(Area under the Curve of ROC)是一个非常常见的评估指标。网上关于AUC的资料很多,知…

Redis系列教程(九):Redis的内存回收原理,及内存过期淘汰策略详解

Redis内存回收机制 Redis的内存回收主要围绕以下两个方面: 1.Redis过期策略:删除过期时间的key值 2.Redis淘汰策略:内存使用到达maxmemory上限时触发内存淘汰数据 Redis的过期策略和内存淘汰策略不是一件事,实际研发中不要弄混淆了,下面会…

字符串匹配算法(Trie树)

文章目录1. Trie树概念2. Trie树操作2.1 存储2.2 查找2.3 插入2.4 删除2.5 打印3. 完整代码4. Trie树与散列表、红黑树的比较4.1 思考题参考文章5. 练习题1. Trie树概念 Trie树,也叫字典树,它是一个树形结构。是一种专门处理字符串匹配的数据结构&#…

论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

来源: IJCAI 2018链接: https://www.ijcai.org/proceedings/2018/0611.pdf本文关注基于知识图谱嵌入(后文全部简称为知识嵌入)的实体对齐工作,针对知识嵌入训练数据有限这一情况,作者提出一种 bootstrapping 策略,迭代标注出可能的实体对齐&a…

大规模领域词汇库项目DomainWordsDict:涵盖68个领域、共计916万的词汇库资源开放

项目概述 DomainWordsDict, Chinese words dict that contains more than 68 domains, which can be used as text classification、knowledge enhance task。涵盖68个领域、共计916万词的专业词典知识库,可用于文本分类、知识增强、领域词汇库扩充等自然语言处理应…

递归」与「动态规划

原文地址:https://juejin.im/post/5c2308abf265da615304ce41#heading-8 在学习「数据结构和算法」的过程中,因为人习惯了平铺直叙的思维方式,所以「递归」与「动态规划」这种带循环概念(绕来绕去)的往往是相对比较难以…

当知识图谱遇上推荐系统之DKN模型(论文笔记一)

Deep Knowledge-Aware Network for News Recommendation 类别:依次学习 首先使用知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入推荐系统,学习得到用户向量和物品向量。 [论文下载链接]https://arxiv.org/abs/1801.08284…

POJ 1936 字符匹配(水题)

题目链接: http://poj.org/problem?id1936 题目大意: 给定字符a,b,问b中去掉一些字符后能不能得到a 解题思路: 暴力从前往后扫描一遍即可。 AC代码: /*** description: poj1936水题* author: michael…

领域应用 | 从数据到智慧,知识图谱如何推动金融更智能?

本文转载在公众号:恒生技术之眼。在《人工智能知识图谱:如何规整海量金融大数据?》一文中,笔者曾提到,面向人工智能的大数据治理,势必能有效支撑智能金融从感知智能向认知智能变革。这是因为目前在资本市场…

2021届秋招算法岗真的要灰飞烟灭了吗?

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 不拖更的夕小瑶2014年末入坑AI,一路见证了AI行业的快速起飞、爆炸、焦虑和冷却。小夕前几天在知乎上看到一个问题《如何看待2021年秋招算法岗灰飞烟灭》被顶上了热榜。有点感叹,怎…