5分钟搞懂池化的本质

大家好啊,我是董董灿!

在很多与计算机视觉相关的神经网络中,我们往往都会看到池化这一算法,它一般跟在卷积层后面。

神经网络中用到最多的池化方式无外乎是最大池化和平均池化。两者运算接近,区别在于是在kernel范围内取最大值还是取平均值来作为池化的输出。

那池化的本质是什么呢?为什么在神经网络中,尤其是CNN网络中,会需要用到池化算法呢?

1、池化的本质

先回顾下池化运算。

下图展示的是一个最大池化的计算过程。它利用一个2x2的核(kernel)来圈定一次池化的计算范围,每次选定输入图片中2x2范围内的最大值数值作为输出。

图片

这一过程非常简单,它计算的每一步,就是从选定的范围内,计算出一个数字来,这一过程也叫做特征的聚合(aggregation)

我们知道,卷积的输出是特征图,特征图的一个通道代表一个特征。

而针对特征图的池化操作在每个通道上是独立进行的,池化前后特征图变化的仅仅是长宽方向的尺寸。

那怎么理解特征聚合呢?

举个例子。

最大池化的每次计算,都是选取kernel范围内的最大值作为这个范围内最显著的特征代表。

一张图片中,像素值最大的地方,往往是图像突变最大的地方,比如图像的轮廓和边缘,因此最大池化,可以有效的提取图像的轮廓边缘信息。

也就是说,通过最大池化,输出了一个比原始图像在长宽方向尺寸更小的图片,但这个更小的图片却聚合了原始图像中最显著的轮廓和边缘特征。

达到了特征聚合的目的,这也是池化算法的本质。

围绕着这个本质,可以引申出几个池化算法的优势。

2、池化的优势

减少计算量

输出的图片在长宽方向上尺寸变小了,从而带来了计算量的减少,这一点是显而易见的。

减少过拟合的风险

计算量的减少,带来的另一个显著影响就是池化层后面的神经网络需要处理的特征图尺寸变小了,从而使得模型的参数量需求减少。

参数越少,过拟合的风险越低,这一点在训练过程中尤为重要。

提高模型对图片平移、缩放和旋转等变换的鲁棒性

之前看到这句话的时候,有点似懂非懂。后来查了一些资料,发现这句话说的其实是池化算法对于原始图片的变换具有轻微的容忍度。

也就是说,有了池化算法,模型可以容忍输入的图像有轻微的旋转、平移或者缩放,可以在不改变任何模型算法或结构的情况下,希望推理出正确的结果。

举个例子。

下面的图片示意了最大池化对于图片轻微旋转的容忍度。

图片

如果输入图片有轻微的旋转,经过最大池化,只要图片旋转的角度不是很厉害,依旧可以在对应位置获取到目标区域中的最大值12。

而对于图片的平移和缩放变换,池化算法同样有着类似的轻微容忍度。

注意这里一直在说是轻微的容忍度。如果一张图片旋转、平移过多,那么经过池化输出的结果肯定是不一样的,这时模型推理的结果可能也就不一样了。

正是因为这几个优势,使得池化操作经常会出现在CNN网络中。

好了,关于池化就写到这,不知看完之后,你对池化这一算法是否有了更深的认识了呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/8056.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在使用《快递批量查询高手》时从TXT文本导入的快递单号出现乱码如何解决。

在日常 工作中,有没有单号用TXT 文档保存吗?那么没有出现这种情况呢,打开TXT文档进去看都是正常没有问题,一但导入软件中就出现乱码的?遇到这个种情况需要什么解决呢?小编今天就教 您一招解决好方法&#x…

电脑微信空间占用简便清理

1、打开电脑版微信、点击左下角的三根横线 2、点击左侧的“设置” 3、弹出层左侧点击“通用设置”->“存储空间管理” 4、点击清理缓存,或者管理 5、点击“管理”后,根据选择的筛选条件,勾线需要清理的,最后点击清理

WormGPT – 网络犯罪分子用来犯罪的人工智能工具

WormGPT – 网络犯罪分子用来发起商业电子邮件泄露攻击的生成式人工智能工具 前言 什么是蠕虫GPT(WormGPT) WormGPT是基于EleutherAI于2021年创建的大型语言模型GPT-J的AI模型。它具有无限的字符支持、聊天记忆保留和代码格式化功能。 如果未部署适当…

C#|无法打开cs文件设计窗口

报错信息:To prevent possible data loss before loading the designer, the following errors must be resolved: 解决方案:实不相瞒我把项目解决方案名称改短了就可以了。。有其他原因或者解决方案望不吝赐教。。

electron dialog.showMessageBox使用案例

electron 版本&#xff1a;25.3.1 index.html <!DOCTYPE html> <html> <head><meta charset"UTF-8"><title>Hello World!</title><meta http-equiv"Content-Security-Policy" content"script-src self unsa…

学好Elasticsearch系列-索引的CRUD

本文已收录至Github&#xff0c;推荐阅读 &#x1f449; Java随想录 文章目录 创建索引删除索引查询数据添加 & 更新数据cat命令公共参数 常用命令aliases 显示别名allocation 显示每个节点的分片数和磁盘使用情况count 显示整个集群或者索引的文档个数fielddata 显示每个节…

计算机视觉(三)未有深度学习之前

文章目录 图像分割基于阈值、基于边缘基于区域、基于图论 人脸检测Haar-like特征级联分类器 行人检测HOGSVMDPM 图像分割 把图像划分成若干互不相交的区域。经典的数字图像分割算法一般是基于灰度值的两个基本特征之一&#xff1a;不连续性和相似性。 基于阈值、基于边缘 基于…

Vert.x整合MongoDB实现通用增删改查

文章目录 前言一、框架搭建二、代码编写1.MongoDB连接2.通用CRUD3.HTTP服务 总结 前言 最近在学习MongoDB的基本功能&#xff0c;只看文档过于无趣了&#xff0c;于是用Vert.x写了个demo加深印象&#xff0c;也在此记录一下。 一、框架搭建 Vert.x使用的版本是4.4.4&#xff…

《论文阅读》具有特殊Token和轮级注意力的层级对话理解 ICLR 2023

《论文阅读》具有特殊Token和轮级注意力的层级对话理解 前言简介问题定义模型构建知识点Intra-turn ModelingInter-turn Modeling分类前言 你是否也对于理解论文存在困惑? 你是否也像我之前搜索论文解读,得到只是中文翻译的解读后感到失望? 小白如何从零读懂论文?和我一…

MySQL事务

目录 前言 1.为什么存在事务 2.什么是事务 3.事务的版本支持 4.事务提交方式 5.事务常见操作方式 6.事务隔离级别 6.1如何理解隔离性 6.2隔离级别 6.3隔离性的查看与设置 6.4读未提交 6.5读提交 6.6可重复读 6.7串行化 7.多版本并发控制 7.1 3个记录隐藏列字段…

面向对象编程:从创建类到封装与构造方法的探索

1. 代码如何创建类&#xff1f; 在面向对象编程中&#xff0c;类是对一类事物的抽象&#xff0c;包含了静态的属性&#xff08;成员变量&#xff09;和动态的行为&#xff08;成员方法&#xff09;。在Java中&#xff0c;创建类的格式如下&#xff1a; 修饰词 class 类名 {//…

办公楼管理高手:一起来学烟雾监测实用技能!

在现代社会中&#xff0c;安全意识和防患意识越来越受到重视。特别是在大型办公楼等人员密集的场所&#xff0c;火灾的风险不容忽视。 为了保障员工和资产的安全&#xff0c;烟感监控成为一项至关重要的安全措施。烟感监控系统作为火灾预警的关键组成部分&#xff0c;能够及早发…

ardupilot 悬停油门学习

目录 文章目录 目录摘要1.悬停油门更新2.如何开启悬停油门学习3.日志记录悬停油门的变化摘要 本节主要记录ardupilot的悬停油门相关知识,正常悬停油门更新:没有解锁和着地不更新,手动模式或者漂移模式不更新,垂直方向有期望速度不更新,只有油门大于最低值,垂直运动速度小…

大数据Flink(四十九):框架版本介绍和编程语言选择

文章目录 框架版本介绍和编程语言选择 一、框架版本介绍 二、编程语言选择 框架版本介绍和编程语言选择

pandas学习

(个人学习使用) 添加索引 # index是行索引&#xff0c;columns是列索引 pd.DataFrame(score, indexidx, columnscol) 常用属性和方法 data.shape # 形状 data.index # 行索引 data.columns # 列索引 data.values # 里面的值&#xff0c;结果是ndarray类型数组 …

uniapp 的input组件在@input事件中限制用户可输入数值的范围,出现视图不更新的bug。

在input事件拿到用户输入的值&#xff0c;然后给input组件绑定的值赋值之前&#xff0c;判断用户输入的不能超过最大值&#xff0c;超过的话默认为100&#xff0c;&#xff0c;这个判断和赋值然后视图更新只能触发一次&#xff0c;之后在输入&#xff0c;发现值改了页面但是不更…

关于网络通信安全协议的一些知识(ssl,tls,CA,https)

首先了解一下http协议的变迁。 http1.0默认短连接&#xff0c;1.1默认长连接并且可以管道传输&#xff0c;但是存在队头阻塞问题&#xff1b; https就是在tcp和http之间加了SSL/TLS层。 http2也是安全的&#xff0c;改进是hpack二进制和编码压缩减小体积&#xff0c;stream没有…

微信存储空间清理

1、打开电脑版微信、点击左下角的三根横线 2、点击左侧的“设置” 3、弹出层左侧点击“文件管理” 4、点击右下角“打开文件夹” 5、默认4打开的为当前登录账户对应的文件夹&#xff08;建议清理路径步骤7&#xff09; 6、点击“WeChat Files”查看其他账户的文件夹&#xff0c…

智能制造RFID设备包括哪些?

智能制造是现代制造业的重要发展方向&#xff0c;其核心是数字化、网络化和智能化。而在智能制造中&#xff0c;RFID设备是一种不可或缺的技术手段&#xff0c;主要用于实现物品的识别、追踪和化管理。以下是智能制造中常用的RFID设备及其功能&#xff1a; 1、 RFID读写器 RFID…

SpringBoot整合Druid

SpringBoot整合Druid POM.xml <!-- 整合Druid --> <dependency><groupId>com.alibaba</groupId><artifactId>druid</artifactId><version>1.1.10</version> </dependency> <!--自启动Druid管理后台--> <depe…