卷积池化尺寸计算公式

卷积层[Conv]:

卷积CNN是我们最常使用的,但是有时候需要观察他的输出前后的差异,这里描述下计算方式,具体如下:

图片大小:WxHxD  W:宽 H:高 D:通道(RGB) 例:320x320x3

卷积核:NxNx3   卷积核大小 后面的3是和图片的通道对应,如果图片是灰度的那么就是1

卷积核个数:C 

步长:S   每次一卷积的时候跨越的步长

填充:P  外网填充多少行和列,一般是图片保留特征或者是维持图片大小

公式计算:

输出数据的高度:OH = (H - N + 2P) / S + 1
输出数据的宽度:OW = (W - N + 2P) / S + 1
输出数据的深度:OD = 卷积核的个数C

*如果输出数据的尺寸不是整数,会对输出数据进行四舍五入或者向下取整等操作。

例子:

输入数据为:3x320x320   

我们这里是BGR的图片,一般cv默认处理就是BGR图片,通道是3,宽和高都是320,也可以理解为三张320x320的图片,方便神经网络的处理

卷积参数:卷积个数:16,卷积核:3x4x4 (由于通道是3,卷积核宽和高都是4,当然卷积核默认都是奇数,这里测试写了个偶数4,选择偶数会导致特征偏移不建议)、步长:3  填充:2

根据公式计算:

输出图片宽:((320 - 4 + 2x2)/ 3 )+ 1  = 107.6666 ≈ 107(选择向下取整,也可以四舍五入,看算法)

输出图片高:((320 - 4 + 2x2)/ 3 )+ 1  = 107.6666 ≈ 107(选择向下取整,也可以四舍五入,看算法)

通道数:16(直接为卷积核个数)

输出的数据为:16x107x107

池化层[Pool]:

池化也是提取特征,可以达到快速缩小特征,比如最大池化、平均池化

里面包含的也是 滤波器  步长

图片大小:WxHxD  W:宽 H:高 D:通道(RGB) 例:320x320x3

滤波器:NxN   滤波器的宽高

公式:(和卷积差不多没有填充)

输出数据的高度:OH = (H - N ) / S + 1
输出数据的宽度:OW = (W - N ) / S + 1

例子

图片输入:3x320x320

池化层:3x3  步长 2

根据公式计算:

输出图片宽:((320 - 3)/ 2 )+ 1  = 159.5≈ 159(选择向下取整,也可以四舍五入,看算法)

输出图片高:((320 - 3)/ 2 )+ 1  = 159.5≈ 159(选择向下取整,也可以四舍五入,看算法)

通道数:3

输出数据为:3x159x159

膨胀卷积【Conv】

卷积的一种,在卷积核中插入空洞(dilation)来扩大感受野,从而捕捉更广泛的上下文信息。膨胀卷积通常用于处理具有较大空间范围的输入数据,(个人理解,其实就是特征图太紧凑了,比如鼻子嘴巴都黏到一起了,通过添加一些空白值把鼻子和嘴巴隔开些,更好的观察分析,如果离得太近可能在某次池化或者卷积就把特征卷没了),用途如图像分割、语义分割,包含膨胀卷积、扩张卷积、空洞卷积。

根常规的卷积比,增加了一个膨胀因子R,具体如下

图片大小:WxHxD  W:宽 H:高 D:通道(RGB) 例:320x320x3

卷积核:NxNx3   卷积核大小 后面的3是和图片的通道对应,如果图片是灰度的那么就是1

卷积核个数:C 

膨胀因子:R  (增加视野的参数)

步长:S   每次一卷积的时候跨越的步长

填充:P  外网填充多少行和列,一般是图片保留特征或者是维持图片大小

首先需要根据膨胀卷积计算出感受野,其实就是相当正常卷积的卷积核宽高(N)

感受野假设为D,感受野大小 = (卷积核大小 - 1) * 膨胀率 + 1

感受野D的计算公式:D = (N-1)*(R-1) +N

输出数据的高度:OH = (H - D + 2P) / S + 1
输出数据的宽度:OW = (W - D + 2P) / S + 1
输出数据的深度:OD = 卷积核的个数C

例子

输入数据为:3x320x320   

我们这里是BGR的图片,一般cv默认处理就是BGR图片,通道是3,宽和高都是320,也可以理解为三张320x320的图片,方便神经网络的处理

卷积参数:卷积个数:16,卷积核:3x4x4 (由于通道是3,卷积核宽和高都是4,当然卷积核默认都是奇数,这里测试写了个偶数4,选择偶数会导致特征偏移不建议)、膨胀因子为2(1为默认卷积)、步长:3  填充:2

根据公式计算:

感受野计算:D= (4-1)*(2-1)+4 =7

输出图片宽:((320 - 7 + 2x2)/ 3 )+ 1  = 106.6666 ≈ 106(选择向下取整,也可以四舍五入,看算法)

输出图片高:((320 - 7 + 2x2)/ 3 )+ 1  = 106.6666 ≈ 106(选择向下取整,也可以四舍五入,看算法)

通道数:16(直接为卷积核个数)

输出的数据为:16x106x106

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/23545.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android——热点开关演讲稿

SoftAP打开与关闭 目录 1.三个名词的解释以及关系 Tethering——网络共享,WiFi热点、蓝牙、USB SoftAp——热点(无线接入点),临时接入点 Hostapd——Hostapd是用于Linux系统的软件,,支持多种无线认证和加密协议,将任…

后端开发面经系列 -- 同程旅行C++一面

同程旅行C一面 公众号:阿Q技术站 文章目录 同程旅行C一面1、sizeof与strlen的区别?2、运算符和函数有什么区别?3、new和malloc?4、内存泄漏与规避方法?5、悬空指针与野指针?6、手撕冒泡排序?7、…

Java集合的迭代操作,Set Map接口以及工具类方法

1、集合元素迭代 1.1 集合元素遍历 集合的遍历:把集合中的每一个元素获取出来 使用for遍历 使用迭代器遍历 Iterator表示迭代器对象,迭代器中拥有一个指针,默认指向第一个元素之前, . boolean hasNext():判断指针后是…

硬件调试记录——ESD保护电路

ESD保护电路,测试其是否已经烧坏,用万用表二极管功能来测试. ESD电路表现出二极管特性,正向电压比反向电压高0.5v~0.7v

任务3.7 开发名片管理系统

本实战项目以Java语言为基础,精心打造了一个功能全面的名片管理系统。系统采用面向对象的设计原则,通过Card类来封装每张名片的详细信息,如姓名、单位、职位和联系电话等,并提供了标准的访问器和修改器方法以确保数据的安全访问。…

回溯算法全排列

给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输入:nums [1,2,3] 输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]] 这里需要用到一个数组来判断,数…

ROS学习记录:自定义消息类型

前言 当我们需要传输一些特殊的数据时,且官方的消息包无法满足需求,我们便可以自己定义一个消息类型。 实验步骤 一、在终端输入cd ~/catkin_ws1/src进入工作空间中src目录 二、输入catkin_create_pkg qq_msgs roscpp rospy std_msgs message_generati…

windows10子系统wsl ubuntu22.04下GN/ninja环境搭建

打开windows10子系统 ubuntu22.04 ubuntu22.04: 首先需要 安装ninja $sudo apt install ninja-build $ ninja --version 1.10.0 安装clang $sudo apt install clang $clang --version Ubuntu clang version 14.0.0-1ubuntu1.1安装gn Github: https://github.com/timniederh…

Python - tuple

声明tuple >>> a (3) >>> type(a) <class int> >>> b 3 >>> type(b) <class int> >>> c (3,) >>> type(c) <class tuple> 元组中只有一个元素时&#xff0c;应该在元素后面追加一个半角的英文逗…

SDXL终于有了足够好的 Openpose 和 Scribble 模型可以使用了。

SDXL终于有了足够好的 Openpose 和 Scribble 模型可以使用了。 xinsir 发布的Openpose 和 Scribble 模型质量相当好&#xff0c;尤其是 Openpose。不过只支持姿态不支持面部。 再加上前几天的 Anyline 线条预处理器和 Canny 模型。SDXL 的生态在发布快一年的时候成熟了。 模…

太阳能语音警示杆在户外的应用及其作用

一、太阳能语音警示杆的主要应用领域 交通管理&#xff1a;在城市道路、乡村公路、高速公路等交通要道&#xff0c;太阳能语音警示杆可以用于提醒驾驶员注意前方路况、减速慢行或者避让施工区域。例如&#xff0c;在临时施工路段&#xff0c;警示杆可以播放“前方施工&#xf…

Orange Pi AI Pro 开箱 记录

香橙派 AIpro&#xff08;OrangePi AIpro&#xff09;是一款面向AI开发的强大开发板&#xff0c;提供了高性能和多功能的开发环境。我将结合自己的开发经验&#xff0c;详细介绍这款开发板的性能、适用场景及使用体验。 一、产品概述 香橙派 AIpro配备了强大的硬件配置&#…

ZeroMq传输视频的几种方案

前言 因为项目需要&#xff0c;现在需要使用ZeroMq去实现摄像头视频数据的传输&#xff0c;尝试了不少方法&#xff0c;以下是一些成功的汇总&#xff0c;定时更新&#xff1a; 参考文章&#xff1a; ZeroMQOpenCV实现视频网络传输_zmq视频传输-CSDN博客 这个代码有点问题&…

详解 Flink 的运行架构

一、组件 1. JobManager 作业管理器是一个 Flink 集群中任务管理和调度的核心&#xff0c;是控制应用执行的主进程 1.1 JobMaster JobMaster 是 JobManager 中最核心的组件&#xff0c;负责处理单独的作业&#xff08;Job&#xff09;。JobMaster 和具体的 Job 是一一对应的&…

通过 SFP 接口实现千兆光纤以太网通信4

Tri Mode Ethernet MAC 与 1G/2.5G Ethernet PCS/PMA or SGMII 的连接 在设计中&#xff0c;需要将 Tri Mode Ethernet MAC 与 1G/2.5G Ethernet PCS/PMA or SGMII 之间通过 GMII 接口互联。Tri Mode Ethernet MAC IP 核的工作时钟源为 1G/2.5G Ethernet PCS/PMA or SGMII …

今日增长工具精选| 8个SaaS出海必备运营工具

一、SurveyMonkey 是一个灵活、方便、经济实惠的在线调查工具&#xff0c;可以通过自行设计定制化问卷&#xff0c;开展消费者调研&#xff0c;收集第一手数据&#xff0c;获取用户反馈。 客户涵盖财富100强公司以及其他不同规模和类型的组织&#xff0c;如公司、学术研究机构…

深入了解Java单例模式及其使用场景

什么是单例模式&#xff1f; 简单通俗来讲&#xff0c;单例模式是一种设计模式&#xff0c;它确保一个类只能有一个实例&#xff0c;并提供全局访问。在 Java 中&#xff0c;可以通过以下几种方式来实现线程安全的单例模式。 饿汉式单例 饿汉式单例模式指的是在类加载的时候…

Redis位图和地理空间GEO介绍与使用

1、位图 应用场景 在很多互联网应用中&#xff0c;我们会存在签到送积分、签到领取奖励等这样的需求&#xff0c;比如: 签到1天送10积分&#xff0c;连续签到2天送20积分&#xff0c;3天送30积分&#xff0c;4天以上均送50积分等。 如果连续签到中断&#xff0c;则重置计数&…

伯克希尔·哈撒韦:“股神”的“登神长阶”

股价跳水大家见过不少&#xff0c;但一秒跌掉62万美元的你见过吗&#xff1f; 今天我们来聊聊“股市”巴菲特的公司——伯克希尔哈撒韦 最近&#xff0c;由于纽交所技术故障&#xff0c;伯克希尔哈撒韦A类股股价上演一秒归“零”&#xff0c;从超过62万美元跌成185.1美元&…