240627_关于CNN中图像维度变化问题

240627_关于CNN中图像维度变化问题

diannao/2025/4/26 13:50:21/文章来源:https://blog.csdn.net/weixin_66378701/article/details/140024371

240627_关于CNN中图像维度变化问题

在学习一些经典模型时，其中得维度变化关系总搞不太明白，集中学习了以下，在此作以梳理总结：

一般来说涉及到的维度变换都是四个维度，当batch size=4，图像尺寸为640*640，RGB三通道时，此时维度就是4×3×640×640。3的意思是RGB三通道，如果你传入的图像是单通道图像，此时维度就是4×1×640×640。

当然有些图你看着是一个黑白图，但是他还是有可能是一张RGB三通道图，具体怎么区分呢。右击图片打开属性，打开详细信息，里面可以看到位深度，位深度为24，则为RGB图，位深度为8，则为单通道图。此处就是一个坑，图像分割任务中，标签往往是单通道图，但是有时从网上找到的数据集看起来是黑白的，但是实际训练就会报错，查看了才发现位深度是24，需要用python代码进行修改，具体跳转240627_图像24位深度（RGB图）转为8位深度（单通道图）-CSDN博客。

当维度是三维时，就是没有batch size这个维度，可以理解为这个维度指的是其中一张图。

标准卷积

以U_Net为例

在这里插入图片描述

# U_Net网络的简单结构，就写了一层，其他同理
block1=block_down(3,64)
x1_use=block1(x) # torch.Size([3, 64, 568, 568])
x1=self.maxpool(x1_use) # torch.Size([3, 64, 284, 284])'''
block down中卷积核的定义为
self.conv1 = nn.Conv2d(inp_channel, out_channel, kernel_size=3, stride=1,padding_mode='reflect')
self.conv2 = nn.Conv2d(out_channel, out_channel, kernel_size=3, stride=1,padding_mode='reflect')
'''

卷积输出的计算公式为

$height_{out}=\frac{(height_{in}-height_{kernel}+2*padding)}{stride}+1$

$width_{out}=\frac{(width_{in}-width_{kernel}+2*padding)}{stride}+1$

输入3张572572的RGB图像（3×3×572×572），经过3×3卷积（padding=0,stride=1），此时的计算公式为
$height_{out}=width_{out}=\frac{(572-3+2*0)}{1}+1=570$
一共经过两层之后尺寸为568568，因为kernel的out_channel定义的是64，所以一共有64个卷积核，输出通道为64，此时维度为3×64×568×568。

然后经过最大池化层，尺寸除以2，通道数不变，此时维度为3×64×284×284

其余层数同理

	batch_size	height	width	in_channel	out_channel
Input	3	572	572	3
Kernel		3	3	3	64
Output	3	570	570		64

1×1卷积

以ResNet50为例

我们看shortcuts分支（右半弧线分支），这个分支输入一张维度为1×256×56×56的图像，经过一个1×1卷积（stride=2,padding=0），此时经过上述公式计算，尺寸为28，输出通道数为512。

	batch_size	height	width	in_channel	out_channel
Input	1	56	56	256
Kernel		1	1	256	512
Output	1	28	28		512

当然也有特殊情况，1×1卷积，卷积核尺寸为1，步长为1，padding=0，通过以上公式可以计算出来尺寸不会发生变化，但通道数可以发生改变，由卷积核数量决定。

全连接层

全连接层就是把所有的像素点都摊开，摊成尺寸为1×1，通道数好多好多，其卷积核尺寸和输入尺寸一致，输出通道数就是卷积核个数

	batch_size	height	width	in_channel	out_channel
Input	1	56	56	256
Kernel		56	56	256	512
Output	1	1	1		512

总结

输出通道数就是卷积核个数

卷积后尺寸计算公式就是

$height_{out}=\frac{(height_{in}-height_{kernel}+2*padding)}{stride}+1$

$width_{out}=\frac{(width_{in}-width_{kernel}+2*padding)}{stride}+1$

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/36495.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

kylin v10 离线安装chrome centos离线安装chrome linux离线安装谷歌浏览器

kylin v10 离线安装chrome centos离线安装chrome linux离线安装谷歌浏览器

1. 先用自己联网的计算机，下载离线安装包，浏览器输入链接下载安装包： https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm 1.2. 信创环境不用执行下面，因为没网 1.3. 若为阿里云服务器，或服…

阅读更多...

深度学习驱动的图像识别革命

深度学习驱动的图像识别革命

深度学习驱动的图像识别革命正在彻底改变我们处理、分析和理解视觉信息的方式。以下是对这一革命的分点表示和归纳： 深度学习在图像识别中的基本原理特征提取：深度学习通过构建多层神经网络，能够自动从原始图像数据中提取出复杂的特征&…

阅读更多...

【第4章】MyBatis-Plus持久层接口之Service Interface(下)

【第4章】MyBatis-Plus持久层接口之Service Interface(下)

文章目录前言一、get1. 示例(getById)2. 示例（getOne）3. 示例（getOne 不抛出异常）4. 示例（getMap）5. 示例（getObj） 二、list1. 示例（list）2. 示例&#xff0…

阅读更多...

AR导航技术加持，图书馆阅读体验智慧升级

AR导航技术加持，图书馆阅读体验智慧升级

在信息爆炸的今天，图书馆作为知识的宝库，其藏书量和种类日益增多。然而，传统的图书馆导航方式已逐渐无法满足用户对快速、准确定位图书的需求。本文将探讨图书馆AR地图导航的实现原理、技术优势、功能特点以及市场前景，揭示为何AR…

阅读更多...

VS studio2019配置远程连接Ubuntu

VS studio2019配置远程连接Ubuntu

VS studio2019配置远程连接Ubuntu 1、网络配置 （1）获取主机IP （2）获取Ubuntu的IP （3）在 windows 的控制台中 ping 虚拟机的 ipv4 地址，在 Ubuntu 中 ping 主机的 ipv4 地址。 ubuntu: ping…

阅读更多...

【Linux】对共享库加载问题的深入理解——基本原理概述

【Linux】对共享库加载问题的深入理解——基本原理概述

原理概述【linux】详解——库-CSDN博客共享库被加载后，系统会为该共享库创建一个结构，这个结构体中的字段描述了库的各种属性。在内存中可能会加载很多库，每一个库都用一个结构体描述。把这些结构体用一些数据结构管理起来，系…

阅读更多...

WordPress Dokan Pro插件 SQL注入漏洞复现(CVE-2024-3922)

WordPress Dokan Pro插件 SQL注入漏洞复现(CVE-2024-3922)

0x01 产品简介 WordPress Dokan Pro插件是一款功能强大的多供应商电子商务市场解决方案，功能全面、易于使用的多供应商电子商务平台解决方案，适合各种规模的电商项目。允许管理员创建一个多卖家平台，卖家可以注册账户并在平台上创建自己的店铺，展示和销售自己的产品。提供…

阅读更多...

kali下安装使用蚁剑（AntSword）

kali下安装使用蚁剑（AntSword）

目录 0x00 介绍0x01 安装0x02 使用1. 设置代理2. 请求头配置3. 编码器 0x00 介绍蚁剑（AntSword）是一个webshell管理工具。官方文档：https://www.yuque.com/antswordproject/antsword 0x01 安装在kali中安装蚁剑，分为两部分&am…

阅读更多...

Zabbix 监控系统部署

Zabbix 监控系统部署

Zabbix 监控系统部署 Zabbix是一个企业级开源分布式监控解决方案，可监控网络的众多参数以及服务器、虚拟机、应用程序、服务、数据库、网站、云等的运行状况和完整性。 Zabbix 使用灵活的通知机制，允许用户为几乎任何事件配置基于电子邮件的警报。这允许…

阅读更多...

java发送图文到公众号

java发送图文到公众号

这两天接到了一个新任务，通过后台管理编写文章，发送到官网的同时，推送一份到公众号，研究了一下微信的文档，发现不难，只需要有几个注意点就可以了。注意： 微信公众号只能访问微信自己上传的图片…

阅读更多...

STM32单片机实现串口IAP升级

STM32单片机实现串口IAP升级

一.概述 1.要实现串口IAP升级，首先要编写一个bootloader程序，然后再写支持IAP的app程序； 2.keil下bootloader的程序rom和ram设置 3.app程序要用bin文件注：本文以STM32H743举例，其他stm32单片机IAP升级原理类似。 …

阅读更多...

达梦数据库的系统视图v$database

达梦数据库的系统视图v$database

达梦数据库的系统视图v$database 基础信息 OS版本： Red Hat Enterprise Linux Server release 7.9 (Maipo) DB版本： DM Database Server 64 V8 DB Version: 0x7000c 03134284132-20240115-215128-20081在达梦数据库（Dameng Database&#xf…

阅读更多...

Java——Lambda表达式

Java——Lambda表达式

1. 背景 Lambda表达式是JavaSE 8中一个重要的新特性。Lambda表达式允许你通过表达式来代替功能接口。 Lambda表达式就和方法一样，它提供了一个正常的参数列表和一个使用这些参数的主体(body，可以是一个表达式或一个代码块)。 Lambda 表达式（…

阅读更多...

C# YoloV8 模型效果验证工具(OnnxRuntime+ByteTrack推理)

C# YoloV8 模型效果验证工具(OnnxRuntime+ByteTrack推理)

C# YoloV8 模型效果验证工具(OnnxRuntimeByteTrack推理) 目录效果项目代码下载效果模型效果验证工具项目代码 using ByteTrack; using OpenCvSharp; using System; using System.Collections.Generic; using System.Diagnostics; using System.Drawing; using Sys…

阅读更多...

远程服务器配置（堡垒机samba/ssh等）

远程服务器配置（堡垒机samba/ssh等）

分配了新的服务器后，要下载代码首先要配置ssh。有以下两种方式： 拷贝原本服务器的在本地的重新生成ssh，再跟服务器密钥配对（如未备份.gitconfig，还需重新配置git账号邮箱。） ssh配置如果是拷贝过来的.ss…

阅读更多...

【win11】Mouse without Borders安装问题以管理员权限安装msi文件

【win11】Mouse without Borders安装问题以管理员权限安装msi文件

【win11】Mouse without Borders安装问题&以管理员权限安装msi文件 Mouse without Borders安装问题解决&以管理员权限安装msi文件启动Windows Installer服务以管理员权限安装msi文件参考文献 Mouse without Borders安装问题在win11下我双击MouseWithoutBorders2.2.1…

阅读更多...

nodejs使用mysql模块自动断开

nodejs使用mysql模块自动断开

背景第二天早上来的时候，发现接口返回异常Cannot enqueue Query after fatal error 从日志看上去，接口是正常运行的，搜索一下之后发现是数据库的问题，连接断开了原因 MySQL中有一个名叫wait_timeout的变量，表示操…

阅读更多...

由监官要求下架docker hub镜像导致无法正常拉取镜像

由监官要求下架docker hub镜像导致无法正常拉取镜像

问题：下载docker镜像超时 error pulling image configuration: download failed after attempts6: dial tcp 202.160.128.205:443: i/o timeout解决办法：配置daemon.json [rootbogon aihuidi]# cat /etc/docker/daemon.json {"registry-mirrors&qu…

阅读更多...

java springboot过滤器

java springboot过滤器

在Spring Boot应用中添加自定义过滤器，可以通过实现Filter接口或继承OncePerRequestFilter类来创建过滤器，并使用FilterRegistrationBean将其注册到Spring容器中。以下是一个简单的示例： 1. 创建过滤器类首先，创建一个实现Fil…

阅读更多...

C++基础语法:类构造函数

C++基础语法:类构造函数

前言 "打牢基础,万事不愁" .C的基础语法的学习引入类是实现面向对象思想的主要方法.前面提到:类是函数的变种,类可以通过调用静态方法或者成员函数来实现逻辑.多数情况下使用成员函数.构造函数是生成类对象成员的必须条件,对此做一些构造函数的归纳构造函数的目…

阅读更多...

最新文章