模型怎么处理不同尺寸的输入图像

1.有全连接层的的CNN模型

卷积能够处理不同尺寸的输入图像,但全连接层不行,因此在送入全连接层之前需将卷积层提取的特征转换为一个固定长度的特征向量。

那么如何转换?

1.1 GAP(Global Average Pooling)全局平均池化

直接代码举例:

import torch
import torch.nn as nn
from torchvision import transforms# 定义带有全连接层和全局平均池化层的 CNN 模型
class CNNWithGlobalAvgPool(nn.Module):def __init__(self):super(CNNWithGlobalAvgPool, self).__init__()self.conv1 = nn.Conv2d(3, 16, 3)self.conv2 = nn.Conv2d(16, 32, 3)self.fc = nn.Linear(32, 10)  # 假设输出类别数为 10self.global_avg_pool = nn.AdaptiveAvgPool2d(1)def forward(self, x):           #(1,3,224,224)x = self.conv1(x)           #(1,16,222,222)x = self.conv2(x)           #(1,32,220,220)x = self.global_avg_pool(x) #(1,32,1,1)x = x.view(x.size(0), -1)   #(1,32)x = self.fc(x)              #(1,10)return x# 创建模型实例
model = CNNWithGlobalAvgPool()image = torch.randn(1,3,224,224)output = model(image)
print(output)

 左边为普通卷积网络提取特征num_chanels*h*w后全部展开成一维向量num_chanels*h*w,再送入到全连接层,不同尺寸的图像得到不同的一维向量,输入到全连接层的in_feature数就不同,故需要统一尺寸。

右图为GAP,直接将每个通道的所有特征取平均得到num_chanels*1的向量,这样就与输入图像尺寸无关了。

1.2 SPP(Spatial Pyramid Pooling)空间金字塔池化。其中,全局平均池化是空间金字塔池化的一种特殊形式,只使用一个池化层。

上示例代码:

import torch
import torch.nn as nn
import torch.nn.functional as Fclass SpatialPyramidPooling(nn.Module):def __init__(self, levels=[1, 2, 4]):super(SpatialPyramidPooling, self).__init__()self.levels = levelsdef forward(self, x):N, C, H, W = x.size()output = []for level in self.levels:kh = H // levelkw = W // levelfor i in range(level):for j in range(level):h_start = i * khw_start = j * kwh_end = min(h_start + kh, H)w_end = min(w_start + kw, W)pool_feat = F.adaptive_max_pool2d(x[:, :, h_start:h_end, w_start:w_end], (1, 1))output.append(pool_feat.view(N, -1))output = torch.cat(output, dim=1)return output# 使用示例
spp = SpatialPyramidPooling(levels=[1, 2, 4])
input_data = torch.randn(1, 3, 32, 32)  # 输入数据大小为(1, 3, 32, 32)
output = spp(input_data)
print(output.size())

 SPP:将特征图划分成不同尺寸的子区域,如1x1、2x2、4x4等不同级别的子区域,对每个子区域进行池化操作,通常是最大池化或平均池化,将这些子区域内的特征映射转换为固定长度的向量,最后将这些向量连接在一起,形成一个具有固定维度的特征表示。

2.FCN全卷积模型

没有全连接层,故可以处理不同尺寸的输入图像

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/770291.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库备份及恢复

一、数据库备份的分类 1.1 从物理与逻辑的角度 从物理与逻辑的角度,备份可分为物理备份、逻辑备份 物理备份:对数据库操作系统的物理文件(如数据文件日志文件等)的备份 物理备份方法 冷备份(脱机备份)是在关闭数据库的时候进行的 热备份(联机备份):数…

大数据基础:Linux基础详解

课程介绍 本课程主要通过对linux基础课程的详细讲解,让大家熟练虚拟机的安装使用,Linux系统的安装配置,学习掌握linux系统常用命令的使用,常用的软件安装方法,制作快照,克隆,完成免密登录&…

【Unity】uDD插件抓屏文字显示不清晰怎么办?

【背景】 之前介绍过用一款简称uDD(uDesktopDuplication)的开源插件抓取电脑桌面。整体效果不错,看电影很流畅。但是当切换到文档,或者仔细看任何UI的文字部分时,发现就模糊了。 【分析】 由于是依托于Canvas上的Te…

vue学习日记10:综合案例-购物车

一、需求说明 1.渲染功能 &#xff08;1&#xff09;代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name&quo…

2024年软件测试面试题大全【含答案】

一、面试基础题 简述测试流程: 1、阅读相关技术文档&#xff08;如产品PRD、UI设计、产品流程图等&#xff09;。 2、参加需求评审会议。 3、根据最终确定的需求文档编写测试计划。 4、编写测试用例&#xff08;等价类划分法、边界值分析法等&#xff09;。 5、用例评审(…

PLC_博图系列☞P:扫描操作数的信号上升沿

PLC_博图系列☞P&#xff1a;扫描操作数的信号上升沿 文章目录 PLC_博图系列☞P&#xff1a;扫描操作数的信号上升沿背景介绍P&#xff1a;扫描操作数的信号上升沿说明参数示例 关键字&#xff1a; PLC、 西门子、 博图、 Siemens 、 p 背景介绍 这是一篇关于PLC编程的文章…

程序员实用学习平台,必看榜!

只要卷不死&#xff0c;就往死里卷&#xff01; 高中老师宣扬的励志鸡汤&#xff0c;仿佛走出了校园踏入社会仍然适用。 “出走半生&#xff0c;归来仍是少年。”emm....... 如今比麻花还卷的社会&#xff0c;学到老才能活到老啊~尤其咱们IT这么优胜劣汰的行业&#xff0c;自是…

Bug定位与分析,软件测试员你中招了吗?

之所以写这一篇文章&#xff0c;是突然想起来曾经在测试过程中被开发嘲讽过&#xff0c;事情是这样的&#xff0c;当时发现了一个疑似前端的Bug就草草提交到了禅道&#xff0c;结果刚来的女前端看到了就有点生气地问我为啥不查清到底是前后端问题就直接派给她前端了&#xff0c…

113 链接集11--ctrl+左键单击多选

1.ctrl左键单击多选&#xff0c;单击单选 精简代码 <div class"model-list"><divmousedown.prevent"handleClick(item, $event)"class"model-list-item"v-for"item in modelList":key"item.id":class"{ model…

蓝桥杯物联网遇见的重大BUG及其产生原因和解决方法

BUG列表 1、ADC的RP2显示一直为0&#xff1a;2、LORX_Tx发送数据乱码&#xff1a;3、strcmp比较char a[2] {1, 2}与“12”字符串是否相等板子会死机&#xff1a;4、LORA_Tx和LORA_Rx放一起会接收不到数据&#xff1a;5、RTC获取到静止时间&#xff1a;6、ADC获取RP1和RP2模拟量…

IO复用并发模型

在讲解复用并发模型之前&#xff0c;先补齐一些知识&#xff1a; 设想一个场景&#xff0c;你今天想洗衣服&#xff0c;但是没有洗衣粉&#xff0c;于是你让快递小哥送来&#xff0c;那在送的这段时间&#xff0c;如果你干了别的活&#xff0c;洗衣服这件事情就被阻塞了&#…

Prometheus(五):监控物理机并进行数据展示

目录 1 ipmi export安装配置1.1 ipmi exporter简介1.2 安装1.2 创建yaml文件1.3 systemd启动配置 ipmi_exporter.service1.4 启动 ipmi_exporter 服务1.5 Prometheus配置创建target&#xff1a;修改Prometheus配置文件 1.6 Grafana配置1.7 IPMI说明1、IPMI2、ipmitool远程电源管…

C++项目——集群聊天服务器项目(五)网络模块与业务模块

今天来正式书写集群聊天服务器网络模块与部分业务模块的代码 环境搭建C项目——集群聊天服务器项目(一)项目介绍、环境搭建、Boost库安装、Muduo库安装、Linux与vscode配置-CSDN博客 Json第三方库 muduo网络库 MySQL数据库 一、工程目录创建 项目通过CMake编译&#xff0c…

C语言:自定义类型:联合体和枚举

目录 联合体 联合体是什么&#xff1f; 联合体的大小计算 枚举 枚举是什么&#xff1f; 为什么要使用枚举&#xff1f; 联合体 联合体是什么&#xff1f; 联合体也是个自定义类型&#xff0c;它和结构体类似&#xff0c;都是由多个成员构成&#xff0c;可以有不同的内置…

【OJ】动归练习二

个人主页 &#xff1a; zxctscl 如有转载请先通知 题目 1. 91.解码方法1.1 分析1.2 代码 2. 62.不同路径2.1 分析2.2 代码 3. 63.不同路径 II3.1 分析3.2 代码 1. 91.解码方法 1.1 分析 题目所述就是把一串数字反向解码为字母映射出来&#xff0c;有多少种方法。 题目也说&…

nav仿真(2)

开启仿真和建图 打开第一个窗口启动仿真&#xff1a; source devel/setup.bash export TURTLEBOT3_MODELburger roslaunch turtlebot3_gazebo turtlebot3_world.launch # 启动仿真打开第二个窗口&#xff0c;开始建图&#xff1a; source devel/setup.bash export TURTLEBOT3_…

mysql存储引擎、行锁与索引的关系

一、存储引擎概念介绍 MySQL中的数据用各种不同的技术存储在文件中&#xff0c;每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力&#xff0c;这些不同的技术以及配套的功能在MySQL中称为存储引擎 存储引擎是MySQL将数据存储在文件系统中的存储…

隐语技术架构

隐语架构 产品定位 算法层 计算层 密码原语 互联互通–资源层 总结

数据结构(五)——树与二叉树的应用

5.5 树与二叉树的应用 5.5.1 哈夫曼树 结点的权&#xff1a;有某种现实含义的数值。 结点的带权路径长度&#xff1a;从树的根到该结点的路径长度&#xff08;经过的边数&#xff09;与该结点上权值的乘积。 树的带权路径长度&#xff1a;树中所有叶结点的带权路径长度之和…

linux系统------------Mysql数据库介绍、编译安装

目录 一、数据库基本概念 1.1数据(Data) 1.2表 1.3数据库 1.4数据库管理系统(DBMS) 数据库管理系统DBMS原理 1.5数据库系统&#xff08;DBS) 二、数据库发展史 1、第一代数据库 2、第二代数据库 3、第三代数据库 三、关系型数据库 3.1关系型数据库应用 3.2主流的…