模型怎么处理不同尺寸的输入图像

1.有全连接层的的CNN模型

卷积能够处理不同尺寸的输入图像,但全连接层不行,因此在送入全连接层之前需将卷积层提取的特征转换为一个固定长度的特征向量。

那么如何转换?

1.1 GAP(Global Average Pooling)全局平均池化

直接代码举例:

import torch
import torch.nn as nn
from torchvision import transforms# 定义带有全连接层和全局平均池化层的 CNN 模型
class CNNWithGlobalAvgPool(nn.Module):def __init__(self):super(CNNWithGlobalAvgPool, self).__init__()self.conv1 = nn.Conv2d(3, 16, 3)self.conv2 = nn.Conv2d(16, 32, 3)self.fc = nn.Linear(32, 10)  # 假设输出类别数为 10self.global_avg_pool = nn.AdaptiveAvgPool2d(1)def forward(self, x):           #(1,3,224,224)x = self.conv1(x)           #(1,16,222,222)x = self.conv2(x)           #(1,32,220,220)x = self.global_avg_pool(x) #(1,32,1,1)x = x.view(x.size(0), -1)   #(1,32)x = self.fc(x)              #(1,10)return x# 创建模型实例
model = CNNWithGlobalAvgPool()image = torch.randn(1,3,224,224)output = model(image)
print(output)

 左边为普通卷积网络提取特征num_chanels*h*w后全部展开成一维向量num_chanels*h*w,再送入到全连接层,不同尺寸的图像得到不同的一维向量,输入到全连接层的in_feature数就不同,故需要统一尺寸。

右图为GAP,直接将每个通道的所有特征取平均得到num_chanels*1的向量,这样就与输入图像尺寸无关了。

1.2 SPP(Spatial Pyramid Pooling)空间金字塔池化。其中,全局平均池化是空间金字塔池化的一种特殊形式,只使用一个池化层。

上示例代码:

import torch
import torch.nn as nn
import torch.nn.functional as Fclass SpatialPyramidPooling(nn.Module):def __init__(self, levels=[1, 2, 4]):super(SpatialPyramidPooling, self).__init__()self.levels = levelsdef forward(self, x):N, C, H, W = x.size()output = []for level in self.levels:kh = H // levelkw = W // levelfor i in range(level):for j in range(level):h_start = i * khw_start = j * kwh_end = min(h_start + kh, H)w_end = min(w_start + kw, W)pool_feat = F.adaptive_max_pool2d(x[:, :, h_start:h_end, w_start:w_end], (1, 1))output.append(pool_feat.view(N, -1))output = torch.cat(output, dim=1)return output# 使用示例
spp = SpatialPyramidPooling(levels=[1, 2, 4])
input_data = torch.randn(1, 3, 32, 32)  # 输入数据大小为(1, 3, 32, 32)
output = spp(input_data)
print(output.size())

 SPP:将特征图划分成不同尺寸的子区域,如1x1、2x2、4x4等不同级别的子区域,对每个子区域进行池化操作,通常是最大池化或平均池化,将这些子区域内的特征映射转换为固定长度的向量,最后将这些向量连接在一起,形成一个具有固定维度的特征表示。

2.FCN全卷积模型

没有全连接层,故可以处理不同尺寸的输入图像

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/770291.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库备份及恢复

一、数据库备份的分类 1.1 从物理与逻辑的角度 从物理与逻辑的角度,备份可分为物理备份、逻辑备份 物理备份:对数据库操作系统的物理文件(如数据文件日志文件等)的备份 物理备份方法 冷备份(脱机备份)是在关闭数据库的时候进行的 热备份(联机备份):数…

大数据基础:Linux基础详解

课程介绍 本课程主要通过对linux基础课程的详细讲解,让大家熟练虚拟机的安装使用,Linux系统的安装配置,学习掌握linux系统常用命令的使用,常用的软件安装方法,制作快照,克隆,完成免密登录&…

校园跑腿大学生创业平台

校园跑腿大学生创业是一个充满挑战与机遇的领域。随着大学生消费能力的提升和校园生活的多样化,校园跑腿服务的需求日益旺盛,这为有志于创业的大学生提供了良好的市场机遇。 首先,创业成本低是校园跑腿大学生创业的一大优势。校园跑腿服务通常…

异常处理篇

文章目录 1. try 和 except2. 多个 except 块3. else 块4. finally 块5. raise 语句6. 自定义异常7. 异常链 1. try 和 except try 块包含可能引发异常的代码,而 except 块则包含处理这些异常的代码。 try:# 尝试执行可能会引发异常的代码result 10 / 0 # 这将引…

【Unity】uDD插件抓屏文字显示不清晰怎么办?

【背景】 之前介绍过用一款简称uDD(uDesktopDuplication)的开源插件抓取电脑桌面。整体效果不错,看电影很流畅。但是当切换到文档,或者仔细看任何UI的文字部分时,发现就模糊了。 【分析】 由于是依托于Canvas上的Te…

后端开发辅助

maven仓库手动添加jar命令 mvn install:install-file -DfileD:\\spire.xls-4.6.5.jar -DgroupIde-iceblue -DartifactIdspire.xls -Dversion4.6.5 -Dpackagingjaroracle调用存储过程示例 DECLAREPO_ERRCODE VARCHAR2(100);PO_ERRMSG VARCHAR2(100);BEGIN-- Call the procedure…

一个程序员老兵的自白~

听人劝、吃饱饭,不要订阅该文所属专栏。 想要挑战一下自己的小伙伴可扫文末名片! 作者:哈哥撩编程(视频号、抖音、公众号同名) 新星计划全栈领域优秀创作者博客专家全国博客之星第四名超级个体COC上海社区主理人特约讲师谷歌亚马逊演讲嘉宾科技博主极星会首批签约作者�…

vue学习日记10:综合案例-购物车

一、需求说明 1.渲染功能 &#xff08;1&#xff09;代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name&quo…

2024年软件测试面试题大全【含答案】

一、面试基础题 简述测试流程: 1、阅读相关技术文档&#xff08;如产品PRD、UI设计、产品流程图等&#xff09;。 2、参加需求评审会议。 3、根据最终确定的需求文档编写测试计划。 4、编写测试用例&#xff08;等价类划分法、边界值分析法等&#xff09;。 5、用例评审(…

要将Oracle中的表从按年分区转换为按月分区,并且保持数据不变,不锁表

在Oracle中,按年分区转换为按月分区并且保持数据不变同时不锁表是一个具有挑战性的任务,因为分区操作通常需要重写表或重新组织数据。但是,您可以通过在线重定义表(Online Table Redefinition)来实现这一目标,从而避免长时间的锁表操作。 在线重定义表允许您在表上进行结…

PLC_博图系列☞P:扫描操作数的信号上升沿

PLC_博图系列☞P&#xff1a;扫描操作数的信号上升沿 文章目录 PLC_博图系列☞P&#xff1a;扫描操作数的信号上升沿背景介绍P&#xff1a;扫描操作数的信号上升沿说明参数示例 关键字&#xff1a; PLC、 西门子、 博图、 Siemens 、 p 背景介绍 这是一篇关于PLC编程的文章…

程序员实用学习平台,必看榜!

只要卷不死&#xff0c;就往死里卷&#xff01; 高中老师宣扬的励志鸡汤&#xff0c;仿佛走出了校园踏入社会仍然适用。 “出走半生&#xff0c;归来仍是少年。”emm....... 如今比麻花还卷的社会&#xff0c;学到老才能活到老啊~尤其咱们IT这么优胜劣汰的行业&#xff0c;自是…

【linux】egrep 命令

egrep命令是用于在文本文件中搜索匹配某个模式的行的工具。它是基于正则表达式引擎的grep命令的扩展版本&#xff0c;支持更多的正则表达式语法。 语法 以下是egrep命令的一般语法&#xff1a; egrep [选项] 模式 文件其中&#xff0c;模式是您要搜索的正则表达式模式&#…

Android代码混淆指南

混淆文件概述 代码混淆是将代码转换成难以阅读和理解的形式&#xff0c;以保护源代码和减少应用体积的过程。以下是Android开发中常用的混淆配置文件及其作用&#xff1a; proguard-android.txt: 这是默认的混淆规则集&#xff0c;位于ANDROID_SDK\tools\proguard目录。它提供…

Bug定位与分析,软件测试员你中招了吗?

之所以写这一篇文章&#xff0c;是突然想起来曾经在测试过程中被开发嘲讽过&#xff0c;事情是这样的&#xff0c;当时发现了一个疑似前端的Bug就草草提交到了禅道&#xff0c;结果刚来的女前端看到了就有点生气地问我为啥不查清到底是前后端问题就直接派给她前端了&#xff0c…

113 链接集11--ctrl+左键单击多选

1.ctrl左键单击多选&#xff0c;单击单选 精简代码 <div class"model-list"><divmousedown.prevent"handleClick(item, $event)"class"model-list-item"v-for"item in modelList":key"item.id":class"{ model…

Java 中的 Math. round(-1. 5) 等于多少?

在 Java 中&#xff0c;Math.round() 方法用于四舍五入一个浮点数。这个方法的工作原理是&#xff0c;它会查看要舍入数值的小数点后第一位。如果这一位是 5 或更大&#xff0c;那么整数部分加 1&#xff1b;如果小于 5&#xff0c;整数部分保持不变。 对于 Math.round(-1.5)&…

【力扣】零钱兑换和零钱兑换2,动态规划算法

【力扣】零钱兑换和零钱兑换2&#xff0c;动态规划算法 最大组合数和最小物品数 package day0325;/*** description 动态规划* date 2024/3/25*/ public class Demo2 {public static void main(String[] args) {// 3 // int[] coins {1, 2, 5}; // int amount…

蓝桥杯物联网遇见的重大BUG及其产生原因和解决方法

BUG列表 1、ADC的RP2显示一直为0&#xff1a;2、LORX_Tx发送数据乱码&#xff1a;3、strcmp比较char a[2] {1, 2}与“12”字符串是否相等板子会死机&#xff1a;4、LORA_Tx和LORA_Rx放一起会接收不到数据&#xff1a;5、RTC获取到静止时间&#xff1a;6、ADC获取RP1和RP2模拟量…

IO复用并发模型

在讲解复用并发模型之前&#xff0c;先补齐一些知识&#xff1a; 设想一个场景&#xff0c;你今天想洗衣服&#xff0c;但是没有洗衣粉&#xff0c;于是你让快递小哥送来&#xff0c;那在送的这段时间&#xff0c;如果你干了别的活&#xff0c;洗衣服这件事情就被阻塞了&#…