语义分割网络-FCN全卷积网络

全卷积神经网络FCN整体概述

FCN是首个端对端针对像素级预测的全卷积网络。FCN会用到分类网络作为backbone
FCN的网络结构类比分类网络

分类网络经过卷积操作后,接全连接层,最后一个全连接层输出长度与分类类别数量相同,最后经过softmax得到术语每个类别的概率。

对于FCN网络,特征提取会用到分类网络作为backbone。类比分类网络,FCN-s32经过一系列卷积操作(下采样)获取特征层,卷积最终输出特征层与语义分割类别数num_cls相等(包含背景),再通过convTranspose反卷积(上采样),得到与原图相同大小的特征图,通道数与num_cls相等。特征图上的每一个像素点在channel维度上对应channel个值,进过softmax得到每一个像素点在所有类别上的概率值,取概率最大值作为该像素点的预测类别。


FCN网络结构

以VGG16为FCN的backbne
VGG16网络结构如下图所示:
VGG16网络结构图
FCN-8s和FCN-16s使用到第3个max pooling和第四个max pooling特征层,分别对应原始图片宽高的1/8和1/16
(理解FCN-8s最后特征层经过8倍上采样, FCN-16s最后特征层经过16倍上采样)

FCN-32S网络结构

FCN-32S网络结构
图片来自
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae*

如上图所示,在backbone特征提取模块使用是VGG16模型中全连接网络之前的所有卷积模块,FC6表示连接一个7×7卷积、激活函数和dropout,特征层大小不变;
FC7表示连接一个1×1卷积、激活函数和dropout,特征层大小不变;
再经过一个1×1卷积,不改变特征层大小,将channel数量转换为与num_cls相同;
经过反卷积(上采样),将特征图上采样32倍得到与原始图片相同大小的特征层;
(如果训练过称重反卷积参数冻结,等于对特征图做双线性插值处理)
得到语义分割结果

FCN-16S网络结构

FCN-16S网络结构
图片来自
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae*

FCN-16s在反卷积结果中融合了backbone中的特征层。
使用VGG16第四个池化后的特征层(原始图像宽高1/16)进过一次1×1卷积将channel数转化为num_cls,
与两倍上采样后的卷积结果相加(特诊层对应位置像素值相加操作),
融合后的结果进行反卷积(16倍上采样),
输出特征层,得到语义分割结果。

FCN-8S网络结构

FCN-8S网络结构
FCN-8s在反卷积结果中融合了backbone中的特征层。
使用VGG16第四个池化后的特征层(原始图像宽高1/16)进行一次1×1卷积将channel数转化为num_cls,
与两倍上采样后的卷积结果相加(特征层对应位置像素值相加操作),
将结果再次两倍上采样,再与VGG16第三个池化后的特征层(原始图像宽高1/8)进行一次1×1卷积将chnnel数量转化为num_cls相加(特征层对应位置像素值相加操作),
融合后的结果进行反卷积(8倍上采样),
输出特征层,得到语义分割结果。

在这里插入图片描述

以上为全卷积神经网络FCN网络结构笔记


感谢:
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/201534.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springMVC实验(五)——数据校验

【知识要点】 数据校验的概念 在软件开发过程中,数据校验是非常重要的环节,用于确保数据的有效性和完整性 。数据校验分为客户端验证和服务端验证,客户端验证是确保人机交互过程中用户操作表单过程中的误操作,由JavaScript代码完…

优化用户直播体验:第三方美颜SDK的前沿技术

当下,用户对于直播体验的要求日益提高,其中之一的重要方面就是实时美颜效果。第三方美颜SDK为直播平台和应用提供了强大的美颜功能,极大地改善了用户的直播观感。 一、背景与发展 过去,直播中的美颜往往依赖于主播或用户自行调整…

【深度学习】深度学习框架的环境配置

目录 1. 配置cuda环境 1.1. 安装cuda和cudnn 1.1.1. 显卡驱动配置 1.1.2. 下载安装cuda 1.1.3. 下载cudnn,将解压后文件复制到cuda目录下 1.2. 验证是否安装成功 2. 配置conda环境 2.1. 安装anaconda 2.2. conda换源 2.3. 创建conda环境 2.4. pip换源 3…

Linux虚假唤醒

为什么会有虚假唤醒一说。Linux内核这么强大,怎么会出现这样的情况?一直以来也很困惑,看了下文链接中的介绍后,豁然开朗。 从计算机设计的角度,如果一层解决不了,那就再多加一层。推算到这里,就…

常见的环境变量用于设置系统的路径查找

常见的环境变量用于设置系统的路径查找 echo $PATH 常见的环境变量用于设置系统的路径查找 在 Linux 中,有一些常见的环境变量用于设置系统的路径查找。以下是一些常见的环境变量和它们的作用: $PATH: 用于设置可执行文件的查找路径。 expo…

【EI征稿中#先投稿,先送审#】第三届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2024)

第三届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2024) 2024 3rd International Conference on Cyber Security, Artificial Intelligence and Digital Economy 第二届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2023&…

深度学习火车票识别系统 计算机竞赛

文章目录 0 前言1 课题意义课题难点: 2 实现方法2.1 图像预处理2.2 字符分割2.3 字符识别部分实现代码 3 实现效果4 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 图像识别 火车票识别系统 该项目较为新颖,适…

网络运维神器:H3C高级命令使用全攻略

哈喽大家好,欢迎来到虚拟化时代君(XNHCYL)。 “ 大家好,我是虚拟化时代君,一位潜心于互联网的技术宅男。这里每天为你分享各种你感兴趣的技术、教程、软件、资源、福利……(每天更新不间断,福…

【算法系列篇】递归、搜索与回溯(一)

文章目录 什么是递归、搜索与回溯算法1. 汉诺塔1.1 题目要求1.2 做题思路1.3 代码实现 2. 合并两个有序链表2.1 题目要求2.2 做题思路2.3 代码实现 3. 反转链表3.2 题目要求3.2 做题思路3.3 代码实现 什么是递归、搜索与回溯算法 递归算法是一种通过重复将问题分解为同类的子问…

【一天一坑系列】Mysql中INSERT IGNORE INTO插入时去重无效,插入了重复数据

1、问题描述 今天刚好有一个需求,需要插入数据时去重。所以第一下就想到了insert ignore into方法,但是使用过程中,发现虽然设置了唯一键,但插入时还是出现了重复插入的情况。 具体信息如下,表的约束设置如下&…

从Excel中找sheet

pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 …

win11安装(未完待续)

学习补丁 test.bat 运行后需要重启 slmgr /ipk W269N-WFGWX-YVC9B-4J6C9-T83GX slmgr /skms kms.03k.org slmgr /ato 文件扩展名 主题 性能设置 开始按钮靠左 任务栏对齐方式-靠左 必备软件 f.lux redshift 360管家 驱动精灵 edge c*lash&#xff08;v2*ray不支持w…

【开题报告】基于SpringBoot的社区老人健康跟踪管理系统设计与实现

1.研究背景 基于Spring Boot的社区老人健康跟踪管理系统的研究背景主要包含了以下几个方面&#xff1a; &#xff08;1&#xff09;人口老龄化趋势 随着社会的发展&#xff0c;我国老年人口比例逐渐增加&#xff0c;老年人口的健康管理成为一个重要议题。随之而来的是对老年…

微信小程序中对于蓝牙通讯数据处理常用的工具函数

一、十六进制转字符串 export const hexToStr function(hex, encoding) {var trimedStr hex.trim();var rawStr trimedStr.substr(0, 2).toLowerCase() "0x" ? trimedStr.substr(2) : trimedStr;var len rawStr.length;var curCharCode;var resultStr [];for…

显示屏 LM3033(ST7920主控)

简介 这是常用的单色液晶 LCD 显示屏。 型号为 LM3033DFW&#xff08;深圳拓普微&#xff09;5V 单电源供电&#xff08;3.3V不可以&#xff0c;对比度会降低到看不清&#xff09;支持并口&#xff08;8080时序&#xff09;和串行通讯&#xff08;SPI&#xff09;带字库 框图…

git stash 对当前分支修改的内容进行暂存

我们在开发的时候往往会遇到这种情况, 在一个分支开发,写了不少内容,但是突然来了一个紧急的需求需要切换分支,去做这个需求,但是当前的分支又因为没有开发完成,不想形成一条无效的commit记录,这时我们就到暂存上场了 git stash 暂存 // 切分支之前 对当前分支修改的内容进行暂…

制作一个RISC-V的操作系统五-RISC-V汇编语言编程二

文章目录 RISC-V汇编指令操作对象RISC-V汇编指令编码格式小端序的概念RISC-V汇编指令分类RISC-V汇编伪指令 RISC-V汇编指令操作对象 RV32I&#xff1a;RISC-V32位机器整数指令集 指令集分非特权指令集和特权指令集 XLEN&#xff1a;变量代表当前机器的字长&#xff08;32位 64…

ModbusRTU\TCP消息帧解析(C#实现报文发送与解析)

目录 知识点常用链接一、Modbus1.ModbusRTU消息帧解析2.主站poll、从站slave通讯仿真-modbusRTU1.功能码01读线圈状态2.功能码03读保持寄存器报文解析&#xff08;寄存器存整型&#xff09;报文解析&#xff08;寄存器存float&#xff09; 3.C#模拟主站Poll&#xff08;ModbusR…

Go 语言中的反射机制

欢迎大家到我的博客浏览&#xff0c;更好的阅读体验请点击 反射 | YinKais Blog 反射在大多数的应用和服务中并不常见&#xff0c;但是很多框架都依赖 Go 语言的反射机制简化代码。<!--more-->因为 Go 语言的语法元素很少、设计简单&#xff0c;所以它没有特别强的表达能…

Mysql的所有数据类型和它们的区别

一、数值类型 1. 普通整数数值类型 以下数据类型只能用以保存整数 整数数值类型类型存储大小&#xff08;字节&#xff09;有符号的取值范围&#xff08;允许存在负数&#xff09;无符号的取值范围TINYINT1-128 ~ 1270 ~ 255SMALLINT2- 327678 ~ 327670 ~ 65535MEDIUMINT3- 8…