学习记录——BiSeNet V2

BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation

BiSeNet V2:基于引导聚合的双边网络实时语义分割

  摘要在语义分割中,低级细节和高级语义都是必不可少的。然而,为了加快模型推理的速度,目前的方法几乎总是牺牲底层的细节,这导致精度大大降低。我们建议将这些空间细节和范畴语义分开处理,以实现高精度和高效率的实时语义分割。为此,我们提出了一种高效的架构,在速度和精度之间进行了良好的权衡,称为双边分割网络(BiSeNet V2)。该架构包括:(i)一个细节分支,具有宽通道和浅层,用于捕获低级细节并生成高分辨率特征表示;(ii)语义分支,通道窄,层次深,获取高级语义上下文。语义分支是轻量级的,因为它减少了信道容量和快速降采样策略。此外,我们设计了一个引导聚合层来增强相互连接并融合两种类型的特征表示。此外,设计了一种增强训练策略,在不增加推理成本的情况下提高分割性能。广泛的定量和定性评估表明,支持提出的体系结构对一些最先进的实时语义分割方法表现良好。具体来说,对于2,048×1,024输入,我们在cityscape测试集上实现了72.6%的Mean IoU,在一个NVIDIA GeForce GTX 1080 Ti卡上的速度为156 FPS,这比现有方法快得多,但我们实现了更好的分割精度。代码和经过培训的模型将公开提供。

引言

  语义分割是为每个像素分配语义标签的任务。它是计算机视觉中的一个基本问题,有着广泛的应用,包括场景理解(Zhou等人,2019)、自动驾驶(Cordts等人,2016;[c] . Geiger et al ., 2012),人类科学[j] . vol . 14:2004.02147 - v1。2020年4月5日机器交互和视频监控,仅举几例。近年来,随着卷积神经网络(Krizhevsky et al ., 2012)的发展,一系列语义分割方法(Zhao et al ., 2017;Chen et al ., 2017;Yu et al ., 2018b;Chen et al ., 2018;Zhang et al ., 2018a)基于全卷积网络(FCN) (Long et al ., 2015)不断提升了最先进的性能。

  这些方法的高精度依赖于它们的骨干网络。骨干网主要有两种架构:(i)扩展骨干网,去除下采样操作,并对相应的滤波核进行上采样,以保持高分辨率的特征表示(Chen et al ., 2015, 2018;赵等,2017,2018b;Fu et al ., 2019;Yu et al, 2020),如图2 (a)所示。(ii)编码器-解码器主干,采用自顶向下和跳过连接,以恢复解码器部分的高分辨率特征表示(Lin et al, 2017;Peng et al ., 2017;Yu等人,2018b),如图2 (b)所示。然而,这两种架构都是为一般的语义分割任务而设计的,不太关心推理速度和计算成本。在扩展主干中,扩展卷积耗时长,去除下采样操作带来了巨大的计算复杂度和内存占用。编码器-解码器架构中的许多连接对内存访问成本不太友好(Ma et al, 2018)。然而,实时语义分割应用对高效的推理速度提出了要求。
  面对这一需求,基于骨干网、现有方法(Badrinarayanan et al ., 2017;Paszke et al, 2016;赵等,2018a;Romera等人,2018;Mazzini, 2018)主要采用两种方法来加速模型:(i)输入限制。在相同的网络架构下,输入分辨率越小,计算成本越低。为了实现实时推理速度,许多算法(Zhao et al ., 2018a;Romera等人,2018;马志尼、2018;Romera et al, 2018)试图限制输入大小以降低整个计算复杂度;(2)通道修剪。它是一种直接的加速方法,特别是在早期阶段修剪通道以提高推理速度(Badrinarayanan et al ., 2017;Paszke et al, 2016;Chollet, 2017)。虽然这两种方式都能在一定程度上提高推理速度,但它们都牺牲了低级细节和空间容量,导致精度急剧下降。因此,为了同时实现高效率和高精度,开发一种特定的实时语义分割架构具有挑战性和重要性。
  我们观察到,低级细节和高级语义对于语义层都是至关重要的心理状态的任务。在一般的语义分割任务中,深层网络和广义网络同时对这两种信息进行编码。然而,在实时语义分割任务中,我们可以将空间细节和类别语义分开处理,以实现准确率和推理速度之间的权衡。
  为此,我们提出了一种双路径架构,称为双边分割网络(BiSeNet V2),用于实时语义分割。其中一条通道被设计为用宽通道和浅层捕捉空间细节,称为细节分支。另一种通道窄、层次深的分类语义提取方法称为语义分支(Semantic Branch)。语义分支只需要一个大的接受域来捕获语义上下文,而细节信息可以由细节分支提供。因此,语义分支可以用更少的通道和快速下采样策略来实现轻量级。将两种类型的特征表示进行合并,以构建更强、更全面的特征表示。这种概念设计为实时语义分割提供了高效的架构,如图2 ©所示。

  具体而言,在本研究中,我们设计了一个引导聚合层来有效地合并这两种类型的特征。为了在不增加推理复杂性的情况下进一步提高性能,我们提出了一种带有一系列辅助预测头的增强训练策略,这些辅助预测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/587991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于时空的Ramsar湿地自动淹没映射利用Google Earth Engine

题目:Spatiotemporal‑based automated inundation mapping of Ramsar wetlands using Google Earth Engine 期刊:Scientific Reports 第一作者:Manish KumarGoyal 发表单位:University of Nebraska 发表日期:2023年 1. 摘要 研究背景:湿地是生态系统中最关键的组成…

ctfshow 新手必刷菜狗杯 谜之栅栏题解记录

知识点:图片比较 拿到之后,有两个图片,直观看不出什么,尝试用工具比较。 用010editor打开其中一个,010editor的工具里面就有比较文件选项,比较两个文件,发现有一处不同。题目说栅栏&#xff0c…

八股文打卡day16——计算机网络(16)

面试题:TCP连接是如何确保可靠性的? 我的回答: 1.数据分块控制。应用数据被分成被认为最适合传输的数据块大小,再发送到传输层,数据块被称为数据报文段或数据段。 2.序列号和确认应答。TCP为每一个数据包分配了一个序…

【Vulnhub 靶场】【Looz: 1】【简单】【20210802】

1、环境介绍 靶场介绍:https://www.vulnhub.com/entry/looz-1,732/ 靶场下载:https://download.vulnhub.com/looz/Looz.zip 靶场难度:简单 发布日期:2021年08月02日 文件大小:2.1 GB 靶场作者:mhz_cyber &…

商标和专利是不是一回事儿?那它们究竟有什么区别呀?

商标和专利都是属于知识产权的一种,但它们的含义是不同的。 1.商标: 商标是指商品的生产者或经营者在其商品或服务上使用的标志,用于标识商品或服务的来源、品质、特点等。商标可以是文字、图形、字母、数字、颜色、声音等,也可…

八个理由:从java8升级到Java17

目录 前言 1. 局部变量类型推断 2.switch表达式 3.文本块 4.Records 5.模式匹配instanceof 6. 密封类 7. HttpClient 8.性能和内存管理能力提高 前言 从Java 8 到 Java 20,Java 已经走过了漫长的道路,自 Java 8 以来,Java 生态系统…

kivy开发一个登陆界面

Kivy Kivy是一个用于开发跨平台移动应用(如Android和iOS)以及桌面应用(如Windows、Linux和macOS)的Python框架。它采用开源许可证(MIT许可证),提供了丰富的图形界面组件和工具,以便…

链表:约瑟夫环

#include<iostream> using namespace std; struct Circle //创建结构体Circle {int index; //编号Circle* next; //指针变量next指向一个节点 }; Circle* CreateList(int n) //创建链表 {Circle* head, * p; //head为头指针&#xff0c;p为当前指针head p new Circle;…

C#,入门教程(04)——Visual Studio 2022 数据编程实例:随机数与组合

上一篇&#xff1a; C#&#xff0c;入门教程(03)——Visual Studio 2022编写彩色Hello World与动画效果https://blog.csdn.net/beijinghorn/article/details/123478581 C#&#xff0c;入门教程(01)—— Visual Studio 2022 免费安装的详细图文与动画教程https://blog.csdn.net…

【CSS】布局方式梳理和总结

1. 前言 网页布局是CSS的重点功能&#xff0c;布局的传统方案是基于盒子模型&#xff0c;依靠display属性、position属性和float属性&#xff0c;它对一些特殊布局很麻烦。 CSS3推出的Flex布局和网格布局&#xff0c;让开发者更容易定制自己想要的布局。本篇梳理和总结一些布局…

java常见面试题:请解释一下Java中的常用ORM框架,如Hibernate、MyBatis等。

ORM&#xff08;Object-Relational Mapping&#xff09;框架在Java中主要用于将关系型数据库中的数据映射到Java对象&#xff0c;从而使得开发者可以更加方便地操作数据库&#xff0c;而不需要编写大量的SQL代码。以下是两个常用的ORM框架&#xff1a;Hibernate和MyBatis。 Hi…

【Delphi 基础知识 8】常用的运算符

目录 算术运算符关系运算符逻辑运算符位运算符 Delphi是一种基于Object Pascal语言的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它支持多种运算符用于执行各种操作。以下是一些常见的Delphi运算符&#xff0c;以及简单的代码示例&#xff1a; 算术运算符 &#xff…

安装Hadoop:Hadoop的单机模式、伪分布式模式——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项

前言 Hadoop包括三种安装模式&#xff1a; 单机模式&#xff1a;只在一台机器上运行&#xff0c;存储是采用本地文件系统&#xff0c;没有采用分布式文件系统HDFS&#xff1b;伪分布式模式&#xff1a;存储采用分布式文件系统HDFS&#xff0c;但是&#xff0c;HDFS的名称节点…

门控循环单元(GRU)-多输入时序预测

目录 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 亮点与优势&#xff1a; 二、实际运行效果&#xff1a; 三、部分代码&#xff1a; 四、完整代码数据下载&#xff1a; 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 本代码基于Matlab平台编译…

工具--Git详解快来看看吧

目录 学习目标&#xff1a; 学习内容&#xff1a; 学习产出&#xff1a; Git的基本概念和工作原理&#xff1a; 版本控制系统的发展历程&#xff1b; 分布式版本控制系统的优势&#xff1b; Git的基本概念&#xff1a;仓库、提交、分支等&#xff1b; Git的工作原理&#xff1a…

IO密集型场景和CPU密集型场景——具体场景汇总

前言 多线程适合处理IO密集型任务&#xff0c;而多进程适合处理CPU密集型任务。选择使用哪种并发模型需要根据具体的应用场景和需求进行权衡。在 Python 中&#xff0c;可以使用 threading 模块实现多线程编程&#xff0c;使用 multiprocessing 模块实现多进程编程。 进阶详解…

DL Homework 13

目录 编程实现优化算法&#xff0c;并3D可视化 1. 函数3D可视化 2.加入优化算法&#xff0c;画出轨迹 3.复现CS231经典动画 4.结合3D动画&#xff0c;用自己的语言&#xff0c;从轨迹、速度等多个角度讲解各个算法优缺点 5.总结 编程实现优化算法&#xff0c;并3D可视化 …

编程笔记 html5cssjs 005 网页上都有哪内容、形式和操作

编程笔记 html5&css&js 005 网页上都有哪内容、形式和操作 一、内容分类二、样式三、互动小结 在编写网页之前&#xff0c;对网页内容及操作进行一个基本分类&#xff0c;然后接下来的任务就分别加以处理。 网页上的内容和操作有很多种&#xff0c;以下是一些常见的内容…

【深度解析C++】const成员函数

系列文章目录 &#x1f308;座右铭&#x1f308;&#xff1a;人的一生这么长、你凭什么用短短的几年去衡量自己的一生&#xff01; &#x1f495;个人主页:清灵白羽 漾情天殇_计算机底层原理,深度解析C,自顶向下看Java-CSDN博客 ❤️相关文章❤️&#xff1a;Cthis指针&#xf…

Kafka_01_Kafka初识

Kafka_01_Kafka初识 Kafka基础概念延迟任务 Kafka Kafka: ZooKeeper协调的分布式消息系统 基于Scala语言编写的高性能、多分区、多副本Kafka高性能的原因&#xff1a;页缓存、顺序IO、零拷贝 具有以下特性&#xff1a; 消息中间件: 系统解耦、冗余存储、流量消峰、异步通信…