I2CKD : INTRA- AND INTER-CLASS KNOWLEDGE DISTILLATION FOR SEMANTIC SEGMENTATION

摘要

本文提出了一种新的针对图像语义分割的知识蒸馏方法,称为类内和类间知识蒸馏(I2CKD)。该方法的重点是在教师(繁琐模型)和学生(紧凑模型)的中间层之间捕获和传递知识。对于知识提取,我们利用从特征图派生的类原型。为了促进知识转移,我们**采用了三重损失来最小化类内的差异,最大化教师和学生原型之间的类间差异。**因此,I2CKD使学生能够更好地模仿每个类的教师的特征表示,从而提高紧凑网络的分割性能。

介绍

一般来说,教师和学生之间的知识质量是使用均方误差(MSE)等几个指标以密集的两两方式计算的,而不考虑类内和类间的特征关系。

在本文中,我们提出了一种针对语义分割的新型知识蒸馏方法,称为类内和类间知识蒸馏(I2CKD)。首先,我们使用特征映射和ground truth(mask)计算每个类的教师原型(质心)。我们工作背后的假设是,教师的良好表现得益于他们合适的制作原型。因此,我们建议将这些知识传授给学生。为此,正如方法的名称所暗示的那样,我们通过最小化/最大化他们之间的类内和类间距离来强迫每个类的学生原型模仿老师原型(见图1)。作为这种约束的一种复杂损失,我们利用了三重损失

image-20240513143413598

相关工作

面向语义分割的知识蒸馏

[9]中,提取率0阶和1阶两类知识。0阶计算像素类概率之间的差。1阶考虑中心像素与其8个领域之间的差异。[12]专注于匹配教师和学生的特征图大小,并提出应用自编码器。然后,计算两两关联图来量化教师和学生知识之间的关系。[10]提出了一个结构化蒸馏(SKD)方案,该方案考虑了使用图的特征图之间的中间蒸馏。分数图之间的像素蒸馏以及通过对抗学习的整体蒸馏。Wang等开发了一种名为Intra-class Feature Variation Distillation(IFVD)的新方法,学习学生模仿教师的Intra-class关系。为了传递IFV知识,使用了余弦距离。Shu等人开发了一种称为通道知识蒸馏(CWD)的方法,该方法的通道维度计算教师和学生激活通道映射的softmax之间的KLD。在我们之前的工作中,我们利用教师特征图之间的相互依赖性作为知识蒸馏。这些知识使用自注意机制捕获,并使用MSE转移。

在获得满意的性能的同时,这些方法忽略了特征图(原型)中每个类的有意义的知识。这些知识可以有效地用于测量教师和学生网络之间的类内和类间相似性。这就是我们方法I2CKD的目的

方法

总体

如图2所示,我们的方法I2CKD将知识从训练有素的教师网络中提炼出来,传递给学生。对于学生网络的每个训练阶段。我们都冻结了教师网络。学生网络通过三个损失来更新其权重,分别捕获得分图和特征图级别的学生/ground truth差异和教师/学生差异。贡献的核心在于特征映射级别,我们建议利用教师和学生之间的类内和类间关系。为此,我们计算了教师和学生类原型之间的三元组损失。

image-20240513145451227

类内和类间的知识蒸馏
类原型计算

对于给定通道的特征映射image-20240513145714338,类c的原型表示为:

image-20240513145720007

其中image-20240513145832008表示ground truth(掩码)。image-20240513145913222是一个指示函数,如果参数为真,则等于1,否则等于0。对于教师和学生网络,我们在特征映射上计算所有类的原型得到矩阵大小为image-20240513150014299,其中C和K分别表示类和通道的数量。

三重损失

我们蒸馏方案的最终目标是最小化类内的差异,最大化教师和学生网络之间的类间差异。具体来说,我们的目标是执行以下约束:

image-20240513150200266

这里d(*)是一个距离函数,m代表一个恒定的边界。image-20240513150652530是从教师和学生网络中提取出的类原型。image-20240513150741254表示与C不同的类的原型,m是给定的余量。

这一约束的执行允许将学生和教师类原型之间的损失表述如下:

image-20240513150837994

image-20240513150914993表示函数image-20240513150922579image-20240513150928148image-20240513150933891范数,

学生训练的总损失

语义切分的总体学生训练损失如下:

image-20240513151025979

image-20240513151127173是平衡所考虑的损失的超参数。

image-20240513151407377是教师分数图image-20240513151416774与学生分数图image-20240513151423458之间的KLD。

image-20240513151429461

image-20240513151448172是softmax函数

image-20240513151453690

image-20240513151543529是ground truth与分割后的图像之间的损失,在我们的工作中,我们使用交叉熵损失。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/11397.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12个乒乓球,有一个次品,不知轻重,用一台无砝码天平称三次,找出次品,告知轻重?

前言 B站上看到个视频:为什么有人不认可清北的学生大多是智商高的? 然后试了下,发现我真菜 自己的思路(失败) 三次称重要获取到12个乒乓球中那个是次品,我想着将12个小球编号,分为四组,每组…

yo!这里是socket网络编程相关介绍

目录 前言 基本概念 源ip&&目的ip 源端口号&&目的端口号 udp&&tcp初识 socket编程 网络字节序 socket常见接口 socket bind listen accept connect 地址转换函数 字符串转in_addr in_addr转字符串 套接字读写函数 recvfrom&&a…

Java入门基础学习笔记2——JDK的选择下载安装

搭建Java的开发环境: Java的产品叫JDK(Java Development Kit: Java开发者工具包),必须安装JDK才能使用Java。 JDK的发展史: LTS:Long-term Support:长期支持版。指的Java会对这些版…

pycharm报错Process finished with exit code -1073740791 (0xC0000409)

pycharm报错Process finished with exit code -1073740791 (0xC0000409) 各种垃圾文章(包括chatgpt产生的垃圾文章),没有给出具体的解决办法。 解决办法就是把具体报错信息显示出来,然后再去查。 勾选 然后再运行就能把错误显示…

MetaRTC-play拉流客户端代码分析

渲染使用opengl,音频播放使用alsa。 当点击播放按钮后,以此调用的类如下,开始建立rtc连接,AV解码,音频渲染,视频渲染。 如果想去除QT,改为cmake工程管理,去掉渲染部分即可。 下方是…

VUE+PrintJS打印-边距设置问题(提供解决方案)

VUE打印我们一般用printJS,虽然它也提供了边距设置,但不管怎么调,感觉都不对,也换其他组件试过,没啥区别,并不能解决问题。 今天又发来个需求,要求设置打印页面的上、下、左、右边距&#xff0…

Linux---vim编辑器(续写)

5. vim正常模式命令集 插入模式 按「i」切换进入插入模式「insert mode」, 按“i”进入插入模式后是从光标当前位置开始输入文件; 按「a」进入插入模式后,是从目前光标所在位置的下一个位置开始输入文字; 按「o」进入插入模式…

从头开始学Spring—01Spring介绍和IOC容器思想

目录 1.Spring介绍 1.1Spring概述 1.2特性 1.3五大功能模块 2.IOC容器 2.1IOC思想 ①获取资源的传统方式 ②反转控制方式获取资源 ③DI 2.2IOC容器在Spring中的实现 ①BeanFactory ②ApplicationContext ③ApplicationContext的主要实现类 1.Spring介绍 1.1Sprin…

Linux系统一步一脚印式学习

Linux操作系统具有许多特点和优势。首先,它是开放源代码的,也就意味着任何人都可以对源代码进行查看和修改。其次,可以同时支持多个用户且可以同时执行多个任务,此外,Linux操作系统也非常稳定和安全。相对于其他操作系…

银川岗位外包有邦芒 让岗位空缺不再成为难题

银川邦芒人力岗位外包服务,专为企业量身定制,涵盖从岗位人员招聘到劳动关系终止的全方位、无风险外包解决方案。借助我们的岗位外包,企业可以在确保用工稳定的同时,将更多资源聚焦于核心业务的发展与创新。 我们提供全面、高效的外…

安全测试|常见SQL注入攻击方式、影响及预防

SQL注入 什么是SQL注入? SQL注入是比较常见的网络攻击方式之一,主要攻击对象是数据库,针对程序员编写时的疏忽,通过SQL语句,实现无账号登录,篡改数据库。 SQL注入简单来说就是通过在表单中填写包含SQL关键…

SSD-60S施耐德电机保护器EOCR-SSD

EOCR主要产品有电子式电动机保护继电器,电子式过电流继电器,电子式欠电流继电器,电子式欠电压继电器,其它保护装置,电流互感器。EOCR-SSD 10-60A电机保护器 系列型号: EOCRSSD-05SEOCRssD-30s EOCRSSD-60SEOCRSSD-0…

Linux文件管理(超详细讲解)

Linux文件管理 一、管理文件1.目录和路径2.目录操作命令3.文件操作命令4.文件内容操作命令 一、管理文件 1.目录和路径 文件与目录简介 文件是Linux操作系统用来存储信息的基本结构,是一组信息的集合。目录是一种特殊的文件,用来保存文件及其相关信息。…

开源即时通讯IM框架 MobileIMSDK v6.5 发布

一、更新内容简介 本次更新为次要版本更新,进行了bug修复和优化升级(更新历史详见:码云 Release Notes、Github Release Notes)。 MobileIMSDK 可能是市面上唯一同时支持 UDPTCPWebSocket 三种协议的同类开源IM框架。轻量级、高…

8种常见的CMD命令

1.怎么打开CMD窗口 步骤1:winr 步骤2:在弹出的窗口输入cmd,然后点击确认,就会出现一个cmd的窗口 2.CMD的8种常见命令 2.1盘符名称冒号 说明:切换盘的路径 打开CMD窗口这里默认的是C盘的Users的27823路径底下&#xf…

基于微信小程序+JAVA Springboot 实现的【网上商城小程序】app+后台管理系统 (内附设计LW + PPT+ 源码+ 演示视频 下载)

项目名称 项目名称: 基于微信小程序的网上商城 项目技术栈 该项目采用了以下核心技术栈: 后端框架/库: Java, SSM框架数据库: MySQL前端技术: 微信开发者工具,微信小程序框架 项目展示 5.1 管理员服务…

Mat: Unknown HPROF Version

问题:Mat 加载 android studio 导出的 hprof 文件失败 原因:android hprof 文件不是标准的 java hprof 文件 解决办法: 使用 android sdk 自带的命令将 hprof 转换成标准的 java hprof

瞬息全宇宙——穿越之旅终极教程,手把手教你做出百万点赞视频

最近一种叫“瞬息全宇宙”的视频火了,抖音一期视频百万赞,各个博主视频都在带瞬息全宇宙这个标签,于是就有很多朋友催我出教程了,在琢磨了几天之后,终于整出来了 教程包含了插件的安装,界面的讲解&#xff…

生产制造行业推拉式生产的复合应用

一、案例分析(汽配行业) 重点: 1. MTO/MTS 与 PUSH/PULL 有关系但是不是充分关系 2. MTO/MTS 是公司经营策略,更多是对市场需求的经营策略,体现在生产时机上的不同,一个是等客户需求,一个是填…

HTML4(三):表单

文章目录 表单1. 基本结构2. 常用表单控件2.1 文本输入框2.2 密码输入框2.3 单选框2.4 复选框2.5 隐藏域2.6 提交按钮2.7 重置按钮2.8 普通按钮2.9 文本域2.10 下拉框2.11 示例 3. 禁用表单控件4. lable标签5. fieldset与legend标签6. 总结 表单 概念:一种包含交互…