Co-assistant Networks for Label Correction论文速读

文章目录

  • Co-assistant Networks for Label Correction
    • 摘要
    • 方法
      • Noise Detector
      • Noise Cleaner
      • 损失函数
    • 实验结果

Co-assistant Networks for Label Correction

摘要

  1. 问题描述

    • 描述医学图像数据集中存在损坏标签的问题。
    • 强调损坏标签对深度神经网络性能的影响。
  2. 提出方法

    • 引入Co-assistant Networks for Label Correction (CNLC)框架。
    • 描述框架的两个模块:噪声检测器和噪声清洗器。
    • 解释噪声检测器和噪声清洗器的功能。
  3. 优化算法设计

    • 描述新的双层优化算法,用于优化提出的目标函数。
  4. 实验设计

    • 描述实验中使用的三个流行医学图像数据集。
    • 说明实验的设置和评估标准。
  5. 实验结果

    • 展示对比实验结果,证明CNLC框架相对于最先进方法的优越性能。

代码地址

方法

在这里插入图片描述
Fig. 1: 所提出的CNLC框架的架构包括两个模块,即噪声检测器和噪声清洗器。噪声检测器输出所有训练样本的嵌入,并将每个类别的训练样本分为三个子组,包括干净样本、不确定样本和损坏样本。噪声清洗器为每个类别构建一个GCN,用于纠正所有类别的损坏样本和一部分不确定样本的标签。

Noise Detector

目前的检测方法设计损失较小的样本被视为干净样本,而损失较大的样本被视为损坏样本。

本文噪声检测器包括两个步骤,即CNN和标签划分,将每个类别的所有训练样本划分为三个子组,即干净样本、不确定样本和损坏样本

首先采用带有交叉熵损失的CNN作为骨干网络来获得所有训练样本的损失。由于交叉熵损失在没有额外抗噪声项的情况下很容易对损坏标签进行过度拟合,将其改为以下抗噪声损失:
在这里插入图片描述
b b b 是每个批次中的样本数量, p i t [ j ] p^t_{i}[j] pit[j] 表示第 t t t个时期中第 i i i 个样本的第 j j j 类预测, y ~ i ∈ { 0 , 1 , . . . , C − 1 } \tilde{y}_i \in \{0, 1, ..., C - 1\} y~i{0,1,...,C1} 表示第 i i i 个样本 x i x_i xi 的损坏标签, C C C 表示类别数, λ ( t ) \lambda(t) λ(t) 是与时间相关的超参数。在公式(1)中,第一项是交叉熵损失。第二项是抗噪声损失,旨在平滑模型参数的更新,从而在一定程度上防止模型对损坏标签过度拟合。

Noise Cleaner

在这里插入图片描述
噪声清洗器旨在纠正具有损坏标签的样本的标签。目前的方法通常使用深度神经网络(如CNN和MLP)来进行标签纠正,但存在两个问题:一是忽略了样本之间的关系,二是样本数量有限。为了解决这些问题,该研究采用了半监督学习方法,为每个类别使用一个GCN来保持样本的局部拓扑结构,并包括三个组件:噪声率估计、基于类别的GCNs和损坏标签修正。

每个基于类别的GCN的输入包括标记样本和未标记样本。标记样本包括正样本(即该类别的干净样本,标签为新标签 z i c = 1 z_{ic} = 1 zic=1和负样本(即该类别的损坏样本,标签为新标签 z i c = 0 z_{ic} = 0 zic=0)。
未标记样本包括来自所有类别的不确定样本子集和其他类别的损坏样本。我们遵循一个原则来为每个类别选择不确定样本,即在公式(1)中损失越高,样本属于损坏样本的概率越高。此外,不确定样本的数量由噪声率估计确定。在噪声率估计中,使用由两个高斯模型组成的高斯混合模型(GMM)来估计训练样本的噪声率。

如图2所示,损坏样本的高斯模型的均值大于干净样本的高斯模型的均值。因此,均值较大的高斯模型可能是损坏标签的曲线。基于此,给定GMM模型对于第 i 个样本的两个输出,分别为具有较大均值和较小均值的输出,分别表示为 M i , 1 M_{i,1} Mi,1 M i , 2 M_{i,2} Mi,2,因此以下定义 v i v_i vi 用于确定第 i 个样本是否为噪声:
在这里插入图片描述
训练样本的噪声率 r r r 计算公式为:
在这里插入图片描述

n n n 代表训练数据集中样本的总数。假设第 c c c 类中样本的数量为 s c s_c sc,每个类别的不确定样本数量为 s c × r − n 1 s_c \times r - n_1 sc×rn1。因此,噪声清洗器中每个类别的未标记样本总数为 n × r − n 1 n \times r - n_1 n×rn1

给定 2 × n 1 2 \times n_1 2×n1 个标记样本和 n × r − n 1 n \times r - n_1 n×rn1 个未标记样本,每个类别的基于类别的GCN进行半监督学习,以预测 n × r n \times r n×r个样本,包括 n × r − n 1 n \times r - n_1 n×rn1 个未标记样本和 n 1 n_1 n1 个此类别的损坏样本。半监督损失 L ssl L_{\text{ssl}} Lssl 包括用于标记样本的二元交叉熵损失 L bce L_{\text{bce}} Lbce 和用于未标记样本的无监督损失 L mse L_{\text{mse}} Lmse,即 L ssl = L bce + L mse L_{\text{ssl}} = L_{\text{bce}} + L_{\text{mse}} Lssl=Lbce+Lmse

其中 L bce L_{\text{bce}} Lbce L mse L_{\text{mse}} Lmse 定义为:
在这里插入图片描述
q i c t q^t_{ic} qict表示第 t t t个时期中第 i i i个样本对于类 c c c的预测。

在损坏的标签校正中,给定C的GCN以及不确定样本子集和所有损坏样本的每个类的相似性分数,它们的标签可以通过以下方式确定:
在这里插入图片描述

损失函数

在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/830914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot指标监控

一.SpringBoot指标监控_添加Actuator功能 Spring Boot Actuator可以帮助程序员监控和管理SpringBoot应用,比如健康检查、内存使用情况统计、线程使用情况统计等。我 们在SpringBoot项目中添加Actuator功能,即可使用Actuator监控 项目,用法如…

使用YALMIP定义LMI,SEDUMI求解矩阵方程

YALMIP(Yet Another MATLAB Package for Modeling and Optimization)是一个MATLAB工具箱,用于定义和求解优化问题,包括线性矩阵不等式(LMI)问题。SEDUMI是一个用于求解LMI问题的求解器,它可以与…

Vitis HLS 学习笔记--S_AXILITE 寄存器及驱动

目录 1. 简介 2. S_AXILITE Registers 寄存器详解 2.1 “隐式”优势 2.2 驱动程序文件 2.3 硬件头文件 2.4 硬件头文件中 SC/COR/TOW/COH 的解释 2.5 驱动控制过程 3. 总结 1. 简介 回顾此博文《Vitis HLS 学习笔记--Syn Report解读(1)-CSDN博…

瘦身秘籍:如何使用 PyInstaller 打造超小型 Python 可执行文件

你是否曾经尝试过将你的 Python 程序打包成一个可执行文件,却发现生成的文件大得惊人?别担心,本文将教你如何使用 PyInstaller 尽可能减小生成的 onefile 大小,让你的程序轻盈如风! 1. 使用虚拟环境 首先&#xff0c…

Python 与 TensorFlow2 生成式 AI(二)

原文:zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者:飞龙 协议:CC BY-NC-SA 4.0 第四章:教授网络生成数字 在前一章中,我们涵盖了神经网络模型的构建基块。在这一章中,我们的第一个项目…

电商技术揭秘四十一:电商平台的营销系统浅析

相关系列文章 电商技术揭秘相关系列文章合集(1) 电商技术揭秘相关系列文章合集(2) 电商技术揭秘相关系列文章合集(3) 文章目录 引言一、用户画像与精准营销用户画像与精准营销的概念用户画像在精准营销中…

正则表达式.java

目录 1.1 正则表达式的概念及演示 正则表达式的作用: 1.2 正则表达式-字符类 1.3 正则表达式-逻辑运算符 1.4 正则表达式-预定义字符 1.5 正则表达式-数量词 1.6 正则表达式练习1 1.7 正则表达式练习2 小结 : ①可以校验字符串是否满足一定的规…

免费通配符证书的申请指南——从申请到启动https

如果您的网站拥有众多二级子域名,那么通配符证书证书是最好的选择。 免费通配符申请流程如下: 1 创建证书服务商账号 首先选择一个提供免费通配符的服务商,打开国产服务商JoySSL官网,创建一个账号(注册账号时填写注册…

Android创建快捷方式到桌面

效果图 参考 https://blog.51cto.com/u_16175498/8811197https://blog.51cto.com/u_16175498/8811197 权限 <uses-permission android:name"com.android.launcher.permission.INSTALL_SHORTCUT" /> 实现 if (Build.VERSION.SDK_INT > Build.VERSION_C…

GPG的使用

这里写自定义目录标题 安装加密程序生成加密密钥怎么备份自己的密钥就可以使用公钥加密邮件信息了 安装加密程序 下载gpg4win&#xff1a; https://www.gpg4win.org/index.html 免费的&#xff0c;如果使用的是苹果电脑&#xff0c;使用https://gpgtools.org/。 如果是linux&a…

Python 与 TensorFlow2 生成式 AI(四)

原文&#xff1a;zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 第九章&#xff1a;文本生成方法的崛起 在前几章中&#xff0c;我们讨论了不同的方法和技术来开发和训练生成模型。特别是在第六章“使用 …

vue3 依赖-组件tablepage-vue3 项目公共配置封装

github求⭐ 可通过github 地址和npm 地址查看全部内容 vue3 依赖-组件tablepage-vue3说明文档&#xff0c;列表页快速开发&#xff0c;使用思路及范例-汇总 vue3 依赖-组件tablepage-vue3说明文档&#xff0c;列表页快速开发&#xff0c;使用思路及范例&#xff08;Ⅰ&#…

【C++】匿名对象超详细详解(什么是匿名对象?对象可以是哪些类型呢?)

目录 一、前言 二、匿名对象的概念详解 &#x1f95d; 语法结构 &#x1f34d;概念理解 三、匿名对象的对象类型 四、匿名对象的使用 &#x1f347;简单场景的使用 &#x1f349;复杂场景的使用 五、总结 六、共勉 一、前言 在C中&#xff0c;匿名对象&#xff08;Ano…

一文解决ArcGIS生成点和管段 含案例讲解

背景 在工作中&#xff0c;我们经常遇到要将坐标数据导入 GIS&#xff0c;生成点位&#xff0c;若是地理坐标系&#xff08;经纬度&#xff09;&#xff0c;那么直接用 arcgis或者QGIS 导入数据就行了&#xff0c;可实际中总会遇到各种问题&#xff1a; 坐标数据集为大地 200…

如何使用Go语言进行基准测试(benchmark)?

文章目录 一、基准测试的基本概念二、编写基准测试函数三、运行基准测试四、优化代码性能五、注意事项总结 在Go语言中&#xff0c;基准测试&#xff08;benchmark&#xff09;是一种评估代码性能的有效方式。通过基准测试&#xff0c;我们可以测量代码执行的时间、内存使用情况…

【Linux】详解core dump文件的作用以及用法ubuntu20.04下无法形成core dump文件的解决办法

说明 从第三大点开始讲解ubuntu20.04下无法形成core dump文件的解决办法。 一、core与term的区别 在之前讲过的信号中&#xff0c;终止进程的信号的动作分为两种&#xff0c;一种是core&#xff0c;一种是term。term&#xff08;全称termination&#xff09;是直接终止进程&am…

C++ string类

目录 0.前言 1.为什么学习string类 1.1 C语言字符串的局限性 1.2 C string类的优势 2.标准库中的string类 2.1 字符串作为字符序列的类 2.2 接口与标准容器类似 2.3 基于模板的设计 2.4 编码和字符处理 3.string类的常用接口说明 3.1构造函数 3.1.1默认构造函数 3…

GPU 架构与 CUDA 关系 并行计算平台和编程模型 CUDA 线程层次结构 GPU 的算力是如何计算的 算力峰值

GPU 架构与 CUDA 关系 本文主要包含 NVIDIA GPU 硬件的基础概念、CUDA(Compute Unified Device Architecture)并行计算平台和编程模型,详细讲解 CUDA 线程层次结构,最后将讲解 GPU 的算力是如何计算的,这将有助于计算大模型的算力峰值和算力利用率。 GPU 硬件基础概念GP…

Django后台项目开发实战二

我们的需求是开发职位管理系统 三个功能&#xff1a; 管理员发布职位候选人能浏览职位用户能投递职位 第二阶段 创建应用 jobs&#xff0c;实现职位数据的建模 python manage.py startapp jobs 然后再 setting .py 注册应用&#xff0c;只需添加应用名称到最后一行 INST…

实验报告5-Spring MVC实现页面

实验报告5-SpringMVC实现页面 一、需求分析 使用Spring MVC框架&#xff0c;从视图、控制器和模型三方面实验动态页面。模拟实现用户登录&#xff0c;模拟的用户名密码以模型属性方式存放在Spring容器中&#xff0c;控制器相应用户请求并映射参数&#xff0c;页面收集用户数据或…