Co-assistant Networks for Label Correction论文速读

文章目录

  • Co-assistant Networks for Label Correction
    • 摘要
    • 方法
      • Noise Detector
      • Noise Cleaner
      • 损失函数
    • 实验结果

Co-assistant Networks for Label Correction

摘要

  1. 问题描述

    • 描述医学图像数据集中存在损坏标签的问题。
    • 强调损坏标签对深度神经网络性能的影响。
  2. 提出方法

    • 引入Co-assistant Networks for Label Correction (CNLC)框架。
    • 描述框架的两个模块:噪声检测器和噪声清洗器。
    • 解释噪声检测器和噪声清洗器的功能。
  3. 优化算法设计

    • 描述新的双层优化算法,用于优化提出的目标函数。
  4. 实验设计

    • 描述实验中使用的三个流行医学图像数据集。
    • 说明实验的设置和评估标准。
  5. 实验结果

    • 展示对比实验结果,证明CNLC框架相对于最先进方法的优越性能。

代码地址

方法

在这里插入图片描述
Fig. 1: 所提出的CNLC框架的架构包括两个模块,即噪声检测器和噪声清洗器。噪声检测器输出所有训练样本的嵌入,并将每个类别的训练样本分为三个子组,包括干净样本、不确定样本和损坏样本。噪声清洗器为每个类别构建一个GCN,用于纠正所有类别的损坏样本和一部分不确定样本的标签。

Noise Detector

目前的检测方法设计损失较小的样本被视为干净样本,而损失较大的样本被视为损坏样本。

本文噪声检测器包括两个步骤,即CNN和标签划分,将每个类别的所有训练样本划分为三个子组,即干净样本、不确定样本和损坏样本

首先采用带有交叉熵损失的CNN作为骨干网络来获得所有训练样本的损失。由于交叉熵损失在没有额外抗噪声项的情况下很容易对损坏标签进行过度拟合,将其改为以下抗噪声损失:
在这里插入图片描述
b b b 是每个批次中的样本数量, p i t [ j ] p^t_{i}[j] pit[j] 表示第 t t t个时期中第 i i i 个样本的第 j j j 类预测, y ~ i ∈ { 0 , 1 , . . . , C − 1 } \tilde{y}_i \in \{0, 1, ..., C - 1\} y~i{0,1,...,C1} 表示第 i i i 个样本 x i x_i xi 的损坏标签, C C C 表示类别数, λ ( t ) \lambda(t) λ(t) 是与时间相关的超参数。在公式(1)中,第一项是交叉熵损失。第二项是抗噪声损失,旨在平滑模型参数的更新,从而在一定程度上防止模型对损坏标签过度拟合。

Noise Cleaner

在这里插入图片描述
噪声清洗器旨在纠正具有损坏标签的样本的标签。目前的方法通常使用深度神经网络(如CNN和MLP)来进行标签纠正,但存在两个问题:一是忽略了样本之间的关系,二是样本数量有限。为了解决这些问题,该研究采用了半监督学习方法,为每个类别使用一个GCN来保持样本的局部拓扑结构,并包括三个组件:噪声率估计、基于类别的GCNs和损坏标签修正。

每个基于类别的GCN的输入包括标记样本和未标记样本。标记样本包括正样本(即该类别的干净样本,标签为新标签 z i c = 1 z_{ic} = 1 zic=1和负样本(即该类别的损坏样本,标签为新标签 z i c = 0 z_{ic} = 0 zic=0)。
未标记样本包括来自所有类别的不确定样本子集和其他类别的损坏样本。我们遵循一个原则来为每个类别选择不确定样本,即在公式(1)中损失越高,样本属于损坏样本的概率越高。此外,不确定样本的数量由噪声率估计确定。在噪声率估计中,使用由两个高斯模型组成的高斯混合模型(GMM)来估计训练样本的噪声率。

如图2所示,损坏样本的高斯模型的均值大于干净样本的高斯模型的均值。因此,均值较大的高斯模型可能是损坏标签的曲线。基于此,给定GMM模型对于第 i 个样本的两个输出,分别为具有较大均值和较小均值的输出,分别表示为 M i , 1 M_{i,1} Mi,1 M i , 2 M_{i,2} Mi,2,因此以下定义 v i v_i vi 用于确定第 i 个样本是否为噪声:
在这里插入图片描述
训练样本的噪声率 r r r 计算公式为:
在这里插入图片描述

n n n 代表训练数据集中样本的总数。假设第 c c c 类中样本的数量为 s c s_c sc,每个类别的不确定样本数量为 s c × r − n 1 s_c \times r - n_1 sc×rn1。因此,噪声清洗器中每个类别的未标记样本总数为 n × r − n 1 n \times r - n_1 n×rn1

给定 2 × n 1 2 \times n_1 2×n1 个标记样本和 n × r − n 1 n \times r - n_1 n×rn1 个未标记样本,每个类别的基于类别的GCN进行半监督学习,以预测 n × r n \times r n×r个样本,包括 n × r − n 1 n \times r - n_1 n×rn1 个未标记样本和 n 1 n_1 n1 个此类别的损坏样本。半监督损失 L ssl L_{\text{ssl}} Lssl 包括用于标记样本的二元交叉熵损失 L bce L_{\text{bce}} Lbce 和用于未标记样本的无监督损失 L mse L_{\text{mse}} Lmse,即 L ssl = L bce + L mse L_{\text{ssl}} = L_{\text{bce}} + L_{\text{mse}} Lssl=Lbce+Lmse

其中 L bce L_{\text{bce}} Lbce L mse L_{\text{mse}} Lmse 定义为:
在这里插入图片描述
q i c t q^t_{ic} qict表示第 t t t个时期中第 i i i个样本对于类 c c c的预测。

在损坏的标签校正中,给定C的GCN以及不确定样本子集和所有损坏样本的每个类的相似性分数,它们的标签可以通过以下方式确定:
在这里插入图片描述

损失函数

在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/830914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot指标监控

一.SpringBoot指标监控_添加Actuator功能 Spring Boot Actuator可以帮助程序员监控和管理SpringBoot应用,比如健康检查、内存使用情况统计、线程使用情况统计等。我 们在SpringBoot项目中添加Actuator功能,即可使用Actuator监控 项目,用法如…

使用YALMIP定义LMI,SEDUMI求解矩阵方程

YALMIP(Yet Another MATLAB Package for Modeling and Optimization)是一个MATLAB工具箱,用于定义和求解优化问题,包括线性矩阵不等式(LMI)问题。SEDUMI是一个用于求解LMI问题的求解器,它可以与…

2024年五一数学建模竞赛赛题浅析-助攻快速选题

题目 复杂性 技术需求 数据处理需求 主要难点 综合评估 A题 高 优化算法、图论、启发式搜索 几何数据解析和路径计算 设计有效的路径优化算法来最小化空程,处理几何布局的复杂性 2 B题 非常高 网络流优化、线性/非线性规划 大规模网络数据处理和流量…

GPT每日面试题—csrf攻击的原理和解决方案

充分利用ChatGPT的优势,帮助我们快速准备前端面试。今日问题:csrf原理和解决方案? Q:如果在前端面试中,被问到csrf原理和解决方案,怎么回答比较好,全面具体的描述一下 A:在前端面试中&#xf…

Vitis HLS 学习笔记--S_AXILITE 寄存器及驱动

目录 1. 简介 2. S_AXILITE Registers 寄存器详解 2.1 “隐式”优势 2.2 驱动程序文件 2.3 硬件头文件 2.4 硬件头文件中 SC/COR/TOW/COH 的解释 2.5 驱动控制过程 3. 总结 1. 简介 回顾此博文《Vitis HLS 学习笔记--Syn Report解读(1)-CSDN博…

瘦身秘籍:如何使用 PyInstaller 打造超小型 Python 可执行文件

你是否曾经尝试过将你的 Python 程序打包成一个可执行文件,却发现生成的文件大得惊人?别担心,本文将教你如何使用 PyInstaller 尽可能减小生成的 onefile 大小,让你的程序轻盈如风! 1. 使用虚拟环境 首先&#xff0c…

Python 与 TensorFlow2 生成式 AI(二)

原文:zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者:飞龙 协议:CC BY-NC-SA 4.0 第四章:教授网络生成数字 在前一章中,我们涵盖了神经网络模型的构建基块。在这一章中,我们的第一个项目…

电商技术揭秘四十一:电商平台的营销系统浅析

相关系列文章 电商技术揭秘相关系列文章合集(1) 电商技术揭秘相关系列文章合集(2) 电商技术揭秘相关系列文章合集(3) 文章目录 引言一、用户画像与精准营销用户画像与精准营销的概念用户画像在精准营销中…

正则表达式.java

目录 1.1 正则表达式的概念及演示 正则表达式的作用: 1.2 正则表达式-字符类 1.3 正则表达式-逻辑运算符 1.4 正则表达式-预定义字符 1.5 正则表达式-数量词 1.6 正则表达式练习1 1.7 正则表达式练习2 小结 : ①可以校验字符串是否满足一定的规…

免费通配符证书的申请指南——从申请到启动https

如果您的网站拥有众多二级子域名,那么通配符证书证书是最好的选择。 免费通配符申请流程如下: 1 创建证书服务商账号 首先选择一个提供免费通配符的服务商,打开国产服务商JoySSL官网,创建一个账号(注册账号时填写注册…

Android创建快捷方式到桌面

效果图 参考 https://blog.51cto.com/u_16175498/8811197https://blog.51cto.com/u_16175498/8811197 权限 <uses-permission android:name"com.android.launcher.permission.INSTALL_SHORTCUT" /> 实现 if (Build.VERSION.SDK_INT > Build.VERSION_C…

Apktool 反编译、修改、重打包学习使用及问题处理

反编译 $ apktool d app.apk -r --only-main-classes -o destDir d 表示反编译 app.apk 是目标apk文件路径-r 表示不反编译资源文件 --only-main-classes 表示不反编译某些资源文件目录下的dex文件&#xff0c;这些dex文件通常是被加固的dex.-o 反编译后代码存放目录 修改 …

GPG的使用

这里写自定义目录标题 安装加密程序生成加密密钥怎么备份自己的密钥就可以使用公钥加密邮件信息了 安装加密程序 下载gpg4win&#xff1a; https://www.gpg4win.org/index.html 免费的&#xff0c;如果使用的是苹果电脑&#xff0c;使用https://gpgtools.org/。 如果是linux&a…

中建三局,宁德时代,金证科技,途游游戏,得物,蓝禾,顺丰,康冠科技24春招内推

中建三局&#xff0c;宁德时代&#xff0c;金证科技&#xff0c;途游游戏&#xff0c;得物&#xff0c;蓝禾&#xff0c;顺丰&#xff0c;康冠科技24春招内推 ①得物 【岗位】技术&#xff0c;设计&#xff0c;供应链&#xff0c;风控&#xff0c;产品&#xff0c;运营&#xf…

Python 与 TensorFlow2 生成式 AI(四)

原文&#xff1a;zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 第九章&#xff1a;文本生成方法的崛起 在前几章中&#xff0c;我们讨论了不同的方法和技术来开发和训练生成模型。特别是在第六章“使用 …

vue3 依赖-组件tablepage-vue3 项目公共配置封装

github求⭐ 可通过github 地址和npm 地址查看全部内容 vue3 依赖-组件tablepage-vue3说明文档&#xff0c;列表页快速开发&#xff0c;使用思路及范例-汇总 vue3 依赖-组件tablepage-vue3说明文档&#xff0c;列表页快速开发&#xff0c;使用思路及范例&#xff08;Ⅰ&#…

常用网络知识点(网管网工需掌握)

前言 最近在学习网络方面的内容时&#xff0c;看到很多知识点重复出现&#xff0c;不管在任何地方都能利用&#xff0c;我也就加班整理出一份针对于网络管理员/网络工程师等从业网络方面的知识点汇总 有需要的可以点赞搜藏慢慢看&#xff01;后续还会更新常见配置命令 BGP BGP…

【C++】匿名对象超详细详解(什么是匿名对象?对象可以是哪些类型呢?)

目录 一、前言 二、匿名对象的概念详解 &#x1f95d; 语法结构 &#x1f34d;概念理解 三、匿名对象的对象类型 四、匿名对象的使用 &#x1f347;简单场景的使用 &#x1f349;复杂场景的使用 五、总结 六、共勉 一、前言 在C中&#xff0c;匿名对象&#xff08;Ano…

一文解决ArcGIS生成点和管段 含案例讲解

背景 在工作中&#xff0c;我们经常遇到要将坐标数据导入 GIS&#xff0c;生成点位&#xff0c;若是地理坐标系&#xff08;经纬度&#xff09;&#xff0c;那么直接用 arcgis或者QGIS 导入数据就行了&#xff0c;可实际中总会遇到各种问题&#xff1a; 坐标数据集为大地 200…

《大数据最全面试题-Offer直通车》目录

大数据时代已经到来&#xff0c;数据科学家、大数据工程师、数据分析师等岗位成为了热门职业。如果你正准备面试&#xff0c;想要脱颖而出&#xff0c;那么《大数据最全面试题-Offer直通车》是你的不二选择。 本书汇集了多篇超过1万字的精华内容&#xff0c;包括程序员入职新公…