深度学习的舌象诊断:从舌头上了解系统性疾病!

首先

深度学习算法能否解决东方医学中依靠医生经验的诊断问题?而要实现这个目标,需要什么呢?

用舌头诊断被称为口腔健康的指标,但在东方医学中,舌头也被用来评估全身的状况。换句话说,通过分析舌头的图像,不仅可以发现特定的疾病,还可以同时发现多种疾病。因此,通过提取医生的经验作为特征和学习模型来普及非语言知识的深度学习的引入备受关注。另一方面,有人指出,这些舌象存在一个问题,就是这些舌象有冗余,无法从图像中把握整体特征。

在这项工作中,使用高方差和局部响应归一化来实现多尺度特征分析。所提出的方法可以学习高层次的特征,提供更多的分类信息。因此,它达到了很高的分类性能。

什么是东方医学、中医和舌诊?

东方医学是以中药、针灸为主的东方传统医学。西医是直接用药物或手术治疗身体不好的部分,而东方医学的目的是着眼于整个身体,而不是只治疗不好的部分,方法有针灸、中医等。此外,它还有自己的"密约"概念。"密约"的意思是还没有生病,但还没有健康,目的是防止因疲劳和积累的抵抗力而引起的疾病。

东方医学的诊断方法有"四诊",其中"望闻问切"是从面部表情、外貌等外在特征来把握身体状态的。其中,舌诊可以从舌头的状态中把握身体的状态,以无创的方式高准确度地找出病症点。千百年来,中医通过观察舌头的颜色、形状和质地来判断患者的健康状况。

但是,这种诊断方法主要是根据医生的经验,有主观的一面,所以很难向陌生人推广诊断方法。在此背景下,利用深度学习积累舌头图像并提取特征以简化诊断方法,受到了人们的关注。

传统方法的问题

虽然已经提出了很多基于颜色、形状、纹理等单一特征的模型,并取得了很好的效果,但这些模型只使用了低级特征,很难获得一定的表现力。特别是在舌头图像的异常检测中,需要整个图像的特征来获得高性能。因此,在检测舌头图像的异常时,提取多方面的综合特征,并将这些特征进行高精度整合的方法被认为是有效的。在我们之前的研究-PCANet中,我们从舌头图像中提取了这样复杂的特征。它基于PCA算法和CNN,可以适用于各种数据和任务,微调所需参数少。此外,据报道,当与机器学习分类算法相结合时,它在分类任务中表现良好。据报道,当与机器学习分类算法如K-最近邻(KNN)、SVM和随机森林(RF)相结合时,它的表现也很好。

另一方面,这种方法有两个问题:“数据处理的冗余"和"处理有偏差的样本时不准确”。关于前者,由于PCA的特性,特征值容易膨胀,导致复杂特征图的数据冗余。此外,PCANet假设样本的分布是很均衡的,数据集中的样本数量很大,所以它可能不能很好地应对不均衡的样本。

本研究的目的

在这项工作中,我们解决了这些问题,并提出CHDNet从舌头图像中提取合适的复合整体特征。它是一种监督学习模型,从无监督的临床数据中学习有用的特征,并利用获得的特征学习如何将患者的健康状态分为正常和异常。

本文提出的探索正常和异常舌头图像特征表示的方法采用了四个关键要素:非线性变换、多尺度特征分析、高方差和局部归一化。该方法可以为预测具有偏态分布的健康状况提供稳健的特征表示。

技巧

建议的方法

对于每张图像,我们从图像中去除背景,提取舌体,并应用CHDNet学习图1中正常和异常舌体的特征。然后将图像归一化为一定的高度和重量。

然后将舌头图像分为训练轮和测试轮,并训练卷积核来生成特征表示,将舌头样本分为正常或异常,并对k-folds交叉验证进行评估,对相应的k轮得到的结果进行平均。

本建议有四个重要内容高分散处理实现了每个特征图中的特征分布无冗余的特性。在对局部响应进行归一化和高分散处理后,不同特征图中同一位置的特征仍有冗余。这样我们就可以解决这个问题。

非线性变换层,主成分分析主要集中在线性分类上,所以存在因冗余而降低精度的问题。特别是当它们被用作不平衡数据的异常检测特征时,这个问题就会出现。为了解决这一问题,引入非线性分析,采用多尺度特征分析,提取精度较高的特征。此外,为了提高对变形的响应,在高方差和局部响应归一化之前,引入多尺度特征分析。

CHDNet由三部分组成:PCA滤波器卷积层、非线性变换层和特征池层,如图2所示。

非线性变换

在这一层,除了传统的批量转换过程和PCA转换外,还进行了非线性转换,以减少PCA分类中出现的冗余。在这个PCA过程中,对每幅图像应用非线性,以消除以下方程线性变换中的检测精度的粗糙。

其中T为图像,C1为第一主成分,a和ε为超参数。

此外,由于tanh(x)用于特征的卷积层,存在负值,这与视觉系统的原理相矛盾。因此,在每个卷积层后增加一个非线性变换层,其效果是将这个负值作为噪声处理。

功能池

除上述非线性变换外,该层的其他功能还包括"直方图–将像素转换为[0,255]的整数"、“多尺度特征分析–将每个直方图中的图像按分辨率汇总为特征”、“高方差–避免退化状态,增加特征间的竞争”、“局部响应归一化–不同的特征。在地图中同一位置的每个特征之间进行归一化处理,以防止冗余”。通过对输入图像进行这一系列处理,正常和异常特征比以前的方法更加突出。转化公式请参考论文。

实验准备

共收集医院267名胃炎患者和48名健康志愿者的315张图片。在特征提取步骤的训练阶段,随机选取40个正常对象和44个异常对象作为训练集,约占总图像的26.67%,用于训练卷积核和确定参数。然后,学习的内核和参数被用于提取其余231个样本的特征。结果平均为10次,交叉验证运行5次。为了评价所提出的方法和传统方法的性能,几个评价指标(精度。灵敏度、特异性、准确性和回收率)。

结果

与传统方法的比较

本次评估的目的是确定所提出的方法与之前的方法PCANet相比是否提高了性能。在本次评估中,我们使用LIBLINEAR SVM作为分类器。

结果表明,提出的高分散(HD)、局部响应归一化(LRN)、多尺度特征分析(MFA)和非线性变换(NT)的组合与PCANet相比,提高了识别率:从84.77%提高到91.44%(约7%)。另外,在样品不平衡方面,所提出的方法使灵敏度略有下降,但特异性有所提高。

分类器的比较

本次评估的目的是确定哪个分类器在检测异常图像时表现最好。

我们比较了使用LIBLINEAR SVM和其他分类器–LDA、KNN、CART、GBDT和RF作为分类器代替LIBSVM的CHDNet的性能–当样本数远小于特征数时,LIBLINEAR SVM的性能优于LIBSVM。比特征数更多–当样本数远小于特征数时,LIBLINEAR SVM的表现比LIBSVM更好。样本数为315个,每个样本中的特征数为43008个,说明LIBLINEAR SVM表现较好。

从精度、特异性、准确度、召回率和F1得分来看,LIBLINEAR SVM的整体性能在下表6种分类器中是最好的,精度91.14%–比LDA高6.24%。同时,与基于距离的模型和树形结构模型相比,特异性从3%提高到25%。通过对比可以看出,参数最优的SVM分类器的性能优于其他方法.LIBLINEAR SVM方法的性能准确率提高到91.14%,在其他分类器中是最好的。

考虑

舌象是东方医学的诊断标准之一,曾有可能无创评估整体身体状况,识别身体疾病。然而,传统模型存在着冗余性和对有偏差样本的检测精度低的问题(特别是在检测异常图像时)。在本研究中,我们提出了一种利用CHDNet这种高度分布式的模型,提取适当的特征进行图像异常检测的模型。评价结果表明,该模型的性能高于传统模型。

但我对此事的看法是这样的。

首先,不清楚为什么选择Linear SVM作为分类器,SVM通常使用RBF内核,但当需要快速计算处理海量数据时,就会使用Linear。作者解释说,原因是特征数远大于样本数,发现Linear的精度高于SVM-RBF内核的精度。不过,造成这一结果的原因没有告诉大家,也不清楚原因。

引入所提出的方法特有的非线性变换的下一个原因是卷积层的tanh(x)中存在负值,但不清楚是否考虑了其他方法,例如,使用ReLU激活函数。在图像分析领域,可以想象,激活函数可以用来剔除负值。在图像分析领域,可以设想使用激活函数:ReLU来处理负值的噪声,但没有明确说明不使用它的原因(或不能引入它),有人认为应该明确说明像现在这样的非线性变换比ReLU函数更有意义这一点。

结论

在本文中,我们提出了一种使用无监督特征学习方法进行舌头图像分类的新型框架。它使用CHDNet通过学习特征来训练一个加权的LIBLINEAR SVM分类器来检测异常患者。实验结果表明,与其他方法相比,我们的新框架和加权LIBLINEAR SVM的组合具有最好的预测性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/27208.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【leetcode--单词规律】

题目要求: 跟上一个字符串的思路一致,只是要进行单词的拆分,用.split()函数即可。 class Solution:def wordPattern(self, pattern: str, s: str) -> bool:word s.split()if(len(pattern) ! len(word)):return Falsereturn len(set(patt…

火爆全网《pvz植物大战僵尸杂交版》最新安装包,支持Android、Windows、iOS!

我是阿星,今天跟大家聊聊最近在B站火得一塌糊涂的老游戏——《植物大战僵尸》。你没听错,就是那个曾经让我们熬夜奋战,一关又一关的游戏。 话说回来,这游戏怎么就突然又火起来了呢? 原来,是因为它的最新整…

关于2024年第一批计算机程序设计员(Python)四级、三级职业技能等级证书认证考试的通知

计算机程序设计员(Python)详细介绍 报名详细信息: 报名截止时间:2024年6月05日 ~ 2024年6月18日 准考证下载时间:2023年6月24日 ~ 6月28日 考试时间:2024年6月29日 四级:08:30~12:30&#…

除了广告和卖货,还有这12种盈利方式

如何让产品赚得更多的钱是永恒的话题,产品的盈利方式也层出不穷。目的是让我们的产品走向商业化,达到变现,不断地更新迭代,发展下去。 本文介绍了产品的12种盈利方式:延迟、便利、图像清晰度、界面、操作速度、灵活性、…

【CS.AL】算法复杂度分析 —— 渐进符号表示法

文章目录 1 概述2 渐进符号详解2.1 大O符号(O)2.2 Ω符号(Ω)2.3 Θ符号(Θ)2.4 o符号(o)2.5 ω符号(ω) 3 具体例子3.1 插入排序(Insertion Sort…

【论文阅读】《Sketch and Refine: Towards Fast and Accurate Lane Detection》

Abstract 车道检测是指确定道路上车道的精确位置和形状。尽管目前的方法已经做出了努力,但由于现实世界场景的复杂性,这仍然是一项具有挑战性的任务。无论是基于建议的方法还是基于关键点的方法,现有方法都无法有效、高效地描绘车道。基于建…

程序猿大战Python——容器——知识补充

字典遍历方法 目标:了解遍历字典的遍历方法。 当要遍历字典的元素内容,即获取字典的键、值。 常用方法: 函数名含义keys()以列表的形式,返回一个字典所有的键。values()以列表的形式,返回一个字典所有的值。items()返…

C++11初始化列表打包器initializer_list

有时我们无法提前知道应该向函数传递几个实参。为了编写能处理不同数量实参的函数我们使用initializer_list Cplusplus中的定义: 其里面有三个成员函数 也就是说他是支持迭代器的,支持迭代器就支持范围for 图像理解 函数类型 void Test1_initializer_li…

在微信小程序中安装和使用vant框架

目录 1、初始化项目2、安装vant相关依赖3、修改 app.json4、修改 project.config.json5、构建npm6、使用示例 本文将详细介绍如何在微信小程序中安装并使用vant框架~ 开发工具:微信开发者工具 1、初始化项目 从终端进入小程序项目目录,执行…

JDK8时间类,时区,时间和格式化

一.时间类 二.获取所有的时区 1.获取所有的时区Set<String> zoneIds ZoneId.getAvailableZoneIds();System.out.println(zoneIds.size()); 根据打印的结果可以看到java类中一共有603个时区。 三.获取当前系统默认的时区 ZoneId zoneId ZoneId.systemDefault();Syste…

linux搭建harbor镜像仓库

安装docker-compose&#xff1a;安装docker-compose_安装 docker-compose-CSDN博客 安装harbor&#xff0c;我安装的是v2.4.3 #下载安装包 wget https://github.com/goharbor/harbor/releases/download/v2.4.3/harbor-offline-installer-v2.4.3.tgz#解压 tar -zxvf harbor-off…

618全面开战,抖音电商头部品牌罗拉密码突然“不干”了?

前言&#xff1a; 随着618电商大战的硝烟渐浓&#xff0c;各大电商平台纷纷摩拳擦掌&#xff0c;准备在这场年度购物盛宴中大展拳脚。然而&#xff0c;在这热闹非凡的氛围中&#xff0c;一个熟悉的名字却显得格外低调——罗拉密码。作为抖音电商领域的头部品牌&#xff0c;罗拉…

文心智能体体验,打造你自己的GPTs应用

利用百度智能体搭建的《RPG冒险游戏大作战》已经发布啦&#xff01; RPG冒险游戏大作战 玩家扮演一位小小勇士女孩&#xff0c;从被巨龙毁灭的冒险小镇出发&#xff0c;一路披荆斩棘&#xff0c;集齐四件神器后&#xff0c;打败巨龙&#xff0c;夺回小镇的安宁&#xff01; 整…

常见机器学习的原理及优略势

有监督 一、线性回归&#xff08;Linear Regression) 1. 算法原理 线性回归&#xff08;Linear Regression&#xff09;是一种基本的回归算法&#xff0c;它通过拟合一个线性模型来预测连续型目标变量。线性回归模型的基本形式是&#xff1a;y w1 * x1 w2 * x2 … wn * …

Java_中间件——Redis

Redis 介绍&#xff1a; Redis是一个基于内存的key-value结构数据库&#xff08;MySQL是通过数据文件方式存储在磁盘上&#xff0c;数据结构是二维表&#xff09; 特点&#xff1a; 更改配置文件&#xff1a; 使用密码&#xff1a; redis默认是不需要密码的&#xff0c;如果…

2024全国大学生信息安全竞赛(ciscn)半决赛(华南赛区)Pwn题解

前言 找华南赛区的师傅要了一份半决赛的Pwn题&#xff0c;听说只有一道题。 题目很简单&#xff0c;可以申请任意大小chunk&#xff0c;并存在UAF、DoubleFree漏洞。 还给了后门函数&#xff0c;不过限制是edit只能写8字节的数据到chunk中。 MyHeap 逆向分析 拖入IDA分析…

Linux--MQTT简介

一、简介 MQTT &#xff08; Message Queuing Telemetry Transport&#xff0c;消息队列遥测传输&#xff09;&#xff0c; 是一种基于客户端服务端架构的发布/订阅模式的消息传输协议。 与 HTTP 协议一样&#xff0c; MQTT 协议也是应用层协议&#xff0c;工作在 TCP/IP 四…

计算机系统的主要概念

这篇文章通过研究“hello&#xff0c;world”这个简单程序的生命周期来介绍计算机系统的主要概念。 1. 信息就是位 上下文 我们以 hello 程序为例&#xff0c;在 linux 系统中&#xff0c;我们编辑文本文件 hello.c&#xff0c;使用编译器将其编译成可执行的 源程序&#xf…

收银系统源码-千呼新零售2.0【连锁店财务管理】

千呼新零售2.0系统是零售行业连锁店一体化收银系统&#xff0c;包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体&#xff0c;线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货等连锁店使用。 详细介绍请查看下…