基于逻辑回归和支持向量机的前馈网络进行乳腺癌组织病理学图像分类

CNN（卷积神经网络）通过使用反向传播方法来学习特征，这种方法需要大量的训练数据，并且存在梯度消失问题，从而恶化了特征学习。

CNN卷积神经网络

CNN由一个多层神经网络组成，该网络从标记的训练数据集中学习一组卷积滤波器。传统上，滤波器学习是通过迭代优化过程（反向传播算法）来实现的，该算法逐步更新滤波器，直到分类误差达到预定于的阈值。

①难以对大量超参数（层数、滤波器的数量和大小）进行调优；②滤波器学习过程缓慢，并且需要庞大的训练图像数据集；③用于学习滤波器的反向传播算法存在梯度消失问题。

由于组织病理学图像的固有特征（高视觉可变性），最先进的CNN方法需要大量的计算资源，以及可用的标记组织病理学图像数据集的规模较小，仍然存在大量的开放研究领域。

组织病理学图像分类

传统的方法是基于从这些图像中提取的手工特征进行分类，通常提取三种类型的特征：

低级、对象级和高级。

低级特征与纹理、强度和颜色有关；

对象级技术提取组织学对象的形状和形态信息；

高级技术提取组织学对象之间的空间关系。

用于组织病理学图像分类的传统分类方法：支持向量机、随机森林、Adaboost、朴素贝叶斯、集成学习、决策树和KNN分类器。

前向传播方法使用预定义的滤波器或者在模型外部学习的滤波器以前馈方式应用。

两种前馈方法的适用性：卷积逻辑回归网络（CLR）和组织病理学图像的卷积支持向量机网络（CSVM-H），两种方法能够有效地从少量乳腺癌图像中学习表示，减少了全切片组织病理学图像分类中的内存占用。

主要研究内容

采用卷积支持向量机网络对组织病理学图像进行分类
提出了两种基于前向传播卷积网络的组织病理学图像分类方法。使用逻辑回归和支持向量机学习网络中的滤波器
在小型数据集上使用前馈方法优于反向传播

网络的主要模块

滤波器学习、特征提取层、分类层

滤波器学习

滤波器是从输入训练图像提取的补丁中学习的。首先，从训练集中提取p个补丁， $x_{1},x_{2},\dots x_{p}$ 及其对应的标签。补丁大小与目标滤波器大小相同，然后随机选择r个补丁进行滤波器学习。通过最小化目标函数来学习滤波器：

$min_{F,b_{0}}\frac{1}{2}F^{T}F+C\sum_{i=1}^{r}l(F,b_{0};x_{i},y_{i})$

其中C>0为正则化参数，F和 $b_{0}$ 分别为滤波器和偏置，{(xi, yi)}为patch及其标签的集合， $l(F,b_{0};x_{i},y_{i})$ 是损失函数

对于CSVM-H模型

$min_{F,b_{0}}\frac{1}{2}F^{T}F+C\sum_{i=1}^{r}max(1-y(tr(F^{T}x_{i})),0)$

对于CLR模型

$min_{F,b_{0}}\frac{1}{2}F^{T}F+C\sum_{i=1}^{r}log(1+e^{-y_{i}(tr(F^{T}x_{i}))})$

特征提取层

从滤波器学习阶段学习到的滤波器与图像（来自前一层的训练图像或特征映射）进行卷积，然后将ReLU激活函数应用于结果，以处理类的非线性可分性，并强制结果的稀疏性，从而促进泛化，最后加入池化操作，在不丢失重要信息的情况下减小特征映射的大小。然后，引入全局池化层提取最终的特征。

分类层

进行滤波器的学习之后，可以将训练过程应用到分类层。

在此过程中，训练数据集的图像在输入到分类器之前经过两次转换：

①使用学习到的滤波器进行特征提取

②然后进行全局池化以提取判别性高级特征（提取特征图与两种类别之间存在的相关性，避免过拟合）

CSVM-H和CLR的体系结构是基于对几种体系结构的实证分析而选择的，这些体系结构是通过改变以下超参数产生的:(i)网络中的总层数，(ii)过滤器的总数，以及(iii)过滤器的大小。

我们提出了一种基于前馈的CNN方法用于组织病理学图像的分类。该方法在小数据集上优于常用的反向传播方法VggNet-16、ResNet-50。所提出的方法得到的结果总体上优于VggNet-16、CSVM和最先进的方法ResNet-50。我们将我们的结果与最先进的工作进行了比较，并说明了所提出模型的局限性和未来的工作。对于二元分类任务，所提模型获得了最佳的AUC和灵敏度，优于所有其他深度学习模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/802449.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！