迁移学习在乳腺浸润性导管癌病理图像分类中的应用

1. 引言 

        乳腺癌主要有两种类型:原位癌:原位癌是非常早期的癌症,开始在乳管中扩散,但没有扩散到乳房组织的其他部分。这也称为导管原位癌(DCIS)。浸润性乳腺癌:浸润性乳腺癌已经扩散(侵入)到周围的乳腺组织。侵袭性癌症比原位癌更难治愈。将乳汁输送到乳晕的管道是大多数乳房生长开始的地方(导管癌)。

        在本文中,使用了一组浸润性导管癌(Invasive Ductal Carcinoma, IDC)数据集,它是一种非常常见的癌症类型,比原位癌具有更高的致死性。肿瘤分级是一种常用的疾病侵袭性评估,用于检查浸润性癌症。首先提取乳腺组织的组织病理学斑块特征,在侵入性和非侵入性之间进行类似的兴趣区域匹配,然后进行其分化。各种分级方案对肿瘤分化进行进一步检查,这涉及到病理学家的监督,这可能是劳动密集型的。正确识别恶性肿瘤区域是一项具有挑战性的工作和耗时的工作。

        乳腺癌筛查是通过医生的临床评估和乳房x光摄影或超声成像来完成的。若筛查结果提示有恶性组织生长的可能,则进行体检筛查后再进行乳腺组织活检以最终诊断。活检方法包括收集细胞样本,在显微镜下观察并固定,然后标记。活检的优点是病理学家可以通过组织显微结构的可视化来进行高度准确的诊断。 

        使用CNN作为特征提取网络。CNN是卷积神经网络(convolutional neural networks)的缩写,它在图像patch上使用卷积函数,并使用滤波器来提取图像的特征。卷积操作之后通常是规范化和激活函数,它们堆叠在一起创建具有多层卷积网络的大型体系结构。批处理归一化层尝试将图像像素转换为0到1的范围。网络体系结构中使用的激活函数等待触发特定值,然后通过它传递该值。 

2. 文献综述

        数据集:使用了名为BreaKH的数据集,包含7909张图像,这些图像来自82位患者的良性和恶性乳腺肿瘤信息。数据集包含2480张良性图像和5429张恶性图像,这些图像通过40倍、100倍、200倍和400倍的放大因子获得。

        图像预处理:对所有图像进行了旋转,并向原始数据集中添加了随机图像失真。通过数据增强,数据集的大小增加到11,184张图像,其中3504张是良性的,7680张是恶性的。

        模型:使用基于迁移学习的方法开发的模型,结合了inception v3和传统CNN模型。在500个训练步骤后,获得了0.89的训练准确度。

        性能:恶性类别的曲线下面积(AUC)为0.93,良性类别的AUC也为0.93,截断值为0.4。

        截断值通常指的是用于修正异常值的界值,即将超出正常区间的数据设为正常区间的最大值或最小值。这样做的好处是可以有效地去除异常值对数据分析的干扰,提高分析结果的精确度和可靠性。 


        数据集:使用了两个数据集来比较传统CNN模型的性能。其中一个数据集是乳腺组织病理图像数据集,包含277,524张大小为50x50的RGB图像,其中90,000张图像用于分析,其中65,279张属于类别‘0’,24,781张属于类别‘1’。另一个数据集是乳腺组织学图像数据集,包含5547张图像,其中2788张是IDC(浸润性导管癌),2759张是非IDC。

        模型:用于该研究的模型包括LeNet、AlexNet、VGG 19、VGG 16、ResNet 50、SVM和Twin SVM。

        训练数据:从乳腺组织学图像数据集中选择了4437张图像作为训练数据。


使用胶囊网络(Capsule Network)来识别和分类癌细胞:

        病理图像预处理:首先,对病理图像进行了预处理,包括图像恢复、亮度调整等,以改善图像质量,提高后续分析的准确性。基于图像属性的分割:根据图像的某些属性(如颜色、纹理等)对图像进行分割,将图像中的不同区域(如正常组织、癌细胞等)区分开来。对象定位:通过像素分组的方法,定位图像中的感兴趣对象(如癌细胞)。分类:将处理后的图像分类为四种类型:正常组织、原位癌、良性病变和浸润性癌。

GLCM用于区分正常与异常肿瘤细胞

        GLCM(灰度共生矩阵):一种用于描述图像中灰度级空间分布关系的矩阵。这里,它被用来区分正常和异常的肿瘤细胞。模糊值转换:利用模糊化方法将癌细胞转换为模糊值。模糊化是通过使用如年龄、评分等成员函数来完成的。函数选择:该研究使用了三角形和梯形函数来进行计算。基于知识库的特征提取:使用已知样本的知识库来获取特征。这些特征是基于已知样本的属性和模式来确定的。分类器应用:将经过模糊化和特征提取的图像数据输入到胶囊网络分类器中,以获取癌细胞的类型和阶段。分类数据共享:将最终分类的数据与研究人员共享,以便进行进一步的评估和研究。

3. 方法

3.1 数据集

数据类型与数量

        研究使用了浸润性导管癌(IDC)的组织病理学图像,包括癌症(IDC +ve,即IDC阳性)和非癌症(IDC -ve,即IDC阴性)的样本。总共有277,524个大小为50x50的图像块(patches),其中198,738个是IDC阴性(非癌症),78,786个是IDC阳性(癌症)。

目标类别

        IDC阴性和IDC阳性是研究的两个目标类别,需要预测图像块是否属于这两个类别之一。IDC阴性(非癌症)被标记为类别0,IDC阳性(癌症)被标记为类别1。

数据集不平衡

数据集显示非癌症的图像块数量超过癌症图像块的两倍。

图像块与标签

        每个图像块都与一个患者ID相关联。图像块的标签由专业医生标记为IDC阳性(癌症)或IDC阴性(非癌症)。

图像大小调整

原始图像块的大小是50x50,但在研究中被重新调整为70x70。

数据集划分

        为了训练和测试,数据集被随机分割。不是使用完整的数据集,而是从277,524个图像块中随机抽取了157,572个。这些50x50的图像块被重新调整为70x70的大小。其中75%的数据用于训练,即118,179个图像块是训练样本;25%的数据用于测试,即39,393个图像块是测试样本。

3.2 迁移学习

        使用预训练的系统模型被称为机器学习中的迁移学习,其中知识(特征,权重等)从先前的模型转移到新模型中以增加其预测。 

        CNN模型在解决与图像分类、图像识别、物体检测增强现实等相关的现实问题方面发挥了重要作用。最常见的是效率网、densenet、MobileNet和Resnet。为了解决更具挑战性的计算机视觉问题,在CNN模型中添加更多的层可能是一种选择。但它也有自己的一系列问题,因为训练神经网络的任务可能很繁琐,增加的附加层也会影响性能衡量。

        MobileNet是CNN的一个类。它使用深度可分离卷积。主要用于移动应用程序。与常规网络卷积相比,深度可分离卷积减少了参数的数量。DenseNet是卷积神经结构,也被称为密集连接卷积网络。在这种情况下,前一层的所有输出都作为下一层的输入。EfficientNet 使用复合系数均匀地缩放所有分辨率/宽度/深度维度。复合缩放方法的前提是,随着输入图像变大,网络需要额外的层来增加接受野,需要更多的通道来捕获更大图像上的更细粒度的模式。

3.3 模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/46622.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kafka Producer之幂等性

文章目录 1. 启用幂等性2. 底层变化3. 数据不重复4. 数据有序 幂等性通过消耗时间和性能的方式&#xff0c;解决乱序和重复问题。 但是只能保证同一生产者在一个分区中的幂等性。 1. 启用幂等性 //创建producerHashMap<String, Object> config new HashMap<>();…

怎样在 PostgreSQL 中优化对大表的分区裁剪和索引选择?

&#x1f345;关注博主&#x1f397;️ 带你畅游技术世界&#xff0c;不错过每一次成长机会&#xff01;&#x1f4da;领书&#xff1a;PostgreSQL 入门到精通.pdf 文章目录 怎样在 PostgreSQL 中优化对大表的分区裁剪和索引选择一、分区裁剪&#xff1a;精准切割&#xff0c;提…

【自学安全防御】三、企业双机热备和带宽管理的综合实验

实验拓扑&#xff1a; 实验任务&#xff1a; 12&#xff0c;对现有网络进行改造升级&#xff0c;将当个防火墙组网改成双机热备的组网形式&#xff0c;做负载分担模式&#xff0c;游客区和DMZ区走FW3&#xff0c;生产区和办公区的流量走FW1 13&#xff0c;办公区上网用户限制流…

go-zero框架入门

go-zero框架环境的安装 goctl 若想用go-zero框架&#xff0c;还需要一些前置条件&#xff1a; 安装goctl go install github.com/zeromicro/go-zero/tools/goctllatest可以使用 goctl 命令查看是否安装成功 成功后安装protoc goctl env check --install --verbose --force…

如何免费用java c#实现手机在网状态查询

今天分享手机在网状态查询接口&#xff0c;该接口适用的场景非常广泛&#xff01;首先我们先讲下什么是手机在网状态&#xff1f;简单来说&#xff0c;就是你得手机号是否还在正常使用中&#xff0c;是否能够及时接收和回复信息&#xff0c;是否能够随时接听和拨打电话。如果你…

深度学习根据代码可视化模型结构图的方法

方法1. Netron Netron 是一个支持多种深度学习模型格式的可视化工具&#xff0c;可以将 PyTorch 模型转换为 ONNX 格式&#xff0c;然后使用 Netron 进行可视化。 安装 Netron&#xff1a; pip install netron使用示例&#xff1a; import torch.onnx# 定义模型 model EMA…

趣谈linux操作系统 9 网络系统-读书笔记

文章目录 网络协议栈基础知识回顾网络分层网络分层的目的各层作用简介延伸-ip地址,有类,无类,cidr socket实现分析tcp/udp回顾socket编程回顾TCP编程回顾UDP编程回顾差异 socket相关接口实现浅析sokcet实现解析创建socket的三个参数socket函数定义及其参数创建socket结构体关联…

MYSQL调优详解:案例解析(第40天)

系列文章目录 一、数据库设计优化 二、查询优化 三、架构优化 四、其他优化策略 五、优化案例解析 文章目录 系列文章目录前言一、数据库设计优化二、查询优化三、架构优化四、其他优化策略五、优化案例解析案例一&#xff1a;优化SELECT查询案例二&#xff1a;使用索引案例三…

【TAROT学习日记】韦特体系塔罗牌学习(3)——女祭司 THE HIGH PRIESTESS II

韦特体系塔罗牌学习&#xff08;3&#xff09;——女祭司 THE HIGH PRIESTESS II 目录 韦特体系塔罗牌学习&#xff08;3&#xff09;——女祭司 THE HIGH PRIESTESS II牌面分析1. 基础信息2. 图片元素 正位牌意1. 关键词/句2.爱情婚姻3. 学业事业4. 人际财富5. 其他象征意 逆位…

赛氪网贡献突出受表彰,中国计算机应用大会颁奖盛典

2024年7月17日&#xff0c;第39届中国计算机应用大会&#xff08;CCF NCCA 2024&#xff09;在万众瞩目中隆重举行&#xff0c;期间举办了盛大的颁奖典礼。此次颁奖典礼对中国计算机应用技术大赛的各大赛道进行了表彰&#xff0c;其中包括“CCF CAT全国算法精英大赛”“全国智能…

node-red学习

Node-RED : 起步 1、安装nodejs Node.js — 在任何地方运行 JavaScript 验证 2、更换下载源 // 查看当前下载地址 npm config get registry // 设置淘宝镜像的地址 npm config set registry https://registry.npmmirror.com/ // 查看当前的下载地址 npm config get registry…

CSS-1_0 CSS和文档流

文章目录 CSS和文档流如何证明这个流的存在呢&#xff1f;流和display番外&#xff1a;inline-block 碎碎念 CSS和文档流 首先什么叫流呢&#xff1f; 通常来说&#xff0c;我们最终看到的网页是HTML文档中定义的各个元素挨个输出的结果&#xff0c;这种一个接一个输出的方式…

前端:Vue学习-2

前端&#xff1a;Vue学习-2 1. vue的生命周期2. 工程化开发和脚手架Vue CLI2.1 组件化开发2.2 scoped解决样式冲突2.3 data是一个函数2.4 组件通信2.5 非父子通信- event bus事件&#xff0c;provide&inject 3.v-model原理->实现父子组件双向绑定4. sync 修饰符->实现…

PyTorch垃圾分类任务与垃圾图片数据集

新书速览|PyTorch深度学习与企业级项目实战-CSDN博客 人工智能用于垃圾分类 人工智能用于垃圾分类&#xff0c;业界早有过相关的讨论&#xff0c;主要有三种方案&#xff1a;第一种方案&#xff0c;把垃圾的相关信息制成表格化数据&#xff0c;然后用传统的机器学习方法实现分…

服务客户,保证质量:腾讯云产品的质量实践

分享主题是“服务客户&#xff0c;保证质量”。自从20年开始&#xff0c;我们把质量提升到了一个前所未有的高度。为什么会如此重视质量呢&#xff1f;在竞争激烈和复杂的市场环境中&#xff0c;产品质量对于企业的重要性不言而喻。一旦出现了质量事故&#xff0c;对客户和企业…

PublicCMS:企业级的Java CMS系统

PublicCMS&#xff1a;企业级的Java CMS系统 在当今互联网飞速发展的时代&#xff0c;PublicCMS作为一款功能强大的开源Java CMS系统&#xff0c;为用户提供了全面的建站解决方案。本文将介绍PublicCMS的基本信息、特点以及如何快速部署和使用。 软件简介 PublicCMS是一款现代…

Visual Studio 2022美化

说明&#xff1a; VS版本&#xff1a;Visual Studio Community 2022 背景美化 【扩展】【管理扩展】搜索“ClaudiaIDE”&#xff0c;【下载】&#xff0c;安装完扩展要重启VS 在wallhaven下载壁纸图片作为文本编辑器区域背景图片 【工具】【选项】搜索ClaudiaIDE&#xff…

如何判断c盘d盘e盘哪个是固态硬盘

怎么区分电脑里面的C盘、D 盘、E盘是机械硬盘还是固态硬盘&#xff1f;在电脑里&#xff0c;硬盘是存储数据的核心部件&#xff0c;负责存储操作系统、软件以及用户数据。硬盘的性能也会影响电脑的流畅度。平时我们最常使用的硬盘分为机械硬盘和固态硬盘。在日常使用中&#xf…

Python酷库之旅-第三方库Pandas(032)

目录 一、用法精讲 91、pandas.Series.set_flags方法 91-1、语法 91-2、参数 91-3、功能 91-4、返回值 91-5、说明 91-6、用法 91-6-1、数据准备 91-6-2、代码示例 91-6-3、结果输出 92、pandas.Series.astype方法 92-1、语法 92-2、参数 92-3、功能 92-4、返回…

​1:1公有云能力整体输出,腾讯云“七剑”下云端

【全球云观察 &#xff5c; 科技热点关注】 曾几何时&#xff0c;云计算技术的兴起&#xff0c;为千行万业的数字化创新带来了诸多新机遇&#xff0c;同时也催生了新产业新业态新模式&#xff0c;激发出高质量发展的科技新动能。很显然&#xff0c;如今的云创新已成为高质量发…