乳腺癌诊断的集成自注意力Transformer编码器

ETECADx: Ensemble Self-Attention Transformer Encoder for Breast Cancer Diagnosis Using Full-Field Digital X-ray Breast Images


内科医生和放射科医生建议使用多种方法来发现乳腺癌,包括数字乳房x线摄影(DM)、超声(US)和磁共振成像(MRI)。

CAD系统与乳腺x线影像结合,可提供乳腺密度、形状及肿块、钙化等疑似异常的相关信息。

卷积神经网络(CNN)是最常用的深度学习方法。他们的端到端技术从输入图像中预测有意义和相关的属性。由于CNN技术可以自动从输入图像中提取特征,因此优于传统方法,因此在图像分类研究领域得到了更广泛的应用。

本文提出的是一种基于集成策略的新型CAD系统(计算机辅助诊断系统),以处理输入原始图像的特征提取,并融合集成学习和基于Transformer的方法

 本文使用迁移学习技术来评估六个预训练深度学习模型(即DenseNet201, VGG16, GoogleNet, InceptionResNetV2, Xception和ResNet50网络)在数字x射线乳房x线照片上的效果。

在二分类方法中,DenseNet201、VGG16和InceptionResNetV2作为变压器编码器网络的特征提取器。而在多类方法中使用DenseNet201、VGG16和Xception。

 基于迁移学习技术和CNN的CAD模型被用于从异常图像中识别正常图像,旨在提高分类精度以及训练和检测的速度。

采用均匀流行逼近和投影(UMAP)、主成分分析(PCA)和单变量方法来降低基于CNN的CAD模型的特征维数。可以使用CNN模型进行特征提取,并使用PCA进行特征维数的降维操作。采用主成分分析法后,计算量和执行时间有所降低,但分类性能没有变化。

机器学习中的集成方法

机器学习中的集成方法是一种结合多个单一模型来解决特定问题的技术。继承策略比单个人工智能模型更有能力实现更高的预测精度。

研究人员通常尝试在独特的环境中使用相同的数据集单独优化和微调人工智能模型的权重。然后,使用单个后端数据库结构将训练好的模型融合在一起,以执行测试和验证过程。

基于Vision Transformer的医学图像分类

采用ViT原理对图像进行分类,其中输入图像被分割成固定大小的小块,然后将这些小块线性连接在一起形成一个矢量,并由传统的转换编码器进行处理。

几种简单模型

  1. 我们可以使用CNN模块提取输入图像的局部特征,同时使用ViT模块改进全局特征以识别输入图像中的不同区域。
  2. 基于超声图像和组织病理学数据集的ViT 半监督学习模型 也被用于乳腺癌的分类
  3. 可以使用局部和全局Transformer块对每侧两个视角拍摄的四张乳房X光照片进行建模,然后将这四幅图像组合成一个序列经由全局Transformer,传递到MLP头部进行分类
  4. 基于ResNet50提取的高级深度特征,使用Transformer编码器和多层感知机MLP进行分类
  5. 使用一个DeconvTransformer(DecT)模型,包括一个颜色反卷积作为卷积层对BreakHis数据集收集的组织病理学图像对乳腺癌进行分类。

基于人工智能的集成自注意力Transformer编码器

医疗基准数据收集、预处理、基于最新技术构建所需的AI模型、以及微调、验证和评估预测性能的连续处理阶段。我们使用基准INbreast数据集采用并微调人工智能框架,在证明了分类标签以及乳房病变的轮廓之后,仔细收集私人医学乳房图像并进行注释,以进一步验证和核实。

 预处理步骤需要去除不需要的细节,提高图像质量,图像尺寸调整和强度归一化。在医学研究领域,这种预处理过程可以显著提高诊断准确率。其中最重要的步骤是提取潜在病变感兴趣区域或斑块,有意识地优化适当的输入图像大小,使AI模型能够根据特定和准确的恶性肿瘤区域微调其可训练参数。

数据集

INbreast公共数据集

INbreast共收集了来自115名患者的410张图像,其中包括来自90名双侧乳房受影响的女性的360张图像(左侧和右侧各4张图像,均为CC和MLO视图)。

CC位:上为乳腺外侧,下为乳腺内侧(即可理解为从头侧往下观察乳腺)

MLO位:上为乳腺上方,下为乳腺下方(即可以理解为从斜侧面观察乳腺)

共25例患者进行乳房切除术(单侧两视角)。多种形式的病变,如肿块、钙化和畸形,都包含在数据集中。其中正常、良、恶性病例分别如下图所示

医疗数据预处理

首先,需要准备可训练的乳房图像,为AI分类器去除不需要或无用的信息,提高图像的空间分辨率和质量,并对像素强度进行归一化和调整以适应所有图像的单一灰度范围。

根据患者唯一ID和BI-RADS分类评分0、1、2、3、4、5,将乳房图像从DICOM图像格式转换为“png”格式。“0”分代表正常情况,“1”和“2”分代表良性情况,“3”到“5”分代表恶性情况。

①每个乳腺肿瘤的乳腺病变精确轮廓由放射科专家精确确定,仅基于这些区域而不是使用整个乳房X光片来训练AI模型。

②在图像补丁提取过程之前,所有的乳房X光片都是作为一个完整的全尺寸图像来读取的,没有缩小尺寸,以保持图像的高分辨率。

③提取图像补丁,仅包含乳腺病变的ROI区域,忽略其他背景信息,这是最重要的预处理步骤。使AI模型能够根据准确的恶性肿瘤区域微调其权重,而不是使用整个图像。

④所有提取的补丁块都被调整为512*512的像素,使AI模型能够在相同的图像特征上进行训练,并减少GPU的处理时间,特别是在庞大的数据集上。

提取ROI图像

OpenCV:对图像的位操作icon-default.png?t=N7T8https://blog.csdn.net/weixin_42286660/article/details/124478848从整张乳房x光片中提取的乳房病变ROI的示例

 补丁图像提取

  1. cv2.threshold 函数通过阈值上限和下限应用于输入图像,我们使用二进制Ostu阈值方法作为附加标志传递,其中阈值可以随机选择
  2. cv2.findContours 函数用于查找乳房病变轮廓,第一步分割图像

        cv2.RETR_EXTERNAL:只检索最外层的轮廓

        cv2.CHAIN_APPROX_SIMPLE:压缩水平、垂直和对角方向的轮廓点

        cv2.contourArea() 是 OpenCV 中的一个函数,用于计算轮廓的面积

        cv2.boundingRect 函数提取具有新尺寸 x、y、宽度和高度的边界矩形(如上图C表示)

        最终分割和裁剪的 ROI 用作输入补丁图像来执行本研究的实验。


对于正常情况,乳房X光照片被分割并裁剪成多个512*512像素的块,由于乳房图像位于图像的一侧,而另一侧具有黑色背景。故我们可以逐像素读取图像,如果黑色像素超过整个图像大小的25%,则计算并删除黑色像素。

用于训练、验证和测试的数据准备

数据分为二元分类和多元分类。乳房图像中的70%、20%和10%被随机分为训练集、测试集和验证集。

训练数据增强

训练基于深度学习的模型需要足够大的数据集。在 INbreast 数据集中,每个类别的图像并不平衡。数据分割后,训练数据由25张良性图像和49张恶性图像组成。对于正常情况,我们在这两种方法中都使用整个图像分割过程生成的所有 597 个补丁。将良性训练集垂直翻转到 50张图像,然后通过旋转 45、90、135、180、225、270 和 315 将所有良性和恶性训练集相加。

在二值分类方法中,训练集的总数为1010(418个正常和592个异常);但在多类别分类方法中,总数为1210(418个正常、400个良性和392个恶性)。正常的补丁图像是由原始正常乳房X光照片生成的,不必经过数据增强。

数据增强是针对异常情况进行的,以扩大实例数量并平衡正常和异常情况。避免在可训练参数的训练和优化过程中由于任何类别的大多数样本而产生任何偏差。

集成迁移学习

预测过程最终是通过合并多个不同模型来完成,使得可以利用来自不同分类器的更有用的信息并获得更准确的分类结果。大多数用于乳腺癌预测的深度学习技术依赖于单个卷积网络。

基于连接集成的特征提取策略

对于所提出的集成学习模型,我们结合了 DenseNet201、VGG16 和 InceptionResNetV2 的深度学习特征用于二元方法,而 DenseNet201、VGG16 和 Xception 则结合用于多分类问题。

混合人工智能模型

通过结合不同的基于CNN的模型,集成学习被用作骨干网络提供高级深层功能。为了不采用单一模型,在计算机视觉图像分类中引入融合技术。Vision Transformer主要根据珍贵的、深层派生的敏感特征更精确地诊断对象,而自注意力特征的使用则是因为它们的高性能和减少对视觉特定归纳偏差的需求。

Transformer是一种基于深度学习的方法,使用自注意力来应用各种权重计算编码器-解码器偏置中每个输入数据的重要性。CNN模型仅检查由滤波器大小建立的接收区域中空间相邻像素之间的关联,因此该类模型无法处理远处的像素。

自注意力网络、多线性感知器块和分类层组成了所提出的 Transformer 编码器

自注意力机制负责连接同一输入数据中的各个位置,创建单个输入序列。 SoftMax 函数将缩放后的点积转换为注意力分数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/802602.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习【向量化(array)】

为什么要向量化 在深度学习安全领域、深度学习练习中,你经常发现在训练大量数据时,深度学习算法表现才更加优越,所以你的代码运行的非常快至关重要,否则,你将要等待非常长的时间去得到结果。所以在深度学习领域向量化…

java中使用雪花算法(Snowflake)为分布式系统生成全局唯一ID

(全局唯一ID的解决方案有很多种,这里主要是介绍和学习Snowflake算法) 什么是雪花算法(Snowflake) 雪花算法(Snowflake Algorithm)是由Twitter公司在2010年左右提出的一种分布式ID生成算法&…

有没有寄快递省钱的方法啊,尤其是搬家寄大件?

从大学开始离家,到读研,工作,辗转换了四五个城市了,大大小小搬家十几次,最近才发现有一个宝藏寄快递方法。 个人寄件贵是为什么呢?据我做物流的朋友说一般我们寄快递因为单量少,所以单件价格都…

Windows下Docker安装Kafka3+集群

编写 docker-compose.yaml 主要参照:https://www.cnblogs.com/wangguishe/p/17563274.html version: "3"services:kafka1:image: bitnami/kafka:3.4.1container_name: kafka1environment:- KAFKA_HEAP_OPTS-Xmx1024m -Xms1024m- KAFKA_ENABLE_KRAFTyes- K…

【一】学习TDengine-总结新技术学习的思考

学习TDengine-总结新技术学习的思考 概要 因业务场景需要我们开始接触时序数据库,于是开始根据以往的学习经验着手熟悉这一项新技术,学习也是一种技能,成功的人越容易成功,因为他们掌握了一套成功的方法,这里提到学习经…

windows 线程同步的四种方式总结

一:内核态下的三种同步方式: 一、互斥变量(Mutex) 互斥对象包含一个使用数量,一个线程ID和一个计数器。其中线程ID用于标识系统中的哪个线程当前拥有互斥对象,计数器用于指明该线程拥有互斥对象的次数。 创…

Vue的学习之旅-part5

Vue的学习之旅-part5 虚拟DOM的原理用JS模拟DOM结构 vue的方法、计算属性、过滤器computed:{} 计算属性computed计算属性的完全体computed计算属性和methods方法的区别:过滤器:filters:{ 多个方法 } Vuex 状态管理模式 前几篇博客: Vue的学习之旅-part1 …

【算法】第二篇 大衍数列

导航 1. 简介2. 数列特征3. 代码演示 1. 简介 大衍数列,来源于《乾坤谱》中对易传“大衍之数五十”的推论。主要用于解释中国传统文化中的太极衍生原理。数列中的每一项,都代表太极衍生过程中,曾经经历过的两仪数量总和。是中华传统文化中隐…

A Study of Network Forensic Investgation in Docker Environments文章翻译

A Study of Network Forensic Investgation in Docker Environments Docker环境下的网络取证研究 摘要 网络罪犯利用越来越多的技术(如虚拟机或基于容器的基础设施)进行恶意活动。 这些虚拟环境的固有动态简化了恶意服务的快速创建,并隐藏了所涉及的系统,这是以前没有的技…

用AI作图,使用这个免费网站,快看我画的大鹏鸟和美女

还是大剑师兰特:曾是美国某知名大学计算机专业研究生,现为航空航海领域高级前端工程师;CSDN知名博主,GIS领域优质创作者,深耕openlayers、leaflet、mapbox、cesium,canvas,webgl,ech…

中科院发布大模型想象增强法IAG,无需外部资源,想想就能变强

在人工智能领域,尤其是自然语言处理(NLP)的子领域——问答系统(QA)中,知识的获取和利用一直是推动技术进步的核心问题。近年来,大语言模型(LLMs)在各种任务中展现出了惊人…

风电场智能化转型基于ARM工控机的HDMI数据实时监控显示

全球能源结构不断调整的大背景下,智能电网、太阳能发电、风能发电等清洁能源领域正经历着一场由技术创新引领的深刻变革。在这场变革中,ARM架构的工控机凭借其出色的性能、低功耗及高度可定制化的特点,正在成为能源管理系统的核心组件&#x…

轴向磁通电机应用场景不断扩展 未来市场存在较大开发空间

轴向磁通电机应用场景不断扩展 未来市场存在较大开发空间 根据磁通方向不同,磁通电机分为轴向磁通电机、径向磁通电机两大类,其中轴向磁通电机的磁通方向为轴向,载流导体系径向放置。轴向磁通电机特点在于结构上旋转转子位于定子的侧面&#…

【算法统治世界】动态规划 个人笔记总结

🎉🎉欢迎光临🎉🎉 🏅我是苏泽,一位对技术充满热情的探索者和分享者。🚀🚀 🌟特别推荐给大家我的最新专栏《数据结构与算法:初学者入门指南》📘&am…

面试字节被挂了

分享一个面试字节的经历。 1、面试过程 一面:上来就直接"做个题吧",做完之后,对着简历上一个项目聊,一直聊到最后,还算比较正常。 二面:做自我介绍,花几分钟聊了一个项目&#xff…

数据库入门-----SQL基础知识

目录 📖前言: 📑SQL概述&&通用语法: 🐳DDL: 🐻操作数据库: 🐞数据类型: 🦉操作表: 🦦DML: 语法规则&#x…

浅析安全传输协议HTTPS之“S”

当前互联网,在各大浏览器厂商和CA厂商的推动下,掀起了一股HTTPS应用浪潮。为了让大家更好的了解HTTPS,本文给大家介绍关于HTTPS 中的S一个整体的认识。从其产生的历史背景、设计目标说起,到分析其协议设计结构、交互流程是如何实现…

R语言数据操纵:常用函数

目录 处理循环的函数 lapply函数 apply函数 mapply函数 tapply函数 split函数 排序的函数 sort函数与order函数 总结数据信息的函数 head函数与tail函数 summary函数 str函数 table函数 any函数 all函数 xtab函数 object.size函数 这篇文章主要介绍R语言中处理…

HarmonyOS 开发-一镜到底“页面转场”动画

介绍 本方案做的是页面点击卡片跳转到详情预览的转场动画效果 效果图预览 使用说明 点击首页卡片跳转到详情页,再点击进入路由页面按钮,进入新的路由页面 实现思路 首页使用了一种视觉上看起来像是组件的转场动画,这种转场动画通常是通过…

swiftui macOS实现加载本地html文件

import SwiftUI import WebKitstruct ContentView: View {var body: some View {VStack {Text("测试")HTMLView(htmlFileName: "localfile") // 假设你的本地 HTML 文件名为 index.html.frame(minWidth: 100, minHeight: 100) // 设置 HTMLView 的最小尺寸…