6.7.13 MV-Swin-T:使用多视图 SWIN 变压器进行乳房 X 光检查分类

传统的乳腺癌分类深度学习方法主要集中在单视图分析上。然而,在临床实践中,放射科医生会同时检查乳房 X 线摄影检查中的所有视图,利用这些视图中固有的相关性来有效检测肿瘤。

在本文中,我们提出了一种完全基于 Transformer 的创新多视图网络,以解决乳房 X 线摄影图像分类中的挑战。我们的方法引入了一种新颖的基于移位窗口的动态注意块促进了多视图信息的有效整合,并促进了这些信息在空间特征图级别视图之间的连贯传输。此外,我们使用 CBIS-DDSM 和 Vin-Dr Mammo 数据集,对基于 Transformer 的模型在不同环境下的性能和有效性进行了全面的比较分析。

1. 引言

早期检测主要依赖于筛查乳房 X 线摄影,包括四张图像——每侧乳房两张,从不同角度拍摄:从侧面拍摄的内外斜向 (MLO) 和从上方拍摄的头尾 (CC)。虽然传统的乳腺癌分类深度学习方法侧重于单视图分析,但放射科医生会同时评估乳房 X 线摄影检查中的所有视图,识别出提供关键肿瘤信息的有价值的相关性。

利用深度神经网络 (DNN) 将多种视角整合到乳腺癌筛查中的努力源于 Carneiro 等人的工作 [5]。在 MLO 和 CC 视图上分别训练模型,然后使用最终全连接层的特征来训练多项逻辑回归模型。在一项平行工作中,Sridevi 等人在 [6] 中提出了一种利用 CC 和 MLO 视图的分类策略。方法包括初始图像规范化、胸肌去除,以及随后通过卷积层和池化层进行特征提取,并将提取的特征连接起来。在 [7] 中,Khan 等人介绍了一种两阶段分类策略,涉及使用从四个乳房 X 光检查视图中提取的 ROI。各种 CNN 被用作特征提取器,并使用早期融合策略将从所有视图中提取的特征连接起来,最终通过分类器层得到输出。


近年来,注意力机制因其广泛的应用而成为深度学习的核心概念。在此背景下,注意力机制的目标是使模型能够选择性地关注相关的局部输入区域和特征通道,从而避免对所有位置和特征一视同仁。在医学图像分析中,诊断通常取决于特定的孤立关注区域,最近的研究探索了将注意力机制整合到多视角乳房 X 线摄影分析中。        Transformer 固有的自注意力机制使模型能够动态地辨别要关注的位置和内容,利用相关的图像区域或特征来增强任务性能。借助自注意力,视觉 Transformer [8] 擅长捕捉输入序列中的长距离依赖关系。


尽管 Transformer 在建模长距离依赖性方面具有明显的前景,但它们在多视图乳房 X 线照片分析中的应用仍然是一个相对未知的领域。 例如 [9],采用了结合 Transformer 和 CNN 的混合模型,引入了全局跨视图 Transformer 块来合并 CC 和 MLO 视图的中间特征图。

另一项值得注意的工作是 [10],它采用了基于 Transformer 的模型进行乳腺癌片段检测。然而,在网络的后期处理多视图,错失了捕捉视图之间局部相关性的机会,并且缺乏公开数据集上的结果,从而限制了与现有文献的可比性。

1.1 文献贡献

为了充分利用多视图洞察,提出了一种基于 Transformer 的新型多视图网络 MV-Swin-T,该网络基于 Swin Transformer [11] 架构构建

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/25882.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用docker-compose搭建达梦数据库主备集群

目录 1. Docker集群的搭建 2. 检查主备数据库 3. 主备集群的JDBC连接设置 1. Docker集群的搭建 达梦的镜像文件都是tar文件,通过docker load命令导入: docker load -i dm8_20240422_x86_rh6_64_rq_ent_8.1.3.140.tar 成功导入后,可看到…

Flutter娱乐与休闲类APP常用的第三方库总汇

Flutter娱乐与休闲类APP常用的第三方库总汇 娱乐与休闲类APP为用户提供了丰富的放松和娱乐方式,包括游戏、音乐、视频、阅读等多种形式。Flutter作为一个高效的跨平台移动应用开发框架,为这类应用的开发提供了强大的支持。本文将汇总Flutter娱乐与休闲类…

机器学习笔记——支持向量机

支持向量机 参数模型对分布需要假设(这也是与非参数模型的区别之一)间隔最大化,形式转化为凸二次规划问题 最大化间隔 间隔最大化是意思:对训练集有着充分大的确信度来分类训练数据,最难以分的点也有足够大的信度将…

68. UE5 RPG 处理多个角色后续bug

我们现在已经有了四个敌人角色,接下来,处理一下在战斗中遇到的问题。 处理角色死亡后还会攻击的问题 因为我们有角色溶解的效果,角色在死亡以后的5秒钟才会被销毁掉。所以在这五秒钟之内,角色其实还是会攻击。主要时因为AI行为树…

AI 大模型重点行业应用情况

1、AI 大模型重点行业应用情况总览 AI大模型将率先在互联网办公、金融等数字化程度较高的行业快速渗透,医疗、交通、 制造等行业的潜在渗透空间大。 2、AI 大模型在金融行业应用情况 金融行业的应用场景丰富,是最早进行数字化转型的机构,因此…

一文了解SpringBoot

1 springboot介绍 1)springboot是什么? Spring Boot是一个用于简化Java应用程序开发的框架。它基于Spring框架,继承了Spring框架原有的优秀特性,比如IOC、AOP等, 他并不是用来代替Spring的解决方案,而是和Spring框架紧密结合,进一步简化了Spring应用的整个搭建和开发过程…

angular2开发知识点

目录 文章目录 一、API 网关地址 配置二、服务注册使用三、模块组件注册使用四、html中style类动态绑定1. 单个类的绑定:[class.special]"isSpecial"2. 多个类的绑定:[ngClass]"{selected:status ,saveable: this.canSave,}"3. 单个…

Python中管理内存?

在Python中管理内存是一个重要但通常对开发者而言较为透明的主题,因为Python提供了自动内存管理功能,如垃圾回收机制,以简化内存管理的复杂性。然而,对于大型项目或需要优化性能的场景,理解Python的内存管理机制以及如…

LLM Algorithms(1): Flash Attention

目录 Background Flash Attention Flash Attention Algorithm 参考 NIPS-2022: Flash Attention: Fast and Memory-Efficient Exact Attention with IO-Awareness idea:减少资源消耗,提升或保持模型性能。普通attention的空间复杂度是 --》降低到F…

数据结构复习笔记

简答题 (3) 顺序表和链表的概念及异同 顺序表: 把逻辑上相邻的结点储存在物理位置上的相邻储存单元中,结点的逻辑关系由储存单元的邻接关系来体现.链表: 逻辑上相邻的结点存储再物理位置上非连续非顺序的存储单元中, 结点的逻辑关系由指向下一个结点的指针确保.相…

抓包工具 HttpAnalyzerFull_V7.6.4 的下载、安装、使用

目录 一、简介二、下载和安装三、如何注册四、使用介绍4.1 开始、停止、清空监控内容4.2 筛选监控内容4.3 监控内容显示 一、简介 Http Analyzer 是一款功能强大的数据包分析工具,它可以实时监控服务器返回的消息,支持64位Windows系统,可以同…

python中的进度条工具tqdm详解

tqdm 是 Python 中一个非常流行的进度条工具,常用于长时间运行的任务,如数据处理、训练机器学习模型等。tqdm 的主要优点是易用性和功能丰富,可以在多种场景下使用。下面是 tqdm 的详细介绍及一些常见用法示例: 安装 首先&#…

JUC-并发编程22-ThreadLocal、InheritableThreadLocal与TransmittableThreadLocal

目录 概述 1. ThreadLocal 基本原理 使用示例 局限性 2. InheritableThreadLocal 基本原理 使用示例 局限性 3. TransmittableThreadLocal 基本原理 使用示例 核心机制 TransmittableThreadLocal的源码分析 核心代码示例 4. 使用框架提供的上下文传递功能 示例…

kaggle竞赛实战9——模型融合

有三种方法, 第一种:均值融合,代码如下 data pd.read_csv(\ result/submission_randomforest.csv\ ) data[randomforest] data[target].values temp pd.read_csv(\ result/submission_lightgbm.csv\ ) …

C++必修:探索C++的内存管理

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:C学习 贝蒂的主页:Betty’s blog 1. C/C的内存分布 我们首先来看一段代码及其相关问题 int globalVar 1; static…

华为OD刷题C卷 - 每日刷题 19(查找接口成功率最优时间段、最大N个数与最小N个数的和)

1、(查找接口成功率最优时间段): 这段代码是解决“查找接口成功率最优时间段”的问题。它提供了一个Java类Main,其中包含main方法和getResult方法,以及一个辅助方法getSum,用于找出数组中最长的时间段&…

微信小程序毕业设计-网吧在线选座系统项目开发实战(附源码+论文)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:微信小程序毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计…

力扣 T62 不同路径

题目 连接 思路 思路1 &#xff1a; BFS爆搜 class Solution { public:queue<pair<int,int>>q;int uniquePaths(int m, int n) {q.push({1,1}); // 起始位置vector<pair<int, int>> actions;actions.push_back({0, 1}); // 向下actions.push_bac…

ant-desigin-vue动态表头并填充数据

ant-design-vue 是一个基于 Ant Design 设计规范和 Vue.js 的 UI 组件库。如果你想在 ant-design-vue 中实现动态表头并填充数据&#xff0c;你可以使用 a-table 组件并动态生成其 columns 和 dataSource 属性。 以下是一个简单的示例&#xff0c;展示了如何动态生成表头和填充…

【网络编程开发】11.IO模型 12.IO多路复用

11.IO模型 什么是IO: IO 是 Input/Output 的缩写&#xff0c;指的是输入和输出。在计算机当中&#xff0c;IO 操作通常指将数据从一个设备或文件中读取到计算机内存中&#xff0c;或将内存中的数据写入设备或文件中。这些设备可以包括硬盘驱动器、网卡、键盘、屏幕等。 通常用…