MTANet: 多任务注意力网络,用于自动医学图像分割和分类| 文献速递-深度学习结合医疗影像疾病诊断与病灶分割

Title

题目

MTANet: Multi-Task Attention Network for Automatic Medical Image Segmentation and Classification

MTANet: 多任务注意力网络,用于自动医学图像分割和分类

01

文献速递介绍

医学图像分割和分类是当前临床实践中的两个关键步骤,其准确性主要取决于个别临床医生的专业知识。计算机辅助诊断(CAD)系统在医学图像诊断中受到广泛关注,旨在帮助临床医生以更准确和客观的方式进行诊断决策。近年来,基于机器学习特别是深度学习的方法,在包括医学图像分割和分类在内的许多医学图像任务中取得了显著进展。

卷积神经网络(CNNs)在许多医学图像分割任务中取得了显著成功。特别是,UNet通过端到端的像素级预测在医学图像分割方面取得了重大突破。UNet引入的编码器和解码器之间的跳跃连接将低分辨率特征融入高分辨率特征中,以提高分割能力。受到UNet成功的启发,近年来大多数领先的模型都建立在UNet架构的基础上,包括ResUNet、DenseUNet、UNet++、DoubleUNet、集成学习等。

然而,这些方法主要集中在医学对象的整个区域,对于检测小的医学对象的敏感性较低。注意力机制在transformer模型成功应用后引起了广泛关注。注意力机制不使用所有可用特征,而是选择一部分相关的感知信息来检测显著特征。在自然场景图像分割网络取得成功后,注意力机制被引入到许多医学图像分割工作中,如Focus UNet、MedT、TransUNet和UACANet等。这些方法在医学分割任务上表现出色,但很少考虑解码器中的高分辨率特征和编码器与解码器之间的连接。

此外,基于transformer的架构已经在语义分割任务中展示了最先进的性能。受到Vision Transformer-based方法(VIT)的发展启发,最近的transformer-based骨干网络在性能上已经达到或超过了基于CNN的骨干网络。

Abstract

摘要

Medical image segmentation and classifica**tion are two of the most key steps in computer-aidedclinical diagnosis. The region of interest were usuallysegmented in a proper manner to extract useful featuresfor further disease classification. However, these methodsare computationally complex and time-consuming. In thispaper, we proposed a one-stage multi-task attention network (MTANet) which efficiently classifies objects in animage while generating a high-quality segmentation maskfor each medical object. A reverse addition attention modulewas designed in the segmentation task to fusion areas inglobal map and boundary cues in high-resolution features,and an attention bottleneck module was used in the classification task for image feature and clinical feature fusion.We evaluated the performance of MTANet with CNN-basedand transformer-based architectures across three imagingmodalities for different tasks: CVC-ClinicDB dataset forpolyp segmentation, ISIC-2018 dataset for skin lesion segmentation, and our private ultrasound dataset for liver tumorsegmentation and classification. Our proposed model outperformed state-of-the-art models on all three datasets andwas superior to all 25 radiologists for liver tumor diagnosis.

医学图像分割和分类是计算机辅助临床诊断中最关键的两个步骤。通常需要以适当的方式对感兴趣的区域进行分割,以提取有用的特征进行进一步的疾病分类。然而,这些方法在计算上非常复杂且耗时。在本文中,我们提出了一种一阶段多任务注意力网络(MTANet),旨在高效地对图像中的对象进行分类,并生成每个医学对象的高质量分割掩膜。在分割任务中,我们设计了逆加注意力模块,用于融合全局地图中的区域和高分辨率特征中的边界线索;在分类任务中,采用了注意力瓶颈模块,用于图像特征和临床特征的融合。我们使用基于CNN和Transformer的架构在三种成像模态下评估了MTANet的性能:CVC-ClinicDB数据集用于息肉分割,ISIC-2018数据集用于皮肤病变分割,以及我们的私有超声数据集用于肝肿瘤分割和分类。我们的模型在所有三个数据集上均优于现有模型,并在肝肿瘤诊断方面优于所有25名放射科医生。

Method

方法

Figure 2 showed the overview of the proposed MTANetwhich used a reverse addition attention module with a parallel partial decoder in the decoder of basic UNet model toobtain more high-resolution features for segmentation branchand attention bottleneck modules in the fully connectedlayers to fusion image feature and clinical feature for classification branch. Each component will be introduced asfollows.

图2显示了提出的MTANet的概述,该网络在基本UNet模型的解码器中使用了逆加注意力模块和并行部分解码器,以获取更多用于分割分支的高分辨率特征,并在全连接层中使用了注意力瓶颈模块来融合图像特征和临床特征用于分类分支。接下来将分别介绍每个组件。

Conclusion

结论

In conclusion, we proposed an end-to-end one-stage network MTANet for automatic medical image analysis. Reverseaddition attention module was designed to fusion areas inglobal map and boundary cues in high-resolution features,and an attention bottleneck module was introduced to balancethe clinical features and image features. Both CNN-based andtransformer-based architectures were proposed. Experimentson three datasets of different imaging modalities demonstratedthe capability of the proposed MTANet.

综上所述,我们提出了一种端到端的一阶段网络MTANet,用于自动医学图像分析。我们设计了逆加注意力模块,用于融合全局地图中的区域和高分辨率特征中的边界线索,同时引入了注意力瓶颈模块来平衡临床特征和图像特征。我们提出了基于CNN和基于transformer的架构。在不同成像模态的三个数据集上的实验表明了MTANet的能力。

Figure

图片

Fig. 1. Flowchart shows patient enrollment process.

图1. 流程图展示了患者入组过程。

图片

Fig. 2. Overview of the proposed MTANet.

图2. 提出的MTANet的概述

图片

Fig. 3. Qualitative segmentation results for automatic medical image segmentation. Green lines denote the ground truth while red lines denote thepredicted results of our model.

图3. 自动医学图像分割的定性结果展示。绿线表示地面真实结果,红线表示我们模型的预测结果。

图片

Fig. 4. Struction of models. Model-I denotes the single classification network. Model-II denotes the two-stage classification network. Model-IIIdenotes our one-stage classification network.

图4. 模型结构。Model-I 表示单一分类网络。Model-II 表示两阶段分类网络。Model-III 表示我们的一阶段分类网络。

图片

Fig. 5. ROC curves of our model and radiologists. (a) validation cohort; (b) testing cohort; (c-d) reader study.

Fig. 5. 我们模型和放射科医生的ROC曲线。(a) 验证队列; (b) 测试队列; (c-d) 读者研究。

Table

图片

TABLE I basic characteristics of the patients in the each cohort

表格 I每个队列患者的基本特征

图片

TABLE II  ablation study for segmentation

表格 II分割的消融研究

TABLE III  performance comparison for polyp segmentation on the CVC-ClinicDB dataset with respect to existing methods

表格 III 在CVC-ClinicDB数据集上针对现有方法进行息肉分割的性能比较

图片

TABLE IV performance comparison for lesion boundary segmentation from ISIC-2018 dataset with respect to existing methods

表格 IV 在ISIC-2018数据集上针对现有方法进行病变边界分割的性能比较

图片

TABLE V   performance comparison for lesion boundary segmentation from ultrasound dataset with respect to existing methods

表格 V在超声数据集上针对现有方法进行病变边界分割的性能比较

图片

TABLE VI  ablation study for classification

表格 VI分类的消融研究

图片

TABLE VIIperformance comparison for liver tumor classification from ultrasound dataset with respect to existing methods

表格 VII 针对超声数据集进行肝肿瘤分类的性能比较

图片

TABLE VIII performance comparison for liver tumor classification from ultrasound dataset with respect to radiologists

表格 VIII 针对超声数据集进行肝肿瘤分类与放射科医生的性能比较

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/29001.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Springboot3+自动装配

导言:这里主要讲述springboot3以后spring.factories功能失效,带来的解决办法。 之前有一次希望用springboot模块拿到工具模块的配置configuration的时候,想通过之前的spring.factories来实现自动装配,但是发现一直拿不到配置&…

数据仓库与数据挖掘(期末复习)

数据仓库与数据挖掘(期末复习) ETL的含义Extract 、 Transformation、Load。 ODS的全称Operational Data Store。 DW全称 Data Warehourse DM全称是Data Mart 数据仓库数据抽取时所用到技术是增量、全量、定时、调度 STAGE层作用是提供业务系统数据…

全国各区县地区生产总值数据(GDP及人均生产总值),精度超高 区县级数据

数据名称: 全国各区县地区生产总值数据 数据格式: shpexcel 数据几何类型: 面 数据精度:区县 数据坐标系: WGS84 数据来源:网络公开数据 数据可视化.

稳了?L3规模化落地在即,激光雷达公司成首批赢家

作者 | 芦苇 编辑 | 德新 在中国,距L3级自动驾驶的规模化落地,又近了一步。 随着国内试点政策刷新,越来越多的车企在部分市域获得了自动驾驶测试牌照,能上路测试的L3级自动驾驶车辆正在快速增加。 其中一个重要节点是&#xf…

C语言最终文章-二叉树

文章目录 前言二叉树的性质二叉树的存储方式顺序存储堆及其应用TopK问题堆排序 链式存储二叉树的练习1.二叉树查找值为x的节点2.判断是否为完全二叉树LC226.翻转二叉树[LC572. 另一棵树的子树](https://leetcode.cn/problems/subtree-of-another-tree/description/)两道选择题 …

目标检测:IOU

IOU(Intersection over Union)交并比: 它计算的是“预测的边框”和“真实的边框”的交叠率,即它们的交集和并集的比值。这个比值用于衡量预测边框与真实边框的重叠程度,从而评估目标检测的准确性。 在目标检测任务中…

嵌入式操作系统_2.嵌入式操作系统的一般架构

1.嵌入式操作系统的概念 嵌入式操作系统通常由硬件驱动程序、调式代理、操作系统内核、文件系统和可配置组件等功能组成,并为应用软件提供标准的API(Application Programming Interface)接口服务。 2.一般嵌入式操作系统的体系结构 从嵌入…

深度神经网络——什么是NLP(自然语言处理)?

自然语言处理(NLP) 是对使计算机能够处理、分析、解释和推理人类语言的技术和工具的研究和应用。 NLP 是一个跨学科领域,它结合了语言学和计算机科学等领域已建立的技术。 这些技术与人工智能结合使用来创建聊天机器人和数字助理,…

海成蜘蛛池广州官网下载

baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? 当我们给自己的泛目录设置仅蜘蛛抓取生成缓存的时候,我们需要模拟蜘蛛抓取测试我们的设置是否成功。绝大部分时候我们都使用网页蜘蛛模拟抓取测…

2024.618到底买什么数码值得?带你一起来看看!

在618期间,这些新品可能会有特别的优惠活动,包括但不限于折扣、满减、赠品等。因此,如果你正在寻找一款适合自己的数码产品,不妨关注各大电商平台的618促销活动,把握机会,以优惠的价格购买到心仪的产品。 …

文件操作(1)(C语言版)

前言: 为什么要学习文件操作: 1、如果大家写过一些代码,当运行结束的时候,这些运行结果将不复存在,除非,再次运行时这些结果才能展现在屏幕上面,就比如之前写过的通讯录。 现实中的通讯录可以保…

【数据结构初阶】--- 堆

文章目录 一、什么是堆?树二叉树完全二叉树堆的分类堆的实现方法 二、堆的操作堆的定义初始化插入数据(包含向上调整详细讲解)向上调整删除堆顶元素(包含向下调整详细讲解)向下调整返回堆顶元素判断堆是否为空销毁 三、…

一个开源的快速准确地将 PDF 转换为 markdown工具

大家好,今天给大家分享的是一个开源的快速准确地将 PDF 转换为 markdown工具。 Marker是一款功能强大的PDF转换工具,它能够将PDF文件快速、准确地转换为Markdown格式。这款工具特别适合处理书籍和科学论文,支持所有语言的转换,并…

2024年最佳插电式混合动力电动汽车

对电动汽车充满好奇和环保意识的司机们还没有准备好跨入纯电动汽车,他们可以找到一个折衷方案,即插电式混合动力车。 在过去的16年里,我一直在把握汽车行业的脉搏。试驾数百辆汽车、电动汽车、插电式混合动力车,跟踪汽车行业的新闻…

DAY04 HTMLCSS

文章目录 一 表单(1) 数字控件(2) 颜色控件(3) 日期控件(4) 月份控件(5) 星期控件(6) 搜索控件(7) 范围控件 二 浮动框架三 结构化标签四 CSS1 CSS概述2 CSS的编写位置1. inline style 行内样式2. inner style 内部样式3. outer style 外部样式4. 小结 3 CSS选择器1. 通用选择器…

一个示例学习C语言到汇编层面

给出以下代码 #include<stdio.h> int main() {int x 0, y 0, z 0;while (1) {x 0;y 1;do {printf("%d\n", x);z x y;x y;y z;} while (x < 255);}return 0; }我们把这个程序编写成32位程序&#xff0c;然后我们放入IDA中进行分析 .text:0080187…

Mysql开启查询日志(General Log)

1、增加配置&#xff1a; /etc/my.cnf [mysqld] general_log1 general_log_file/var/log/mysql/query.log 2、增加目录和文件&#xff0c;并且授权 可以使用以下命令修改权限&#xff1a; 创建目录&#xff1a;sudo mkdir -p /var/log/mysql 更改目录所有者&#xff1a;sudo…

【日常记录】【插件】prisma 链接MySQL数据库 简单入门

文章目录 1、新建项目&#xff0c;使用prisma链接数据库1.1、先创建一个项目1.2、初始化 npm 配置文件及下载依赖1.3、初始化TS配置文件1.4、初始化 prisma1.5、更改 prisma/schema.prisma1.6 更改.env 文件1.7 编写 prisma/schema.prisma1.8 将编写的 prisma/schema.prisma 映…

OSPF被动接口配置(华为)

#交换设备 OSPF被动接口配置 一、基本概念 OSPF被动接口&#xff0c;也称为抑制接口&#xff0c;即将路由器某一接口配置为被动接口后&#xff0c;该接口不会再接受和发送OSPF报文 二、使用场景 在路由器与终端相近或者直接相连的一侧配置被动接口 因为OSPF会定期发送报文…

ensp防火墙web密码重置(前提通过console可以登录)

客户电脑是命令行没有用户名直接输入密码就可以登录了&#xff0c;但是web端不知道admin的密码 前两天遇到运维单位的一台防火墙web网页不知道用户名密码&#xff0c;默认的登录不了&#xff0c;但是通过console可以登录命令行&#xff0c;今天就记录下如何通过命令行修改web页…