MTANet: 多任务注意力网络,用于自动医学图像分割和分类| 文献速递-深度学习结合医疗影像疾病诊断与病灶分割

Title

题目

MTANet: Multi-Task Attention Network for Automatic Medical Image Segmentation and Classification

MTANet: 多任务注意力网络,用于自动医学图像分割和分类

01

文献速递介绍

医学图像分割和分类是当前临床实践中的两个关键步骤,其准确性主要取决于个别临床医生的专业知识。计算机辅助诊断(CAD)系统在医学图像诊断中受到广泛关注,旨在帮助临床医生以更准确和客观的方式进行诊断决策。近年来,基于机器学习特别是深度学习的方法,在包括医学图像分割和分类在内的许多医学图像任务中取得了显著进展。

卷积神经网络(CNNs)在许多医学图像分割任务中取得了显著成功。特别是,UNet通过端到端的像素级预测在医学图像分割方面取得了重大突破。UNet引入的编码器和解码器之间的跳跃连接将低分辨率特征融入高分辨率特征中,以提高分割能力。受到UNet成功的启发,近年来大多数领先的模型都建立在UNet架构的基础上,包括ResUNet、DenseUNet、UNet++、DoubleUNet、集成学习等。

然而,这些方法主要集中在医学对象的整个区域,对于检测小的医学对象的敏感性较低。注意力机制在transformer模型成功应用后引起了广泛关注。注意力机制不使用所有可用特征,而是选择一部分相关的感知信息来检测显著特征。在自然场景图像分割网络取得成功后,注意力机制被引入到许多医学图像分割工作中,如Focus UNet、MedT、TransUNet和UACANet等。这些方法在医学分割任务上表现出色,但很少考虑解码器中的高分辨率特征和编码器与解码器之间的连接。

此外,基于transformer的架构已经在语义分割任务中展示了最先进的性能。受到Vision Transformer-based方法(VIT)的发展启发,最近的transformer-based骨干网络在性能上已经达到或超过了基于CNN的骨干网络。

Abstract

摘要

Medical image segmentation and classifica**tion are two of the most key steps in computer-aidedclinical diagnosis. The region of interest were usuallysegmented in a proper manner to extract useful featuresfor further disease classification. However, these methodsare computationally complex and time-consuming. In thispaper, we proposed a one-stage multi-task attention network (MTANet) which efficiently classifies objects in animage while generating a high-quality segmentation maskfor each medical object. A reverse addition attention modulewas designed in the segmentation task to fusion areas inglobal map and boundary cues in high-resolution features,and an attention bottleneck module was used in the classification task for image feature and clinical feature fusion.We evaluated the performance of MTANet with CNN-basedand transformer-based architectures across three imagingmodalities for different tasks: CVC-ClinicDB dataset forpolyp segmentation, ISIC-2018 dataset for skin lesion segmentation, and our private ultrasound dataset for liver tumorsegmentation and classification. Our proposed model outperformed state-of-the-art models on all three datasets andwas superior to all 25 radiologists for liver tumor diagnosis.

医学图像分割和分类是计算机辅助临床诊断中最关键的两个步骤。通常需要以适当的方式对感兴趣的区域进行分割,以提取有用的特征进行进一步的疾病分类。然而,这些方法在计算上非常复杂且耗时。在本文中,我们提出了一种一阶段多任务注意力网络(MTANet),旨在高效地对图像中的对象进行分类,并生成每个医学对象的高质量分割掩膜。在分割任务中,我们设计了逆加注意力模块,用于融合全局地图中的区域和高分辨率特征中的边界线索;在分类任务中,采用了注意力瓶颈模块,用于图像特征和临床特征的融合。我们使用基于CNN和Transformer的架构在三种成像模态下评估了MTANet的性能:CVC-ClinicDB数据集用于息肉分割,ISIC-2018数据集用于皮肤病变分割,以及我们的私有超声数据集用于肝肿瘤分割和分类。我们的模型在所有三个数据集上均优于现有模型,并在肝肿瘤诊断方面优于所有25名放射科医生。

Method

方法

Figure 2 showed the overview of the proposed MTANetwhich used a reverse addition attention module with a parallel partial decoder in the decoder of basic UNet model toobtain more high-resolution features for segmentation branchand attention bottleneck modules in the fully connectedlayers to fusion image feature and clinical feature for classification branch. Each component will be introduced asfollows.

图2显示了提出的MTANet的概述,该网络在基本UNet模型的解码器中使用了逆加注意力模块和并行部分解码器,以获取更多用于分割分支的高分辨率特征,并在全连接层中使用了注意力瓶颈模块来融合图像特征和临床特征用于分类分支。接下来将分别介绍每个组件。

Conclusion

结论

In conclusion, we proposed an end-to-end one-stage network MTANet for automatic medical image analysis. Reverseaddition attention module was designed to fusion areas inglobal map and boundary cues in high-resolution features,and an attention bottleneck module was introduced to balancethe clinical features and image features. Both CNN-based andtransformer-based architectures were proposed. Experimentson three datasets of different imaging modalities demonstratedthe capability of the proposed MTANet.

综上所述,我们提出了一种端到端的一阶段网络MTANet,用于自动医学图像分析。我们设计了逆加注意力模块,用于融合全局地图中的区域和高分辨率特征中的边界线索,同时引入了注意力瓶颈模块来平衡临床特征和图像特征。我们提出了基于CNN和基于transformer的架构。在不同成像模态的三个数据集上的实验表明了MTANet的能力。

Figure

图片

Fig. 1. Flowchart shows patient enrollment process.

图1. 流程图展示了患者入组过程。

图片

Fig. 2. Overview of the proposed MTANet.

图2. 提出的MTANet的概述

图片

Fig. 3. Qualitative segmentation results for automatic medical image segmentation. Green lines denote the ground truth while red lines denote thepredicted results of our model.

图3. 自动医学图像分割的定性结果展示。绿线表示地面真实结果,红线表示我们模型的预测结果。

图片

Fig. 4. Struction of models. Model-I denotes the single classification network. Model-II denotes the two-stage classification network. Model-IIIdenotes our one-stage classification network.

图4. 模型结构。Model-I 表示单一分类网络。Model-II 表示两阶段分类网络。Model-III 表示我们的一阶段分类网络。

图片

Fig. 5. ROC curves of our model and radiologists. (a) validation cohort; (b) testing cohort; (c-d) reader study.

Fig. 5. 我们模型和放射科医生的ROC曲线。(a) 验证队列; (b) 测试队列; (c-d) 读者研究。

Table

图片

TABLE I basic characteristics of the patients in the each cohort

表格 I每个队列患者的基本特征

图片

TABLE II  ablation study for segmentation

表格 II分割的消融研究

TABLE III  performance comparison for polyp segmentation on the CVC-ClinicDB dataset with respect to existing methods

表格 III 在CVC-ClinicDB数据集上针对现有方法进行息肉分割的性能比较

图片

TABLE IV performance comparison for lesion boundary segmentation from ISIC-2018 dataset with respect to existing methods

表格 IV 在ISIC-2018数据集上针对现有方法进行病变边界分割的性能比较

图片

TABLE V   performance comparison for lesion boundary segmentation from ultrasound dataset with respect to existing methods

表格 V在超声数据集上针对现有方法进行病变边界分割的性能比较

图片

TABLE VI  ablation study for classification

表格 VI分类的消融研究

图片

TABLE VIIperformance comparison for liver tumor classification from ultrasound dataset with respect to existing methods

表格 VII 针对超声数据集进行肝肿瘤分类的性能比较

图片

TABLE VIII performance comparison for liver tumor classification from ultrasound dataset with respect to radiologists

表格 VIII 针对超声数据集进行肝肿瘤分类与放射科医生的性能比较

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/29001.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Springboot3+自动装配

导言:这里主要讲述springboot3以后spring.factories功能失效,带来的解决办法。 之前有一次希望用springboot模块拿到工具模块的配置configuration的时候,想通过之前的spring.factories来实现自动装配,但是发现一直拿不到配置&…

数据仓库与数据挖掘(期末复习)

数据仓库与数据挖掘(期末复习) ETL的含义Extract 、 Transformation、Load。 ODS的全称Operational Data Store。 DW全称 Data Warehourse DM全称是Data Mart 数据仓库数据抽取时所用到技术是增量、全量、定时、调度 STAGE层作用是提供业务系统数据…

因果卷积和递归神经网络

因果卷积(causal convolution)和递归神经网络(RNN)在处理序列数据时各有优劣。这里我们分析两者的工作机制和性能特点。 ### 因果卷积 1. **因果卷积的特点**: - **不使用未来信息**:因果卷积只利用当前及…

全国各区县地区生产总值数据(GDP及人均生产总值),精度超高 区县级数据

数据名称: 全国各区县地区生产总值数据 数据格式: shpexcel 数据几何类型: 面 数据精度:区县 数据坐标系: WGS84 数据来源:网络公开数据 数据可视化.

稳了?L3规模化落地在即,激光雷达公司成首批赢家

作者 | 芦苇 编辑 | 德新 在中国,距L3级自动驾驶的规模化落地,又近了一步。 随着国内试点政策刷新,越来越多的车企在部分市域获得了自动驾驶测试牌照,能上路测试的L3级自动驾驶车辆正在快速增加。 其中一个重要节点是&#xf…

C语言最终文章-二叉树

文章目录 前言二叉树的性质二叉树的存储方式顺序存储堆及其应用TopK问题堆排序 链式存储二叉树的练习1.二叉树查找值为x的节点2.判断是否为完全二叉树LC226.翻转二叉树[LC572. 另一棵树的子树](https://leetcode.cn/problems/subtree-of-another-tree/description/)两道选择题 …

如何开展接口测试

项目中如何开展接口测试 需求分析 接口文档解析 设计测试用例 脚本开发 执行及缺陷跟踪 生成测试报告 接口自动化持续集成(可选)

音视频开发_SDL音频播放器的实现

今天向大家介绍一下如何通过 SDL 实现一个PCM音频播放器。这是一个最简单的播放器,它不涉及到音频的解复用,解码等工作。我们只需要将音频原始数据喂给 SDL 音频接口就可以听到悦耳的声音了。在下面的列子中我将向你演示,使用 SDL 做这样一个…

目标检测:IOU

IOU(Intersection over Union)交并比: 它计算的是“预测的边框”和“真实的边框”的交叠率,即它们的交集和并集的比值。这个比值用于衡量预测边框与真实边框的重叠程度,从而评估目标检测的准确性。 在目标检测任务中…

嵌入式操作系统_2.嵌入式操作系统的一般架构

1.嵌入式操作系统的概念 嵌入式操作系统通常由硬件驱动程序、调式代理、操作系统内核、文件系统和可配置组件等功能组成,并为应用软件提供标准的API(Application Programming Interface)接口服务。 2.一般嵌入式操作系统的体系结构 从嵌入…

Mysql特殊用法分享

不存在则插入,存在则更新的2种写法 前置使用条件,必须有唯一索引 -- 1 REPLACE INTO REPLACE INTO typora.ip_view_times_record (ip, view_times, url) VALUES(10.25.130.64, 1, https://10.25.168.80/fhh/index.html?urlindex.md543);-- 2 ON DUPLI…

HTTP服务器实现长连接的思路(Java语言)

一、背景 目前的HTTP服务器很多,只要是编程语言支持线程和网络通信,就能开发一个HTTP协议服务器。 市场上常用的是Tomcat、Ngnix、Httpd等技术。 二、本文目的 介绍使用Java语言来开发HTTP服务器的处理逻辑。 这是个人可以参考的HTTP服务器通用逻辑。…

使用Selenium进行元素定位的全面指南

使用Selenium进行元素定位的全面指南 引言 Selenium 是一个广泛使用的开源工具,用于自动化Web浏览器的操作。无论你是进行自动化测试,还是需要抓取网页数据,Selenium 都是一个非常有用的工具。而在Selenium中,定位网页元素是自动…

LabVIEW机械设备故障诊断中,振动分析的有效性与局限性如何

LabVIEW作为一种强大的图形化编程工具,在机械设备故障诊断中的振动分析中发挥了重要作用。振动分析通过监测机械设备的振动信号,能够有效地诊断设备故障。然而,尽管其有效性显著,但也存在一些局限性。本文将探讨LabVIEW在振动分析…

C# —— for循环语句

基本语法 for (初始表达式; 条件表达式; 增量表达式) { // 循环体 } for循环中 有三个空 第一个空(初始表达式): 一般用来声明一个临时的局部变量 用来计数 第二个空(条件表达式): 表明进入循环的条件 一个bool类型的值(bool类型 条…

深度神经网络——什么是NLP(自然语言处理)?

自然语言处理(NLP) 是对使计算机能够处理、分析、解释和推理人类语言的技术和工具的研究和应用。 NLP 是一个跨学科领域,它结合了语言学和计算机科学等领域已建立的技术。 这些技术与人工智能结合使用来创建聊天机器人和数字助理,…

海成蜘蛛池广州官网下载

baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? 当我们给自己的泛目录设置仅蜘蛛抓取生成缓存的时候,我们需要模拟蜘蛛抓取测试我们的设置是否成功。绝大部分时候我们都使用网页蜘蛛模拟抓取测…

Comparable和Comparator区别

相同点:都是用于比较排序。 不同点: 1、接口所在的包不同:comparable:java.lang.Comparable;Comparator:java.util.Comparator 2、比较逻辑不同:Comparable:内部比较器&#xff1…

2024.618到底买什么数码值得?带你一起来看看!

在618期间,这些新品可能会有特别的优惠活动,包括但不限于折扣、满减、赠品等。因此,如果你正在寻找一款适合自己的数码产品,不妨关注各大电商平台的618促销活动,把握机会,以优惠的价格购买到心仪的产品。 …

文件操作(1)(C语言版)

前言: 为什么要学习文件操作: 1、如果大家写过一些代码,当运行结束的时候,这些运行结果将不复存在,除非,再次运行时这些结果才能展现在屏幕上面,就比如之前写过的通讯录。 现实中的通讯录可以保…