I 2U-Net:具有丰富信息交互的双路径 U-Net 用于医学图像分割| 文献速递-基于深度学习的多模态数据分析与生存分析

Title

题目

I 2U-Net: A dual-path U-Net with rich information interaction for medical image segmentation

I 2U-Net:具有丰富信息交互的双路径 U-Net 用于医学图像分割

01

文献速递介绍

在计算机视觉领域,医学图像分割是一个主要挑战,例如皮肤镜图像中的皮肤病变分割(Dai等,2022年)、结肠镜图像中的息肉分割(Fan等,2020年)、磁共振图像中的脑肿瘤分割(Wang等,2021年)以及腹部CT图像中的多器官分割(Cao等,2021年)。这些分割结果提供了关于解剖区域的宝贵信息,有助于详细分析和帮助医生准确描绘损伤、监测疾病进展,并评估适当治疗的需求。随着对智能医学图像分析需求的增加,精确而稳健的分割方法变得越来越重要。

为了满足这一需求,许多具有编码器-解码器结构的深度学习方法被提出(Ramesh等,2021年)。它们的编码器通常用于提取图像特征,解码器则用于将提取的特征恢复到原始图像大小,并输出最终的分割结果。作为编码器-解码器网络的代表,U-Net(Ronneberger等,2015年)在许多医学分割任务中证明了其有效性,这启发了一系列高效的U形分割网络的发展,如Attention U-Net(Oktay等,2018年)、Res-UNet(Xiao等,2018年)和DR-UNet(Li等,2019年)。

尽管这些U形网络在医学图像分割中被广泛使用,但仍存在一个不可忽视的问题,即对具有模糊边界和不规则形状病变的分割结果不理想。这一结果主要归因于两个因素:(i)U形网络编码器提取的特征几乎被抽象语义信息所占据,失去了大量详细内容描述;(ii)尽管解码器中的跳跃连接可以融合低分辨率和高分辨率信息以改善特征学习,但受限于低分辨率和高分辨率特征之间的较大语义差距,导致特征图模糊和分割结果不佳(Pang等,2019年)。如图1所示,随着网络加深,详细信息(如边界、形状和纹理)逐渐减少,这显然对密集预测任务不利

Abstract

摘要

尽管 U 形网络在许多医学图像分割任务中取得了显著的性能,但它们很少建模层次化层之间的顺序关系。这一弱点使得当前层难以有效利用前一层的历史信息,导致对具有模糊边界和不规则形状病变的分割结果不尽如人意。为了解决这一问题,我们提出了一种新颖的双路径 U-Net,称为 I2U-Net。新提出的网络通过双路径之间的丰富信息交互,鼓励历史信息的重复使用和重新探索,使得深层可以学习更全面的特征,既包含低层次的详细描述,又包含高层次的语义抽象。具体来说,我们引入了一个多功能信息交互模块(MFII),它通过统一设计可以建模跨路径、跨层次和跨路径-层次的信息交互,使得所提出的 I2U-Net 表现类似于展开的 RNN,并享有建模时间序列信息的优势。此外,为了进一步选择性地和敏感地整合双路径编码器提取的信息,我们提出了一种全面信息融合和增强模块(HIFA),可以有效地连接编码器和解码器。在包括皮肤病变、息肉、脑肿瘤和腹部多器官分割在内的四个具有挑战性的任务上进行的广泛实验一致显示,所提出的 I2U-Net 在性能和泛化能力上均优于其他最先进的方法。

Method

方法

Chen et al. (2017) revealed that residual connection (He et al.,enables feature re-usage while dense connection (Huang et al.,encourages new feature exploration, which are both importantfor learning valuable representations. They also found that while residual and dense connections differ on the surface, both of them aremanifestations of a higher-order recurrent neural network (HORNN).Motivated by these, we propose a dual-path U-Net for medical imagesegmentation, dubbed I2U-Net. One path of I2U-Net is dedicated toimage feature information, while the other is to hidden state information with shared convolutional kernels along the depth. This structureallows I2U-Net to work similarly to an unfolded RNN (LeCun et al.,2015; Zhao et al., 2021) and enjoy its advantage of modeling time sequence information. It also allows I2U-Net to inherit the advantages ofresidual and dense connections, enabling convenient re-usage of historyfeatures and flexible exploration of new features with an acceptablecomputation cost.

Chen等人(2017年)揭示了残差连接(He等,2016年)能够实现特征的重复使用,而密集连接(Huang等,2017年)则鼓励新特征的探索,这两者对于学习有价值的表示是非常重要的。他们还发现,尽管在表面上残差连接和密集连接有所不同,但它们都是高阶递归神经网络(HORNN)的表现形式。

受此启发,我们提出了一种用于医学图像分割的双路径 U-Net,名为 I2U-Net。I2U-Net 的一个路径专注于图像特征信息,而另一个路径专注于隐藏状态信息,并且沿着深度使用共享的卷积核。这种结构使得 I2U-Net 可以类似于展开的RNN(LeCun等,2015年;Zhao等,2021年),享受其建模时间序列信息的优势。同时,这种结构也让 I2U-Net 继承了残差连接和密集连接的优势,能够方便地重复使用历史特征,并以可接受的计算成本灵活探索新特征。

Conclusion

结论

This paper proposed a dual-path U-net (dubbed I2U-Net) with richinformation interaction for medical image segmentation, which workssimilarly to an unfolded RNN and enjoys the advantage of modeling thetime-sequential relationship between different network layers. Specifically, I2U-Net developed a multi-functional information interactionmodule (MFII) that enables the current layer to effectively re-use andre-explore the previous layers’ historical information, allowing deeplayers to learn more comprehensive features that contain both low-leveldetail description and high-level semantic abstraction. Moreover, I2UNet developed a holistic information fusion and augmentation module(HIFA) to sensitively augment the information extracted by the dualpath encoder. The proposed HIFA merges the advantage of local andglobal operation and can flexibly learn discriminative representationfrom a wider frequency range, bridging the encoder and the decodermore efficiently. Thanks to these creative designs, extensive experiments on four challenging tasks, including skin lesion, polyp, braintumor, and abdominal multi-organ segmentation, consistently provedthat the proposed I2U-Net has excellent segmentation performance andgeneralization ability.

本文提出了一种具有丰富信息交互的双路径U-Net(称为I2U-Net),用于医学图像分割,其工作原理类似于展开的RNN,并享有建模不同网络层之间时间序列关系的优势。具体而言,I2U-Net开发了一个多功能信息交互模块(MFII),使当前层能够有效地重复使用和重新探索前几层的历史信息,从而使深层能够学习到更全面的特征,既包括低级别的详细描述,也包括高级别的语义抽象。此外,I2U-Net开发了一个全面的信息融合和增强模块(HIFA),以敏感地增强双路径编码器提取的信息。所提出的HIFA融合了局部和全局操作的优势,可以灵活地从更广泛的频率范围学习判别性表示,更有效地连接编码器和解码器。由于这些创新设计,针对皮肤病变、息肉、脑肿瘤和腹部多器官分割等四项挑战性任务的广泛实验一致表明,所提出的I2U-Net具有出色的分割性能和泛化能力。

Figure

图片

Fig. 1. Heat maps in four different layers of the U-Net.

图1. U-Net 中四个不同层次的热力图。

图片

Fig. 2. Illustration of the proposed I2U-Net. I2U-Net is a dual-path U-Net with rich information interaction. One path uses medical images as input to extract image featureinformation like traditional U-Nets. In contrast, the other path uses zero-initialized learnable matrix as input to store the hidden state information with shared convolutional kernelsalong the depth. This structure allows I2U-Net to work similarly to an unfolded RNN and enjoy its advantages, including modeling the time-sequential relationship of hierarchicallayers and making the most of historical information.

图2. 所提出的I2U-Net示意图。I2U-Net是一个具有丰富信息交互的双路径U-Net。其中一条路径使用医学图像作为输入,提取像传统U-Net一样的图像特征信息。相比之下,另一条路径使用零初始化的可学习矩阵作为输入,在深度上使用共享的卷积核存储隐藏状态信息。这种结构使得I2U-Net可以类似于展开的RNN工作,并享受其优势,包括建模层次化层之间的时间序列关系,充分利用历史信息。

图片

Fig. 3. Illustration of the proposed MFII module. MFII enables multi-faceted information interaction among the dual paths of I2U-Net. MFII has three differentrepresentations: E-MFII, E-MFII, and D-MFII. E-MFII and E-MFII are used in theencoder stage. Their difference is that E-MFII* reduces the feature size by convolutionwith stride 2, while E-MFII keeps the size unchanged. D-MFII is used in the decoderstage, which increases the feature size by deconvolution.

图3. 所提出的MFII模块示意图。MFII模块实现了I2U-Net双路径之间的多方面信息交互。MFII具有三种不同的表示形式:E-MFII、E-MFII和D-MFII。E-MFII和E-MFII用于编码器阶段。它们的区别在于,E-MFII*通过步幅为2的卷积来减小特征大小,而E-MFII保持大小不变。D-MFII用于解码器阶段,通过反卷积来增加特征大小。

图片

Fig. 4. Demonstration of the pyramid pooling and the multi-scale atrous convolution in HIFA module.

图4. HIFA模块中金字塔池化和多尺度空洞卷积的示意图。

图片

Fig. 5. Sample results of skin lesion segmentation on ISIC2018 (first three rows)and PH2 (last two rows). The colors white, green, and red represent the correctsegmentation, under-segmentation, and over-segmentation, respectively.

图5. 在ISIC2018数据集上的皮肤病变分割示例结果(前三行)和在PH2数据集上的示例结果(后两行)。白色、绿色和红色分别表示正确分割、欠分割和过分割。

图片

Fig. 6. Trend graph of IoU score in skin lesion segmentation task.

图6. 皮肤病变分割任务中IoU分数的趋势图。

图片

Fig. 7. Sample results of polyp segmentation on five public datasets. The colorswhite, green, and red represent the correct segmentation, under-segmentation, andover-segmentation, respectively.

图7. 在五个公共数据集上的息肉分割示例结果。白色、绿色和红色分别表示正确分割、欠分割和过分割。

图片

Fig. 8. Sample results of brain tumor segmentation. The union of red, blue, and greenregions represents the Whole Tumor(WT); the union of red and blue regions representsthe Tumor Core (TC); and the green region denotes the Enhancing Tumor (ET).

图8. 脑肿瘤分割的示例结果。红色、蓝色和绿色区域的并集代表整个肿瘤(WT);红色和蓝色区域的并集代表肿瘤核心(TC);绿色区域表示增强肿瘤(ET)。

图片

Fig. 9. Sample results of abdominal multi-organ segmentation.

图9. 腹部多器官分割的示例结果。

图片

Fig. 10. Segmentation results of different models in our system.

图10. 我们系统中不同模型的分割结果。

图片

Fig. 11. Heat maps are obtained by the four encoder stages of the Baseline and ourI 2U-Net.

图11. 热力图由基线模型和我们的I2U-Net的四个编码器阶段获取。

图片

Fig. 12. Heat maps are obtained by different bridges in our system.

图12. 我们系统中不同桥接方式获取的热力图。

图片

Fig. 13. Influence of pre-trained parameters on IoU score of skin disease segmentation tasks.

图13. 预训练参数对皮肤病分割任务IoU分数的影响

Table

图片

Table 1Compared with different methods for skin lesion segmentation. The best results are in bold

表1与不同的皮肤病变分割方法比较。最佳结果用粗体显示。

图片

Table 2 Compared with different methods for polyp segmentation. The best results are in bold.

表2 不同息肉分割方法的比较。最佳结果用粗体显示。

图片

Table 3Compared with different methods for brain tumor segmentation. WT, ET and TC represent Whole Tumor, Enhancing Tumor and Tumor Core sub-regions, respectively. The bestresults are in bold.

表3 不同脑肿瘤分割方法的比较。WT、ET和TC分别代表整个肿瘤、增强肿瘤和肿瘤核心子区域。最佳结果用粗体显示。

图片

Table 4Compared with different methods for abdominal multi-organ segmentation. The best results are in bold.

表4 不同腹部多器官分割方法的比较。最佳结果用粗体显示。

图片

Table 5Segmentation performances of different models in our system. The proposed I2U-Net is Model 4. The number of parameter and FLOPs are calculated based onthe 2D segmentation tasks.

表5 我们系统中不同模型的分割性能。提出的I2U-Net是模型4。参数数量和FLOPs是基于2D分割任务计算的。

图片

图片

Table 6 Segmentation performance of I2U-Net variants equipped with different bridges. The number of parameter and FLOPs are calculated based on the 2D segmentation tasks

表6 不同桥接方式装备的I2U-Net变体的分割性能。参数数量和FLOPs是基于2D分割任务计算的。

图片

Table 7Segmentation performances of MFII and its two variants

表7 MFII及其两个变体的分割性能

图片

Table 8Segmentation performance of different hidden state initialization methods.

表8 不同隐藏状态初始化方法的分割性能

图片

Table 9Influence of pre-trained parameters on the performance of different methods.

表9 预训练参数对不同方法性能的影响

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/868696.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【IMU】 椭球拟合标定加计Bias、Scale

椭球拟合简介 MESE IMU中,x,y,z轴的度量单位并不相同,假设各轴之间相互直。 加计静止状态(也就是只受重力的状态下),各个姿态只受重力的,x,y,z轴值(假设x,y,z轴相互垂直并且度量单…

TCP的p2p网络模式

TCP的p2p网络模式 1、tcp连接的状态有以下11种 CLOSED:关闭状态LISTEN:服务端状态,等待客户端发起连接请求SYN_SENT:客户端已发送同步连接请求,等待服务端相应SYN_RECEIVED:服务器收到客户端的SYN请请求&…

EPICS数据库示例

本文目标是使用EPICS数据库示例帮助新手理解如何使用不同的示例。 1、使用seq和mbbo的简单选择器 这个简单示例展示了如何使用一个mbbo和一个seq来旋转哪个值将被设置到一个PV。 # 这个mbbo记录将选择将运行seq的哪段 record(mbbo, "CHOOSE") {field(VAL, "…

ArcGIS中国工具(ArcGISCTools)等插件使用体验

ArcGIS中国工具(ArcGISCTools)的主要功能 1. 接合图表生成 这个功能允许用户生成标准分幅图的行政区边框注记,并在打印时自动加入。这对于需要制作标准地图的用户非常实用。 2. 图框工具 图框工具可以帮助用户创建和管理地图的图框&#…

Qt creator 控件转到槽 报错 The class containing “Ui:Dialog“ could not be found in

今天调试程序,发现主界面控件转到槽,报错如下图: 问题表现为:只有主窗口控件有这个错误,其他子窗口正常。 解决: 在网上搜这个报错信息,都没有一个很好的解决办法。 最后发现是我在子窗口中要…

Java根据经纬度获取两点之间的距离

Java根据经纬度获取两点之间的距离,最近在实现类似于钉钉打卡签到的需求,因为对精度要求不是很高,所以可以通过一个球面距离的公式来求两点距离,这里将地球当成一个球体,实际上地球是一个不规则的球体,所以…

C++继承(一文说懂)

目录 一: 🔥继承的概念及定义1.1 继承的概念1.2 继承定义1.2.1 定义格式1.2.2 继承关系和访问限定符1.2.3 继承基类成员访问方式的变化 二:🔥基类和派生类对象赋值转换三:🔥继承中的作用域四:&a…

DHCP与TCP的简单解析

目录 一、DHCP 1.1 DHCP概述 1.2 DHCP的优势 1.3 DHCP的模式与分配方式***** 1.3.1 DHCP的模式:C/S模式(客户机与服务器模式) 1.3.2 DHCP的分配方式 1.4 DHCP的租约过程及原理 1.4.1 DHCP的工作原理***** 1.4.2 更新租约原理***** …

高考志愿怎么选专业,哪些是热门专业?

选专业看上去非常简单,但是真正做起来的时候确实不容易,因为对于很多结束高考的学生来说,选专业就意味着他们选择自己的未来,这可是直接关系到未来的学习和职业发展,关系到将来的就业方向,再加上现在的社会…

近红外光谱脑功能成像(fNIRS):2.实验设计、指标计算与多重比较

一、实验设计的策略与方法 近红外光谱成像(INIRS)作为一种非侵入性脑功能成像技术,为研究大脑活动提供了一种高效、生态效度高的方法。然而,为了充分利用INIRS技术并确保实验结果的准确性和可靠性,研究者必须精心设计实…

基于stm32开发的红外循迹小车

本项目算是接触32来开发的第一个小项目了,虽然前期用51写过一个循迹小车,以为直接转到32会比较简单,结果还是花了大几天才把小车的参数完全调完,以此来记录下自己的学习历程(注:循迹算法并未加入PID算法&am…

spring boot集成easypoi导出word换行处理

项目场景&#xff1a; spring boot集成easypoi导出word <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><version>4.4.0</version> </dependency> 问题描述 spring boo…

最新的 DL/T645 调试工具,工程师必备

分享一个好用的 DL/T645 调试工具&#xff0c;下载地址&#xff1a;https://www.redisant.cn/dl645master 文章目录 最新的 DL/T645 调试工具&#xff0c;工程师必备主要功能软件截图 最新的 DL/T645 调试工具&#xff0c;工程师必备 DL/T645 是中国电力行业的一个通信协议标准…

Day47:LeedCode1143.最长公共子序列 1035.不相交的线 53. 最大子序和 392.判断子序列

1143. 最长公共子序列 给定两个字符串 text1 和 text2&#xff0c;返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 &#xff0c;返回 0 。 一个字符串的 子序列 是指这样一个新的字符串&#xff1a;它是由原字符串在不改变字符的相对顺序的情况下删除某些字…

解决uni-app中全局设置页面背景颜色只有部分显示颜色的问题

在页面的style标签设置了背景色但是只显示一部分 <style lang"scss"> .content{background-color: #f7f7f7;height: 100vh; } </style>我们在app.vue里设置就行了 注意一定要是**page{}** <style>/*每个页面公共css */page{background-color: #…

淘宝商品评论电商API接口:提升销量与用户评论的策略

一、API接口简介 淘宝商品评论电商API接口是淘宝开放平台提供的一项服务&#xff0c;联讯数据通过这个接口&#xff0c;商家可以获取关于自己商品的评论数据&#xff0c;包括评论内容、评分、买家等级等信息。这些数据可以帮助商家更好地了解消费者需求&#xff0c;优化商品和服…

724.力扣每日一题7/8 Java

博客主页&#xff1a;音符犹如代码系列专栏&#xff1a;算法练习关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ 目录 思路 解题方法 时间复杂度 空间复杂度 Code 思路 主要基于数组的…

linux主机离线安装python3环境

一、下载好python版本 Index of /ftp/python/https://www.python.org/ftp/python/ 二、创建文件夹 mkdir /home/python/ 三、上传到主机 四、解压 # 解压xz得到tar包 xz -d Python-3.9.8.tar.xz # 解压tar包 tar -xvf Python-3.9.8.tar 五、指定安装路径 # 进入解压后的…

【Python_GUI】tkinter常用组件——文本类组件

文本时窗口中必不可少的一部分&#xff0c;tkinter模块中&#xff0c;有3种常用的文本类组件&#xff0c;通过这3种组件&#xff0c;可以在窗口中显示以及输入单行文本、多行文本、图片等。 Label标签组件 Label组件的基本使用 Label组件是窗口中比较常用的组件&#xff0c;…

【LeetCode】有效的数独

目录 一、题目二、解法 一、题目 请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 &#xff0c;验证已经填入的数字是否有效即可。 数字 1-9 在每一行只能出现一次。 数字 1-9 在每一列只能出现一次。 数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。&…