I 2U-Net:具有丰富信息交互的双路径 U-Net 用于医学图像分割| 文献速递-基于深度学习的多模态数据分析与生存分析

Title

题目

I 2U-Net: A dual-path U-Net with rich information interaction for medical image segmentation

I 2U-Net:具有丰富信息交互的双路径 U-Net 用于医学图像分割

01

文献速递介绍

在计算机视觉领域,医学图像分割是一个主要挑战,例如皮肤镜图像中的皮肤病变分割(Dai等,2022年)、结肠镜图像中的息肉分割(Fan等,2020年)、磁共振图像中的脑肿瘤分割(Wang等,2021年)以及腹部CT图像中的多器官分割(Cao等,2021年)。这些分割结果提供了关于解剖区域的宝贵信息,有助于详细分析和帮助医生准确描绘损伤、监测疾病进展,并评估适当治疗的需求。随着对智能医学图像分析需求的增加,精确而稳健的分割方法变得越来越重要。

为了满足这一需求,许多具有编码器-解码器结构的深度学习方法被提出(Ramesh等,2021年)。它们的编码器通常用于提取图像特征,解码器则用于将提取的特征恢复到原始图像大小,并输出最终的分割结果。作为编码器-解码器网络的代表,U-Net(Ronneberger等,2015年)在许多医学分割任务中证明了其有效性,这启发了一系列高效的U形分割网络的发展,如Attention U-Net(Oktay等,2018年)、Res-UNet(Xiao等,2018年)和DR-UNet(Li等,2019年)。

尽管这些U形网络在医学图像分割中被广泛使用,但仍存在一个不可忽视的问题,即对具有模糊边界和不规则形状病变的分割结果不理想。这一结果主要归因于两个因素:(i)U形网络编码器提取的特征几乎被抽象语义信息所占据,失去了大量详细内容描述;(ii)尽管解码器中的跳跃连接可以融合低分辨率和高分辨率信息以改善特征学习,但受限于低分辨率和高分辨率特征之间的较大语义差距,导致特征图模糊和分割结果不佳(Pang等,2019年)。如图1所示,随着网络加深,详细信息(如边界、形状和纹理)逐渐减少,这显然对密集预测任务不利

Abstract

摘要

尽管 U 形网络在许多医学图像分割任务中取得了显著的性能,但它们很少建模层次化层之间的顺序关系。这一弱点使得当前层难以有效利用前一层的历史信息,导致对具有模糊边界和不规则形状病变的分割结果不尽如人意。为了解决这一问题,我们提出了一种新颖的双路径 U-Net,称为 I2U-Net。新提出的网络通过双路径之间的丰富信息交互,鼓励历史信息的重复使用和重新探索,使得深层可以学习更全面的特征,既包含低层次的详细描述,又包含高层次的语义抽象。具体来说,我们引入了一个多功能信息交互模块(MFII),它通过统一设计可以建模跨路径、跨层次和跨路径-层次的信息交互,使得所提出的 I2U-Net 表现类似于展开的 RNN,并享有建模时间序列信息的优势。此外,为了进一步选择性地和敏感地整合双路径编码器提取的信息,我们提出了一种全面信息融合和增强模块(HIFA),可以有效地连接编码器和解码器。在包括皮肤病变、息肉、脑肿瘤和腹部多器官分割在内的四个具有挑战性的任务上进行的广泛实验一致显示,所提出的 I2U-Net 在性能和泛化能力上均优于其他最先进的方法。

Method

方法

Chen et al. (2017) revealed that residual connection (He et al.,enables feature re-usage while dense connection (Huang et al.,encourages new feature exploration, which are both importantfor learning valuable representations. They also found that while residual and dense connections differ on the surface, both of them aremanifestations of a higher-order recurrent neural network (HORNN).Motivated by these, we propose a dual-path U-Net for medical imagesegmentation, dubbed I2U-Net. One path of I2U-Net is dedicated toimage feature information, while the other is to hidden state information with shared convolutional kernels along the depth. This structureallows I2U-Net to work similarly to an unfolded RNN (LeCun et al.,2015; Zhao et al., 2021) and enjoy its advantage of modeling time sequence information. It also allows I2U-Net to inherit the advantages ofresidual and dense connections, enabling convenient re-usage of historyfeatures and flexible exploration of new features with an acceptablecomputation cost.

Chen等人(2017年)揭示了残差连接(He等,2016年)能够实现特征的重复使用,而密集连接(Huang等,2017年)则鼓励新特征的探索,这两者对于学习有价值的表示是非常重要的。他们还发现,尽管在表面上残差连接和密集连接有所不同,但它们都是高阶递归神经网络(HORNN)的表现形式。

受此启发,我们提出了一种用于医学图像分割的双路径 U-Net,名为 I2U-Net。I2U-Net 的一个路径专注于图像特征信息,而另一个路径专注于隐藏状态信息,并且沿着深度使用共享的卷积核。这种结构使得 I2U-Net 可以类似于展开的RNN(LeCun等,2015年;Zhao等,2021年),享受其建模时间序列信息的优势。同时,这种结构也让 I2U-Net 继承了残差连接和密集连接的优势,能够方便地重复使用历史特征,并以可接受的计算成本灵活探索新特征。

Conclusion

结论

This paper proposed a dual-path U-net (dubbed I2U-Net) with richinformation interaction for medical image segmentation, which workssimilarly to an unfolded RNN and enjoys the advantage of modeling thetime-sequential relationship between different network layers. Specifically, I2U-Net developed a multi-functional information interactionmodule (MFII) that enables the current layer to effectively re-use andre-explore the previous layers’ historical information, allowing deeplayers to learn more comprehensive features that contain both low-leveldetail description and high-level semantic abstraction. Moreover, I2UNet developed a holistic information fusion and augmentation module(HIFA) to sensitively augment the information extracted by the dualpath encoder. The proposed HIFA merges the advantage of local andglobal operation and can flexibly learn discriminative representationfrom a wider frequency range, bridging the encoder and the decodermore efficiently. Thanks to these creative designs, extensive experiments on four challenging tasks, including skin lesion, polyp, braintumor, and abdominal multi-organ segmentation, consistently provedthat the proposed I2U-Net has excellent segmentation performance andgeneralization ability.

本文提出了一种具有丰富信息交互的双路径U-Net(称为I2U-Net),用于医学图像分割,其工作原理类似于展开的RNN,并享有建模不同网络层之间时间序列关系的优势。具体而言,I2U-Net开发了一个多功能信息交互模块(MFII),使当前层能够有效地重复使用和重新探索前几层的历史信息,从而使深层能够学习到更全面的特征,既包括低级别的详细描述,也包括高级别的语义抽象。此外,I2U-Net开发了一个全面的信息融合和增强模块(HIFA),以敏感地增强双路径编码器提取的信息。所提出的HIFA融合了局部和全局操作的优势,可以灵活地从更广泛的频率范围学习判别性表示,更有效地连接编码器和解码器。由于这些创新设计,针对皮肤病变、息肉、脑肿瘤和腹部多器官分割等四项挑战性任务的广泛实验一致表明,所提出的I2U-Net具有出色的分割性能和泛化能力。

Figure

图片

Fig. 1. Heat maps in four different layers of the U-Net.

图1. U-Net 中四个不同层次的热力图。

图片

Fig. 2. Illustration of the proposed I2U-Net. I2U-Net is a dual-path U-Net with rich information interaction. One path uses medical images as input to extract image featureinformation like traditional U-Nets. In contrast, the other path uses zero-initialized learnable matrix as input to store the hidden state information with shared convolutional kernelsalong the depth. This structure allows I2U-Net to work similarly to an unfolded RNN and enjoy its advantages, including modeling the time-sequential relationship of hierarchicallayers and making the most of historical information.

图2. 所提出的I2U-Net示意图。I2U-Net是一个具有丰富信息交互的双路径U-Net。其中一条路径使用医学图像作为输入,提取像传统U-Net一样的图像特征信息。相比之下,另一条路径使用零初始化的可学习矩阵作为输入,在深度上使用共享的卷积核存储隐藏状态信息。这种结构使得I2U-Net可以类似于展开的RNN工作,并享受其优势,包括建模层次化层之间的时间序列关系,充分利用历史信息。

图片

Fig. 3. Illustration of the proposed MFII module. MFII enables multi-faceted information interaction among the dual paths of I2U-Net. MFII has three differentrepresentations: E-MFII, E-MFII, and D-MFII. E-MFII and E-MFII are used in theencoder stage. Their difference is that E-MFII* reduces the feature size by convolutionwith stride 2, while E-MFII keeps the size unchanged. D-MFII is used in the decoderstage, which increases the feature size by deconvolution.

图3. 所提出的MFII模块示意图。MFII模块实现了I2U-Net双路径之间的多方面信息交互。MFII具有三种不同的表示形式:E-MFII、E-MFII和D-MFII。E-MFII和E-MFII用于编码器阶段。它们的区别在于,E-MFII*通过步幅为2的卷积来减小特征大小,而E-MFII保持大小不变。D-MFII用于解码器阶段,通过反卷积来增加特征大小。

图片

Fig. 4. Demonstration of the pyramid pooling and the multi-scale atrous convolution in HIFA module.

图4. HIFA模块中金字塔池化和多尺度空洞卷积的示意图。

图片

Fig. 5. Sample results of skin lesion segmentation on ISIC2018 (first three rows)and PH2 (last two rows). The colors white, green, and red represent the correctsegmentation, under-segmentation, and over-segmentation, respectively.

图5. 在ISIC2018数据集上的皮肤病变分割示例结果(前三行)和在PH2数据集上的示例结果(后两行)。白色、绿色和红色分别表示正确分割、欠分割和过分割。

图片

Fig. 6. Trend graph of IoU score in skin lesion segmentation task.

图6. 皮肤病变分割任务中IoU分数的趋势图。

图片

Fig. 7. Sample results of polyp segmentation on five public datasets. The colorswhite, green, and red represent the correct segmentation, under-segmentation, andover-segmentation, respectively.

图7. 在五个公共数据集上的息肉分割示例结果。白色、绿色和红色分别表示正确分割、欠分割和过分割。

图片

Fig. 8. Sample results of brain tumor segmentation. The union of red, blue, and greenregions represents the Whole Tumor(WT); the union of red and blue regions representsthe Tumor Core (TC); and the green region denotes the Enhancing Tumor (ET).

图8. 脑肿瘤分割的示例结果。红色、蓝色和绿色区域的并集代表整个肿瘤(WT);红色和蓝色区域的并集代表肿瘤核心(TC);绿色区域表示增强肿瘤(ET)。

图片

Fig. 9. Sample results of abdominal multi-organ segmentation.

图9. 腹部多器官分割的示例结果。

图片

Fig. 10. Segmentation results of different models in our system.

图10. 我们系统中不同模型的分割结果。

图片

Fig. 11. Heat maps are obtained by the four encoder stages of the Baseline and ourI 2U-Net.

图11. 热力图由基线模型和我们的I2U-Net的四个编码器阶段获取。

图片

Fig. 12. Heat maps are obtained by different bridges in our system.

图12. 我们系统中不同桥接方式获取的热力图。

图片

Fig. 13. Influence of pre-trained parameters on IoU score of skin disease segmentation tasks.

图13. 预训练参数对皮肤病分割任务IoU分数的影响

Table

图片

Table 1Compared with different methods for skin lesion segmentation. The best results are in bold

表1与不同的皮肤病变分割方法比较。最佳结果用粗体显示。

图片

Table 2 Compared with different methods for polyp segmentation. The best results are in bold.

表2 不同息肉分割方法的比较。最佳结果用粗体显示。

图片

Table 3Compared with different methods for brain tumor segmentation. WT, ET and TC represent Whole Tumor, Enhancing Tumor and Tumor Core sub-regions, respectively. The bestresults are in bold.

表3 不同脑肿瘤分割方法的比较。WT、ET和TC分别代表整个肿瘤、增强肿瘤和肿瘤核心子区域。最佳结果用粗体显示。

图片

Table 4Compared with different methods for abdominal multi-organ segmentation. The best results are in bold.

表4 不同腹部多器官分割方法的比较。最佳结果用粗体显示。

图片

Table 5Segmentation performances of different models in our system. The proposed I2U-Net is Model 4. The number of parameter and FLOPs are calculated based onthe 2D segmentation tasks.

表5 我们系统中不同模型的分割性能。提出的I2U-Net是模型4。参数数量和FLOPs是基于2D分割任务计算的。

图片

图片

Table 6 Segmentation performance of I2U-Net variants equipped with different bridges. The number of parameter and FLOPs are calculated based on the 2D segmentation tasks

表6 不同桥接方式装备的I2U-Net变体的分割性能。参数数量和FLOPs是基于2D分割任务计算的。

图片

Table 7Segmentation performances of MFII and its two variants

表7 MFII及其两个变体的分割性能

图片

Table 8Segmentation performance of different hidden state initialization methods.

表8 不同隐藏状态初始化方法的分割性能

图片

Table 9Influence of pre-trained parameters on the performance of different methods.

表9 预训练参数对不同方法性能的影响

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/868696.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用python画一个爱心

1 问题 Python是一种常见的计算机编程语言,如何用python简单的画一个爱心呢? 2 方法 利用turtle库以及简单规范代码将爱心画出。 代码清单 1 from turtle import *pensize(1)pencolor(red)fillcolor(pink)speed(5)up()goto(-30,100)down()begin_fill()l…

【IMU】 椭球拟合标定加计Bias、Scale

椭球拟合简介 MESE IMU中,x,y,z轴的度量单位并不相同,假设各轴之间相互直。 加计静止状态(也就是只受重力的状态下),各个姿态只受重力的,x,y,z轴值(假设x,y,z轴相互垂直并且度量单…

TCP的p2p网络模式

TCP的p2p网络模式 1、tcp连接的状态有以下11种 CLOSED:关闭状态LISTEN:服务端状态,等待客户端发起连接请求SYN_SENT:客户端已发送同步连接请求,等待服务端相应SYN_RECEIVED:服务器收到客户端的SYN请请求&…

Qt QChart 图表库详解及使用

文章目录 Qt QChart 图表库详解及使用一、Qt Charts 概述二、安装 Qt Charts1. 在项目中添加 Qt Charts三、Qt Charts 的基本使用1. 创建一个简单的折线图2. 添加图例和自定义样式四、Qt Charts 的交互功能1. 启用缩放和平移2. 启用数据点选择五、Qt Charts 的高级特性1. 多轴绘…

EPICS数据库示例

本文目标是使用EPICS数据库示例帮助新手理解如何使用不同的示例。 1、使用seq和mbbo的简单选择器 这个简单示例展示了如何使用一个mbbo和一个seq来旋转哪个值将被设置到一个PV。 # 这个mbbo记录将选择将运行seq的哪段 record(mbbo, "CHOOSE") {field(VAL, "…

ArcGIS中国工具(ArcGISCTools)等插件使用体验

ArcGIS中国工具(ArcGISCTools)的主要功能 1. 接合图表生成 这个功能允许用户生成标准分幅图的行政区边框注记,并在打印时自动加入。这对于需要制作标准地图的用户非常实用。 2. 图框工具 图框工具可以帮助用户创建和管理地图的图框&#…

Qt creator 控件转到槽 报错 The class containing “Ui:Dialog“ could not be found in

今天调试程序,发现主界面控件转到槽,报错如下图: 问题表现为:只有主窗口控件有这个错误,其他子窗口正常。 解决: 在网上搜这个报错信息,都没有一个很好的解决办法。 最后发现是我在子窗口中要…

Java根据经纬度获取两点之间的距离

Java根据经纬度获取两点之间的距离,最近在实现类似于钉钉打卡签到的需求,因为对精度要求不是很高,所以可以通过一个球面距离的公式来求两点距离,这里将地球当成一个球体,实际上地球是一个不规则的球体,所以…

[Vue3 + TS + Vite] 获取网页选中内容的字符串格式或HTML格式

获取网页选中内容的字符串格式 let selected_text_by_mouse: any// 获取选中的文字 const mouse_selected_text(event:MouseEvent)>{const selection window.getSelection();if(selection && selection.rangeCount > 0){const content selection.toString();s…

C++继承(一文说懂)

目录 一: 🔥继承的概念及定义1.1 继承的概念1.2 继承定义1.2.1 定义格式1.2.2 继承关系和访问限定符1.2.3 继承基类成员访问方式的变化 二:🔥基类和派生类对象赋值转换三:🔥继承中的作用域四:&a…

DHCP与TCP的简单解析

目录 一、DHCP 1.1 DHCP概述 1.2 DHCP的优势 1.3 DHCP的模式与分配方式***** 1.3.1 DHCP的模式:C/S模式(客户机与服务器模式) 1.3.2 DHCP的分配方式 1.4 DHCP的租约过程及原理 1.4.1 DHCP的工作原理***** 1.4.2 更新租约原理***** …

高考志愿怎么选专业,哪些是热门专业?

选专业看上去非常简单,但是真正做起来的时候确实不容易,因为对于很多结束高考的学生来说,选专业就意味着他们选择自己的未来,这可是直接关系到未来的学习和职业发展,关系到将来的就业方向,再加上现在的社会…

【ROS2】中级-编写可组合节点 (C++)

目录 起点 代码更新 添加包依赖 类定义没有主方法 CMake 变更 运行您的节点 起点 我们假设你有一个常规的 rclcpp::Node 可执行文件,你希望在与其他节点相同的进程中运行它,以实现更高效的通信。 我们将从一个直接继承自 Node 的类开始,并且定…

Socket网络通信流程

目录 创建Socket 绑定和监听(服务器端) 建立连接 数据传输 关闭连接 Socket不是一种协议,是对TCP/UDP等协议进行封装后供程序调用的接口,代码中调用相应的接口,即可将数据发送给对方,这种编程方式叫做socket编程。客户端建立一个socket,服务端建立一个socket,二者…

ELB和VPC是云计算领域中的两个术语,通常与Amazon Web Services (AWS)相关联

ELB 和 VPC 是云计算领域中的两个术语,通常与亚马逊云服务(AWS)相关: 1. **ELB (Elastic Load Balancer)**: - 这是AWS提供的一种服务,用于自动分配进入应用程序的流量,以实现高可用性和容错…

近红外光谱脑功能成像(fNIRS):2.实验设计、指标计算与多重比较

一、实验设计的策略与方法 近红外光谱成像(INIRS)作为一种非侵入性脑功能成像技术,为研究大脑活动提供了一种高效、生态效度高的方法。然而,为了充分利用INIRS技术并确保实验结果的准确性和可靠性,研究者必须精心设计实…

基于stm32开发的红外循迹小车

本项目算是接触32来开发的第一个小项目了,虽然前期用51写过一个循迹小车,以为直接转到32会比较简单,结果还是花了大几天才把小车的参数完全调完,以此来记录下自己的学习历程(注:循迹算法并未加入PID算法&am…

spring boot集成easypoi导出word换行处理

项目场景&#xff1a; spring boot集成easypoi导出word <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><version>4.4.0</version> </dependency> 问题描述 spring boo…

基于深度学习的RGB图像和IMU的数据融合

基于深度学习的RGB图像和IMU数据融合是一种结合视觉信息和惯性测量单元&#xff08;IMU&#xff09;数据以提升系统性能的方法。这种技术在机器人导航、无人机飞行控制、增强现实&#xff08;AR&#xff09;和虚拟现实&#xff08;VR&#xff09;等应用中具有重要意义。以下是关…

Spring AOP 通知的执行顺序

1. 结论 官方文档&#xff1a;Spring AOP Advice 故各种通知的执行顺序&#xff1a; Spring版本5.2.7以后&#xff1a; Around环绕通知前置操作Before前置通知目标方法After后置通知AfterReturnin返回通知或AfterThrowing异常通知Around环绕通知后置操作 Spring版本5.2.7一千…