文献速递:深度学习胰腺癌诊断--胰腺肿瘤的全端到端深度学习诊断

Title 

题目

Fully end-to-end deep-learning-based diagnosis of

pancreatic tumors

胰腺肿瘤的全端到端深度学习诊断

01

文献速递介绍

胰腺癌是最常见的肿瘤之一,预后不良且通常是致命的。没有肿瘤的患者只需要进一步观察,而胰腺肿瘤的诊断需要紧急行动和明确的手术计划。如果延迟治疗,病情恶化和死亡的风险将增加,使得胰腺肿瘤的准确诊断对其成功的手术治疗至关重要。

人工智能可以帮助提高影像解释的准确性,并使诊断专业知识更广泛地可用。然而,胰腺肿瘤诊断的人工智能方法发展不够成熟,因为这一任务尤其具有挑战性。首先,目标在形状、大小和位置上高度可变,并且仅占整个CT图像的非常小的一部分。在我们的CT数据集中,胰腺仅占每个CT图像的约1.3%。其余信息来自其他器官,如肝脏、胃、肠道和图像背景,这些信息几乎不会影响人工智能模型的诊断。此外,肿瘤与周围组织的高相似性进一步降低了准确性和诊断效率。第三点是缺乏合适的胰腺图像数据集,这直接影响了人工智能模型的发展。

先前的研究已经尝试解决这些问题。一种有效的方法是胰腺分割。Chakraborty等人基于手动分割的CT图像,利用随机森林和支持向量机学习预测胰腺高风险乳头状粘液性肿瘤(IPMN)。Wei等人提出了一个支持向量机系统,包含24个基于指南的特征和385个放射组学高通量特征,结合由放射科医师标记的感兴趣区域(ROI)来诊断胰腺浆液性囊性肿瘤(SCN)。随着深度学习框架的发展,研究人员已经能够构建有效的深度编码器-解码器网络进行胰腺分割,提高了诊断准确性。Zhu等人报告了一种多尺度分割方法,通过检查是否有足够数量的体素被分割为肿瘤来筛查胰管腺癌(PDAC)。Liu等人首先分割胰腺,然后分类异常以检测PDAC。然而,在不增加医疗专家工作量或程序成本的情况下,高效获得即时诊断和治疗建议仍然是一个重大问题。由于原始患者数据(来自医院记录)包含了CT检查的诊断报告和不同成像平面以及血管造影阶段的图像,因此可用于诊断的有效CT图像的比例很小。因此,成功应用深度学习框架的关键在于对原始数据进行详细的自动预处理。

本研究提出了一个完全端到端的深度学习(FEE-DL)模型,用于从原始腹部CT图像自动诊断胰腺肿瘤。该模型的方法论有四个步骤,用于从原始数据中定位胰腺肿瘤:影像筛选、胰腺定位、胰腺分割和胰腺肿瘤诊断。

Abstract-Background 

摘要

Artificial intelligence can facilitate clinical decision making by considering massive amounts of medical imaging data. Various algorithms have been implemented for different clinical applications. Accurate diagnosis and treatment require reliable and interpretable data. For pancreatic tumor diagnosis, only58.5% of images from the First Affiliated Hospital and the Second Affiliated Hospital, Zhejiang University School of Medicine are used, increasing labor and time costs to manually filter out images not directly used by the diagnostic model.

人工智能在临床决策中能够通过考虑大量医学影像数据来提供帮助。不同的算法已经应用于不同的临床应用中。准确的诊断和治疗需要可靠且可解释的数据。对于胰腺肿瘤的诊断,浙江大学医学院附属第一医院和第二医院的影像数据只使用了58.5%,增加了手动筛选出未被诊断模型直接使用的影像的劳动力和时间成本。

Results

结果

We established a fully end-to-end deep-learning model for diagnosing pancreatic tumors and proposing treatment. The model considers original abdominal CT images without any manual preprocessing. Our artificial-intelligence-based system achieved an area under the curve of 0.871 and a F1 score of 88.5% using an independent testing dataset containing 107,036 clinical CT images from 347 patients. The average accuracy for all tumor types was 82.7%, and the independent accuracies of identifying intraductal papillary mucinous neoplasm and pancreatic ductal adenocarcinoma were 100% and 87.6%, respectively. The average test time per patient was 18.6 s, compared with at least 8 min for manual reviewing. Furthermore, the model provided a transparent and interpretable diagnosis by producing saliency maps highlighting the regions relevant to its decision.

我们建立了一个完全端到端的深度学习模型,用于诊断胰腺肿瘤并提出治疗方案。该模型考虑了原始腹部CT影像,没有进行任何手动预处理。我们基于包含347名患者的107,036张临床CT影像的独立测试数据集,人工智能系统实现了0.871的曲线下面积和88.5%的F1分数。对于所有肿瘤类型的平均准确率为82.7%,识别乳头状粘液性肿瘤和胰管腺癌的独立准确率分别为100%和87.6%。每位患者的平均测试时间为18.6秒,而手动审查至少需要8分钟。此外,该模型通过生成突出显示与其决策相关区域的显著性图,提供了透明且可解释的诊断。

Conclusions

结论

The proposed model can potentially deliver efficient and accurate preoperative diagnoses that could aid the surgical management of pancreatic tumor.

所提出的模型有可能提供高效准确的术前诊断

Method

方法

This study used a training dataset of 143,945 dynamic contrast-enhanced CT images of the abdomen from 319 patients. The proposed model contained four stages: image screening, pancreas location, pancreas segmentation, and pancreatic tumor diagnosis.

本研究使用了319名患者的143,945张动态增强CT腹部影像的训练数据集。提出的模型包含四个阶段:影像筛选、胰腺定位、胰腺分割和胰腺肿瘤诊断。

Figure

图片

Figure 1. The original files obtained from the hospitals contain different file formats, different imaging planes and different angiography phases. (A) Artificial intelligence approaches currently used for pancreatic diagnosis focus on the analysis of valid CT images, and ignore the importance of screening the original data at an early stage. (B) Our proposed FEE-DL model first screens out transverse plane CT images containing the pancreas from complex original files before deep-learning diagnosis.

图1. 从医院获取的原始文件包含不同的文件格式、不同的成像平面和不同的血管造影相。(A) 当前用于胰腺诊断的人工智能方法专注于分析有效的CT图像,忽略了在早期阶段筛选原始数据的重要性。(B) 我们提出的完全端到端深度学习模型首先从复杂的原始文件中筛选出包含胰腺的横断面CT图像,然后进行深度学习诊断。

图片

Figure 2. Multiplex original clinical data. (A-C) Images not directly used by the FEE-DL model containing (A) coronal plane CT scan, (B) sagittal plane CT scan, and (C) CT scan without pancreas. (D) Arterial, (E) venous, and (F) delayed phase CT scans.

图2. 多重原始临床数据。(A-C) 不直接被完全端到端深度学习模型使用的图像,包括(A) 冠状面CT扫描,(B) 矢状面CT扫描,以及(C) 不含胰腺的CT扫描。(D) 动脉期,(E) 静脉期,和(F) 延迟期CT扫描。

图片

Figure 3. Workflow diagram of the model’s training and testing phase. In the training phase, after valid images screening and data augmentation from the original abdominal CT images, we constructed a deep-learning model involving pancreas location, pancreas segmentation, image fusion and pancreatic tumor diagnoses. The loss function is calculated according to the prediction and label, and the weights of the neural networks are updated according to the back-propagation algorithm. The best weights are fixed for subsequent use on the testing dataset to diagnose pancreatic tumor.

图3. 模型的训练和测试阶段的工作流程图。在训练阶段,经过从原始腹部CT图像中筛选出有效图像并进行数据增强后,我们构建了一个深度学习模型,涉及胰腺定位、胰腺分割、图像融合和胰腺肿瘤诊断。根据预测和标签计算损失函数,并根据反向传播算法更新神经网络的权重。最佳权重被固定用于对测试数据集进行胰腺肿瘤的诊断。

图片

Figure 4. Architectures of the three sub-networks: (A) ResNet18 for pancreas location, (B) U-Net32 for pancreas segmentation, and (C) ResNet34 for pancreatic tumor diagnosis. (D) Detailed structures of the identity (ID), down sampling (DS), and convolution (Conv) blocks. (AvgPool, average-pooling; BN, batch normalization; Concate, concatenation; FC, fully connected; MaxPool, max-pooling; ReLU, rectified linear unit; Trans, transposed).

图4. 三个子网络的架构:(A) 用于胰腺定位的 ResNet18,(B) 用于胰腺分割的 U-Net32,以及 (C) 用于胰腺肿瘤诊断的 ResNet34。(D) 身份(ID)、下采样(DS)和卷积(Conv)模块的详细结构。(AvgPool,平均池化;BN,批量归一化;Concate,串联;FC,全连接;MaxPool,最大池化;ReLU,修正线性单元;Trans,转置)。

图片

Figure 5. Performance of each sub-network in the training and validation datasets. (A) ResNet18 for pancreas location. (B) U-Net32 for pancreas segmentation. (C) ResNet34 for pancreatic tumor diagnoses. (D) Representative results of pancreas segmentation. Rows from top to bottom are input CT images, ground truth, prediction, fusion results, and pancreas contours in CT, respectively, where radiologists’ annotations are shown in green and computerized segmentation is displayed in red. Higher resolution images are also shown on the lower left side.

图5. 每个子网络在训练和验证数据集中的性能。(A) 用于胰腺定位的 ResNet18。(B) 用于胰腺分割的 U-Net32。(C) 用于胰腺肿瘤诊断的 ResNet34。(D) 胰腺分割的代表性结果。从上到下的行分别是输入 CT 图像、地面真相、预测、融合结果和 CT 中的胰腺轮廓,其中放射科医生的标注显示为绿色,计算机分割显示为红色。较高分辨率的图像也显示在左下角

图片

Figure 6. Performance of the FEE-DL model. (A) Confusion matrix. (B) Receiver operating characteristic (ROC) curves of the model and random prediction for comparison. The area under the curve (AUC) was 0.871. (C) Prediction accuracy of different pancreatic tumors with respect to the average accuracy (82.7%). (IPMN, intraductal papillary mucinous neoplasm; PDAC, pancreatic ductal adenocarcinoma; SCN, serous cystic neoplasm).

图6. FEE-DL模型的性能。(A) 混淆矩阵。(B) 模型和随机预测的接收者操作特征曲线(ROC曲线)进行比较。曲线下面积(AUC)为0.871。(C) 不同胰腺肿瘤的预测准确度与平均准确度(82.7%)的关系。(IPMN,胰管内乳头状黏液性肿瘤;PDAC,胰管腺癌;SCN,浆液性囊性肿瘤)。

图片

Figure 7. Comparison of saliency maps for (A-C) a tumor patient and (D-F) a normal control in different angiography phases: left, arterial phase; center, venous phase; and right, delayed phase.

图7. 不同血管造影相位下肿瘤患者(A-C)和正常对照(D-F)的显著性图比较:左侧,动脉期;中间,静脉期;右侧,延迟期。

Table

图片

Table 1 lists the types of pancreatic tumor and their frequency in the training and testing datasets. Pancreatic cancer (PDAC) and pancreatic tumors such as IPMN, pancreatic neuroendocrine tumors (PNET), SCN, and ‘Other’ are considered as positive cases. Rare cases or lesions on the pancreas caused by

表1 列出了训练和测试数据集中胰腺肿瘤的类型及其频率。胰腺癌(PDAC)和诸如IPMN、胰腺神经内分泌肿瘤(PNET)、SCN和“其他”等胰腺肿瘤被视为阳性病例。由胰腺引起的罕见病例或病变。

图片

Table 2. Patient characteristics in the training and testing datasets

表2 列出了训练和测试数据集中患者的特征。

图片

Table 3. Performance of each sub-network

表3. 每个子网络的性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/818383.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构与算法】递推

来源:《信息学奥赛一本通》 所谓递推,是指从已知的初始条件出发,依据某种递推关系,逐次推出所要求的各中间结果及最后结果。其中初始条件或是问题本身已经给定,或是通过对问题的分析与化简后确定。 从已知条件出发逐…

浏览器工作原理与实践--跨站脚本攻击(XSS):为什么Cookie中有HttpOnly属性

通过上篇文章的介绍,我们知道了同源策略可以隔离各个站点之间的DOM交互、页面数据和网络通信,虽然严格的同源策略会带来更多的安全,但是也束缚了Web。这就需要在安全和自由之间找到一个平衡点,所以我们默认页面中可以引用任意第三…

web前端框架设计第四课-条件判断与列表渲染

web前端框架设计第四课-条件判断与列表渲染 一.预习笔记 1.条件判断 1-1:v-if指令:根据表达式的值来判断是否输出DOM元素 1-2:template中使用v-if 1-3:v-else 1-4:v-else-if 1-5:v-show(不支…

【快捷部署】017_MongoDB(6.0.14)

📣【快捷部署系列】017期信息 编号选型版本操作系统部署形式部署模式复检时间017MongoDB6.0.14Ubuntu 20.04apt单机2024-04-11 一、快捷部署 #!/bin/bash ################################################################################# # 作者:…

SQL注入sqli_labs靶场第十七题

B站教学视频很详细 【sql注入之sqli-labs系列教程(less11-17)】sqli-labs_33_less17_哔哩哔哩_bilibili 我将SQL语句在页面中显示,以便更深入学习。 1.寻找注入点 修改密码的一个页面。 输入正确的账号密码,可以看到,账号为admin&#xf…

PHP Storm 2024.1使用

本文讲的是phpstorm 2024.1最新版本激活使用教程,本教程适用于windows操作系统。 1.先去idea官网下载phpstorm包,我这里以2023.2最新版本为例 官网地址:https://www.jetbrains.com/zh-cn/phpstorm/ 2.下载下来后安装,点下一步 …

Qt5 编译oracle数据库驱动

库文件 1、Qt源码目录:D:\Qt5\5.15.2\Src\qtbase\src\plugins\sqldrivers\oci 2、oracle客户端SDK: https://www.oracle.com/database/technologies/instant-client/winx64-64-downloads.html 下载各版本中的如下压缩包,一定要版本相同的 将两个压缩包…

性能升级,INDEMIND机器人AI Kit助力产业再蜕变

随着机器人进入到越来越多的生产生活场景中,作业任务和环境变得更加复杂,机器人需要更精准、更稳定、更智能、更灵敏的自主导航能力。 自主导航技术作为机器人技术的核心,虽然经过了多年发展,取得了长足进步,但在实践…

Python的国际化和本地化【第162篇—国际化和本地化】

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 随着全球化的发展,多语言支持在软件开发中变得越来越重要。Python作为一种流行的…

EasyRecovery数据恢复软件2024百度云网盘下载链接

EasyRecovery数据恢复软件是一款功能强大的数据恢复工具,它能够帮助用户从各种存储设备中恢复丢失或误删除的文件数据。无论是由于意外删除、格式化、病毒攻击还是其他原因导致的数据丢失,EasyRecovery都能提供有效的解决方案。 该软件支持多种存储介质…

Java全栈开发前端+后端(全栈工程师进阶之路)【介绍】

Java全栈开发前端后端(全栈工程师进阶之路) 本次课程,从0到1讲解全栈开发 前端到后端,解决您的开发难题 课程如下: 第1阶段-课程介绍与环境搭建 前置课程: 1、HTML 2、JavaScript 3、CSS 4、Java基…

Redis实现延迟任务的几种方案

🏷️个人主页:牵着猫散步的鼠鼠 🏷️系列专栏:Java全栈-专栏 🏷️个人学习笔记,若有缺误,欢迎评论区指正 目录 1.前言 2.Redis如何实现延迟任务? 3.代码实现 3.1. 过期键通知事…

针对MaxCompute优化案例分享

声明 原文来源:微信公众号:阿里云开发者 前言 MaxCompute 是阿里巴巴集团推出的一种大数据计算平台,用于处理海量数据和进行数据分析。它提供了高可靠性、高扩展性和高性能的数据处理能力,支持 SQL 查询、MapReduce 计算和机器…

初识ansible服务剧本playbook及剧本编写实例

目录 1、playbook剧本文件概念 1.1 剧本文件的结构由4部分组成 2、配置实例 实例1-编写一个实现批量安装mariadb数据库的剧本 实例2-编写一个创建一个目录/backup,并在目录喜爱创建01.txt文件的剧本 实例3-编写一个添加定时同步时间的定时任务剧本 错误反思 1、playbook剧…

趣话最大割问题:花果山之群猴博弈

内容来源:量子前哨(ID:Qforepost) 编辑丨浪味仙 排版丨 沛贤 深度好文:3000字丨15分钟阅读 趋利避害,是所有生物遵循的自然法则,人类也不例外。 举个例子,假如你是某生鲜平台的配…

论文速读:Do Generated Data Always Help Contrastive Learning?

在对比学习领域,最近很多研究利用高质量生成模型来提升对比学习 给定一个未标记的数据集,在其上训练一个生成模型来生成大量的合成样本,然后在真实数据和生成数据的组合上执行对比学习这种使用生成数据的最简单方式被称为“数据膨胀”这与数据…

【C++核心-基础知识】内存分析和new操作符

内存分析和new操作符 一、内存分析1. 程序运行前就存在的区域1.1 代码区1.2 全局区1.3 代码演示 2. 程序运行后才存在的区域2.1 栈区2.2 堆区 二、new操作符1. 基本介绍2. 代码演示 一、内存分析 C程序在执行时,将内存大方向划分为4个区域: 代码区&…

CountDownLatch

CountDownLatch 翻译: 倒计时锁存器,,,,count计数,down停止,Latch锁 解释: 允许一个或多个线程等待,直到在其他线程中执行的一组操作完成的同步辅助不懂?…

破译验证码reCAPTCHA 之 打码平台

由于登录需要验证码,除了日常的字符串+数字,此时就需要用第三方插件进行破译。 reCaptcha是Google公司的验证码服务,方便快捷,改变了传统验证码需要输入n位失真字符的特点。 1. reCAPTCHA 初识 reCaptcha是Google公司…

Nginx讲解 很详细了!!!

hello,你好鸭,我是Ethan,很高兴你能来阅读,昵称是希望自己能不断精进,向着优秀程序员前行!💪💪💪 目前博客主要更新Java系列、数据库、项目案例、计算机基础等知识点。感谢你的阅读和…