文献速递:深度学习肝脏肿瘤诊断---基于深度学习的肝细胞结节性病变在整片组织病理图像上的分类

Title 

题目

Deep Learning-Based Classification of Hepatocellular Nodular Lesions on Whole-Slide Histopathologic Images

基于深度学习的肝细胞结节性病变在整片组织病理图像上的分类

Background 

背景

Hepatocellular nodular lesions (HNLs) constitute a heterogeneous group of disorders. Differential diagnosis among these lesions, especially high-grade dysplasticnodules (HGDNs) and well-differentiated hepatocellular carci noma (WD-HCC), can be challenging, let alone biopsy speci mens. We aimed to develop a deep learning system to solve these puzzles, improving the histopathologic diagnosis of HNLs (WD-HCC, HGDN, low-grade DN, focal nodular hyperplasia,hepatocellular adenoma), and background tissues (nodularcirrhosis, normal liver tissue).

肝细胞结节性病变(HNLs)构成了一个异质性疾病群。这些病变之间的鉴别诊断,特别是高级别发育不良结节(HGDNs)与良性分化的肝细胞癌(WD-HCC),可能具有挑战性,更不用说活检样本了。我们旨在开发一个深度学习系统来解决这些难题,以提高HNLs(WD-HCC、HGDN、低级别DN、局灶性结节性增生、肝细胞腺瘤)以及背景组织(结节性肝硬化、正常肝组织)的组织病理诊断。

Conclusions

结论

We first developed a deep learning diagnostic model for HNLs, which performed well and contributed to enhancing the diagnosis rate of early HCC and risk stratification of patients with HNLs. Furthermore, HnAIM had significant ad vantages in patch-level recognition, with important diagnostic implications for fragmentary or scarce biopsy specimens.

我们首次开发了一个用于HNLs的深度学习诊断模型,该模型表现良好,并有助于提高早期HCC的诊断率和HNLs患者的风险分级。此外,HnAIM在补丁层面识别方面具有显著优势,对于零碎或稀缺的活检样本具有重要的诊断意义。

Results

结果

We obtained 213,280 patches from 1115 whole-slide images of 738 patients. An optimal model was finally chosen based on F1 score and area under the curve value, named hepatocellular-nodular artificial intelligence model (HnAIM), with the overall 7-category area under the curve of 0.935 in the independent external validation cohort. For biopsy specimens, the agreement rate with sub specialists’ majority opinion was higher for HnAIM than 9 pa thologists on both patch level and whole-slide images level.

我们从738名患者的1115张整片幻灯片图像中获得了213,280个补丁。基于F1得分和曲线下面积值,最终选择了一个最优模型,命名为肝细胞结节性人工智能模型(HnAIM),在独立外部验证队列中,7类别的曲线下面积为0.935。对于活检样本,HnAIM与亚专家多数意见的一致率高于9名病理学家,无论是在补丁层面还是整片幻灯片图像层面。

Method

方法

The samples consisting of surgical and biopsy specimens were collected from 6 hospitals. Each specimen was reviewed by 2 to 3 subspecialists. Four deep neural networks (ResNet50, InceptionV3, Xception,and the Ensemble) were used. Their performances were eval uated by confusion matrix, receiver operating characteristic curve, classification map, and heat map. The predictive efficiency of the optimal model was further verified by comparing with that of 9 pathologists.

样本包括手术和活检标本,这些标本收集自6家医院。每个标本由2至3名亚专科医生审核。使用了四个深度神经网络(ResNet50、InceptionV3、Xception和集成网络)。它们的性能通过混淆矩阵、接收者操作特征曲线、分类图和热图进行评估。通过与9名病理医生的诊断结果进行比较,进一步验证了最优模型的预测效率。

Figure

图片

Figure 1. Data, study design, and HnAIM classification framework. Six independent data sets (Headquarters, Lingnan andYuedong Hospital of SYSUTH, SYSUFH, FSFPH, and GZFPH) were used in this study. (A) The Headquarters and YuedongHospital of SYSUTH data sets were used for developing a 7-category discriminative model, while the other 4 data sets wereused for the external testing. (B) The distribution of the samples for each type of liver nodule in model development (left) andindependent external validation (right). (C) Flow chart of the study. The data sets of the 7 categories were divided into thetraining (70%), validation (15%), and testing (15%) sets. Then, ROIs were labeled with green masks for each category. Patcheswere extracted from ROIs by OpenSlide library at  40 magnification with a size of 1024  1024. The training set was used totrain the ensemble model based on 3 basic models, while the validation set was used to fine-tune superparameters, such as learning rate, and the testing set used to evaluate models’ performances by confusion matrix, ROC curve, WSI-level classi-fication map, and patch-level heat map. Patches of liver biopsy specimens were predicted by the optimal model and areshown using a histogram, while the model’s referral decisions were compared with the ones made by different levels ofpathologists.

图1. 数据、研究设计和HnAIM分类框架。本研究使用了六个独立数据集(总部、岭南及SYSUTH的粤东医院、SYSUFH、FSFPH和GZFPH)。(A) 总部和SYSUTH的粤东医院数据集用于开发7类鉴别模型,而其他四个数据集用于外部测试。(B) 模型开发中(左)和独立外部验证中(右)各类型肝结节样本的分布。(C) 研究流程图。7类数据集被划分为训练集(70%)、验证集(15%)和测试集(15%)。然后,每个类别的感兴趣区域(ROIs)用绿色遮罩标记。通过OpenSlide库以40倍放大从ROIs提取1024×1024大小的补丁。训练集用于基于三个基础模型训练集成模型,验证集用于调整超参数,如学习率,测试集用于通过混淆矩阵、ROC曲线、WSI级分类图和补丁级热图评估模型性能。肝活检标本的补丁由最优模型预测,并通过直方图显示,而模型的转诊决定与不同级别的病理医生所做的决定进行比较。

图片

Figure 2. Performance of deep learning models. (A) Classification results are shown by confusion matrices on the internal testing set for Resnet50, Inception V3, Xception, and the Ensemble model. Numbers represent the number of patches classified correctly (diagonal) and incorrectly (off the diagonal). (B) The ROC curve and the AUC value on the internal testing set for models of Resnet50 (black line), Inception V3 (blue line), Xception (green line), and Ensemble (red line). The Xception and the Ensemble models both performed the best, with AUC values of 0.9991, indicating models were trained with high accuracy. (C) The ROC curve and AUC value on the independent external validation using the Ensemble model (HnAIM) in FSFPH, SYSUFH, GZFPH, and the entire external data set.

图2. 深度学习模型的性能。(A) 在内部测试集上,Resnet50、Inception V3、Xception和集成模型的分类结果通过混淆矩阵显示。数字代表正确分类(对角线上)和错误分类(对角线外)的补丁数量。(B) 在内部测试集上,Resnet50(黑线)、Inception V3(蓝线)、Xception(绿线)和集成模型(红线)的ROC曲线和AUC值。Xception和集成模型的表现最佳,AUC值为0.9991,表明模型具有高精度的训练。(C) 使用集成模型(HnAIM)在FSFPH、SYSUFH、GZFPH和整个外部数据集上的独立外部验证的ROC曲线和AUC值。

图片

Figure 3. WSI-level panoramicclassification map of surgicalsample: (A) WD-HCC, (B)HGDN, (C), LDN, (D), FNH, and(E) HCA. (Left) Original WSIs(original magnification  0.4).(Middle) Classification mapswere constructed frommodel’s predictions of corresponding patches. Colorsfrom blue to red meantdifferent liver lesions. For NC,LGDN, HGDN, and WDHCC,gradually deepening coloreven indicated increased degree of malignancy (labels: 2,5–7). The diagnostic labelswere as follows: 0 for background, 1 for NNL, 2 for NC, 3for HCA, 4 for FNH, 5 forLGDN, 6 for HGDN, and 7 forWDHCC. (Right) Pie charts

quantitatively show the percentage of different categoriesin each WSI.

图3. 外科样本的WSI级全景分类图:(A) WD-HCC,(B) HGDN,(C) LDN,(D) FNH,和 (E) HCA。(左) 原始WSIs(原始放大倍数0.4)。(中) 分类图根据模型对应补丁的预测构建。颜色从蓝色到红色表示不同的肝脏病变。对于NC、LGDN、HGDN和WDHCC,颜色的逐渐加深甚至表示恶性程度的增加(标签:2,5-7)。诊断标签如下:0代表背景,1代表NNL,2代表NC,3代表HCA,4代表FNH,5代表LGDN,6代表HGDN,7代表WDHCC。(右) 饼图定量显示每个WSI中不同类别的百分比。

图片

Figure 4. Performance of HnAIM in biopsy specimens and comparison with pathologists. (A) Patch-level histogram of biopsy specimens shows the model’s predictions for 7 categories, with a focus on cell morphologic features. The category with the largest proportion was regarded as the final classification. Agreement rates with the majority opinion of subspecialists for the HnAIM and pathologists (3 each for junior, intermediate, and senior pathologist) on 7 categories across (B) all 961 patches and (C) 30 WSIs of biopsy specimens. To represent the average level of each group, the agreement rate was shown as the mean value across 3 pathologists. The error bars represent the 95% CIs. Potential reasons for disagreements among pathologists with HnAIM may include inherent uncertainty in the 2-dimensional interpretation of a 3-dimensional specimen, ambiguity in diagnostic guidelines, the limited number of tissue samples, and cognitive factors such as anchoring.

图4. HnAIM在活检标本中的表现及与病理医生的比较。(A) 活检标本的补丁级直方图显示了模型对7个类别的预测,重点关注细胞形态特征。占比最大的类别被视为最终分类。HnAIM与亚专家多数意见的一致率以及(B)所有961个补丁和(C)30个活检样本WSI中7个类别的病理医生(初级、中级和高级各3名)的一致率。为代表每组的平均水平,一致率以3名病理医生的平均值显示。误差条表示95%置信区间。病理医生与HnAIM之间意见不一的潜在原因可能包括对三维标本二维解读的固有不确定性、诊断指南的模糊性、组织样本数量有限以及认知因素如锚定效应。

Table

图片

Table 1.Seven-Category Agreement With Subspecialists’ Majority Opinion of 9 Pathologists and Hepatocellular-NodularArtificial Intelligence Model Based on Patches and Whole-Slide Images of 30 Liver Biopsy Specimens

表1. 基于30个肝活检标本的补丁和整片图像的九名病理学家和肝细胞结节性人工智能模型与亚专家多数意见的七类别一致性

图片

Table 2.Lesion Characteristics of Patients With Indefinite Diagnoses after 3 Independent Reviews

表2. 经过三次独立审查后,诊断不确定的患者的病变特征

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/818040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型拥有的数万亿个参数,这个指标如何理解

数万亿个参数这个指标是描述大型人工智能模型复杂度的一个方式。在这个上下文中,一个“参数”可以理解为模型中的一个配置或设置,它决定了模型在处理数据时的行为。这些参数在模型的训练过程中被调整和优化,以便模型能够更好地完成特定任务&a…

理解vuecli和nginx启动Vue项目区别

Vue CLI 和 Nginx 在启动 Vue 项目时各自扮演着不同的角色,它们之间存在一些关键的区别。以下是关于这两者的主要差异: 1.开发环境与部署环境: Vue CLI:Vue CLI 是一个基于 Node.js 的开发工具,主要用于在本地开发环…

面试八股——JVM★

类加载 类加载器的定义 类加载器的类别 类装载的执行过程 类的装载过程: 加载: 验证: 准备: 这里设置初始值并不是传统意义的设置初始值(那个过程在初始化阶段)。 解析: 初始化: …

序列化结构(protobuf)实现一个TCP服务器(C++)

Protocol Buffers(protobuf)是一种由Google开发的用于序列化结构化数据的方法,通常用于在不同应用程序之间进行数据交换或存储数据。它是一种语言无关、平台无关、可扩展的机制,可以用于各种编程语言和环境中。 1、首先建立proto文…

Linux服务器下安装Oracle数据库

Linux服务器下安装Oracle数据库详细说明文档:https://gitee.com/WilliamWangmy/snail-knowledge/blob/master/Oracle/Linux%E4%B8%8B%E5%AE%89%E8%A3%85Oracle.md ps:如果觉得作者写的还行,能够满足您的需求,请给作者的开源项目st…

白杨SEO:把AI结合SEO优化的工具有哪些?我常用的AIGC工具分享

前言:这是白杨SEO原创第523篇。为什么想到写这个?因为有好几个朋友问我做SEO主要用哪个AI工具来创作?所以就分享一下我用的工具,希望对大家有一点点帮助,需要的可以收藏。图片在公众号白杨SEO上去看。 声明&#xff1…

k8s中修复mongodb启动失败

背景 同事反馈 dev环境的yapi不能登录,看了一下是同事两年前用helm搭建的。单副本使用。 排查发现是后端数据库mongodb数据库挂掉。 rootdev-k8s-master03:~# kubectl get svc NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE mo…

湘潭大学-编译原理-实验一+实验二

了解了DFA的化简的含义,按照笔者的理解,表示的意思是把集合不断进行划分,直到不可以再进行划分,划分的依据是当前的符号到下一个符号,到达的这些下一个符号,是否属于同一个集合,假设属于同一个集…

李廉洋;4.12现货黄金,美原油最新走势分析及策略。

现货黄金在美盘末将历史新高刷至2377美元/盎司。美国3月份PPI指数较上年同期上升2.1%,为11个月来的最高增幅,这份数据加之此前火爆的CPI指数,为美联储实现2%目标所面临的坎坷之路奠定了基础。不过,PPI报告中的细节让担心通胀再度加…

全面支持工业协议钡铼IOy系列模块无缝融入PLC及工业物联网架构

钡铼IOy系列模块作为工业控制领域的创新产品,以其卓越的性能和广泛的适用性,无缝融入PLC(可编程逻辑控制器)及工业物联网架构,为工业自动化领域带来了全新的可能性。下面我们将详细探讨钡铼IOy系列模块与PLC及工业物联…

图像分割:Pytorch实现UNet++进行医学细胞分割

图像分割:Pytorch实现UNet进行医学细胞分割 前言相关介绍项目结构具体步骤准备数据集读取数据集设置并解析相关参数定义网络模型定义损失函数定义优化器训练验证 参考 前言 由于本人水平有限,难免出现错漏,敬请批评改正。更多精彩内容&#x…

【Golang学习笔记】从零开始搭建一个Web框架(三)

文章目录 分组控制分组嵌套中间件 前情提示: 【Golang学习笔记】从零开始搭建一个Web框架(一)-CSDN博客 【Golang学习笔记】从零开始搭建一个Web框架(二)-CSDN博客 分组控制 分组控制(Group Control)是 Web 框架应提供…

【算法刷题 | 回溯思想 01】4.11(回溯算法理论、组合、组合总和 ||| )

文章目录 回溯1.回溯算法理论基础1.1什么是回溯法?1.2回溯法的效率1.3回溯法解决的问题1.4如何理解回溯法?1.5回溯法模板 2.组合2.1问题2.2解法一:暴力解法(循环次数不确定)2.3解法二:回溯2.3.1回溯思路&am…

Unity Shader之数学篇

一、坐标系 1、二维笛卡尔坐标系 屏幕坐标系是二维笛卡尔坐标系,OpenGL的屏幕坐标系原点在左下角,DirectX的屏幕坐标系原点在左上角。 2、三维笛卡尔坐标系 三维笛卡尔坐标系要区分是左手坐标系还是右手坐标系。 左手坐标系:举起你的左手…

linnux文件服务

1.FTP:文件传输协议。 基础:控制端口(身份验证) command 21/tcp 数据端口: data 20/tcp FTP Server默认配置:yum -y install vsftpd (安装vsftpd) touch /var/ftp/abc.txt(创建文件) systemctl start vsftpd(启动文件) systemctl …

Python零基础从小白打怪升级中~~~~~~~FastAPI和SQLAlchemy的整合

第六节:FastAPI和SQLALchemy的整合 一、ORM的查询操作 # 查找某个模型对应的那个表中所有的数据:all_person session.query(Person).all()# 使用filter_by来做条件查询all_person session.query(Person).filter_by(namemomo1).all()# 使用filter来做条…

【Go 快速入门】泛型 | 类型约束 | 泛型接口 | 通用数据结构

文章目录 泛型类型参数类型实例化类型约束类型集并集 & 交集 泛型接收者泛型方法泛型接口两种接口类型泛型接口 泛型实现通用数据结构数组链表数组队列 本节项目地址:06-GenericsQueue 泛型 如果你经常要分别为不同的类型写完全相同逻辑的代码,那么…

输了,腾讯golang一面凉了

本月正值4月,是金三银四的找工作的最佳时机。同时竞争也是很大,因为每年这个时候快要毕业的大学生也进去了找工作的潮水中。 今天分享我的一位大佬朋友CC,勇闯腾讯golang的面试经历。 这次面试问题的方向主要集中在计算机基础个网络方面。 下面是主要问到的问题。 第一个…

Word文档如何更改页面背景颜色?

在Microsoft Word中,设置页面颜色的方法有多种,以下为其中几种常用的方法:(为office2016版本操作) 方法一:使用主题颜色 1. 打开Word文档,在菜单栏中选择“设计”。 2. 在“设计”选项卡中&a…

泰山众筹:低门槛高回报的电商营销新模式

大家好,我是吴军,来自一家专注于软件开发的公司,担任产品经理一职。今天,我想与大家分享一种备受瞩目的商业模式——泰山众筹。 泰山众筹之所以能够在市场上迅速走红,其背后的原因值得我们深入探讨: 首先&…