“多分辨率图网络”的模型:准确识别卵巢癌各种亚型

卵巢癌发病率居我国女性生殖系统恶性肿瘤第3位,死亡率居妇科恶性肿瘤之首其特点是存在异质性的组织学亚型。最常见的五种亚型,占所有卵巢癌的90%,分别是高级别浆液性癌(HGSC)、低级别浆液性癌(LGSC)、透明细胞癌(CCC)、粘液性癌(MC)和子宫内膜样癌(EC)。这些亚型在遗传学、预后和治疗选择上都有所不同,这使得它们的分类成为卵巢癌诊断的一个关键组成部分。然而,仅从标准的组织病理学样本中确定亚型可能是一项困难的任务,存在高水平的观察者间不一致性。因此,病理学家通常需要请求辅助性测试和第二意见以确保准确的诊断,这减缓了诊断路径并增加了成本。

计算机视觉模型在辅助病理诊断方面展现出巨大潜力,但卵巢癌亚型分类模型尚未得到临床验本文将使用基于视觉 Transformer (ViT) 的组织病理学基础模型UNICODE模型来提取特征,并将其与多分辨率图网络相结合,以实现对卵巢癌亚型的高精度分类。

1 方法

1.1 数据集

1.1.1 训练集:来自利兹教学医院 NHS 信托基金的 1864 张卵巢癌切除 WSI,包含五种亚型,共 434 名患者。

1.1.2 独立测试集:来自利兹教学医院 NHS 信托基金的 100 张 WSI,包含五种亚型,共 30 名患者,用于独立测试模型性能。

1.1.3 外部验证集:来自Transcanadian Study的 80 张 WSI,包含五种亚型,共 80 名患者,用于外部验证模型泛化能力。

卵巢癌组织学亚型

训练集

独立测试集

外部测试集

高级别浆液性癌 (HGSC)

1266个WSIs, 308名患者

20个WSIs, 7名患者

30个WSIs, 30名患者

子宫内膜样癌 (EC)

209个WSIs, 38名患者

20个WSIs, 5名患者

11个WSIs, 11名患者

透明细胞癌 (CCC)

198个WSIs, 45名患者

20个WSIs, 7名患者

20个WSIs, 20名患者

低级别浆液性癌 (LGSC)

92个WSIs, 21名患者

20个WSIs, 6名患者

9个WSIs, 9名患者

粘液性癌 (MC)

99个WSIs, 22名患者

20个WSIs, 5名患者

10个WSIs, 10名患者

​​​​​​​1.2 模型架构

多分辨率图网络模型流程

1.2.1 模型架构主要步骤

  • 组织块提取: 从整个组织切片中提取多个组织块,并根据所选的放大倍数调整块大小。
  • 特征提取: 使用预训练模型 (UNI 或 ImageNet 预训练的 ResNet50) 从降采样后的组织块中提取特征。
  • 图构建: 基于组织块的空间排列构建图结构,其中每个节点代表一个组织块,节点之间通过边连接,边权重表示节点之间的空间距离或语义相似度。
  • 图卷积网络: 使用图卷积网络 (GCN) 或图注意力网络 (GAT) 对图进行操作,学习节点之间的依赖关系,并更新节点特征。
  • 图池化: 使用图池化层对图进行降维,减少节点数量,同时保留重要的图结构信息。
  • 特征融合: 将不同放大倍数的图特征进行融合,例如通过连接或加权求和的方式。
  • 分类器: 使用全连接神经网络对融合后的特征进行分类,输出卵巢癌亚型预测结果。

1.2.2 模型变种

  • 不同特征提取器: 使用不同的预训练模型作为特征提取器,例如 UNI 或 ResNet50。
  • 不同放大倍数: 使用不同放大倍数的组织块进行训练,例如 5x、10x 和 20x。
  • 不同图结构: 使用不同的图结构,例如 GCN 或 GAT,并调整图结构和图池化层的参数。
  • 不同特征融合方式: 使用不同的特征融合方式,例如连接、加权求和或注意力机制。

2 结论

七个卵巢癌亚型分类模型在交叉验证、内部保留测试和Transcandian Study数据集上的外部验证结果

  • X轴:展示了不同的模型配置,包括基线图模型(5x + 10x)、ABMIL 10x 仅、图10x 仅、图10x + 20x、朴素特征空间、Concat_zero特征空间和ImageNet-ResNet50特征。
  • Y轴:展示了模型性能的三个关键指标:平衡准确率(Balanced Accuracy)、AUROC(Area Under the Receiver Operating Characteristic curve,接收者操作特征曲线下面积)和F1分数(F1 Score)。
  • 条形图/折线图:使用了条形图来表示不同模型在不同验证阶段的性能。每个模型有三个条形,分别对应交叉验证、保留测试和外部验证的结果。

2.1 模型性能

  • 交叉验证:10x 和 20x 放大倍数的多分辨率图模型 (concat_zero) 表现最佳,平衡准确率为 74.2%。
  • 独立测试集:ABMIL 模型表现最佳,平衡准确率为 88.0%。
  • 外部验证集:10x 和 20x 放大倍数的多分辨率图模型表现最佳,平衡准确率为 99.0%,接近完美。

2.2 模型性能分析

  • 特征提取器:UNI 特征提取器优于 ImageNet 预训练 ResNet50,说明选择合适的特征提取器对模型性能至关重要。
  • 放大倍数:10x+20x 放大倍数模型在所有验证集上都优于 5x+10x 基线模型,说明使用更高放大倍数的数据可以提升模型性能。
  • 多分辨率特征空间:三种不同的多分辨率特征空间处理方式各有优劣,concat_zero 在交叉验证和外部验证中表现最佳,naive 在独立测试集中表现最佳。

2.3 模型性能的影响因素

  • 验证集的差异:独立测试集和外部验证集包含的样本数量较少,且不包括间隔减瘤手术样本,这可能导致模型性能评估结果存在偏差。
  • 扫描放大倍数的差异:不同扫描放大倍数可能影响图像质量,进而影响模型性能。
  • 指标的选择:AUROC 指标在处理不平衡多分类问题时存在局限性,平衡准确率和 F1 分数更能反映模型的临床应用价值。

2.4 结论

  • 多分辨率图模型可以提高卵巢癌亚型分类的准确性,特别是在外部验证集中表现出接近完美的性能。
  • UNI 特征提取器优于 ImageNet 预训练 ResNet50。
  • 10x+20x 放大倍数模型优于 5x+10x 和单一放大倍数模型。
  • 多分辨率特征空间的选择对模型性能有一定影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/51480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

项目实战--JUC之CompletableFuture温故

CompletableFuture温故 一、前言二、Future三、CompletableFuture3.1 CompletableFuture定义3.2 CompletableFuture使用场景3.3 CompletableFuture 常见操作3.3.1 创建CompletableFuture3.3.2 使用CompletableFuture3.3.3 异常处理3.3.4 注意事项 四、CompletableFuture处理工具…

阿里云创建的SpringBoot项目打包时找不到主清单属性

原因是因为maven配置文件中有一个打包属性配置 <configuration><mainClass>com.yang.ExamSystemApplication</mainClass><!-- 找到这个<skip>true</skip>标签关闭&#xff0c;或者属性改为false --><skip>true</skip> </c…

Hive环境搭建(Mysql数据库)

【实验目的】 1) 了解hive的作用 2) 熟练hive的配置过程&#xff08;Mysql数据库&#xff09; 【实验原理】 Hive工具中默认使用的是derby数据库&#xff0c;该数据库使用简单&#xff0c;操作灵活&#xff0c;但是存在一定的局限性&#xff0c;hive支持使用第三方数据库&…

第一百八十三节 Java IO教程 - Java目录事件、Java异步I/O

Java IO教程 - Java目录事件 当文件系统中的对象被修改时&#xff0c;我们可以监听watch服务以获取警报。 java.nio.file包中的以下类和接口提供watch服务。 Watchable接口WatchService接口WatchKey接口WatchEvent接口WatchEvent.Kind接口StandardWatchEventKinds类 可监视对…

FPGA开发——按键控制LED的实现

一、概述 在上一篇文章中我们学习了按键的相关消抖及其使用&#xff0c;在这篇文章当中我们就针对通过按键实现LED的控制。 1、按键原理图 2、基本框架 通过我们前面编写的按键消抖的文件和LED文件将按键和LED两个模块进行交互&#xff0c;从而达到按键控制LED的目的。 二、…

计算机毕业设计碾压导师Python+Django农产品推荐系统 农产品爬虫 农产品商城 农产品大数据 农产品数据分析可视化 PySpark Hadoop

基于Spark的农产品个性推荐系统 相关技术介绍: 1. Python Python是一种高级编程语言&#xff0c;具有简洁、易读、易学的特点&#xff0c;被广泛应用于Web开发、数据分析、人工智能等领域。 在此系统中&#xff0c;我们使用Python进行后端开发&#xff0c;利用其强大的语法…

Mysql 输出本月初至当前的全部天数

代码&#xff1a; SELECT DATE_FORMAT(DATE_ADD(CONCAT(DATE_FORMAT(CURDATE(), "%Y-%m-01")),INTERVAL (CAST(help_topic_id AS SIGNED)) DAY),%Y-%m-%d) as DATE FROMmysql.help_topic WHERE help_topic_id < TIMESTAMPDIFF(DAY, CONCAT(DATE_FORMAT(CURDATE…

【最优化方法】随笔 - 基本概念简单整理

文章目录 前言1.背景知识两个概念&#xff1a; 2.最优化问题2.1应用2.2 最优化问题的数学形式极小化目标函数可行区域可行解 2.3 举例说明2.4 最优化问题不同的类型2.5 一些概念 3.凸集和凸函数3.1 范数3.2 矩阵范数&#xff08;扩展&#xff09;3.3 凸集与凸函数凸集凸函数 写…

实时宽表建设

实时宽表建设是数据仓库&#xff08;Data Warehouse, 简称数仓&#xff09;中的一种重要建模技术&#xff0c;旨在提高数据查询和分析的效率。以下是对实时宽表建设的详细解释&#xff1a; 一、定义 实时宽表&#xff0c;顾名思义&#xff0c;是指具有较多字段&#xff08;列…

无人机像素经纬度识别

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…

组件库 组件工程化管理探索

文章目录 组件库单组件版本控制打包组件在用户项目中注册组件项目可以直接在模版中使用引入的打包后的组件原因 每个组件独立的 package.json 文件的单组件包管理使用 lerna 或 yarn workspaces 进行统一管理添加组件文档、测试通过 CI/CD 流水线自动化这个流程 国际化换肤组件…

旅美钢琴学者何超东北巡演启幕,精湛演绎肖邦全套作品

7月26日、28日&#xff0c;旅美钢琴学者何超在长春和哈尔滨两地成功开启了他的暑期钢琴独奏音乐会东北巡演。在这两场演出中&#xff0c;何超为观众带来了全套肖邦的「谐谑曲」与「叙事曲」&#xff0c;以娴熟的技巧、惊人的记忆力和体力&#xff0c;将八首曲目一气呵成&#x…

一体化政务大数据体系-数据目录系统

1、系统目标 实现数据目录一体化&#xff0c;按照应编尽编的原则&#xff0c;推动各地区各部门建立全量覆盖、互联互通的高质量一体化政务数据目录。建立数据目录系统与部门目录、地区目录实时同步更新机制&#xff0c;实现政务数据“一本账”管理。 2、需求描述 一是实现政…

这可能是开源界最好用的能源管理系统

&#x1f482; 个人网站: IT知识小屋&#x1f91f; 版权: 本文由【IT学习日记】原创、在CSDN首发、需要转载请联系博主&#x1f4ac; 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦 文章目录 写在前面项目简介项目特点项目架构模块展示项目获取 写在前面 大…

buu做题(9)

[MRCTF2020]PYWebsite 有个二维码 扫了一下啊二维码 function enc(code){hash hex_md5(code);return hash;}function validate(){var code document.getElementById("vcode").value;if (code ! ""){if(hex_md5(code) "0cd4da0223c0b280829dc3ea4…

Java之归并排序

归并排序 归并排序(Merge Sort)算法&#xff0c;使用的是分治思想。分治&#xff0c;顾名思义&#xff0c;就是分而治之&#xff0c;将一个大问题分解成小的子问题来解决。小的子问题解决了&#xff0c;大问题也就解决了。 核心源码: mergeSort(m->n) merge(mergeSort(m-&g…

Java8新特性(一) Lambda表达式与函数式接口

Java8新特性&#xff08;一&#xff09; Lambda表达式与函数式接口 一. 基本概念 Lambda表达式是Java 8中引入的一个重要的新特性&#xff0c;该表达式提出了一种新的语法规则&#xff0c;用于对某些&#xff08;函数式接口&#xff09;匿名内部类的书写方式进行简化。除此之外…

什么是等保测评?

信息安全等级保护测评&#xff0c;简称等保测评&#xff0c;是根据我国《信息安全等级保护管理办法》的规定&#xff0c;对国家重要信息系统进行的安全评估制度。等保测评的频率、必要性以及在实际操作中的常见误区&#xff0c;是企业和机构在进行等保测评时需要了解的重要内容…

智能写作分享

智能写作技术路线 ​ 在大模型的现有能力框架内&#xff0c;其对于处理长文档级别的智能写作任务存在一定的局限性。针对这一问题&#xff0c;本文深入探讨了长文档智能写作这一应用场景&#xff0c;并在此基础上&#xff0c;提出了一套切实可行的技术解决方案。该方案旨在弥补…

ts踩坑!使用可选链 ?.处理可能遇到的 undefined 或 null 值的情况,但是仍然收到一个关于可能为 undefined 的警告!

在 TypeScript 中&#xff0c;当你使用可选链&#xff08;Optional Chaining&#xff09;?. 时&#xff0c;你其实已经处理了可能遇到的 undefined 或 null 值的情况。但是&#xff0c;如果你仍然收到一个关于可能为 undefined 的警告&#xff0c;这可能是因为 TypeScript 的类…