文献速递:多模态影像组学文献分享:生成一种多模态人工智能模型以区分甲状腺良性和恶性滤泡性肿瘤:概念验证研究

文献速递:多模态影像组学文献分享:生成一种多模态人工智能模型以区分甲状腺良性和恶性滤泡性肿瘤:概念验证研究

文献速递介绍

近年来,人工智能(AI)领域日益被探索,作为一种增强传统医学诊断和预后方法的手段。机器学习(ML),AI的一个子领域,是一系列算法,任务是通过从数据集中提取有意义的特征和模式来创建预测或二元分类。当应用于医学图像时,ML有潜力揭示人工分析所遗漏的诊断特征,并已展现出与专家放射科医生相当乃至超越的预测能力。鉴于甲状腺结节在普通人群中的高发病率,加之超声解释中的主观性问题和观察者间的可变性,改善甲状腺超声图像的分类一直是AI研究的特别关注领域。

特别是在甲状腺疾病领域,ML方法主要集中在开发二元分类模型上,试图仅凭超声图像更准确地区分良性和恶性结节。然而,大多数先前的研究都包括了所有甲状腺癌,很少有专注于特定组织学亚型,如滤泡性癌,它们约占分化型甲状腺癌的5%到10%。

滤泡性癌与良性滤泡腺瘤仅凭人类对超声的解释无法区分,在没有明确的局部区域性或转移性疾病的情况下,需要在外科切除后对包膜或血管侵犯进行病理确认。因此,传统基于图像特征的ML分类模型在这一特定亚型的应用可能面临特别的挑战。

提高这些ML模型预测能力的方法,特别是在不常见的组织类型上,仍然是探索性追求的领域。结合多模态数据,而不是仅使用单一视觉数据类型(例如,超声图像或病理切片)或传统的临床病理数据,可能是一种实现更高准确性的方法。理论上,这种数据融合更好地模拟了临床决策实际过程,临床医生必须考虑来自多个来源的不同数据类型(例如,实验室值、影像学、患者病史和症状、生命体征的实时趋势),并开始应用于医学领域的不同领域。最近对多模态ML在健康环境中的应用的综述显示,与单模态模型相比,多个先前研究中展示了更好的预测能力。然而,多模态模型由于需要获取、处理和清洗大量数据,可能构建起来复杂且耗时,并且使用这种方法的当前研究报告了不同的技术。

鉴于特定组织学亚型ML模型数据的匮乏,我们寻求探索多模态ML方法的新颖性,其具体的二元分类任务是预测滤泡性癌与腺瘤。因此,这个概念验证研究的目的是开发一个多模态ML模型,任务是在接受甲状腺手术的研究人群中对滤泡性癌与腺瘤进行分类,并评估其与单一数据类型ML模型相比的预测准确性。作为一项探索性研究,我们广泛调查了所有术前和术后临床和影像学特征的相对重要性,这些特征可能有助于滤泡性癌与腺瘤的分类,以更好地了解哪些数据点在这一患者人群中最具有预测癌症的能力。

Title

题目

Generating a multimodal artificial intelligence model to differentiatebenign and malignant follicular neoplasms of the thyroid: A proof-ofconcept study

生成一种多模态人工智能模型以区分甲状腺良性和恶性滤泡性肿瘤:概念验证研究

Background

背景

Machine learning has been increasingly used to develop algorithms that can improve

medical diagnostics and prognostication and has shown promise in improving the classification of

thyroid ultrasound images. This proof-of-concept study aims to develop a multimodal machine-learning

model to classify follicular carcinoma from adenoma.

机器学习已越来越多地被用于开发算法,以提高医学诊断和预后的能力,并且在改善甲状腺超声波影像分类方面显示出潜力。这项概念验证研究旨在开发一种多模态机器学习模型,以区分滤泡性癌症和腺瘤。

Methods

方法

This is a retrospective study of patients with follicular adenoma or carcinoma at a single

institution between 2010 and 2022. Demographics, imaging, and perioperative variables were collected.

The region of interest was annotated on ultrasound and used to perform radiomics analysis. Imaging

features and clinical variables were then used to create a random forest classifier to predict malignancy.Leave-one-out cross-validation was conducted to evaluate classifier performance using the area underthe receiver operating characteristic curve.

这是一项回顾性研究,研究了2010年至2022年期间在单一机构接受治疗的滤泡性腺瘤或癌症患者。收集了人口统计学、影像学和围手术期变量。在超声波上标注了感兴趣区域,并用于进行放射组学分析。然后使用影像特征和临床变量创建随机森林分类器以预测恶性肿瘤。使用接收者操作特征曲线下面积进行留一交叉验证以评估分类器性能。

Results

结果

Patients with follicular adenomas (n ¼ 7) and carcinomas (n ¼ 11) with complete imaging and

perioperative data were included. A total of 910 features were extracted from each image. The t

distributed stochastic neighbor embedding method reduced the dimension to 2 primary represented

components. The random forest classifier achieved an area under the receiver operating characteristic

curve of 0.76 (clinical only), 0.29 (image only), and 0.79 (multimodal data).Conclusion: Our multimodal machine learning model demonstrates promising results in classifyingfollicular carcinoma from adenoma. This approach can potentially be applied in future studies to generatemodels for preoperative differentiation of follicular thyroid neoplasms.

包括了有完整影像和围手术期数据的滤泡性腺瘤(n = 7)和癌症(n = 11)患者。每个影像中提取了910个特征。t分布的随机邻居嵌入方法将维度降至2个主要代表性组成部分。随机森林分类器在接收者操作特征曲线下面积达到0.76(仅临床),0.29(仅影像),和0.79(多模态数据)。结论:我们的多模态机器学习模型在区分滤泡性癌症和腺瘤方面显示出有希望的结果。这种方法未来可以应用于生成用于术前区分滤泡性甲状腺肿瘤的模型的研究。

Figure

图片

Figure 1. Two examples of annotated ultrasound imagesd(A) adenoma; (B) carcinoma. Ultrasound images were cross-referenced with pathology reports to identifynodule of interest in each patient. All images that had nodule in view were manuallyannotated as shown to indicate region of interest ROI.

图1. 两个标注过的超声波影像示例(A)腺瘤;(B)癌症。超声波影像与病理报告进行了交叉参考,以确定每个患者感兴趣的结节。所有展示结节的影像均已手动标注,如图所示,以指示感兴趣区域(ROI)。

图片

Figure 2. Receiver operating characteristic curves of clinical only, image only, andmultimodal model performance are shown. The area under the curve values demonstrate the improved performance of the multimodal model (0.792) in comparison withthe clinical only model (0.759) and image only model (0.260). AUC, area under thecurve.

图2. 仅临床、仅影像和多模态模型性能的接收者操作特征曲线展示如下。曲线下面积值显示了多模态模型(0.792)相比于仅临床模型(0.759)和仅影像模型(0.260)的性能提升。AUC,曲线下面积。

图片

Figure 3. This graph displays feature importance score based on the clinical random forest classifier model, with size of nodule on pathology showing highest importance scoreamong the included clinical variables. BMI, body mass index; US, ultrasonography

图3. 该图展示了基于临床随机森林分类器模型的特征重要性评分,其中病理学上结节的大小显示为最高重要性评分在包括的临床变量中。BMI,身体质量指数;US,超声波检查。

Table

图片

TableIDemographic,preoperative,andoperative/postoperative clinical variables for patients in the 2 cohorts

表I 两组患者的人口统计学、术前和术中/术后临床变量

图片

Table IISummary of sensitivity, specificity, NPV, and PPV of the clinical only, image only, and multimodal models

zx-1701917912981)]

Table IISummary of sensitivity, specificity, NPV, and PPV of the clinical only, image only, and multimodal models

表II 仅临床、仅影像和多模态模型的灵敏度、特异性、NPV和PPV总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204748.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Failed to resolve org.junit.platform:junit-platform-launcher:1.9.3

springboot 跑 unit test 的时候,如果报错如题的话,可以更改idea 里的 Settings ——> HTTP Proxy 配置为:Auto-detect proxy settings

Google 发布最强大模型Gemini,能力与GPT-4相当

一、Gemini 介绍 Gemini 是一个多模式模型系列,在图像、音频、视频和文本领域展示了真正强大的功能。其中功能最强大的模型 Gemini Ultra 在 32 个基准测试中的 30 个中提升了最先进水平,其中包括 12 个流行文本和推理基准测试中的 10 个、9 个图像理解…

让工作更高效,那些不能错过的8款泳道图绘制工具

在现代企业的运营管理中,泳道图扮演了至关重要的角色。这种独特的图表工具以其直观、清晰的特点,帮助我们理解和改进复杂的工作流程,从而提升效率。本文将为你分享8款实用且高效的泳道图绘制工具,它们能够帮助你轻松创建出专业级别…

Java程序员,你掌握了多线程吗?【文末送书】

目录 摘要 01、多线程对于Java的意义 02、为什么Java工程师必须掌握多线程 03、Java多线程使用方式 04、如何学好Java多线程 参与方式🥇 推荐一个人工智能学习网站 https://www.captainbed.cn/bear 摘要 互联网的每一个角落,无论是大型电商平台的…

C语言内存函数讲解

目录 文章目录 内存函数针对的数据类型不确定可能是整型数据,字符数据,结构体数据...... memcpy的使用和模拟实现 memcpy的使用 memcpy打印字符数据 memcpy打印整型数据 memcpy的模拟实现 模拟实现的memcpy打印重叠情境 memmove的使用和模拟实现 memm…

为什么出海企业需要呼叫中心?

随着现代商业世界的发展,企业面临着越来越多的挑战和机遇。为了提高客户服务水平、客户满意度、企业形象和销售业绩,呼叫中心已成为越来越多企业的首选。那么,为什么出海企业需要呼叫中心呢? 1. 提高客户服务质量 首先&#xff…

Linux | tar,bc,uname指令

Linux | tar,bc, 文章目录 Linux | tar,bc,tar指令【重要】bc指令uname –r指令 tar指令【重要】 tar [-cxtzjvf] 文件与目录 … 参数: -c :建立一个压缩文件的参数指令(create 的意思);-x &am…

为什么对中小企业来说,数字化转型很难?

引言 数字化转型对中小企业至关重要,然而,实施这一转型却充满挑战。中小企业面临着资源、技术、文化和安全方面的种种难题,这些困难限制了它们在数字化领域的发展和竞争力。这种挑战不仅影响企业内部运营,还直接影响其与客户和市…

中国的下一个风口:数字化!

——“中国的下一个风口是什么?数字化?你赞同吗?” ——“中国的下一个风口是不是‘数字化’,不敢妄下定论。” 但可以肯定的是,企业想站上未来产业的风口,“数字化”是必经之路。也就是说,数…

HarmonyOS 开发 Java 与 ArkTS 如何抉择?

本文详细分析 Java 与 ArkTS 在 HarmonyOS 开发过程的区别,力求解答学员的一些困惑。 何为 HarmonyOS? 在讨论语言的差异时,我们先了解下什么是 HarmonyOS。华为官方是这么解释 HarmonyOS 的: “鸿蒙操作系统”特指华为智能终端…

视频集中存储/智能分析融合云平台EasyCVR平台接入rtsp,突然断流是什么原因?

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安…

Halcon 机械视觉 使用仿射变换 机械手实现孔位定位

要推算机械手平面坐标系A与相机平面坐标系B的关系,我们可以首先找到两个平面坐标系之间的平移量和旋转量。 平移量:选择一个公共的参考点,比如某个标志物,假设在坐标系A中的坐标为(Ax, Ay),在坐标系B中的坐标为(Bx, B…

GD32F303移植RT-Thread

我的平台: 芯片:GD32F303CCT6 编译器:KEIL5 一、下载keil专用 RT-Thread 安装包 https://www.keil.arm.com/packs/ 。。。。 。。。。 二、准备一个干净的GD32F303裸机工程,我就增加了串口功能 三、开始移植 1.rt-thread系统…

Java网络编程——非阻塞通信

对于用ServerSocket以及Socket编写的服务器程序和客户程序,它们在运行过程中常常会阻塞。例如当一个线程执行ServerSocket的accept()方法时,假如没有客户连接,该线程就会一直等到有了客户连接才从accept()方法返回。再例如当线程执行Socket的…

Chart 5 性能优化概述

文章目录 前言5.1 可移植性5.2 优化梗概5.3 OpenCL 移植的初始评估5.4 将CPU代码移植到OpenCL GPU5.5 并行化GPU和CPU工作负载5.6 瓶颈分析5.6.1 识别瓶颈5.6.2 解决瓶颈 5.7 API层面性能优化5.7.1 API函数调用的正确安排5.7.2 使用基于事件驱动的pipeline5.7.3 内核编译和构建…

0基础学习云计算难吗?

很多人经常会问云计算是什么?云计算能干什么?学习云计算能做什么工作?其实我们有很多人并不知道云计算是什么,小知今天来给大家讲讲学习云计算能做什么。 中国的云计算行业目前正处于快速发展阶段,随着互联网和数字化…

人脸识别安卓主板_MTK方案智能闸机门禁工业安卓主板定制开发

人脸识别主板广泛应用于各个领域,包括人脸支付系统、人脸识别监控系统、写字楼办公楼门禁闸机、校园、地铁、住宅门禁、考勤机、智能门锁、广告机、售卖机等。 主板基于联发科MTK方案,并由行业PCBA和MTK的核心板组成。根据产品需求,可以选择…

qt creator配置opencv库 (MSVC版本)

目录 1. MSVC版本 1.1 使用cmake编译opencv 1.2 再使用visual studio 2019生成opencv的lib,dll 1.3 配置opencv的系统环境变量 1.4 新建qt项目 1. MSVC版本 1.1 使用cmake编译opencv 1.2 再使用visual studio 2019生成opencv的lib,dll 1.3 配置opencv的系统环境变量 D:…

Educational Codeforces Round 159 (Div. 2) A~E

A.Binary lmbalance(思维) 题意: 给出一个01字符串,你可以对字符串进行无限次下列操作: 选择一个位置 i ( 1 ≤ i ≤ ∣ s ∣ − 1 , |s|为字符串s的长度 ) i(1 \le i \le |s| - 1,\text{|s|为字符串s的长度}) i(1≤…

深度学习实战66-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图

大家好,我是微学AI,今天给大家介绍一下深度学习实战66-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图。本文我将介绍自动驾驶技术及其应用场景,并重点阐述了基于计算机视觉技术下的自动驾驶。自动驾驶技术是一种利用人工智能和…