多模态融合 + 慢病精准预测

多模态融合 +慢病精准预测

    • 慢病预测算法拆解
        • 子解法1:多模态数据集成
        • 子解法2:实时数据处理与更新
        • 子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析
      • 慢病预测更多模态

 


论文:https://arxiv.org/pdf/2406.18087

演示:https://www.youtube.com/watch?v=oqmL9DEDFgA

传统的慢性病诊断涉及与医生面对面的咨询以识别疾病。然而,缺乏研究集中在使用临床笔记和血液测试值预测和开发应用系统。

我们收集了台湾医院数据库2017至2021年的五年电子健康记录(EHRs)作为人工智能数据库。

开发了一个基于大型语言多模态模型(LLMMs)的慢性病预测平台。

这个平台可以与前端网页和移动应用集成,还能连接到医院的后端数据库,提供实时的风险评估诊断。

我们使用多种模态数据,来处理常见的慢性疾病,如糖尿病、心脏病和高血压,进行多模态模型训练。

  • 临床笔记:这些文本数据包含医生的详细观察和患者的病历描述,能够提供患者的历史病情和症状信息。
  • 实验室测试结果:包括血液检测等生化指标,这些是量化数据,提供了关于患者当前健康状况的重要信息。
  • 历史电子健康记录(EHR):可能包括患者过去的医疗记录、药物使用记录、手术历史等,这些数据有助于模型理解患者的整体健康轨迹。

以及使用了大模型,如BERT 、BiomedBERT、Flan-T5-large-770M 和 GPT-2 作为文本特征提取器。

  • 在高血压的预测中,所有模型的表现都相对较低,其中BERT和BiomedBERT的精确度和F1分数均为0.35和0.32,而GPT-2的表现最差,精确度为0.29,F1分数为0.25。

  • 对于心脏病的预测,GPT-2表现最好,精确度为0.81,召回率为0.85,F1分数为0.83。BiomedBERT也表现良好,其精确度、召回率和F1分数分别为0.76、0.75和0.75。

  • 在糖尿病分类上,GPT-2与BiomedBERT表现较好,GPT-2的精确度为0.70,召回率为0.71,F1分数也为0.70;而BiomedBERT的召回率达到0.72,F1分数为0.67。

  • 结论是,在临床记录,文本特征提取器,每个大模型在不同慢病上,效果都不同。最好是专门子领域微调过的。

接下来,我们将单一模态的临床笔记作为输入到LLMMs中,提取文本特征嵌入,并使用注意力模块将它们融合,用于最终的预测任务。

  • 数据收集与预处理:从EHR和实验室测试数据开始,收集必要的信息。
  • AI训练数据库的建立:包括数据清洗和医疗团队的注解,以确保数据的质量和适用性。
  • 大型语言多模态模型(LLMMs):展示了如何使用LLMMs来从处理过的数据中提取特征,并用于预测如早期糖尿病和其他慢性疾病。

在这里插入图片描述
Web平台的四个主要界面:

  • (a) 疾病风险界面:展示患者的糖尿病、高血压和心脏病风险评估。
  • (b) 早期疾病预测界面:展示患者未来90、180、270和360天的糖尿病风险。
  • © SHAP值解释界面:使用SHAP值来标识临床笔记中的关键风险因素。
  • (d) 实验室数据提交界面:允许医生上传患者的血液测试数据。

慢病预测算法拆解

开发一个能够实时预测和警报慢性病风险的医疗诊断系统,以提高患者管理效率并支持临床决策。

解法涉及整合多模态数据以提高慢性病预测的准确性。

子解法1:多模态数据集成

特征:慢性病的预测需要综合多种数据源(如临床笔记、实验室测试结果)来增强预测模型的信息丰度。

  • 原因:之所以采用多模态数据集成,是因为慢性病的表现和影响因素多样,需要多维度的数据支持以提高预测的全面性和准确性。
  • 例子:通过结合EHR中的文本数据(如医生的临床笔记)和量化数据(如血液检测结果),LLMMs能够更全面地分析患者的健康状态,预测疾病发展。

对于血液测试数据,构建了一个深度神经网络(DNN)来获取血液表示。

为了更好地整合这两种模态,我们使用了多头注意力层来计算来自两个领域的嵌入的注意力得分和矩阵。

最后,采用全连接层来预测多种疾病。

子解法2:实时数据处理与更新

特征:慢性病管理需求对数据的时效性极高,需要系统能够实时处理和更新数据。

  • 原因:之所以需要实时数据处理与更新,是因为慢性病状的快速变化需要及时调整治疗方案,以防病情恶化。
  • 例子:系统通过实时同步最新的健康检查结果和临床记录到数据库,并即时进行数据分析,以便快速反馈给医生和患者潜在的健康风险。
子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析

特征:LLMMs能够处理和理解大规模和复杂的数据集,适用于提取临床文本和实验室数据中的关键特征。

  • 原因:之所以使用LLMMs,是因为它们在处理复杂和大量的医疗数据方面具有优越性,可以捕捉深层次的模式和关联,提供精确的病症风险预测。
  • 例子:LLMMs分析患者的历史数据和最新测试结果,使用深度学习技术识别出可能导致疾病恶化的关键指标,从而提前警告医生和患者采取预防措施。

在阅读和理解了文章内容之后,可以看到背后的模式是通过技术集成和数据智能处理来增强医疗预测系统的效能。

体现了医疗信息技术领域中对实时、精确医疗决策支持系统的需求增长。

例如,将实时数据处理与多模态数据分析相结合,可以实现更为动态和精准的疾病管理,这在处理慢性病如糖尿病或心血管疾病时尤为重要。

慢病预测更多模态

在慢性病预测中,考虑多模态数据是非常有益的,因为这可以显著增加预测的精确度和全面性。

以下是一些重要的数据模态,它们在慢性病预测中可以提供关键信息:

  1. 临床笔记和医疗记录:这些文本数据提供了患者的详细病史,包括症状描述、治疗反应、以及医生的观察和推论。

  2. 实验室测试结果:血液、尿液等生化检测结果提供了关于患者生理状况的具体量化数据,如血糖、胆固醇、肝功能指标等。

  3. 影像医学数据:包括X光、MRI、CT扫描等影像资料,这些图像数据能帮助评估器官的结构和功能状况,对于诊断如癌症、心脏病等疾病尤为重要。

  4. 生理监测数据:如心电图、血压监测、血糖监测等连续的生理参数监测,可以提供关于患者状况的实时数据。

  5. 可穿戴设备数据:随着技术的发展,越来越多的健康相关数据可以通过可穿戴设备收集,如活动量、心率、睡眠质量等,这些数据有助于理解患者的生活习惯和日常健康状况。

  6. 遗传信息:基因数据可以揭示个体对特定疾病的易感性,对于预测遗传性疾病或评估疾病风险具有重要价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/865022.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动化测试用例设计-软件测试基本概念解析

软件测试基本概念解析 1. 引言:软件测试的重要性​ 在当今这个数字化时代,软件质量直接关系到企业的竞争力和用户满意度。一个小小的bug可能造成重大经济损失,甚至影响品牌形象。因此,软件测试成为了确保软件可靠性的关键环节&a…

发电机保护屏组成都有哪些,如何选择

发电机保护屏组成都有哪些,如何选择 发电机是电力系统中最常用的一种电力设备。例如水力发电机,柴油发电机,风力发电机,火力发电等等。发电机保护是保证发电机安全、稳定运行的重要手段之一。对于一些小型机组的发电机&#xff0c…

探囊取物之多形式注册页面(基于BootStrap4)

基于BootStrap4的注册页面,支持手机验证码注册、账号密码注册 低配置云服务器,首次加载速度较慢,请耐心等候;演练页面可点击查看源码 预览页面:http://www.daelui.com/#/tigerlair/saas/preview/ly4gax38ub9j 演练页…

RTSP协议在视频监控系统中的典型应用、以及视频监控设备的rtsp地址格式介绍

目录 一、协议概述 1、定义 2、提交者 3、位置 二、主要特点 1、实时性 2、可扩展性 3、控制功能 4、回放支持 5、网络适应性 三、RTSP的工作原理 1、会话准备 2、会话建立 3、媒体流控制 4、会话终止 5、媒体数据传输 四、协议功能 1、双向性 2、带外协议 …

趣玩双色球APP-PyQt5实现

开发环境及软件主要功能说明 开发环境 win10 Vscode Python10.5-64_bit 使用的python库 requests,bs4,pandas,PyQt5 主要功能说明: 数据库更新,保存,另存为功能过滤显示,根据期数,开奖日期,开间期号过…

NativeMemoryTracking查看java内存信息

默认该功能是禁用的,因为会损失5-10%的性能 开启命令 -XX:NativeMemoryTrackingdetail 打印命令 jcmd 45064 VM.native_memory summary scaleMB > NativeMemoryTracking.log 具体的日志信息 ➜ ~ ➜ ~ jcmd 45064 VM.native_memory summary scaleMB 45064…

AndroidStudio activity-1.8.0.aar依赖报错

在使用Androidstudio自帶的創建activity及配套 xml時,構建項目失敗,報錯内容: Null extracted folder for artifact: ResolvedArtifact(componentIdentifierandroidx.activity:activity:1.8.0, variantNamenull, artifactFileC:\Users\hhhh\.…

Golang 开发实战day15 - Input info

🏆个人专栏 🤺 leetcode 🧗 Leetcode Prime 🏇 Golang20天教程 🚴‍♂️ Java问题收集园地 🌴 成长感悟 欢迎大家观看,不执着于追求顶峰,只享受探索过程 Golang 开发实战day15 - 用户…

object对象类型截取实现数组的slice效果

slice是数组的方法,而对象(Object)和数组是两种不同的数据结构。对象没有索引(index)的概念。 对象的属性是通过键(key)来访问的,而这些键并不保证是整数或连续的。 1、获取对象的键…

AMEYA360:类比半导体推出36V超低输入偏置电流高性能通用运算放大器

在精密信号处理领域,每一次技术创新都意味着性能的飞跃与应用的拓展。上海类比半导体技术有限公司(以下简称“类比半导体”)凭借其在模拟及数模混合芯片设计领域的深厚积累,今日正式宣布推出其全新OPJ301x系列超低输入偏置电流高性能通用运算放大器。该系…

Canvas 指纹:它是什么以及如何绕过它

什么是 Canvas 指纹? 网络浏览器在执行其功能时会收集各种信息。当这些信息中的某些被用于识别网站用户时,这被称为浏览器指纹。 浏览器指纹包括以下有关浏览器的信息:设备型号、浏览器类型和版本、操作系统 (OS)、屏幕分辨率、时区、p0p 文…

AI大模型对话(上下文)缓存能力

互联网应用中,为了提高数据获取的即时性,产生了各种分布式缓存组件,比如Redis、Memcached等等。 大模型时代,除非是免费模型,否则每次对话都会花费金钱来进行对话,对话是不是也可以参照缓存的做法来提高命…

java面试-SpringAOP

1.SpringAOP的使用 你了解Spring AOP 吗? 通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术。 2.SpringAOP的原理 我们可以将ASM生成的类进行缓存,这样能解决生成的类比较低效的问题。 ASM是可以操作字节码的框架。 真实实现类和…

【elastic默认磁盘达到百分之多少不写入】

1、Elasticsearch(Elastic)默认的磁盘水位线设置是为了防止磁盘空间耗尽导致的数据丢失。在Elasticsearch中,这个设置被称为cluster.routing.allocation.disk.watermark, 并且分为三个级别:low、high和flood_stage。 …

js中添加数组元素的方法

push() 方法将一个或多个元素添加到数组的末尾,并返回新的长度。 let arr [1, 2, 3]; arr.push(4); // arr 现在是 [1, 2, 3, 4] arr.push(5, 6); // arr 现在是 [1, 2, 3, 4, 5, 6] unshift() 方法将一个或多个元素添加到数组的开头,并返回新的长…

刷题Day40|518. 零钱兑换 II、377. 组合总和 Ⅳ、70. 爬楼梯 (进阶)

完全背包:物品有无限个。 518. 零钱兑换 II 思路:找组合数。递推公式和494、目标和一样:dp[j] dp[j - nums[i]]。注意遍历顺序是先物品后背包才是组合。 377. 组合总和 Ⅳ 思路:找组合数。递推公式照样。要注意遍历顺序。 70…

去中心化社会的崛起:探索区块链对社会结构的影响

随着区块链技术的发展和应用,我们正逐步迈向一个去中心化的社会结构。本文将深入探讨区块链技术如何影响社会结构,从经济、政治到文化等多个方面进行探索和分析,揭示其可能带来的革命性变革。 1. 区块链技术的基本原理回顾 1.1 分布式账本与…

网络工程术语

1. IP 地址 (IP Address) IP 地址是分配给每个网络设备的唯一标识符,用于在网络中进行通信。IP 地址有两种主要版本: IPv4 和 IPv6。 IPv4 (Internet Protocol version 4): 由四组数字组成,每组数字在0到255之间,例如 192.168.…

黑芝麻科技A1000简介

文章目录 1. A1000 简介2. 感知能力评估3. 竞品对比4. 系统软件1. A1000 简介

Latex写作工具整理(Overleaf)

一、公式(MathType) 先用MathType编辑好公式,再粘贴到Overleaf 预置-剪切和复制预置-选择“MathML或Tex"-确定 1.行内公式 粘贴到overleaf里面把两侧的" \["替换成"$" $ A $ 2.单行公式 \begin{equation}\labe…