【医学大模型】临床推理 + 大模型,推理感知型诊断框架

临床推理 + 大模型,推理感知型诊断框架

    • 提出背景
      • Module II-1: 少数样本CoT推理
      • Module II-2: 单模态学生蒸馏
      • Module II-3: 多模态学生蒸馏

 


提出背景

论文:https://arxiv.org/pdf/2312.07399.pdf

 

这篇文章提出了一种新的诊断框架,专注于利用大型语言模型(LLMs)进行临床推理以改进疾病诊断。

推理感知型诊断框架是一种结合了人类临床推理方式和大型语言模型(LLMs)能力的诊断方法。

它不仅依赖于直接的病症识别,还通过模拟医生的推理过程来提供诊断。

这种方法能够解释其推理过程,从而增加医生和患者对机器学习模型判断的信任。

推理感知型诊断框架概览:
在这里插入图片描述
该框架有三个组成部分:

  • 使用LLMs进行少数样本推理,模型使用少数例子来生成推理和诊断。
  • 单模态蒸馏,使用一个参数小于7B的精调语言模型(LM)。
  • 多模态蒸馏,使用一个参数小于7B的精调视觉-语言模型(VLM),可能结合文本和图像数据进行诊断。

Module II-1: 少数样本CoT推理

  • 特征: 利用LLMs在少数样本情境下通过CoT(思维链条)提示进行逻辑推理的能力。
  • 逻辑链: 这个子模块首先生成一个临床推理Rˆ,然后基于这个推理和病人描述P预测疾病诊断Dˆ。这个过程是顺序的,意味着先生成推理,再做出诊断。
  • 目的: 探索LLMs在临床诊断领域的应用,尤其是如何通过逻辑推理来提升疾病诊断的准确性。

CoT 用LLMs的能力,通过生成自然语言的理由来指导和解释解决方案,模拟临床专业人员的推理过程。这种推理是为了弥补传统深度学习模型在临床推理方面的缺失,特别是它们缺乏提供诊断解释的能力。

推理感知型诊断(Reasoning-aware Diagnosis): 本质上,这是针对疾病诊断的链式思维推理的具体应用。

在临床推理的背景下,这意味着模型不仅基于患者数据进行诊断,而且还能生成解释其推理路径的理由,从而提供更透明的诊断过程。

在这里插入图片描述
上图,使用临床推理进行病人诊断的模型输入和输出的示例。

模型输入包括病人的描述,如年龄、教育、婚姻状况、迷你精神状态检查得分、APOE4基因的存在,以及MRI扫描结果显示有严重的杏仁核和内侧颞叶萎缩。

模型输出提供了一个临床推理,引用相关知识来指导和解释诊断。

在这个示例中,基于提供的证据和推理,患者被诊断为轻度认知障碍。

Module II-2: 单模态学生蒸馏

  • 特征: 使用LLMs生成的临床推理来训练更小的语言模型,这些小模型能够在实际应用中更便捷地部署。
  • 逻辑链: 这个子模块通过最小化生成损失LLM-Distill来训练语言模型,这个过程包括用临床数据和对应的推理来优化模型。
  • 目的: 将大型语言模型的推理能力转移到更小、更实用的模型中,使其能够在现实世界的临床设置中使用。

Module II-3: 多模态学生蒸馏

  • 特征: 考虑到临床诊断经常涉及医学图像,此子模块扩展了知识蒸馏到视觉-语言模型(VLMs),这些模型能够处理文本和图像输入。
  • 逻辑链: 给定病人描述P和对应的MRI扫描V,VLM被训练来基于这些输入顺序预测临床推理R和诊断D,通过最小化损失LVLM-Distill来学习。
  • 目的: 在临床诊断中整合多模态数据(文本和图像),通过更小的模型实现高效的推理和诊断。

从理解临床数据的需求出发,通过链式思维推理生成理由,再到利用这些理由进行精确诊断,最后通过模型蒸馏确保这一过程可以在实际临床环境中高效运行。

 

假设诊断阿尔茨海默病(AD)的诊断,我们有一个患者的数据,包括:

  • 文本描述:来自MRI扫描的描述,指出患者有严重的海马体萎缩。
  • 人口统计信息:患者年龄、性别等。
  • 教育水平:患者受教育年数。
  • 迷你精神状态检查(MMSE)结果:一种常用的认知功能评估工具。
  • APOE4基因的存在:与阿尔茨海默病风险增加相关的基因。

在传统的疾病诊断模型中,可能直接根据这些数据使用图像或文本分类来预测患者是否患有阿尔茨海默病、轻度认知障碍(MCI)或正常认知。

而在推理感知型诊断框架中,处理过程如下:

  1. 生成临床推理(R):首先,LLM会根据患者数据生成一个临床推理,解释为什么根据提供的信息,特定的诊断是有道理的。

    例如,模型可能会生成一个推理:“考虑到患者的海马体萎缩程度,结合其年龄、MMSE评分下降,以及APOE4基因的存在,这些都是阿尔茨海默病的典型指标。”

  2. 预测诊断(D):接着,模型会使用这个推理来做出诊断决策。

    在这个例子中,基于推理,模型可能会预测患者患有阿尔茨海默病。

这种方法的优势在于,它不仅提供了一个诊断结果,还给出了达到这个结论的逻辑路径。

这种透明的推理过程与医生分析患者信息时的思考过程相似,可以帮助医生更好地理解和信任模型的判断,同时也为患者提供了更加详细和透明的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/695859.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android T 远程动画显示流程其二——动画的添加流程(更新中)

前言 接着上篇文章分析 Android T 远程动画显示流程其一 切入点——处理应用的显示过渡 下面,我们以从桌面点击一个应用启动的场景来分析远程动画的流程,窗口添加的流程见Android T WMS窗口相关流程 这里我们从AppTransitionController.handleAppTran…

HAL STM32 HW I2C DMA + SSD1306/SH1106驱动示例

HAL STM32 HW I2C DMA SSD1306/SH1106驱动示例 📍硬件I2C DMA驱动参考:https://blog.csdn.net/weixin_45065888/article/details/118225993 📌github上的相关项目:https://github.com/taburyak/STM32_OLED_SSD1306_HAL_DMA &am…

五种多目标优化算法(MOGWO、MOJS、NSWOA、MOPSO、MOAHA)性能对比,包含6种评价指标,9个测试函数(提供MATLAB代码)

一、5种多目标优化算法简介 1.1MOGWO 1.2MOJS 1.3NSWOA 1.4MOPSO 1.5MOAHA 二、5种多目标优化算法性能对比 为了测试5种算法的性能将其求解9个多目标测试函数(zdt1、zdt2 、zdt3、 zdt4、 zdt6 、Schaffer、 Kursawe 、Viennet2、 Viennet3)&#xff0…

Linux服务器安装MySQL8

进入安装目录 /usr/local下载 wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysql-8.0.20-linux-glibc2.12-x86_64.tar.xz解压,重命名 tar -Jxvf mysql-8.0.20-linux-glibc2.12-x86_64.tar.xzmv mysql-8.0.20-linux-glibc2.12-x86_64 mysql8创建用户组、用户 # 需要…

fastApi笔记01-路径参数

路径参数 使用与 Python 格式化字符串相同的语法来声明路径"参数"或"变量" from fastapi import FastAPIapp FastAPI()app.get("/items/{item_id}") def read_item(item_id):return {"item_id": item_id} http://127.0.0.1:8000/i…

SpringSecurity安全框架

我们使用这个springSecurity安全框架,作用是认证,授权,将用户的权限和对应的资源进行绑定,默认的是在内存中保存的,实际开发中,是需要根据项目业务的需求对某些方法进行重写,使数据库中权限对应的资源进行绑定,就是查看当前登录的用户所扮演的角色,该角色有哪些权限 授权 1内…

【操作系统】

计算机操作系统 计算机是如何让用户得到好的体验什么是操作系统(OS)操作系统如何管理 计算机是如何让用户得到好的体验 计算机系统是由计算机硬件和软件组成的。用户使用计算机,比如在文本文件填写内容,通过邮箱发送邮件&#xf…

Aloudata StarRocks 直播预告:指标平台的物化加速实践

数据指标的管理、研发和应用一直存在着诸多痛点,这些挑战促使了对指标平台解决方案的需求不断增长。2月29日(星期四)19:00,Aloudata 将与 StarRocks 携手举办线上直播,深入揭秘第三代指标平台物化加速的强大能力&#…

大蟒蛇(Python)笔记(总结,摘要,概括)——第10章 文件和异常

目录 10.1 读取文件 10.1.1 读取文件的全部内容 10.1.2 相对文件路径和绝对文件路径 10.1.3 访问文件中的各行 10.1.4 使用文件的内容 10.1.5 包含100万位的大型文件 10.1.6 圆周率中包含你的生日吗 10.2 写入文件 10.2.1 写入一行 10.2.2 写入多行 10.3 异常 10.3.1 处理Ze…

基于springboot+vue的课程答疑系统(前后端分离)

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

外站群服务器的特性及使用优势

随着互联网的快速发展,站群服务器在网站运营中扮演着越来越重要的角色。相较于国内站群服务器,国外站群服务器因其独特的特性和使用优势,受到了众多网站管理员的青睐。本文将对国外站群服务器的特性及使用优势进行科普介绍。 一、国外站群服务…

【Spring Cloud】实现微服务调用的负载均衡

文章目录 什么是负载均衡自定义实现负载均衡启动shop-product微服务通过nacos查看微服务的启动情况自定义实现负载均衡 基于Ribbon实现负载均衡添加注解修改服务调用的方法Ribbon支持的负载均衡策略通过修改配置来调整 Ribbon 的负载均衡策略通过注入Bean来调整 Ribbon 的负载均…

JS进阶——解构赋值

数组解构 基本: let [a, b, c] [1, 2, 3]; // a 1 // b 2 // c 3 可嵌套 let [a, [[b], c]] [1, [[2], 3]]; // a 1 // b 2 // c 3 可忽略 let [a, , b] [1, 2, 3]; // a 1 // b 3 不完全解构 let [a 1, b] []; // a 1, b undefined 剩余运…

如何创造价值写给自己的笔记

人工智能统领全文 在深入探讨这篇概述之前,我们首先需要理解一个核心观点:生产力的进步与生产关系的变革是相辅相成的。这一点在历史的长河中不断得到验证,从工业时代到信息时代,再到如今由人工智能引领的新时代,每一…

探索D咖智能饮品机器人的工作原理:科技、材料与设计的相互融合

智能饮品机器人是近年来随着人工智能和自动化技术的发展而崭露头角的一种创新产品。它将科技、材料和设计相互融合,为消费者带来了全新的饮品体验。下面D咖来探索智能饮品机器人的工作原理,以及科技、材料和设计在其中的作用。 首先,智能饮品…

Observability:使用 OpenTelemetry 和 Elastic 监控 OpenAI API 和 GPT 模型

作者: 来自 Elastic David Hope ChatGPT 现在非常火爆,甚至席卷了整个互联网。 作为 ChatGPT 的狂热用户和 ChatGPT 应用程序的开发人员,我对这项技术的可能性感到非常兴奋。 我看到的情况是,基于 ChatGPT 的解决方案将会呈指数级…

Docker本地部署Rss订阅工具并实现公网远程访问

文章目录 1. Docker 安装2. Docker 部署Rsshub3. 本地访问Rsshub4. Linux安装Cpolar5. 配置公网地址6. 远程访问Rsshub7. 固定Cpolar公网地址8. 固定地址访问 Rsshub是一个开源、简单易用、易于扩展的RSS生成器,它可以为各种内容生成RSS订阅源。 Rsshub借助于开源社…

如何在OpenWRT安装内网穿透工具实现远程访问本地搭建的web网站界面

文章目录 前言1. 检查uhttpd安装2. 部署web站点3. 安装cpolar内网穿透4. 配置远程访问地址5. 配置固定远程地址 前言 uhttpd 是 OpenWrt/LuCI 开发者从零开始编写的 Web 服务器,目的是成为优秀稳定的、适合嵌入式设备的轻量级任务的 HTTP 服务器,并且和…

【k近邻】Kd树构造与最近邻搜索示例

【k近邻】 K-Nearest Neighbors算法原理及流程 【k近邻】 K-Nearest Neighbors算法距离度量选择与数据维度归一化 【k近邻】 K-Nearest Neighbors算法k值的选择 【k近邻】 Kd树的构造与最近邻搜索算法 【k近邻】 Kd树构造与最近邻搜索示例 近邻法的实现需要考虑如何快速搜索个最…

第5讲:数组

第5讲:数组 1. 数组的概念2. 一维数组的创建和初始化2.1 数组创建2.2 数组的初始化2.3 数组的类型 3. ⼀维数组的使用3.1 数组下标3.2 数组元素的打印3.3 数组的输入 4. ⼀维数组在内存中的存储5. sizeof计算数组元素个数6. 二维数组的创建6.1 二维数组的概念6.2 二维数组的创建…