眼底照 + OCT图 + 精神状态 ,预测阿尔兹海默症

眼底照片和OCT图像,预测阿尔兹海默症

    • 数据
    • 多模态网络
    • 模型集成
    • 可视化分析

 


论文:https://www.ophthalmologyretina.org/action/showPdf?pii=S2468-6530%2824%2900045-9

目前,认知障碍的诊断依赖于血清和蛋白质生物标志物的检测、脑脊液检查和正电子发射断层扫描等成本高昂且有时具有侵入性的测试。

因此,这些测试并不适合在基层医疗环境或社区中进行认知障碍的检测。

这篇研究的目的是开发和验证一个能够快速、简便地准确识别认知障碍患者的人工智能系统。

过程:开发深度学习模型、模型验证和性能改进。

深度学习模型:

  • 使用多模态数据输入,结合眼底照片和OCT图像。
  • 应用卷积神经网络(CNN)技术,设计多模态网络架构。

之所以使用此子解法:因为多模态视网膜图像可以提供关于视网膜和脉络膜的综合信息,这对于识别认知障碍具有潜在价值。

例如,使用眼底图像可以观察视网膜血管的变化(视网膜发病中后期变化),而OCT图像可以提供视网膜层次结构的详细视图(视网膜发病前期变化)。

性能改进:

  • 通过增加数据样本的多样性和数量来优化和改进模型。
  • 应用模型集成技术,结合多种网络架构的优势。

之所以使用此子解法:增加样本多样性可以帮助模型更好地泛化到不同的人群,而模型集成可以提高预测性能,减少过拟合的风险。

例如,集成多个不同架构的网络(如ResNet-50, InceptionV3, DenseNet-121和VGG),可以利用它们各自的优势,提高整体模型的鲁棒性和准确性。

数据

入选标准是年龄≥50岁。共有4403名符合条件的个体,其中3468人(78.8%,包括1963名女性,占56.6%)参加了眼科检查。

需要每位参与者的眼底照片(双眼的视盘中心和黄斑中心)清晰可见,OCT图像(双眼的中心凹水平截面)层次分明且可以分析,以及迷你精神状态检查(MMSE)的数据。

  • 总共有3468名参与者提供了眼底图像,其中包括6014张视盘中心图像和6106张黄斑中心图像。
  • 2974名参与者提供了OCT图像,共计5948张。

在这里插入图片描述

开发数据集:

  • 训练集:包含8248张眼底照片,4124张OCT图像,共2062名参与者。
  • 内部验证集:包含1176张眼底照片,588张OCT图像,共294名参与者。

外部验证数据集:

  • 外部测试集1:包含1180张眼底照片,590张OCT图像,共295名参与者。
  • 外部测试集2:包含1180张眼底照片,590张OCT图像,同样是295名参与者。

主要统计数据和结果:

  • 性别:训练集中男性占42.6%,外部测试集中大约46%。
  • 年龄:训练集平均年龄约为63.84岁,外部测试集平均年龄约为63至64岁。
  • 教育水平:较多参与者接受过7-9年的教育。
  • 体力活动:训练集中有34.7%的参与者活跃,而外部测试集这一比例稍低。
  • 健康状况:包括体质指数、血压、总胆固醇、高血压、糖尿病和与年龄相关的眼病情况。
  • 迷你精神状态检查(MMSE):平均分数在训练集和验证集中约为26分,外部测试集约为26.5分。

为了提高模型的鲁棒性和适用性,训练集故意包括了患有眼病的患者的视网膜图像,因为AMD和青光眼等与年龄相关的眼病在50岁以上的个体中很常见。

对所有参与者使用4张眼底照片(双眼的视盘中心和黄斑中心图像)和2张OCT图像(双眼的中心凹水平截面)进行模型开发和验证。

同时收集了包括性别、年龄、教育水平、体力活动、收缩压、体质指数(BMI)、总胆固醇以及高血压、糖尿病和与年龄相关的眼病状况等风险因素数据。

在这里插入图片描述

多模态网络

训练用于分类眼底和OCT图像的CNN模型。采用3种独立的特征编码器(例如VGG-19)提取特征,并通过共享全连接层进行分类。

  • 使用来自不同视场的眼底图像和OCT图像的特征,通过编码器提取并合并特征。
  • 这些特征被输入到共享的分类器,并通过全连接层进行处理,以建立用于认知障碍筛查的模型。

模型集成

为了提高系统的整体性能和鲁棒性,训练了4个使用不同计算视觉学习主干网络的多模态网络,如VGG-19、ResNet-50、InceptionV3和DenseNet-121。

  • 模型集成技术,结合了四种不同的深度学习模型(ResNet-50, InceptionV3, DenseNet-121, 和 VGG),通过简单的平均方法融合,以增强模型的鲁棒性和准确性。
  • 通过集成多个模型,研究提高了算法对输入数据的综合理解能力,减少了过拟合的风险,使得模型在未见数据上的表现更加平滑和泛化。
  1. 独立训练多个模型
  • 选择模型架构:选择具有不同特点的多个模型架构。
  • ResNet-50 擅长处理层次较深的网络结构问题
  • InceptionV3 在处理图片的尺度上有优势,能够捕捉到不同尺度上的特征
  • DenseNet-121 则通过其密集连接的方式改进了信息和梯度的流动,使得网络更加高效
  • 而 VGG 模型结构简单,但在图像识别上表现良好
  • 训练过程:每个模型分别在相同的数据集上进行独立训练。
  • 这包括使用眼底照片和OCT图像作为输入,训练每个模型以识别认知障碍的迹象。
  1. 模型输出的融合
  • 输出平均:在模型训练完成后,将这些模型的输出(通常是分类的概率)进行平均处理。
  • 融合策略:简单平均是一种常见的融合策略,因为它不需要额外的权重调整,可以减少过拟合的风险,并且实现简单。
  • 每个模型被赋予相等的权重,其预测结果的平均值被用作最终预测。

模型集成能够综合不同模型的优势,降低因模型特定偏差带来的风险,从而在多样化的数据上获得更稳定和可靠的性能。

例如,在眼底图像分析中,不同模型可能对不同类型的图像特征(如血管结构、黄斑区的细节等)有不同的敏感性,通过模型集成,可以综合这些特征的识别能力,提高诊断的准确性和鲁棒性。

模型性能

  • 模型1(单独使用以黄斑为中心的眼底照片)
  • 模型2(单独使用以视盘为中心的眼底照片)在三个数据集(内部验证、外部验证1、外部验证2)中的AUC值分别为0.738/0.758/0.725 和 0.754/0.732/0.702。
  • 模型3(结合使用以黄斑和视盘为中心的眼底照片)在各数据集中的AUC值有轻微提高,分别为0.766、0.760、0.750。
  • 模型4(使用OCT图像中穿过中心凹的水平截面)的性能略有下降,AUC值为0.726、0.707、0.702。
  • 模型5(多模态模型,结合使用眼底照片和OCT图像达到了最高的性能,AUC值为0.820、0.786、0.784。
  • 模型6(使用CAIDE风险评分)的AUC值为0.836、0.795、0.749。

模型5的性能显著优于模型1至4。

  • 与CAIDE风险评分模型相比,模型5在AUC上没有显著差异,但表现更稳定,准确性更高。
  • 在不同性别和年龄组中,模型5的表现没有显著差异,展示了良好的稳定性。

可视化分析

热图分析显示:

  • 在认知功能正常的参与者中,CNN主要使用眼底照片中的视盘信号,而OCT图像的重要性较低
  • 对于认知障碍的参与者,CNN使用的信号包括眼底照片中视盘周围的信号,以及OCT图像中黄斑和视盘区域的视网膜和脉络膜

在这里插入图片描述
D、E和F图则对应地展示了认知功能正常的个体的相同图像。

A、B和C图分别展示了认知障碍患者的黄斑中心眼底照片、视盘中心眼底照片和OCT图像的热图。

看可视化的结果,阿尔兹海默症,OCT 图才是重点。

但如果只用 OCT 图,效果还不如 fundus图(眼底图)。

综合使用效果最好,现在医学算法,都是多模态、模型集成效果更 SOTA。

下一步:

  • 尽管研究证实了使用视网膜图像识别认知障碍的可行性,但样本量的限制可能影响了模型性能的最优化。
  • 未来研究需要在更大、多中心的人群中验证模型的普适性,使用不同的眼底相机和OCT设备,包括针对视盘中心的OCT图像和OCT血管造影的检查。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/22917.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【教程】WordPress主题子比主题 添加私密评论功能

教程如下 打开子比主题的 functions.php 文件,在最后一个 ?> 的前面添加以下代码: //私密评论 function liao_private_message_hook( $comment_content , $comment){$comment_ID = $comment->comment_ID; $parent_ID = $comment->comment_parent; $parent_emai…

[SaaS] AI+数据,tiktok选品,找达人,看广告数据

TK观察专访丨前阿里“鲁班”创始人用AIGC赋能TikTok获千万融资用AI数据做TikTokhttps://mp.weixin.qq.com/s/xp5UM3ROo48DK4jS9UBMuQ主要还是爬虫做数据的。 商家做内容:1.找达人拍内容,2.商家自己做原生自制内容,3.广告内容。 短视频&…

南京观海微电子----焊机用DC-DC 24V 升压电路分析

焊机用DC-DC 24V 升压电路分析 辅电升压电路关键元件有:UC3843、电感、MOS功率管、整流二极管等组成。其核心是UC3843。UC3843是脉宽调制IC,工作频率可达500kHz,组成电路引脚少、外围元件简单,启动电流仅需1mA,开启电压…

BC C language

题目汇总 No.1 打印有规律的字符(牛牛的字符菱形) 代码展示 #include<stdio.h> int main() {char ch=0;scanf("%c"

Meta Llama 3 残差结构

Meta Llama 3 残差结构 flyfish 在Transformer架构中&#xff0c;残差结构&#xff08;Residual Connections&#xff09;是一个关键组件&#xff0c;它在模型的性能和训练稳定性上起到了重要作用。残差结构最早由He et al.在ResNet中提出&#xff0c;并被广泛应用于各种深度…

ArUco与AprilTag 标签

一、简介 在许多计算机视觉应用程序中&#xff0c;姿势估计非常重要&#xff1a;机器人导航&#xff0c;增强现实等等。 该过程基于发现真实环境中的点与其2d图像投影之间的对应关系。 这通常是一个困难的步骤&#xff0c;因此通常使用合成或基准标记来简化操作。 最受流行的…

Day13 配置AutoMapper关系映射

在上一节 中,无论ToDoController 控制器,或 IToDoService 服务的接口中,方法的实参必须是传实体类。但在实际开发过程中,这样是不允许的。标准且规范的做法是,定义一个数据传输层,即DTO层。 DTO(Data Transfer Objects)数据传输对象,它是一种设计模式,主要用于在不同…

【机器学习-09】 | Scikit-Learn工具包进阶指南:Scikit-Learn工具包之高斯混合sklearn.mixture模块研究

&#x1f3a9; 欢迎来到技术探索的奇幻世界&#x1f468;‍&#x1f4bb; &#x1f4dc; 个人主页&#xff1a;一伦明悦-CSDN博客 ✍&#x1f3fb; 作者简介&#xff1a; C软件开发、Python机器学习爱好者 &#x1f5e3;️ 互动与支持&#xff1a;&#x1f4ac;评论 &…

【全网唯一】触摸精灵iOS版纯离线本地文字识别插件

目的 触摸精灵iOS是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务&#xff0c;节省大量人工操作的时间。但触摸精灵的图色功能比较单一&#xff0c;无法识别屏幕上的图像&#xff0c;根据图像的变化自动执行相应的操作。本篇文章主要…

【Python绘画】画正方形简笔画

本文收录于 《一起学Python趣味编程》专栏&#xff0c;从零基础开始&#xff0c;分享一些Python编程知识&#xff0c;欢迎关注&#xff0c;谢谢&#xff01; 文章目录 一、前言二、代码示例三、知识点梳理四、总结 一、前言 本文介绍如何使用Python的海龟画图工具turtle&#…

Stable Diffusion 临时文件夹设定

即使将Easy Diffusion或Stable Diffusion安装在C盘之外的某个地方&#xff0c;如果持续使用Stable Diffusion一段时间后&#xff0c;仍然会发现C盘空间在快速变小。这是因为有很多自动下载的文件还是保存在C盘。为了解决这个问题&#xff0c;我们需要做以下临时文件夹设定。 H…

嵌入式 Linux LED 驱动开发实验学习

I.MX6U-ALPHA 开发板上的 LED 连接到 I.MX6ULL 的 GPIO1_IO03 这个引脚上&#xff0c;进行这个驱动开发实验之前&#xff0c;需要了解下地址映射。 地址映射 MMU 全称叫做 MemoryManage Unit&#xff0c;也就是内存管理单元。在老版本的 Linux 中要求处理器必须有 MMU&#x…

dvwa靶场的下载、配置

目录 下载 配置 连接数据库 搭建网站&#xff08;可选&#xff09; 配置靶场 下载 百度网盘链接&#xff1a;https://pan.baidu.com/s/1oK2UzKFxIIPQkhz6hD8WFQ?pwdpbb2 提取码&#xff1a;pbb2 迅雷链接&#xff1a;https://pan.xunlei.com/s/VNzHo9gXgbsk5E8tcx6Yek…

练习实践-linux启动耗时分析

练习实践-启动耗时整体概览&#xff0c;具体服务的启动细节 参考来源&#xff1a; B站up主林哥讲运维&#xff1a;一分钟学会&#xff1a;可视化查看系统启动时的性能 如何使用Linux命令查看系统的启动进程&#xff08;linux查看启动进程&#xff09; 解决ubuntu开机变慢&…

双指针法 ( 三数之和 )

题目 &#xff1a;给你一个整数数组 nums &#xff0c;判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k &#xff0c;同时还满足 nums[i] nums[j] nums[k] 0 。请 你返回所有和为 0 且不重复的三元组。 注意&#xff1a;答案中不可以包含重复…

代理IP类型有哪些?定义与区别

您应该对代理有了一定的了解。但是&#xff0c;代理服务器也有不同的类型。就其来源而言&#xff0c;最常见的代理服务器类型是住宅代理和数据中心代理&#xff1a; 1、住宅代理 住宅代理是 ISP 向房主提供的 IP 地址。它是与物理位置关联的真实 IP 地址&#xff0c;因此允许…

WPF中Window的外观实现及常用属性

文章目录 1. 概要2. Window的外观2.1 Window的外观组成2.2 Window的实现2.3 Window外观配置2.4 Window 的其他常用属性1. AllowsTransparency 2. WindowStartupLocation3. ShowInTaskbar4. ShowActivated5. SizeToContent6. Topmost7. WindowStyle 1. 概要 和 Android 类似, W…

小米SU7智能座舱介绍,果然有亮点!

2024 年,小米 SU7 横空出世,从开始的怀疑到发布后仅 24h 就达到了 8W 台的订单量,火到出圈的具象化。智能手机厂家造车,之前的华为做了榜样,小米作为汽车制造中又一条鲶鱼,能否给智能汽车市场带来新的契机? 小米造车可谓是各方位进行全新打造,包括座舱、底盘、智驾、车…

sentaurus节点重排

sentaurus使用时&#xff0c;有时候节点顺序会比较乱&#xff0c;为了方便更好的查看&#xff0c;可以对其进行重新编排&#xff0c;操作方法如下&#xff0c;右键——project——clean up 然后选中chean up 选项中的renumber the Tree&#xff0c;然后点击cleanup操作完成即可…

数据结构:模拟栈

数据结构&#xff1a;模拟栈 题目描述参考代码 题目描述 输入样例 10 push 5 query push 6 pop query pop empty push 4 query empty输出样例 5 5 YES 4 NO参考代码 #include <iostream>using namespace std;const int N 1000010;int m, x; int q[N]; string op; int…