Nomogram文献分析:提取数据

前言

今天教大家如何分析Nomogram类型的文章,并使用我们开发的系统零代码提取数据。

系统地址:https://clinicaldata.fun/

要分析的文章:https://pubmed.ncbi.nlm.nih.gov/36504658/ 。这是一篇典型的mimic-iii数据分析的套路,构建一个Nomogram预测某种结局发生的影响因素。在这里插入图片描述

这个研究旨在调查全身免疫炎症(SII)与颅内出血(ICH)患者在重症监护病房(ICU)的住院死亡风险之间的关联,并进一步开发与SII相关的预测模型,以预测ICH患者的住院死亡风险。

在训练组中,232名ICH患者死亡,708名存活。LASSO回归显示一些预测因子,包括白细胞计数、血糖、血尿素氮、SII、格拉斯哥昏迷评分、年龄、心率、平均动脉压、红细胞、碳酸氢盐、红细胞分布宽度、肝硬化、呼吸衰竭、肾功能衰竭、恶性肿瘤、血管加压药和机械通气。建立了整合这些预测因子的预测模型。在训练组中,量表图下面积(AUC)为0.810,在测试组中为0.822,表明这个量表图可能有良好的性能。

结论:全身免疫炎症与ICU中ICH患者的住院死亡风险增加有关。已开发并验证了一种针对ICU中ICH患者的住院死亡风险的量表图。

第一步:文章思路分析

1. 病人对象 Subject

要提取数据,你首先必须知道自己的研究对象是什么。这篇文章里,研究对象是颅内出血的病人,那么哪些是这些病人呢?需要通过ICD-9、ICD-10进行判断了。文章里面的ICD用的是:

在这里插入图片描述

2. 入组标准

所以入组的研究对象是ICD-9 code是:431, 432, 9487, 77210-77214。首先就要把这些病人挑出来。

3. 排除标准

(1) aged <18 years;

(2) were hospitalized in the ICU for <24 h;

(3) had missing data of SII; and

(4) had missing data of other covariates.

4. 终点指标

你需要知道你要分析的结局指标是啥,这是文章的落脚点。常说的Y。这篇文章里面就是指的住院死亡 in-hospital death

5. 独立因素

就是病人相关的指标了,一般包括基础资料,血氧血气,生化,vital sign,并发症,ICU 评分等等了。一般Table 1都会列出的了,这篇文章大致是:

在这里插入图片描述

6. 分析过程

这个是一般的数据处理过程,大致为:LASSO (单因素分析)–》 多因素逻辑回归 --》Nomogram 构建 --》Nomogram的评价,如ROC/AUC,c-index,IDI, NRI, DCA等等。比如另一篇文章的比较全面的流程图:

在这里插入图片描述

这个分析也是一个大头,考验你的R语言基础和统计学功底。

好了,下面我们开始进行提取数据,并尝试重新这篇简单文章的Nomogram的构建。

第二步:提取数据

其实系统已经设计得很简单,零代码,只需要点点勾勾就能导出你要的数据。一般来讲,大家提取衍生库的内容都够用了,原生库的原始数据一般很粗糙,没有归类总结。比如MIMIC-III数据库的chartevents, labevents,患者的住院期间的图表信息,数据量庞大,也是MIMIC-数据库臃肿的原因。里面其实我们需要的就是些血氧血气生化指标,大部分都在衍生库里面。除非你有些特殊要求,不建议提这个数据。

1. 输入ICD code,选择病人队列

如前面提到的,进入MIMIC-III数据库,点击“ICD搜索”,选择‘Disease’,选择‘全部诊断’ (就是不区分是否第一诊断),搜索框里面输入 431, 432, 9487, 77210, 77211, 77212, 77213, 77214 (多个icd code逗号区分),当然也可以输入关键词,比如 “intracerebral hemorrhage”。所有包含这些字符的ICD code都会显示,找到你想要的,进行勾选,注意 可跨页勾选

在这里插入图片描述
在这里插入图片描述

然后点击按钮确定选择这些病人:

在这里插入图片描述

虽然系统会直接跳到数据提取页面,但是在“输入icustay_ids”这里可以看到你勾选的所有病人的icustay_id:

在这里插入图片描述

做这个输入,是为了给你提供方便,你如果知道自己icustay_id,直接清空之后粘贴,然后点击 “提交icustayid,开始提取数据 ”就可以提取你的病人队列了。文章是1925个,这里有2152个,可能和我选择的ICD code有关,比如我这里勾选了蛛网膜下出血。当有多个ICD code的时候,一定要选准确!

2. 导出数据

这个很简单了。一个个指标勾选,导出数据即可。其实我们的数据主要在“衍生库”里面:

在这里插入图片描述

如果你不知道这些指标叫什么,建议还是多补充背景知识。

如果偷懒些,我帮你预置了一些指标,一步勾选,一键导出即可。

原生数据库,我们只需要病人资料 patients 表,和adminssion表的内容即可。用于后面判断是否住院死亡。

下面是两分钟就提好的这个文章的数据了:

在这里插入图片描述

每个csv都是 tab分格的数据,如果用Excel打开会显示到一行,需要手动导入分割才能看到。一般我们都是在R里面进行后续处理的了。csv文件,直接当txt打开,长这样:

在这里插入图片描述

GCS这个指标对出血病人还是挺重要的。

这样,数据导出就完成了,总共花费了10分钟不到。

下面开始数据合并和处理,建模分析。

第三步:数据预处理

大致分为几个步骤:1)数据合并;2)病人队列排除;3)指标缺失值处理;4)变量初始化。

1. 数据合并

为什么不推荐对所有表进行简单的连接合并?因为你会看到这些表不是所有字段唯一的。

数据导入R里面,先看看数据行数在每个表的情况:

在这里插入图片描述

大部分是2152行数据,和前面的数据icustay_id 数量相符。但血气值有5k多行,patients有2703行,icu_stay只有2144行。而有些数据有缺失,比如vital sign只有2114行。以哪一个表为起始表进行合并要根据实际情况就行。

我这里已admission为起始进行合并,结果如下:

> dim(merge.data)
[1] 2152   94 
# 合并之后有2152个队列,有94个指标

在这里插入图片描述

其中住院死亡是结局:admissions.hospital_expire_flag 表里面直接给出了。

2. 排除病人

标准:1) age < 18; 2) icu 时长超过24 小时

### exclude age less than 18
raw.ready <- raw.ready[raw.ready$icustay_detail.admission_age > 18,]### exclude patients less than 24 hours
raw.ready <- raw.ready[raw.ready$icustay_detail.los_icu>=1,]

3. 缺失值处理

看看缺失情况:

在这里插入图片描述

缺失大于20%的指标需要删除:

在这里插入图片描述

然后还需要对缺失值进行插值补全。这样数据基本准备好了。可以开始建模进行后续分析了。至此不再赘述。

第四步:欣赏下我们用这个系统做出来的图

在这里插入图片描述
在这里插入图片描述
我们的图表已经发表在TOP期刊 。

最后

重复一遍系统地址:https://clinicaldata.fun/

另外一些功能也还在陆续开发中,敬请期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/638495.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

srm-50——攻防世界

可以知道这道题是二类题型&#xff0c;你完成某个事情给你flag 我们输入正确的东西&#xff0c;给“flag” 运行一下可以知道这些关键词 直接关键词在字符串里面 找到运行得到的东西 INT_PTR __stdcall DialogFunc(HWND hDlg, UINT a2, WPARAM a3, LPARAM a4) {HMODULE Mo…

vue.js js 雪花算法ID生成 vue.js之snowFlake算法

随着前端业务越来越复杂&#xff0c;自定义表单数据量比较大&#xff0c;每条数据的id生成则至关重要。想到前期IOS中实现的雪花算法ID&#xff0c;照着其实现JS版本&#xff0c;供大家学习参考。 一、库的建立引入 在你项目中创建一个snowFlake.js的文件&#xff1a;拷贝以下…

【2020】百度校招Java研发工程师笔试卷(第二批)算法题

贴一下我去年9月份写的博客 三道编程题&#xff0c;一道数学题&#xff0c;两道图论&#xff0c;哎嘿嘿&#xff0c;我就是不会做&#xff0c;哎嘿嘿&#xff0c;哭了。。。 一.最小值 牛牛给度度熊出了一个数学题&#xff0c;牛牛给定数字n,m,k&#xff0c;希望度度熊能找到…

Python使用graphviz绘制模块间数据流

graphviz官方参考链接&#xff1a; http://www.graphviz.org/documentation/ https://graphviz.readthedocs.io/en/stable/index.html 文章目录 需求描述环境配置实现思路代码实现 需求描述 根据各模块之间的传参关系绘制出数据流&#xff0c;如下图所示&#xff1a; 并且生成…

【SpringBoot】SpringBoot 项目初始化方法

github 搜索 springboot 模板 github 搜索 springboot 模板&#xff0c;拉取现成代码。 SpringBoot 官方的模板生成器 SpringBoot 官方的模板生成器&#xff08;https://start.spring.io/&#xff09; 在 IDEA 开发工具中生成 这里我修改成阿里的镜像主要是要使用 Java8。 …

YOLOv8 更换主干网络之 HGNetV2

论文地址:https://arxiv.org/abs/2304.08069 代码地址:https://github.com/PaddlePaddle/PaddleDetection 中文翻译:https://blog.csdn.net/weixin_43694096/article/details/131353118 YOLOv8 更换方式 YOLOv8 想用这个主干直接换就行了,因为项目里面已经集成了,写一个…

[python]使用pyqt5搭建yolov8钢筋计数一次性钢材计数系统

【官方框架地址】 github地址&#xff1a;https://github.com/ultralytics/ultralytics 【算法介绍】 Yolov8是一种先进的深度学习模型&#xff0c;用于目标检测和识别。在钢筋计数任务中&#xff0c;Yolov8可以有效地识别和计数图像中的钢筋。下面是对如何使用Yolov8实现钢筋…

【嵌入式移植】4、U-Boot源码分析1—Makefile

U-Boot源码分析1—Makefile 1 分析思路2 u-boot源码目录结构3 Makefile源码3.1 版本号3.2 环境变量3.3 Beautify output3.4 输出文件的目录设置、PHONY目标3.6 目录信息3.5 Source Code Checker3.7 设置单独编译模块、PHONY目标3.8 获取宿主机的架构和系统3.9 设置交叉编译工具…

一个非常流行的R语言调色板:RColorBrewer

R 语言有许多非常优秀的调色板&#xff0c;本文就介绍一个非常流行的&#xff0c;我也经常在用的调色板 R 包&#xff1a;RColorBrewer。 安装 install.packages("RColorBrewer") 加载 library(RColorBrewer) library(knitr) 初探 ?RColorBrewer 在帮助页面可以看到…

Python实现单因素方差分析

Python实现单因素方差分析 1.背景 正念越来越受到人们关注&#xff0c;正念是一种有意的、不加评判的对当下的注意觉察。可以通过可以通过观呼吸、身体扫描、正念饮食等多种方式培养。 为了验证正念对记忆力的影响&#xff0c;选取三组被试分别进行正念训练&#xff0c;运动训…

使用STM32的UART实现蓝牙通信

✅作者简介&#xff1a;热爱科研的嵌入式开发者&#xff0c;修心和技术同步精进 代码获取、问题探讨及文章转载可私信。 ☁ 愿你的生命中有够多的云翳,来造就一个美丽的黄昏。 &#x1f34e;获取更多嵌入式资料可点击链接进群领取&#xff0c;谢谢支持&#xff01;&#x1f447…

解密.dataru被困的数据:如何应对.dataru勒索病毒威胁

导言&#xff1a; 在数字时代&#xff0c;勒索病毒如.dataru正在不断演变&#xff0c;威胁着用户的数据安全。本文91数据恢复将深入介绍.dataru勒索病毒的特点、被加密数据的恢复方法&#xff0c;以及预防措施&#xff0c;帮助您更好地了解并对抗这一数字威胁。当面对被勒索病…

基于SpringBoot的在线问卷调查管理系统

基于SpringBoot的在线问卷调查管理系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatis工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 前台主页 问卷列表 问卷详情 管理员界面 摘要 基于Spring Boot的在线问卷调…

JVM篇--垃圾回收器高频面试题

1 你知道哪几种垃圾收集器&#xff0c;各自的优缺点是啥&#xff0c;重点讲下cms和G1&#xff0c;包括原理&#xff0c;流程&#xff0c;优缺点&#xff1f; 1&#xff09;首先简单介绍下 有以下这些垃圾回收器 Serial收集器&#xff1a; 单线程的收集器&#xff0c;收集垃圾时…

云贝教育 |【OceanBase】OBCA认证考试预约流程

一、OBCA账号登录/注册&#xff0c;链接 https://www.oceanbase.com/ob/login/mobile?gotohttps%3A%2F%2Fwww.oceanbase.com%2Ftraining%2Fdetail%3Flevel%3DOBCA 注册完之后&#xff0c;请点击右上“登录”进行实名认证 OBCA考试报名链接&#xff1a;https://www.oceanbase.…

stm32cubemx下载以及安装【最新版本傻瓜式教程】

一、官网 https://www.st.com/zh/development-tools/stm32cubemx.html 二、下载【废话不多说&#xff0c;按照图示所圈进行】 没有登录账号的建议先注册登录再进行下载&#xff0c;这样省去后面认证的麻烦。 选择自己电脑对应环境的版本&#xff0c;我的是windows11&#xf…

MSE Nacos:解决敏感配置的安全隐患

作者&#xff1a;察溯 前言 Nacos 简介 Nacos [ 1] 是一个更易于构建云原生应用的配置管理和服务管理平台。Nacos 的配置中心具有众多优势&#xff1a;动态实时更新配置、支持水平扩展的高可用系统架构、API 简单易上手、开源免费、多语言支持、集成度高等。基于以上特点&am…

Html+Css+JavaScript实现完整的轮播图功能

概要 这个案例具备常见轮播图完整的功能&#xff0c;大家可以根据自己的需求去修改&#xff1b; 代码可以直接复制运行&#xff0c;需要安装sass 主要功能&#xff1a; &#xff08;1&#xff09;鼠标移入轮播图&#xff0c;左右两边的按钮出现&#xff0c;离开则隐藏按钮&a…

proteus8.15安装教程

proteus8.15安装教程 1.管理员运行 2.一直NEXT到这一步&#xff0c;需要注意&#xff0c;一定要选这一个 3.选中后出现 4.一直下一步到更新 这边结束后准备激活&#xff1a; 1.安装激活插件&#xff0c;先关闭防火墙 2.下一步 3.最后&#xff0c;将数据库放在根目录下 …

从零开始配置pwn环境:sublime配置并解决pwn脚本报错问题

1.sublime安装 Download - Sublime Text ──(holyeyes㉿kali2023)-[~] └─$ sudo dpkg -i sublime-text_build-4169_amd64.deb [sudo] password for holyeyes: Selecting previously unselected package sublime-text. (Reading database ... 409163 files and directori…