Python数据分析-风湿关节炎生存分析

一、研究背景和意义

类风湿关节炎(RA)是一种慢性炎症性疾病,主要影响关节,但也可能影响身体的其他部分。RA的病因尚不完全清楚,但已知其涉及免疫系统的异常反应。患者的免疫系统错误地攻击自身的关节组织,导致炎症、疼痛和关节损伤。RA的长期影响可能包括关节变形、功能丧失和生活质量的显著下降。此外,RA还与心血管疾病等全身性并发症密切相关。在RA的管理和治疗中,早期诊断和干预至关重要。尽管已有多种治疗方法(如药物治疗和物理治疗)用于缓解症状和延缓疾病进展,
但许多患者仍可能经历疾病的急性发作(failure)和血管闭塞(occlusion)。这些急性事件不仅影响患者的健康和生活质量,还增加了医疗负担和社会成本。

二、研究意义

提高早期诊断和预测能力:通过构建预测模型,本研究能够识别出RA患者在未来可能经历急性发作或血管闭塞的高风险个体,从而实现早期干预和个性化治疗。这不仅有助于提高患者的生活质量,还能有效降低医疗成本。

为临床决策提供支持:本研究的预测模型可作为临床医生的辅助工具,帮助他们在治疗决策过程中考虑更多的变量和因素,从而制定更为科学和有效的治疗方案。

推动RA研究的发展:通过深入分析多种生理和病理指标与RA急性事件之间的关系,本研究为RA的病理机制研究提供了新的视角和数据支持,有助于揭示RA的复杂病理机制,推动相关基础研究的发展。

三、实证分析

读取数据集

数据和代码

import pandas as pd# 加载数据
file_path = 'interpolation_RA_baseline_anytime_failure.csv'
data = pd.read_csv(file_path)
data.head()

查看数据基本信息 

检查缺失值

可以发现没有缺失值

接下来检查检查重复值

接下来进行描述性统计分析

接下来绘制每个特征的直方图

# 绘制分布图,每行6个图
num_plots = len(numerical_columns)
fig, axes = plt.subplots(num_plots // 6 + 1, 6, figsize=(20, 5 * (num_plots // 6 + 1)))for i, column in enumerate(numerical_columns):row, col = divmod(i, 6)sns.histplot(data[column].dropna(), kde=True, ax=axes[row, col])axes[row, col].set_title(f'Distribution of {column}')# 删除多余的子图
for j in range(i + 1, len(axes.flatten())):fig.delaxes(axes.flatten()[j])plt.tight_layout()
plt.show()

 

计算相关矩阵

也可以绘制热力图

plt.figure(figsize=(12, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

 接下来进行回归分析
线性回归和逻辑回归

# 线性回归
X = data[numerical_columns_with_target]
y = data['RAfailureanytime']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)linear_model = LinearRegression()
linear_model.fit(X_train, y_train)
linear_predictions = linear_model.predict(X_test)# 逻辑回归
logistic_model = LogisticRegression(max_iter=1000)
logistic_model.fit(X_train, y_train)
logistic_predictions = logistic_model.predict(X_test)

 

还可以使用其他模型

from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC# 决策树
decision_tree = DecisionTreeClassifier()
decision_tree.fit(X_train, y_train)
dt_predictions = decision_tree.predict(X_test)# 随机森林
random_forest = RandomForestClassifier()
random_forest.fit(X_train, y_train)
rf_predictions = random_forest.predict(X_test)# 支持向量机
svc_model = SVC(probability=True)
svc_model.fit(X_train, y_train)
svc_predictions = svc_model.predict(X_test)

 

接下来进行生存分析
生存曲线和Cox回归模型

# Cox回归模型
cox_model = CoxPHFitter()
cox_model.fit(data, duration_col='failuretime', event_col='RAfailureanytime')
cox_model.print_summary()

 

四、结论

本研究通过分析一组包含多种临床和生理指标的RA患者数据,构建了线性回归和逻辑回归模型,用于预测RA患者的急性发作和血管闭塞情况。

研究结果显示,模型在分类和预测方面表现出较高的准确性和可靠性。具体来说,逻辑回归模型的整体准确率为88%,在精确度、召回率和F1评分等方面均表现良好。ROC曲线的AUC值表明模型具有较高的分类性能,能够有效区分高风险和低风险患者。通过本研究的成果,临床医生可以更早地识别出高风险患者,从而采取早期干预措施,减少急性事件的发生率。此外,本研究还为进一步的RA病理机制研究提供了数据支持,推动了RA研究的发展。

未来,随着数据量的增加和模型的不断优化,预测模型的准确性和应用范围将进一步提升。我们希望本研究的成果能够在实际临床中得到应用,为RA患者的管理和治疗带来实质性的改善。同时,我们也期待更多的研究者参与到这一领域,共同探索和解决RA这一复杂疾病带来的挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/38204.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HCIA4.9-4.19笔记

通讯——双向的,必须保证有来有回才能成功。 当拓扑图中的所有路由器拥有拓扑图中的所有网段时,即可实现全网通。 路由器获取位置网段的方法 静态路由 由管理员手写的路由条目 动态路由 所有路由器上运行同一种动态路由协议,之后通过路…

低代码表单配置平台替代普通表单配置平台,前端部分重构的设计和思路

前言 最近将公司的旧表单配置平台重构为低代码表单配置平台,这里记录一下这个过程的设计和思路,不涉及具体的代码;另外这篇文章基本只涉及前端部分,也不涉及与后端数据交互部分。 需求 固化的表单配置平台 -> 灵活的表单配置…

【最长公共前缀 动态规划】2430. 对字母串可执行的最大删除数

如果有不明白的,请加文末QQ群。 本文涉及知识点 最长公共前缀 动态规划 动态规划汇总 LeetCode 2430. 对字母串可执行的最大删除数 给你一个仅由小写英文字母组成的字符串 s 。在一步操作中,你可以: 删除 整个字符串 s ,或者 …

vscode中的字符缩进问题

问题描述: 如图当一行代码中出现不同类型的字符时,使用tab缩只是插入了固定数量(默认4)的空格或制表符,仍然无法对齐。 解决方法: vscode找到设置,搜索fontFamily,对应输入框写入mon…

Linux系统编程--进程间通信

目录 1. 介绍 1.1 进程间通信的目的 1.2 进程间通信的分类 2. 管道 2.1 什么是管道 2.2 匿名管道 2.2.1 接口 2.2.2 步骤--以父子进程通信为例 2.2.3 站在文件描述符角度-深度理解 2.2.4 管道代码 2.2.5 读写特征 2.2.6 管道特征 2.3 命名管道 2.3.1 接口 2.3.2…

集成平台建设方案(Doc原件)

基础支撑平台作为系统总体架构的核心,不仅要促进与各应用子系统和第三方系统的顺畅交互,还需确保内部业务在该平台上能够灵活扩展。针对这一需求,我们对基础支撑平台提出了以下要求: (1) 平台需基于其基础架构,为多源异…

python基础:设置代码格式

随着编写的程序越来越长,有必要了解一些代码格式的约定,让你的代码尽可以能易于阅读。 python代码编写规范为PEP8,有兴趣的朋友可以下载观看,这里仅作简要说明。 1、缩进 PEP8建议每级缩进都使用4个空格。多数情况下编程语言的…

vscode-创建vue3项目-修改暗黑主题-常见错误-element插件标签-用法涉及问题

文章目录 1.vscode创建运行编译vue3项目2.添加项目资源3.添加element-plus元素4.修改为暗黑主题4.1.在main.js主文件中引入暗黑样式4.2.添加自定义样式文件4.3.html页面html标签添加样式 5.常见错误5.1.未使用变量5.2.关闭typescript检查5.3.调试器支持5.4.允许未到达代码和未定…

UE5的安装与基本操作(一)

文章目录 前言安装UE5新建第一个游戏项目基本游览方式对目标进行变换各种变换对齐 快速定位目标 总结 前言 Unreal Engine 5 (UE5) 是一款由 Epic Games 开发的实时 3D 创作平台,用于制作游戏、电影、动画、建筑可视化和其他类型的交互式体验。UE5 提供了一系列强大…

Flutter第十五弹 Flutter插件

目标: 1.Flutter插件是什么?有什么作用? 插件 (plugin) 是 package 的一种,全称是 plugin package,我们简称为 plugin,中文叫插件。 2.怎么创建Flutter插件? 一、什么是插件 在flutter中&am…

【成都活动邀请函】7月6 | PowerData 数字经济-“成都“开源行!

【成都活动邀请函】7月6 | PowerData 数字经济-"成都"开源行! 活动介绍活动信息线上直播扫码报名往期活动回顾专注数据开源,推动大数据发展 活动介绍 九天开出一成都,万户千门入画图。 自古以来,成都便是国家发展的重要…

第2章-Python编程基础

#本章目标 1,了解什么是计算机程序 2,了解什么是编程语言 3,了解编程语言的分类 4,了解静态语言与脚本语言的区别 5,掌握IPO程序编写方法 6,熟练应用输出函数print与输入函数input 7,掌握Python…

【机器学习】机器学习的重要技术——生成对抗网络:理论、算法与实践

引言 生成对抗网络(Generative Adversarial Networks, GANs)由Ian Goodfellow等人在2014年提出,通过生成器和判别器两个神经网络的对抗训练,成功实现了高质量数据的生成。GANs在图像生成、数据增强、风格迁移等领域取得了显著成果…

leetCode.97. 交错字符串

leetCode.97. 交错字符串 题目思路 代码 class Solution { public:bool isInterleave(string s1, string s2, string s3) {int n s1.size(), m s2.size();if ( s3.size() ! n m ) return false;vector<vector<bool>> f( n 1, vector<bool> (m 1));s1 …

Sparse4D v3: Advancing End-to-End 3D Detection and Tracking

Sparse4D v3: Advancing End-to-End 3D Detection and Tracking 相关内容&#xff1a;总览&#xff0c;Sparse4D v1&#xff0c;Sparse4D v2&#xff0c; 单位&#xff1a;地平线(Sparse4D v1 v2 原班人马) GitHub&#xff1a;https://github.com/HorizonRobotics/Sparse4D …

昇思25天学习打卡营第5天 | 网络构建

目录 1.定义模型类 2.模型层 nn.Flatten nn.Dense nn.ReLU nn.SequentialCell nn.Softmax 3.模型参数 代码实现&#xff1a; 总结 神经网络模型是由神经网络层和Tensor操作构成的&#xff0c; mindspore.nn提供了常见神经网络层的实现&#xff0c; 在MindSpore中&a…

AI智能客服项目拆解(1) 产品大纲

本文作为拆解AI智能客服项目的首篇&#xff0c;以介绍产品大纲为主。后续以某AI智能客服产品为例&#xff0c;拆解相关技术细节。 AI智能客服是一种基于人工智能技术的客户服务解决方案&#xff0c;旨在提高客户满意度和优化企业运营。利用人工智能和自然语言处理技术&#xff…

MySQL之索引失效的情况

什么情况下索引会失效&#xff1f; 违反最左前缀原则范围查询右边的列不能使用索引不要在索引列上进行运算操作字符串不加单引号导致索引失效以%开头的like模糊查询 什么情况下索引会失效&#xff1f; 示例&#xff0c;有user表如下 CREATE TABLE user (id bigint(20) NOT NU…

JAVA期末速成库(11)第十二章

一、习题介绍 第十二章 Check Point&#xff1a;P454 12.1&#xff0c;12.9&#xff0c;12.10&#xff0c;12,12 二、习题及答案 12.1 What is the advantage of using exception handling? 12.1使用异常处理的优势是什么? 答:使用异常处理有以下优势&#xff1a; 1. 提高…

Spark join数据倾斜调优

Spark中常见的两种数据倾斜现象如下 stage部分task执行特别慢 一般情况下是某个task处理的数据量远大于其他task处理的数据量&#xff0c;当然也不排除是程序代码没有冗余&#xff0c;异常数据导致程序运行异常。 作业重试多次某几个task总会失败 常见的退出码143、53、137…