基于python实现心血管疾病风险预测分析

一、项目简介

项目背景

利用心血管疾病风险预测数据集进行深入分析,探究不同因素与心血管疾病风险之间的关联。

数据源

Kaggle上的心血管疾病风险预测数据集。(Cardiovascular Diseases Risk Prediction Dataset | Kaggle)

二、数据预处理

导入数据集

数据清洗和处理

三、数据分析

单变量分析

对身高、体重、BMI、酒精消费等数值特征进行分析。

结果解释

- 身高(cm):患者的身高似乎遵循正态分布,大多数患者的身高在 160 至 180 厘米左右。

- 体重(公斤):患者的体重似乎也呈正态分布,大多数患者体重大约在 60 至 100 公斤之间。

- BMI:身体质量指数的分布有些右偏。 大量患者的BMI在20至30之间,属于正常至超重范围。 然而,也有大量患者的 BMI 处于肥胖范围 (>30)。

- 喝酒频率:大多数患者饮酒量较低,但也有少数患者饮酒量较高。

- 食用水果:大多数患者经常食用水果,但也有少数患者食用频率较低。

- 食用绿色蔬菜:大多数患者适度食用绿色蔬菜,但也有少数患者食用频率较低。

- 食用炸薯条:基本上所有患者都很少吃炸薯条。

分类特征分析

分析一般健康状况、体检情况、锻炼习惯、心脏病历史等分类特征。

结果解释

- 总体健康状况:大多数患者将其总体健康状况描述为“良好”,“非常好”是第二常见的反应。 很少有患者将自己的健康状况评为“一般”或“差”。

- 体检:大多数患者在过去一年内接受过体检。 很少有患者在 2 年前或 5 年前进行最后一次体检。

- 锻炼:与不锻炼的患者相比,更多的患者表示他们锻炼过。

- 心脏病:绝大多数患者没有心脏病。 只有一小部分患者患有心脏病。

- 皮肤癌:绝大多数患者没有皮肤癌。

- 其他癌症:与皮肤癌类似,大多数患者没有其他形式的癌症。

- 抑郁症:大多数患者没有抑郁症。 然而,确实有不少患者报告患有抑郁症。

- 糖尿病:与上述疾病相关特征类似,大多数患者并没有糖尿病。 然而,一小部分人确实患有糖尿病。

- 关节炎:大多数患者没有关节炎,但也有相当一部分患者患有关节炎。

- 性别:数据集中女性患者略多于男性患者。

- 年龄区间:数据集包含各种年龄类别的患者。 65-69岁年龄段的患者最多,其次是70-74岁和60-64岁年龄段。

- 吸烟史:大多数患者没有吸烟史。

双变量分析

探究不同变量与疾病之间的关系。

结果解释

- 心脏病:

   - 心脏病在一般健康状况评价为“良好”或“一般”的患者中更为普遍。

   - 在运动的患者中稍微常见一些。

   - 男性比女性更容易患心脏病。

   - 心脏病的患病率随着年龄的增长而增加,在80岁以上年龄组中最为常见。

   - 心脏病在有吸烟史的患者中也更常见。

- 皮肤癌:

   - 皮肤癌在一般健康状况评价为“良好”或“非常好”的患者中更为常见。

   - 在运动的患者中稍微常见一些。

   - 不同性别的患病率没有太大差异。

   - 皮肤癌的患病率随着年龄的增长而增加,在80岁以上的年龄组中最常见。

   - 根据吸烟史,患病率没有太大差异。

- 其他癌症:

   - 其他癌症在总体健康状况评价为“良好”或“非常好”的患者中更为常见。

   - 在运动的患者中,这种情况稍微常见一些。

   - 不同性别的患病率没有太大差异。

   - 其他癌症的患病率随着年龄的增长而增加,其中在70-74岁年龄段最常见。

   - 根据吸烟史,患病率没有太大差异。

- 糖尿病:

   - 在一般健康状况评价为“一般”或“良好”的患者中,糖尿病更为普遍。

   - 在运动的患者中更为常见。

   - 不同性别的患病率没有太大差异。

   - 糖尿病的患病率随着年龄的增长而增加,在70-74岁年龄段最常见。

   - 根据吸烟史,患病率没有太大差异。

- 关节炎:

   - 关节炎在一般健康状况评价为“良好”或“非常好”的患者中更为普遍。

   - 在运动的患者中稍微常见一些。

   - 女性比男性更容易患关节炎。

   - 关节炎的患病率随着年龄的增长而增加,在70-74岁年龄段最常见。

   - 根据吸烟史,患病率没有太大差异。

多变量分析

综合考虑多个变量,分析它们与疾病风险之间的相互作用。

结果解释

- 按年龄类别划分的总体健康状况分布显示,随着年龄的增长,将健康状况评价为“良好”或“非常好”的个体比例下降,而将健康状况评价为“一般”或“差”的比例增加。

- 一般健康状况与疾病状况(心脏病、皮肤癌、其他癌症、糖尿病、关节炎)之间的关系显示出一些有趣的模式:

    - 对于心脏病、其他癌症、糖尿病、皮肤癌和关节炎,健康状况被评为“差”或“一般”的人群的患病率较高。 这表明这些状况可能不会影响个人对其整体健康状况的看法。

结果解释

- 按运动划分的BMI类别分布显示,经常运动的人的“正常”BMI 比例较高,而不经常运动的人的“超重”和“肥胖”BMI 比例较高。 这表明运动与更健康的体重指数相关。

- BMI类别与疾病状况(心脏病、皮肤癌、其他癌症、糖尿病、关节炎)之间的关系显示出以下模式:

     - 对于糖尿病和关节炎,BMI“超重”和“肥胖”的人群患病率较高。 这表明这些情况可能与较高的BMI水平有关。

     - 对于心脏病、皮肤癌和其他癌症,不同BMI类别的患病率似乎分布更均匀。 这可能表明这些类型的癌症可能不像其他疾病那样与体重指数密切相关。

四、数据可视化

统计图表

使用Seaborn和Matplotlib生成的各类图表。

相关性热力图

展示不同特征之间的相关性。

结果解释

- 相关性热力图提供数据集中不同特征之间相关性的直观表示。 每个方块显示每个轴上变量之间的相关性。 相关性值的范围为-1到1。值接近1表示强正相关,值接近-1表示强负相关,值在0附近表示不相关。

- 以下是热图中的一些观察结果:

     - BMI和体重(kg)与糖尿病呈正相关。 这表明体重指数和体重较高或不锻炼的人更有可能患糖尿病。

     - 一般健康状况与糖尿病、心脏病、关节炎和抑郁症呈负相关。 这表明,总体健康状况较差的人更有可能患有这些疾病。

     - 年龄类别与心脏病、皮肤癌、其他癌症、糖尿病和关节炎呈正相关。 这表明这些疾病的风险随着年龄的增长而增加。

     - 男性与心脏病和皮肤癌呈正相关,与关节炎呈负相关。 这表明男性更容易患心脏病或皮肤癌,但患关节炎的可能性较小。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/185285.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

视图层、模板(补充)

视图层 响应对象 响应---》本质都是 HttpResponse HttpResponse---》字符串render----》放个模板---》模板渲染是在后端完成 js代码是在客户端浏览器里执行的模板语法是在后端执行的redirect----》重定向 字符串参数不是是空的状态码是 3开头JsonResponse---》json格式数据 …

Moonbeam生态项目分析 — — DeFi借贷协议Moonwell

流动性激励计划Moonbeam Ignite是帮助用户轻松愉快体验Moonbeam生态的趣味活动。在Moonbeam跨链连接的推动下,DeFi的各种可能性在这里爆发。DeFi或许不热门,但总有机会捡漏,了解Monbeam生态项目,我们邀请Moonbeam大使分享他们的研…

【linux防火墙】设置开启路由转发,SNAT和DNAT转换原理及应用实操,添加自定义链归类iptables规则

目录 一、关于iptables规则的保存 1.1持久保存规则 1.2加载规则 1.3开机自动加载规则 1.4使用iptables-service软件来进行规则的保存和加载(不建议使用) 二、SNAT和DNAT的原理和应用 SNAT的原理与应用: DNAT的原理和应用: …

在java java.util.Date 已知逝去时间怎么求年月日 数学计算不用其他方法

在Java中,使用java.util.Date类已知逝去时间求年月日的方法如下: 首先,获取当前时间和逝去时间之间的毫秒数差值,可以使用Date类的getTime()方法获得时间戳。 将毫秒数转换为秒数,并计算出总共的天数。 根据总共的天…

应用软件快速开发平台,一起实现办公流程化发展!

做好办公流程化发展能给企业带来什么好处?其实,在快节奏发展社会中,很多企业的规模和业务量也在不断扩展中,如果还是懒散的办公方式是不能达到事半功倍的效果的。要想实现高效率发展,采用办公流程化发展能让企业管理朝…

【广州华锐互动】节约用水VR互动教育:身临其境体验水资源的珍贵!

随着技术的不断发展,虚拟现实(VR)技术在许多领域得到了广泛应用。在节水宣传教育方面,VR技术也展现出了其独特的优势。与传统宣传教育方式相比,节约用水VR互动教育具有更加沉浸式、互动性和实践性的特点,能…

【全栈开发】Next.js与RedwoodJS——比较js框架

Next.js和RedwoodJS是两个广泛用于构建web应用程序的JavaScript框架。这两个框架都提供了一系列功能和好处,但它们在方法和理念上有所不同。在本文中,我们将仔细研究Next.js和RedwoodJS,并对它们进行比较,以帮助您为项目选择正确的…

java开发之基于个微群聊二次开发

请求URL: http://域名地址/getGroupQrCode 请求方式: POST 请求头Headers: Content-Type:application/jsonAuthorization:login接口返回 参数: 参数名必选类型说明wId是String登录实例标识chatRoomI…

强化学习-DQN

网上看来很多,但是还是觉得这篇文章将得最好: 可视化强化学习解释 - Deep Q Networks,循序渐进 |Ketan Doshi 博客 (ketanhdoshi.github.io)

泛域名SSL证书是什么?泛域名SSL证书价格多少钱?

泛域名SSL证书是一种SSL证书类型,也被称为通配符SSL证书。SSL证书是保护网站数据传输安全及服务器身份可信的数字证书产品,通常绑定域名或IP,配置到网站服务器上。SSL证书根据保护域名数量及域名类型的不同,可以分为单域名SSL证书…

CentOS7.5搭建Hadoop-3.3.6集群的详细操作流程-实操版本

一、准备工作 1、安装 VMware,已安装的,跳过此步骤即可 官方正版VMware下载(16 pro):https://www.aliyundrive.com/s/wF66w8kW9ac 安装:选一下安装地址,一直下一步即可。(可能会要…

(免费领源码)Python#MySQL图书馆管理系统071718-计算机毕业设计项目选题推荐

摘 要 随着时代的不断更新,社会的不断变换,信息技术的飞速发展,计算机科技技术也逐步走向成熟。图书馆管理系统对于当今社会来说是必不可少的一个信息组成部分,它可以管理大量图书、大量读者、让读者有条不紊的进行借阅图书&#…

Sui受邀参加Builder DAO举办的LeadUp The Night活动,畅谈Sui与Move语言

LeadUp the Night是一个定期举办的MeetUp活动,由Builder DAO邀请区块链各方项目开发者、VC担任本活动的讲师。这个活动旨在促进区块链技术的发展和应用,让参与者有机会开发创新的区块链应用,探索区块链技术的潜力。 ​​11月30日受BuilderDA…

豆粕期权 MVIX 指数构建及策略回测

1. VIX指数 VIX 最初被设计出来的目的是为了预警市场的潜在风险,一般来说,当 VIX 指数小于 15 时,表示市场出现非理性繁荣;当 VIX 指数大于 40 时,表示市场对 未来的非理性恐慌,短期内可以出现反弹。VIX 指…

leetcode面试经典150题——34 有效的数独(矩阵)

题目: 有效的数独 描述: 请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。 数字 1-9 在每一行只能出现一次。 数字 1-9 在每一列只能出现一次。 数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出…

【产品功能】dolphinscheduler的告警功能的代码在哪

告警 MasterExecThread类runProcess方法涉及到的表和字段 总结番外 MasterExecThread类 runProcess方法 if(!sendTimeWarning && checkProcessTimeOut(processInstance) ){alertManager.sendProcessTimeoutAlert(processInstance,processService.findProcessDefineBy…

Provisioning Profile的重要性

大家好,我是咕噜-凯撒。在iOS和macOS开发中,Provisioning Profile(配置文件)是一个至关重要的组成部分,它包含开发者证书、App ID和设备信息的文件,不仅用于验证应用程序的身份和权限,还包括了很…

Docker的基本概念和优势,以及实际应用场景

目录 概要 基本概念 容器 (Container) 什么是容器 容器与虚拟机的区别 镜像 (Image) Dockerfile 仓库 (Repository) 容器编排 (Orchestration) Docker Compose Docker Daemon 和 Docker Client 网络 (Network) 数据卷 (Volume) 主要优势 提高移植性和可移植性 提…

力扣每日一题(2023-11-30)

力扣每日一题 题目:1657. 确定两个字符串是否接近 日期:2023-11-30 用时:21 m 07 s 时间:11ms 内存:43.70MB 代码: class Solution {public boolean closeStrings(String word1, String word2) {if(word1.…

分布式技术(二)注册中心

💌 所属专栏:【微服务】😀 作 者:长安不及十里💻 工作:目前从事电力行业开发🌈 目标:全栈开发🚀 个人简介:一个正在努力学技术的Java工程师,专注基…