使用R语言进行Logistic回归分析(2)

一、数据集描述,问题要求

下表是40位肺癌病人的生存资料,X1表示生活行为能力平分(1到100),X2为病人的年龄(年),X3由诊断到进入研究的时间(月),X4表示肿瘤的类型(‘0’表示鳞瘤,‘1’表示小型细胞癌,‘3’表示腺癌,‘4’表示大型细胞癌)X5表示化疗的方法(‘1’表示常规,‘0’表示试验新法);Y表示病人的生存时间(‘0’表示生存时间短,‘生存时间小于200天,‘1’表示生存时间长,生存时间大于等于200天)

要求:1、建立E(y)=P(Y=1)对X1-X5的Logistic回归模型,并进行参数显著性检验和预测。

二、根据数据集,建立Logistic回归模型,并进行分析

x1<-c(70,60,70,40,40,70,70,80,60,30,80,40,60,40,20,50,50,40,80,70,60,90,50,70,20,80,60,50,

70,40,30,30,40,60,80,70,30,60,80,70)

x2<-c(64,63,65,69,63,48,48,63,63,53,43,55,66,67,61,63,66,68,41,53,37,54,52,50,65,52,70,40,36,44,54,59,69,50,62,68,39,49,64,67)

x3<-c(5,9,11,10,58,9,11,4,14,4,12,2,25,23,19,4,16,12,12,8,13,12,8,7,21,28,13,13,22,36,9,87,5,22,4,15,4,11,10,18)

x4<-c(1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,0,0,0,0,1,1,1,1,1,1,1,1,2,2,2,2,3,3,3,0,0,0,0,0)

x5<-c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0)

y<-c(1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,1,0,1,1,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,1,1)

df<-data.frame(x1,x2,x3,x4,x5,y)
log.glm<-glm(y~x1+x2+x3+x4+x5,family = binomial,data=df)
summary(log.glm)

运行得到:

从回归结果可以看到,系数只有一个是显著的,即病人的生活行为能力X1对p(Y=1)的影响是显著的,其余系数没通过检验。

三、使用逐步回归法,筛选出合适变量并找到最优的回归方程

log.step<-step(log.glm)
summary(log.step)

运行得到:

> log.step<-step(log.glm)
Start:  AIC=40.39
y ~ x1 + x2 + x3 + x4 + x5Df Deviance    AIC
- x3    1   28.484 38.484
- x2    1   28.484 38.484
- x5    1   28.799 38.799
<none>      28.392 40.392
- x4    1   32.642 42.642
- x1    1   38.306 48.306Step:  AIC=38.48
y ~ x1 + x2 + x4 + x5Df Deviance    AIC
- x2    1   28.564 36.564
- x5    1   28.993 36.993
<none>      28.484 38.484
- x4    1   32.705 40.705
- x1    1   38.478 46.478Step:  AIC=36.56
y ~ x1 + x4 + x5Df Deviance    AIC
- x5    1   29.073 35.073
<none>      28.564 36.564
- x4    1   32.892 38.892
- x1    1   38.478 44.478Step:  AIC=35.07
y ~ x1 + x4Df Deviance    AIC
<none>      29.073 35.073
- x4    1   33.535 37.535
- x1    1   39.131 43.131
> summary(log.step)Call:
glm(formula = y ~ x1 + x4, family = binomial, data = df)Coefficients:Estimate Std. Error z value Pr(>|z|)  
(Intercept) -6.13755    2.73844  -2.241   0.0250 *
x1           0.09759    0.04079   2.393   0.0167 *
x4          -1.12524    0.60239  -1.868   0.0618 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1(Dispersion parameter for binomial family taken to be 1)Null deviance: 44.987  on 39  degrees of freedom
Residual deviance: 29.073  on 37  degrees of freedom
AIC: 35.073Number of Fisher Scoring iterations: 6

使用逐步回归法得到了最终的回归方程,此时已经剔除了变量X2,X3,X5,只保留变量X1,X4,从回归方程的检验结果来看,系数是显著性得到了提高。

最终的回归方程为:

p=exp(-6.13755+0.09759x1-1.12524x4)/(1+exp(-6.13755+0.09759x1-1.12524x4))

使用该回归方程对,对40位病人生存时间较长的概率(Y=1)进行拟合和预测。

> log.pre<-predict(log.step)
> p<-exp(log.pre)/(1+exp(log.pre))
> p
运行得到各病人的生存时间较长的概率p(Y=1):

从而得到最终的生存时间较长的概率的拟合值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/716071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

291.【华为OD机试】模拟目录管理(JavaPythonC++JS实现)

🚀点击这里可直接跳转到本专栏,可查阅顶置最新的华为OD机试宝典~ 本专栏所有题目均包含优质解题思路,高质量解题代码(Java&Python&C++&JS分别实现),详细代码讲解,助你深入学习,深度掌握! 文章目录 一. 题目-模拟目录管理二.解题思路三.题解代码Python题解…

计算机设计大赛 深度学习火车票识别系统

文章目录 0 前言1 课题意义课题难点&#xff1a; 2 实现方法2.1 图像预处理2.2 字符分割2.3 字符识别部分实现代码 3 实现效果4 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 图像识别 火车票识别系统 该项目较为新颖&#xff0c;适…

Pycharm的下载安装与汉化

一.下载安装包 1.接下来按照步骤来就行 2.然后就能在桌面上找到打开了 3.先建立一个文件夹 二.Pycharm的汉化

ABAP - SALV教程07 斑马纹显示和SALV标题

SALV设置斑马纹和标题 METHOD set_layout.DATA: lo_display TYPE REF TO cl_salv_display_settings. * 取得显示对象lo_display co_alv->get_display_settings( ).* 设置ZEBRA显示lo_display->set_striped_pattern( X ). * 设置Titlelo_display->set_list_he…

企业微信变更主体怎么改?

企业微信变更主体有什么作用&#xff1f;做过企业运营的小伙伴都知道&#xff0c;很多时候经常会遇到现有的企业需要注销&#xff0c;切换成新的企业进行经营的情况&#xff0c;但是原来企业申请的企业微信上面却积累了很多客户&#xff0c;肯定不能直接丢弃&#xff0c;所以这…

【二】【SQL】去重表数据及分组聚合查询

去重表数据 表的准备工作 去除表中重复的数据&#xff0c;重复的数据只留一份。 mysql> create table duplicate_table (-> id int,-> name varchar(20)-> ); Query OK, 0 rows affected (0.03 sec)mysql> insert into duplicate_table values-> (100,aaa)…

Day24-yum与rpm软件包管理2

Day24-yum与rpm软件包管理2 1. 配置缓存rpm包2. 为什么要缓存&#xff1f;3. 组包相关指令4. yum帮助与补全功能4.1 补全4.2 什么是yum源4.3 常见互联网 yum 源 5. 搭建局域网YUM仓库实践 1. 配置缓存rpm包 修改yum.conf配置 [rootoldboy ~]# sed -i.bak s#keepcache0#keepca…

SLAM基础知识:前端和后端

在基于滤波的SLAM算法中&#xff0c;使用迭代卡尔曼滤波&#xff08;Iterative Kalman Filtering&#xff09;来求解当前帧状态量的步骤通常属于SLAM系统的前端部分。 前端负责处理传感器数据&#xff0c;进行状态估计和地图构建的初步步骤。迭代卡尔曼滤波作为一种滤波器&…

批次大小对ES写入性能影响初探

问题背景 ES使用bulk写入时每批次的大小对性能有什么影响&#xff1f;设置每批次多大为好&#xff1f; 一般来说&#xff0c;在Elasticsearch中&#xff0c;使用bulk API进行批量写入时&#xff0c;每批次的大小对性能有着显著的影响。具体来说&#xff0c;当批量请求的大小增…

PVLAN组网实验

一&#xff0c;PVLAN类型 主VLAN 主VLAN可以由多个辅助私用VLAN组成&#xff0c;而这些辅VLAN与主VLAN属于同一子网。 辅助VLAN ① 团体VLAN&#xff1a;如果某个端口属于团体VLAN&#xff0c;那么它就不仅能够与相同团体VLAN中的其他端口进行通信&#xff0c;而且还能够与…

使用rsync同步服务器和客户端的文件夹

使用rsync同步服务器和客户端的文件夹 实现目的实验准备实验操作步骤服务器操作关闭防火墙和SELINUX安装rsync修改服务器配置文件/etc/rsync.conf创建服务器备份文件的目录创建rsync系统运行的用户修改备份文件的所有者和所属组创建rsync.passwd启动rsync服务并进行验证 客户端…

中间件安全(概述)有中间件的各类链接和官网信息和漏洞库以及配置问题和开源工具

分类主要包括Apache、IIS、Tomcat、weblogic、websphere、Jboss等相关的技术知识和实践。 以Apache为例讲一讲如何保证中间件安全 中间件安全是指保护中间件软件和服务的安全性&#xff0c;防止被恶意攻击或者滥用。中间件软件是指在操作系统和应用程序之间提供通信和集成功能…

【Go】命令行相关

查看go的环境 go env # 查看go的环境变量 goRoot # 编译器的环境 goPath设置go module 打开cmd命令行&#xff0c;执行以下命令 go env -w GO111MODULEoff # on-打开 off-关闭 auto-自动相关命令 go build # 项目路径下执行&#xff0c;能编译当前go项目&#xff08;一个…

RFID(Radio Frequency Identification)技术笔记

一、RFID的介绍 RFID&#xff0c;全称为Radio Frequency Identification&#xff0c;即射频识别技术&#xff0c;也常被称为电子标签或无线射频识别。它是一种非接触式的自动识别技术&#xff0c;通过射频信号自动识别目标对象并获取相关数据&#xff0c;识别过程无需人工干预&…

[云原生] k8s之pod容器

一、pod的相关知识 1.1 Pod基础概念 Pod是kubernetes中最小的资源管理组件&#xff0c;Pod也是最小化运行容器化应用的资源对象。一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的&#xff0c;例如&#xff0c;用于管理…

如何确保JDK版本与操作系统架构匹配?

1. 序言 最近的工作中&#xff0c;需要升级JDK版本到17.0.7&#xff0c;以解决一个JDK bug&#xff1a;JDK-8299626该bug的core dump关键字如下&#xff1a;SIGSEGV in PhaseIdealLoop::build_loop_late_post_work公司JDK团队提供的、包含JDK的基础镜像&#xff0c;有aarch64和…

Hololens2开发环境配置及项目生成部署

Hololens2开发环境配置及项目生成部署 Hololens2开发环境配置及项目生成部署一、官方文档及推荐配置说明1.官方文档介绍2.推荐配置及配置说明 二、安装步骤0.现有Visual Stuido和Unity卸载1.Windows SDK安装2.Visual Studio安装3.Unity安装4.MRTK配置 三、初次环境配置1.新建Un…

vmware的诡异网络

坦白说&#xff0c;vmware的网络我始终是没有搞太懂。 我习惯使用的是“仅主机”和“NAT”。 “仅主机”我习惯配置静态IP&#xff0c;互相访问没问题。 “NAT”则主要用于windows系统&#xff0c;简单方便。windows虚拟机一般也没啥特别的互相访问需求&#xff0c;直接文件复制…

简单了解GaussDB

大家都已经很熟悉openGauss了&#xff0c;昨天我的文章中说陕西电力的用采系统用Gaussdb替代了Oracle&#xff0c;就有朋友问我这个Gaussdb是不是就是openGauss。这个问题还真的有点不好回答&#xff0c;Gaussdb和openGauss渊源很近&#xff0c;但是还不是一码事。华为在数据库…

c++八股文:c++面向对象

文章目录 1.c面向对象三大特性2.c的三个访问修饰符3.多重继承4.重载与重写5.c多态怎么实现6.成员函数/成员变量/静态成员函数/静态成员变量的区别7.构造函数和析构函数8.c构造函数有几种9.什么是虚函数什么是虚函数表10.虚函数和纯虚函数的区别11.抽象类和纯虚函数12.虚析构13.…