R 回归 虚拟变量na_【R语言进阶】Logistic回归及哑变量设置

946a8f5c78d04a7c7e9d1fb4d07f97e6.gif点击上方“蓝字”,我们一起分析数据

Logistic回归是最常用的多因素回归模型,在医学研究中,常用于研究疾病的危险因素,下面我们一起来看看,R语言是如何实现Logistic回归的。

1

第一步 导入数据

首先,在excel里全选数据集,右键复制。

7d42056339e5b2a6761192feda8a7be0.png

然后,在Rstudio中,输入:

mydata "clipboard")

查看数据:

b2909dda829b5f66ad81e3790f75fdcd.png

2

第二步 分类变量和等级变量转成因子型变量

mydata$sex$sex,levels=c(0,1),                  labels=c("Female","Male"))mydata$work$work,levels=c(0,1),                   labels=c("Non-work","Work"))mydata$disease$disease,levels=c(0,1),                       labels=c("Non-disease","Disease"))mydata$bmig$bmig,levels=c(1,2,3),                    labels=c("normalweight","overweight","obese"))mydata$bloodtype$bloodtype,levels=c(1,2,3,4),                      labels=c("O","A","B","AB"))

 查看数据:

67065545e587049c7f5298fae743a611.png

da07f83424891126bb9c18630d3e4fc8.png

3

第三步进行单因素logistic回归

model1 <- glm(disease ~ bloodtype, data= mydata, family = binomial())

查看结果:

e09442f609873dedac4b71aa8a492c85.png

结果解读:

Estimate列表示回归系数,Std.Error表示标准误,z value表示统计量的值,Pr(>|z|)表示p值。我们可以看到bloodtypeA、bloodtypeB、bloodtypeC的结果,但是没看到bloodtypeO的结果。这是因为R语言logistic回归默认将分类变量的第一个factor设置为参照,通过前面的str(mydata)命令获得的数据集概况,可以看到bloodtype的levels顺序为:O、A、B、AB,所以在此回归模型中bloodtypeO当作参照。

获得OR值:

54fde494cb165429ad263d0e6730511f.png

获得OR值95%可信区间:

3a18535fefe86ce841c61666838939fe.png

科研论文通常需要我们提供OR值及其95%可信区间以及p值,虽然这些都得到了,但是貌似整理起来比较麻烦,别急,我们通过命令进行整理。具体而言:先通过broom包中tidy函数把model1的结果变成规范的数据框格式,提取出p值,再把OR值和OR的95%可信区间,组合到一起。

install.packages("broom")library(broom)y

c44a356a0f5bbcfd6bfc6435f94657f4.png

zexp(coef(model1)),

 48e7be7eaf21bce741050faa87fe7aaa.png

结果解读:

exp.coef.model1表示OR值, X2.5和X97.5表示OR值的95%可信区间,y.p.value表示p值。Bloodtype作为无序多分类变量,需要设置为哑变量,一般哑变量的数目比分类变量的数目少一个,少掉的那个就作为参照(reference)。例如本例中,bloodtypeO就是参照,本文末尾有较为详细的说明。

4

第四步 多因素logistic回归

Model2 <- glm(disease ~sex+age+bmig+work+a+b+c+x+y, data = mydata, family = binomial())

c82928e711fa559061ebffc8b68a6520.png

整理成表格:

library(broom)mexp(coef(model2)),

e3d4046def4ad0cec972223869f2ec2b.png

结果输出到excel里:

write.csv(m,file="多因素logistic回归结果.csv")

在G盘的R文件夹中查看生成的多因素logistic回归结果,如图所示:

d4b7e414d7087df6bdfb0bcc022be389.png

经过更改表头及简单的调整:

d68d2f6774fb2c8be094ba89a7bd2e6e.png

5

 进阶:哑变量及参照的设置

Logistic回归中一个重点内容,把无序多分类变量设置为哑变量,本文的例子中bloodtype是无序多分类变量,需要设置成哑变量,一个快捷的方法是把bmig设置为因子变量,做logistic时,默认为已经设置成哑变量。

还有一个重要的问题是如何设置哑变量的参照,本例中我们是以O型为参照,其他各型与它相比。如果我们想把A型设为参照,该如何操作呢?

我们先看下bloodtype的各level名称的顺序:

 51aec75f1a65c4832a8da3fda64f5563.png

 把A型作为参照,只需把A调到第一个位置:

mydata$bloodtype$bloodtype,

查看是否成功:

levels(mydata$bloodtype)

b47bc9133cab36c6387c122f275257a0.png

运行模型

model3 <- glm(disease ~sex+age+bmi+work++bloodtype+a+b+c+x+y, data = mydata, family = binomial())

fae85979f68d8cbbb8ce2d6999b149ae.png

78474cb71073b227b50f0bc3431b055d.png890a55569fa610da1ed69fbfae6901b2.png关注我的,数据分析都不求人了不信你试试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/532267.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

logisticregression参数_通俗地说逻辑回归【Logistic regression】算法(二)sklearn逻辑回归实战...

前情提要&#xff1a;通俗地说逻辑回归【Logistic regression】算法&#xff08;一&#xff09; 逻辑回归模型原理介绍上一篇主要介绍了逻辑回归中&#xff0c;相对理论化的知识&#xff0c;这次主要是对上篇做一点点补充&#xff0c;以及介绍sklearn 逻辑回归模型的参数&#…

tensorflow适用于python版本_tensorflow用python哪个版本更好?

tensorflow用python哪个版本&#xff1f;一、安装anaconda tensorflow是基于python脚本语言的&#xff0c;因此需要安装python, 当然还需要安装numpy、scipy、six、matplotlib等几十个扩展包。如果一个个安装&#xff0c;装到啥时候去&#xff1f;&#xff08;我曾经光安装scip…

php parse url ctf,【SSRF】如何绕过filter_var(), preg_match() 和 parse_url()

0x01 前言这篇文章是在我看完一片国外安全大佬写的文章后对其进行总结并翻译得到的。0x02 正文之绕过filter_var和preg_match本片文章主要深入一种php ssrf的技术——如何绕过例如filter_var(), preg_match()和parse_url()等函数。本次我进行测试的php版本全部为php v5.6.30php…

python json解析_python读取json文件并解析

原博文 2018-07-09 18:35 − # -*- coding: utf-8 -*- import os import json import sys reload(sys) sys.setdefaultencoding(utf-8) filelistos.listdir(E:\\log\\files\\) for ite... 相关推荐 2019-12-05 20:03 − 如何使用 Python 语言来编码和解码 JSON 对象。 JSON(Jav…

python中文词云图代码_Python简单实现词云图代码及步骤解析

一、安装 wordcloud pip install wordcloud 二、加载包、设置路径 import os from wordcloud import WordCloud import matplotlib.pyplot as plt os.chdir(E:\\pyspace\\tmp) 三、词云图示例 1、默认参数示例 text Keep it simple and stupid. wc WordCloud() # 实例化词云图…

usb大容量存储设备驱动程序_20年历史了!为什么USB接口还存在?网友:原来如此...

USB接口作为计算机领域应用最广泛的数据接口&#xff0c;已有20多年的历史。和它的名字一样&#xff0c;USB(Universal Serial Bus)最初也是为统一的数据接口而设计的。你几乎可以用它来代替计算机的各种外部数据接口&#xff0c;只需为它设计相应的驱动程序。随着市场对USB接口…

linux终端炫酷命令,你不得不知道11个炫酷的 Linux 终端命令

很多朋友都很喜欢Linux &#xff0c;Linux是一套免费使用和自由传播的类Unix操作系统&#xff0c;是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统&#xff0c;Linux是一款免费的操作系统&#xff0c;用户可以通过网络或其他途径免费获得&#xff0c;并可…

lasso回归_一文读懂线性回归、岭回归和Lasso回归

(图片由AI科技大本营付费下载自视觉中国)作者 | 文杰编辑 | yuquanle本文介绍线性回归模型&#xff0c;从梯度下降和最小二乘的角度来求解线性回归问题&#xff0c;以概率的方式解释了线性回归为什么采用平方损失&#xff0c;然后介绍了线性回归中常用的两种范数来解决过拟合和…

springcloud架构特点_打造企业级微服务平台架构,分布式应用场景管理

微服务平台架构是一项在云中部署应用和服务的新技术。大部分围绕微服务的争论都集中在容器或其他技术是否能很好的实施微服务。微服务系统可以在“自己的程序”中运行&#xff0c;并通过“轻量级设备与HTTP型API进行沟通”。关键在于该服务可以在自己的程序中运行。通过这一点我…

怎么判断一个字符串的最长回文子串是否在头尾_LeetCode 5 迅速判断回文串的Manacher算法...

本文始发于个人公众号&#xff1a; TechFlow题意Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.Link: https://leetcode.com/problems/longest-palindromic-substring/翻译给定一个字符串s&#xff0c…

spring和mybatis结合做简单的增删查改系统_springbootamp;amp;vue简单的景点信息管理系统...

springboot&&vue简单的景点信息管理系统这两天闲着没有什么事&#xff0c;就根据陈哥的教程&#xff0c;试着写了一个springboot和vue的简单的景点信息管理系统。也就大致实现了最基本的增删查改。先看看效果图吧&#xff1a;1、登陆界面&#xff1a; 2、注册界面&…

spark算子_十、Spark之详解Action类算子

常用Action类算子列表reduce(func): 通过func函数来对RDD中所有元素进行聚合运算&#xff0c;先运算分区内数据&#xff0c;再运算分区间数据。scala> val rdd1 sc.makeRDD(1 to 100)rdd1: org.apache.spark.rdd.RDD[Int] ParallelCollectionRDD[4] at makeRDD at :24# 对…

await原理 js_「速围」Node.js V14.3.0 发布支持顶级 Await 和 REPL 增强功能

本周&#xff0c;Nodejs v14.3.0 发布。这个版本包括添加顶级 Await、REPL 增强等功能。REPL 增强通过自动补全改进对 REPL 的预览支持&#xff0c;例如&#xff0c;下图中当输入 process.ver 之后&#xff0c;不需要输入剩下的实际内容&#xff0c;它帮我们生成了自动补全的输…

linux输入ls后不显示_零基础学习之Linux基础命令小结

安装完重启后&#xff0c;没有像sery所说在图形界面崩溃了&#xff0c;由于我没有安装X-WINDOWS而是直接进入了文本界面。如果你想做linux管理的话&#xff0c;最好在文本界面下工作&#xff0c;这样会适应如下图:第一行显示的是我们所安装的linux是Red Hat 企业4第二行显示的是…

.gitignore文件_【第1739期】为Git仓库里的.idea文件夹正名

前言.idea该不该提交到代码仓库中呢&#xff1f;你的意见呢&#xff1f;今日早读文章由《Flask Web开发》作者李辉分享。正文从这开始&#xff5e;&#xff5e;在网络上&#xff0c;我曾多次看到人们对于Git仓库中的.idea文件夹的偏见。最近的一次是在某个博客中技术专家对于志…

监控linux时间不对,shell 计算故障时间 配合web监控

#!/bin/bash#checkfail.log 为SHELL监控网站时间存放的日志文件 https://blog.51cto.com/junhai/2437965fail_time(){starttimetail -n 1000 checkfail.log |grep "$url"|grep "第1次"|tail -n 3|head -n 1|awk {print $1, $2} #取网站挂掉的时间endtimet…

linux redis清空数据恢复,Redis数据恢复--误删数据后一次吓尿的经历

1、起因&#xff0c;一个flushdb命令因为误操作&#xff0c;输入了一个flushdb命令&#xff0c;导到redis里0号库里的数据全部清空&#xff0c;OMG&#xff0c;这里有不少重要信息&#xff0c;如果被领导知道&#xff0c;必开除2、appendonly留有生机仔细想想&#xff0c;当时数…

c语言 枚举类型 uint32_浅谈C语言枚举类型 | 附自创用法分享

经济学家说过&#xff0c;路边是不会有100元的&#xff1b;但如果有&#xff0c;你还是要捡起来。同理&#xff0c;在貌似万物免费的网络时代&#xff0c;你是很难找到有针对性的好资料&#xff1b;但是如果有&#xff0c;希望你能认真学习吸收。比如笔者今天写的这一篇一今天这…

java pdf增删改查_如何利用Java代码操作索引库?

今天是刘小爱自学Java的第161天。感谢你的观看&#xff0c;谢谢你。学习计划安排如下&#xff1a;学了几天的Elasticserch&#xff0c;但都是它本身的知识点&#xff0c;如何通过Java语言去操作它呢&#xff1f;这就好比以前学数据库&#xff0c;在数据库工具中通过sql语句也能…

sublime text3 怎么配置、运行python_SublimeText3按ctrl+b执行python无反应

最后更新时间&#xff1a;2017-09-14 现象&#xff1a; 在Sublime中打开.py文件&#xff0c;按”ctrlb”执行时无反应。点击工具->编译系统中已经有且识别到Python&#xff0c;但执行”run&#xff08;ctrlshiftb&#xff09;”时无反应&#xff0c;Sublime左下角提示”No B…