多分类logistic回归分析案例教程

因变量为无序多分类变量,比如研究成人早餐选择的相关因素,早餐种类包括谷物类、燕麦类、复合类,此时因变量有三种结局,而且三种早餐是平等的没有顺序或等级属性,此类回归问题,可以使用多分类Logistic回归进行分析。

1. 模型原理

多分类Logistic有时也称为多元Logistic回归,从因变量的多个类别中选一个水平作为对照,拟合其他类别水平相较于该对照水平的Logistic回归模型,因此k个分类水平的因变量,最终得到k-1个Logistic回归模型。

2. 重要概念

有以下主要概念:

(1) 多分类Logistic回归模型的参数估计与二元Logistic类似,同样采用最大似然法。

(2) 在模型检验方面和二元Logistic回归模型有一些差别,常用的拟合优度检验为Pearson卡方检验和偏差似然比卡方检验。其他概念和二元Logistic回归基本类似。

3. 多分类Logistic实例分析

【例5-9】以1992年美国总统选举的部分数据为例,总统投票对象包括Bush、Perot、Clinton,数据中变量说明见表 5-27,试分析选民投票情况。案例数据来源于卢纹岱(2006),数据文档见“例5-9.xls”。

1) 基本条件判断

研究投票候选人的相关影响因素,投票对象变量为“pres”,有3个分类水平,为无序多分类变量,总投票数为1847,通过【通用方法】→【频数】可知,“pres”三个投票对象 Perot、Bush、Clinton依次获得278票、661票、908票,样本量能满足Logistic回归的经验要求,本例仅包括年龄、性别两个自变量,暂不考察多重共线性问题。

本例拟以Perot作为参照水平采用多分类Logistic回归进行分析。

2) 建立Logistic回归模型

数据读入平台后,仪表盘依次选择【进阶方法】→【多分类Logit】模块,将“pres”变量拖拽至【Y(定类)】,“age”和“sex”变量拖拽至【X(定量/定类)】。此处应注意,常见的参照水平主要包括第一个类别或最后一个类别,平台默认是以第一个数字编码或较小的数据作为参照组。

多分类Logistic回归的自变量可以是定量数据,或者定类数据,如果是多分类定类数据可根据实际情况提前做哑变量处理,如果未做哑变量转换,移入【X(定量/定类)】后,平台将按定量数据进行回归分析。勾选【保存预测类别】,命令平台对案例数据进行类别预测,操作设定界面如图 5-27所示,最后单击【开始分析】。

多分类Logistic回归输出包括基本汇总、模型似然比检验、回归分析结果汇总、预测准确率等结果。在结果解读和分析时,可参考二元logistic回归,先判断模型总体是否有效,评价模型拟合质量,最后检验各自变量因素的显著性及分析OR值结果。

3) Logistic回归模型的检验与评价

和二元Logistic回归一样,多分类Logistic回归模型总体检验仍然采用的是似然比卡方检验。

如上表5-28所示,经检验,卡方值=89.743,p﹤0.05,认为模型总体上有统计学意义,模型有效。表中的AIC、BIC,以及-2LL,和二元Logistic回归解读一致,均为取值越小越好,主要用于多个模型间的比较,此处可解释分析的意义不大。

也可以用预测准确率来评价模型的拟合优度,如上表5-29所示。本次拟合的多分类Logistic回归模型,对Perot、Bush的投票预测准确率都很低,对Clinton投票预测准确率可达到99.34%。

4) 回归系数与OR值解释与分析

k个分类水平的因变量进行多分类Logistic回归,将得到k-1个模型,每个模型独立计算各自变量对因变量的回归结果,因此在表5-30中,应注意该表格分为上下两部分,前4行为与Petor相比较,投票给Bush的影响因素分析;而后4行为与Petor相比较,投票给Clinton的影响因素分析。

(1) 与Petor相比较,投票给Bush的影响因素分析:

经Wald卡方检验,性别sex(卡方值=4.292,p﹤0.05)、年龄age(卡方值=38.921,p﹤0.01),认为性别和年龄对投选Bush的影响有统计学意义。这两个因素的偏回归系数均为正数,说明与投选Bush有正相关关系。相对应的OR值均大于1,OR值95% CI不包括1,提示性别、年龄对投票结果有影响。

以性别为例,OR=1.351,表示与给Petor投票相比较,女性投票给Bush的可能性是男性的1.351倍(默认是低编码水平为参照)。

(2) 与Petor相比较,投票给Clinton的影响因素分析:

经Wald卡方检验,性别sex(卡方值=27.191,p﹤0.01)、年龄age(卡方值=48.151,p﹤0.01),认为性别和年龄对投选Clinton的影响有统计学意义。这两个因素的偏回归系数均为正数,说明与投选Clinton有正相关关系。相对应的OR值均大于1,OR值95% CI不包括1,提示性别、年龄对投票结果有影响。

性别的OR=2.084,为促进因素,表示与Petor相比较,女性投票给Clinton的可能性是男性的2.084倍。年龄的OR=1.035, 同样也属于促进性因素,表示与Petor相比较,年龄越大的群体,他们会更加愿意投票给Clinton。

5) 结果报告

根据表中常数项和偏回归系数,可以写出两个模型的表达式为:

ln(Bush/Perot)=-0.992 + 0.301×sex + 0.031×age

ln(Clinton/Perot)=-1.486 + 0.734×sex + 0.034×age

性别、年龄对投票结果的影响均有统计学意义,是候选人选取成功的显著影响因素。


以上内容摘自《SPSSAU科研数据分析方法与应用》第5章——相关影响关系研究,书中不仅涵盖了数据清理、统计分析和模型构建等内容,还提供了丰富的案例,以便于读者在实际研究中应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/59489.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

工业相机常用功能之白平衡及C++代码分享

目录 1、白平衡的概念解析 2、相机白平衡参数及操作 2.1 相机白平衡参数 2.2 自动白平衡操作 2.3 手动白平衡操作流程 3、C++ 代码从XML读取参数及设置相机参数 3.1 读取XML 3.2 C++代码,从XML读取参数 3.3 给相机设置参数 1、白平衡的概念解析 白平衡(White Balance)…

越权访问漏洞

V2Board Admin.php 越权访问漏洞 ## 漏洞描述 V2board面板 Admin.php 存在越权访问漏洞,由于部分鉴权代码于v1.6.1版本进行了修改,鉴权方式变为从Redis中获取缓存判定是否存在可以调用… V2Board Admin.php 越权访问漏洞 漏洞描述 V2board面板 Admin.ph…

[C++ 核心编程]笔记 4.4.2 类做友元

4.4.2 类做友元 关键步骤: 在另一个类中使用 friend class 类名 拓展: 在类外写成员函数(已在类内声明, 实现可以写在外面): //类外写成员函数 Building::Building() {m_SittingRoom "客厅";m_BedRoom "卧室"; }GoodGay::GoodGay() {//创建建筑物对象…

W外链如何设置活码功能?

根据搜索结果,W外链平台的活码功能允许用户创建动态二维码,这些二维码背后可以链接到不同的目标链接或页面,并且可以根据预设条件自动更新跳转链接。以下是W外链平台活码功能的一些关键特点和使用步骤 : 1.活码的特点&#xff1a…

【论文复现】基于图卷积网络的轻量化推荐模型

本文所涉及所有资源均在这里可获取。 📕作者简介:热爱跑步的恒川,致力于C/C、Java、Python等多编程语言,热爱跑步,喜爱音乐、摄影的一位博主。 📗本文收录于论文复现系列,大家有兴趣的可以看一看…

QT 实现绘制汽车仪表盘

1.界面实现效果 以下是具体的项目需要用到的效果展示,通常需要使用QPainter类来绘制各种图形和文本,包括一个圆形的仪表盘、刻度、指针和数字。 2.简介 分为以下几个部分,首先设置抗锯齿 painter.setRenderHint(QPainter::Antialiasing)。 QPainter p(this);p.setRender…

2020年美国总统大选数据分析与模型预测

数据集取自:2020年🇺🇸🇺🇸美国大选数据集 - Heywhale.com 前言 对2020年美国总统大选数据的深入分析,提供各州和县层面的投票情况及选民行为的可视化展示。数据预处理阶段将涉及对异常值的处理&#xff0…

sqlserver使用bak文件恢复数据库

进入数据库 sqlcmd -S localhost -U SA -P password备份文件 #备份格式BACKUP DATABASE your_database_name TO DISK path_to_backup_file.bak;#举例 1> BACKUP DATABASE XJZDataTest TO DISK /root/mssql.bak; 2> go使用备份文件恢复数据库 1、查询备份文件中的数据…

拥有一个智能化清理电脑垃圾的工具 是一个非常明智的选择 效率高安全删除文件

拥有一个智能化清理电脑垃圾的工具 是一个非常明智的选择 效率高&安全删除文件。大家以前清理电脑垃圾是不是都是只删除回收站垃圾,或者有些人更聪明一点就会删除临时文件,仅仅清理这些垃圾是不够的,C盘其实还有更多的垃圾需要清理。 太…

RK3568 Android12跳过认证 预置谷歌服务GMS

在Rom开发中需要发布海外版本时基本都需要内置google服务,而规范方式集成的话都需要设备进行认证,获取google应用签名等非常复杂的一套流程,一般大厂才有这些资质和资源,这里介绍一种非常规方式集成GMS,跳过设置认证流程,在RK3568 android12环境亲测有效。 谷歌全家桶中…

[蓝桥杯算法从小白到大牛]动态规划第二讲:三步问题

目录 1->题目链接 2->题目解析 3->讲解算法原理 核心流程: 3.1->状态表示 3.2->状态转移方程(最重要的一步) 3.3->初始化 3.4->填表顺序 3.5->返回值 4->编写代码实现 5->您的专属鼓励师 1->题目链接 三步问题 2->题目解析 题目…

C#与C++交互开发系列(二十):跨进程通信之共享内存(Shared Memory)

1、前言 共享内存(Shared Memory)是一种高效的跨进程通信方式,尤其适用于同一台计算机上的进程之间的高速数据传输。与套接字相比,共享内存允许多个进程直接访问同一块内存区域,减少了数据传输的中间步骤,…

智慧公厕解决方案是未来厕所新建和改造的方向

在当今科技飞速发展的时代,智慧公厕解决方案正逐渐成为厕所新建和改造的主流方向,为人们带来更便捷、卫生、高效的使用体验。 一、智能化体验提升便捷性 智慧公厕配备了一系列智能设施,极大地提升了使用的便捷性。比如,智能环保取…

C++ | Leetcode C++题解之第542题01矩阵

题目&#xff1a; 题解&#xff1a; class Solution { public:vector<vector<int>> updateMatrix(vector<vector<int>>& matrix) {int m matrix.size(), n matrix[0].size();// 初始化动态规划的数组&#xff0c;所有的距离值都设置为一个很大的…

Vue3中实现原生CSS完成圆形按钮点击粒子效果和定点旋转动画

效果&#xff1a; 源码&#xff1a; <script setup> import { ElMessage } from "element-plus"; const isClick () > {ElMessage.success(Clicked); }; </script><template><button click"isClick" class"button">…

DGL之copy_e和copy_u

消息函数copy_e和copy_u用法 copy_e语法格式例子 copy_u语法格式例子 copy_e 语法格式 dgl.function.copy_e(e, out)参数&#xff1a; e (str)&#xff1a;边的特征字段&#xff0c;指定用于计算消息的边特征。out (str)&#xff1a;输出的消息字段&#xff0c;指定存储消息…

python画图|hist()函数深层体验

【1】引言 前述学习已经掌握hist()函数的基本运用技巧&#xff0c;可通过下述链接直达&#xff1a; python画图|hist()函数画直方图初探-CSDN博客 python画图|hist()函数画直方图进阶-CSDN博客 我们已经理解hist()函数本质上画的是概率分布图&#xff0c;相关知识属于数理统…

如何提升论文写作能力?

很多同学刚开始都不知道如何写作学术论文&#xff0c;这个也很正常&#xff0c;否则要导师来做什么。而且写作是需要练习的,等你写了5篇以上的论文&#xff0c;你就有感觉了。其次&#xff0c;你们感觉论文写作不知道从何下手还有个重要原因是缺少指导&#xff0c;最近接触了几…

配置管理,雪崩问题分析,sentinel的使用

目录 配置管理一&#xff1a;什么是配置管理二&#xff1a;配置共享三&#xff1a;配置热更新 雪崩问题一&#xff1a;原因分析二&#xff1a;解决方案 Sentinel一&#xff1a;快速入门二&#xff1a;请求限流三&#xff1a;线程隔离四&#xff1a;fallback五&#xff1a;服务熔…

算法练习:904. 水果成篮

题目链接&#xff1a;904. 水果成篮。 题目意思就是可以选取两个种类的水果不能超过两个种类&#xff0c;该种类个数没有限制&#xff0c; 但是一旦超过两个种类的水果就要停止计数。 示例中数组编号就是就是种类&#xff0c;就是不能出现三个不同编号的数。 1.暴力解法&…