主成分分析和因子分析十大不同点

主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。


1.原理不同

主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。

因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成就是要从数据中提取对变量起解释作用的少数公共因子因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)

 

2.线性表示方向不同

因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合

 

3.假设条件不同

主成分分析:不需要有假设(assumptions),

因子分析:需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 

 

4.求解方法不同

求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法

 (实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)

  注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。此外,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题(会出现最小特征根接近0的情况)

求解因子载荷的方法:主成分法主轴因子法,极大似然法,最小二乘法,a因子提取法

 

5.主成分和因子的变化不同

主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的

因子分析:因子不是固定的,可以旋转得到不同的因子

 

6.因子数量与主成分的数量

主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。

因子分析:因子个数需要分析者指定SPSSsas根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;

 

7.解释重点不同:

主成分分析:重点在于解释个变量的总方差,

因子分析:则把重点放在解释各变量之间的协方差。 

 

8.算法上的不同:
主成分分析:协方差矩阵的对角元素是变量的方差;

因子分析所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)

 

9.优点不同:

因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;

主成分分析:

   第一:如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析;

   第二:通过计算综合主成分函数得分,对客观经济现象进行科学评价

   第三:它在应用上侧重于信息贡献影响力综合评价。

   第四:应用范围广,主成分分析不要求数据来自正态分布总体,其技术来源是矩阵运算的技术以及矩阵对角化和矩阵的谱分解技术,因而凡是涉及多维度问题,都可以应用主成分降维;

 

10.应用场景不同:

主成分分析:

   可以用于系统运营状态做出评估,一般是将多个指标综合成一个变量,即将多维问题降维至一维,这样才能方便排序评估;

   此外还可以应用于经济效益、经济发展水平、经济发展竞争力、生活水平、生活质量的评价研究上;

   主成分还可以用于和回归分析相结合,进行主成分回归分析,甚至可以利用主成分分析进行挑选变量,选择少数变量再进行进一步的研究。

   一般情况下主成分用于探索性分析,很少单独使用,用主成分来分析数据,可以让我们对数据有一个大致的了解。

  几个常用组合:

   主成分分析+判别分析,适用于变量多而记录数不多的情况;

   主成分分析+多元回归分析,主成分分析可以帮助判断是否存在共线性,并用于处理共线性问题;

   主成分分析+聚类分析,不过这种组合因子分析可以更好的发挥优势。

因子分析:

  首先,因子分析+多元回归分析,可以利用因子分析解决共线性问题;

  其次,可以利用因子分析,寻找变量之间的潜在结构;

  再次,因子分析+聚类分析,可以通过因子分析寻找聚类变量,从而简化聚类变量;

   此外,因子分析还可以用于内在结构证实

文章同步发表于新浪微博:http://blog.sina.com.cn/s/blog_8813a3ae01018671.html


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/293227.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PostgreSQL 最佳实践 - 水平分库(基于plproxy)

背景 我一直以来都比较推荐plproxy这个PostgreSQL代理软件, 因为它小巧灵活好用, 效率高. 最近朋友邀请我给他们做个分布式的方案, 所以又把plproxy翻出来了. 本文讲一讲在单节点中如何快速的部署plproxy环境. 环境 PostgreSQL 9.3.1 plproxy 2.x plrpoxy节点 hostaddr 1…

Andorid之教你全手工去除定制软件

什么钛备份, RE管理器, 豌豆荚 recovery模式. 都一边休息着去吧. 为了删掉几个 软件 而安某个软件, 这也太浪费表情了. 一直都不信任到处都提供的下载, 毕竟,我们的安全性比什么都重要. 做好资料的保密, 不让随便传播, 这个问题应该是我们最关心的问题. 要不然, 一不小心又出来…

通过Rancher Desktop在桌面上运行K8s

Rancher 发行的操作系统新选择:Rancher Desktop for Windows,它可以帮助你在Windows桌面上管理Kubernetes和容器。当然他当然会支持Linux,Mac的。准备工作在我们探索全新的Rancher Desktop之前,我们需要准备以下内容:1…

数学家排名,高斯第二牛顿第三?!看完第一的简历,他果然比牛顿还牛逼.........

如果让你给数学家排名,你会怎么排?谁排第一?高斯?阿基米德?还是其他哪位数学神仙?今天早上超模君发现,在国内某排行网站上,由网友投票选出来“世界十大数学家”里,名列前…

oc引导windows蓝屏_跟电脑蓝屏say no!【亲测有效】

​ 01专业解释电脑蓝屏,又叫蓝屏死机(Blue Screen of Death,简称BSOD),是微软的 Windows 系列操作系统在无法从一个系统错误中恢复过来时,为保护电脑数据文件不被破坏而强制显示的屏幕图像。 看到了吧&…

C语言常用基础位操作

1、使用下面的代码将最右边的1改变为0,假如没有1则结果为0(e.g.,01011000>01010000): x & (x-1) 此代码可以用来判断一个无符号的整数是否为2的幂,假如x & (x-1)1,则x为2的幂&#…

Android系统手机端抓包方法(tcpdump)

抓包准备 1. Android手机需要先获得root权限。一种是否获得root权限的检验方法:安装并打开终端模拟器(可通过安卓市场等渠道获得)。在终端模拟器界面输入su并回车,若报错则说明未root,若命令提示符从$变#则为rooted&am…

hdu 1800 (map)

链接:http://acm.hdu.edu.cn/showproblem.php?pid1800 Flying to the Mars Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 10830 Accepted Submission(s): 3472 Problem DescriptionIn the year 8…

数据挖掘在金融行业十大应用

目前数据挖掘在各行各业应用广泛,尤其在金融、保险、电子商务和电信方面得到了很好的效果,本文对金融行业数据挖掘应用做了一个简单的总结,目的是想起到抛砖引玉的作用,欢迎各位大牛拍砖。 一:风险控制(贷款…

.NET 6 中的七个 System.Text.Json 特性

忽略循环引用在 .NET 5 中,如果存在循环依赖, 那么序列化的时候会抛出异常, 而在 .NET 6 中, 你可以选择忽略它。Category dotnet new() {Name ".NET 6", }; Category systemTextJson new() {Name "System.Text.Json",Parent dotnet }; do…

Redis整合Spring结合使用缓存实例

林炳文Evankaka原创作品。转载请注明出处http://blog.csdn.net/evankaka 摘要:本文介绍了如何在Spring中配置redis,并通过Spring中AOP的思想,将缓存的方法切入到有需要进入缓存的类或方法前面。 一、Redis介绍 什么是Redis? redis…

读取无线手柄数据_xbox series x/s 手柄开箱

原标题:xbox series x/s 手柄开箱xbox series x/s 手柄开箱 2020-11-12 08:29:003点赞2收藏4评论小编注:此篇文章来自#原创新人#激励计划,新人发文前三篇文章,篇篇额外奖励50金币。参加超级新人计划活动,新人发文即可瓜…

豆瓣评分9.4!这一部纪录片,探秘中国人迹罕至的未至之境!

全世界只有3.14 % 的人关注了爆炸吧知识Bilibili 联合“美国国家地理”,悄悄出品了一部史诗级动物记录片,忍不住要推荐给大朋友小朋友们——《未至之境》。这部纪录片由B站和国家地理联合创作,从绵延万里的山脉高原到枝繁叶茂的雨林竹海&…

ssh无密码公钥登陆

根据自己的发展历程,回忆一下,之前接触到的都是密码用户登录,自从到了好孩子集团,感受了证书登录的情况,刚开始很抵触,超不习惯,而且当时对原理不了解,总是出错,给运维的…

使用OpenTelemetry搭配Zipkin构建NetCore分布式链路跟踪 | WebAPI + gRPC

OpenTelemetry介绍OpenTelemetry是一组标准和工具的集合,旨在管理观测类数据,如 trace、metrics、logs 等。通过标准化不同的应用程序和框架如何收集和发出可观察性遥测数据,OpenTelemetry旨在解决这些环境带来的一些挑战。OpenTelemetry包括…

C语言 linux环境基于socket的简易即时通信程序

转载请注明出处:http://www.cnblogs.com/kevince/p/3891033.html ——By Kevince 最近在看linux网络编程相关,现学现卖,就写了一个简易的C/S即时通信程序,代码如下: head.h 1 /*头文件,client和server…

腾讯云cloudlite认证_【腾讯云】考个证...大数据开发工程师认证

作为一个大数据行业的从业者,考个腾讯云大数据开发工程师认证总比考个消防证 easy 吧…?关于考这个认证的意义其实主要在于全面复习一下大数据相关的知识点,另外有个腾讯云的认证,也许大概也会对你找工作有点帮助的吧?…

Logistic回归主要应用领域

主要应用领域 1、预测是否发生、发生的概率(流失、客户响应等预测) 如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。 2、影响因素、危险因素分析&#xff…

Java Process.waitFor()这个方法是做什么用的

java.lang.Process.waitFor()方法将导致当前的线程等待,如果必要的话,直到由该Process对象表示的进程已经终止。此方法将立即返回,如果子进程已经终止。如果子进程尚未终止,则调用线程将被阻塞,直到子进程退出。public…

kernel shell bash简介

还记得我们在Linux启动的时候。首先会启动内核 (kernel),内核是一段计算机程序,这个程序直接管理管理硬件,包括CPU、内存空间、硬盘接口、网络接口等等。所有的计算机操作都要通过内核传递给硬件。为了我们方便调用内核,我们将内核…