matlab pca降维_手撸PCA(Python七行代码实现）

直接上代码：

x = np.random.rand(10,5) #随机生成一组样本
x -= x.mean(axis=0) 	# 见详注1
C = x.T.dot(x)    		# 计算自协方差矩阵
lam,v= lina.eig(C)    	# 特征分解，v是
new_index = np.argsort(lam)[::-1]    # 特征值排序，见详注2
A = -v[:,new_index]					 # 得到A
w = x.dot(A)						 # 计算变换后的特征
r = lam[new_index]/lam.sum()		 # 计算所有特征对应的贡献率

测试一下：

w[:,:2]		# 新特征的前2个>>> array([[-0.3939524518, -0.4184678305],[-0.5907434013,  0.2033346207],[-0.4585388051, -0.111367225 ],[ 0.4552495673, -0.0405062598],[-0.2335902798, -0.4260334862],[ 0.4523182771,  0.039755097 ],[ 0.0902288594,  0.1869543779],[ 0.089419155 ,  0.7656098218],[ 0.7645053936, -0.3353675658],[-0.1748963144,  0.1360884499]])r			# 各个特征值对应的贡献率>>> array([0.4026073116, 0.2589988934, 0.2088275432, 0.0902665298,0.0392997221])

对比SKLEARN实现：

pca = PCA(n_components=2)pca.fit(x)	# x还是最开始那个xpca.explained_variance_ratio_>>> array([0.4026073116, 0.2589988934])	# 前2个特征对应的贡献率（完全一致）pca.transform(x)								# 降维变换（完全一致）>>> array([[-0.3939524518, -0.4184678305],[-0.5907434013,  0.2033346207],[-0.4585388051, -0.111367225 ],[ 0.4552495673, -0.0405062598],[-0.2335902798, -0.4260334862],[ 0.4523182771,  0.039755097 ],[ 0.0902288594,  0.1869543779],[ 0.089419155 ,  0.7656098218],[ 0.7645053936, -0.3353675658],[-0.1748963144,  0.1360884499]])

计算变换后的特征差值：

 w1 = w[:,0]w2 = pca.transform(c)[:,0]
((w1-w2)**2).sum()
>>> 2.2980196096428498e-30

贡献率的值：

pca.explained_variance_ratio_ - r[:2]
>>> array([ 1.1102230246e-16, -1.6653345369e-16])

详细注解见： https://blog.csdn.net/cauchy7203/article/details/107421996

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/523202.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

matlab pca降维_手撸PCA(Python七行代码实现）

相关文章

MaxCompute复杂数据分布的查询优化实践

android开源tabview,TabBarView

Linux 主机信息总览

AliOS Things异步事件框架Yloop

这项技术，风头正劲，BAT要力捧！程序员：我彻底慌了...

joi模块验证日期格式_python datetime模块详解

AliOS Things 基于组件化思想的多bin特性

case计算机英语,计算机英语常用术语

查看linux是否为虚拟机，以及其它信息，cpu，主机型号，主板型号等

数据库风云：老骥伏枥，新秀辈出

解读阿里云oss-android/ios-sdk 断点续传（多线程）

云钻还在吗苏宁怎么解除实名认证_快手7天怎么养号，5步简易养号方案送上

将html表格导出到excel表格,table2excel-将HTML表格内容导出到Excel中_html/css_WEB-ITnose...

RDS读写分离,海量数据一键搞定

7 行代码优雅地实现 Excel 文件导出功能？

Docker精华问答 | 用dockerfile制作镜像

日志服务Flink Connector《支持Exactly Once》

两个瓶子水怎样一样多_同事每天比我多睡两个小时！省下70万买了地铁站附近房子杭州姑娘却感叹买房时一定是脑子进了水……...

为什么电路交换不适合计算机网络,电路交换技术不适合计算机数据通信

'parent.relativePath' points at no local POM