PCA主成分分析

首先可以先阅读这一篇文档。

http://wenku.baidu.com/view/4df2c1d276a20029bd642d76.html

 

基本的算法和原理在上面的文档内已经写得很详细了,总结一下PCA的数学模型吧:

第一种求法:

image

image

易知A是对称阵,所以可以对角化

image

因为P是要求出来的,所以可以另image

由线性代数的理论得知:image

最终则可以得到:

image

 

第二种求法:

那就是矩阵的SVD分解

image

其中U、V均为酉矩阵(正交阵是实数特殊化的酉矩阵)。那么我们可以另P=UT,则也可以达到第一种求法的目的。

 

从信号的角度来说,对角阵中非零元素代表着实际的信号值,经过PCA之后,可以减少数据间的冗余度以及维度,并且可以去掉一些信息量少的非零元素值,进一步减少数据维度。

传统的PCA是通过协方差矩阵来判定变量间的相关性的。可以知道,两个变量间的相关性与是否相互独立是没有关系的。只有在数据符合正态分布(高斯分布)的时候,不相关才和相互独立等价。

所以传统PCA的算法只能用在数据服从正态分布的基础上,幸运的是生活中大部分观测的变量都符合这个分布。

或者可以通过改进的PCA算法,从而适应服从其他分布的数据。

转载于:https://www.cnblogs.com/lvfq/archive/2013/03/27/2984435.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/474575.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

oracle xe 最大连接数,解决Oracle XE报错ORA-12516(Oracle回话数超出限制)

本地安装的OracleXEUniv—oracle特别版,免费用户可以自由使用,但有连接数量和存储限制。最近遇到一个问题,当我的SSM项目连接本地数据库oracleXE后,我的navicat再连接时就会报错ORA-12516,就是oracle的会话数超出了限制…

LeetCode MySQL 579. 查询员工的累计薪水(over(rows n preceding)选取窗口1+前n条)

文章目录1. 题目2. 解题1. 题目 Employee 表保存了一年内的薪水信息。 请你编写 SQL 语句,对于每个员工,查询他除最近一个月(即最大月)之外,剩下每个月的近三个月的累计薪水(不足三个月也要计算&#xff…

二元查找树的后序遍历结果

题目:输入一个整数数组,判断该数组是不是某二元查找树的后序遍历的结果。如果是返回 true ,否则返回 false 。 例如输入5、7、6、9、11、10、8,由于这一整数序列是如下树的后序遍历结果: 8 / \ 6 10 …

oracle收集直方图,sql – 在Oracle中创建直方图/频率分布的最佳方法?

如果您的创建时间是日期列,那么这将是微不足道的:SELECT TO_CHAR(CREATE_TIME,DAY:HH24),COUNT(*)FROM EVENTSGROUP BY TO_CHAR(CREATE_TIME,DAY:HH24);实际上,转换createtime列并不太难:select TO_CHAR(TO_DATE(19700101,YYYYMMDD) createtime / 86400…

LeetCode MySQL 615. 平均工资:部门与公司比较(over窗口函数)

文章目录1. 题目2. 解题1. 题目 给如下两个表,写一个查询语句,求出在每一个工资发放日,每个部门的平均工资与公司的平均工资的比较结果 (高 / 低 / 相同)。 表: salary | id | employee_id | amount | p…

oracle加密可以跟java一致吗,在GBase 8s上使用java udr实现Oracle兼容的加密解密功能...

最近碰到客户从Oracle迁移到GBase 8s使用到字段加密解密功能,使用到了Utl_raw.cast_to_varchar2、Utl_raw.cast_to_raw、Utl_encode.base64_decode、dbms_obfuscation_toolkit.desdecrypt等oracle特有函数,这些与GBase 8s自带的加密函数DECRYPT_CHAR并不兼容。客户暂时只能考虑…

LeetCode MySQL 1127. 用户购买平台 *

文章目录1. 题目2. 解题1. 题目 支出表: Spending ---------------------- | Column Name | Type | ---------------------- | user_id | int | | spend_date | date | | platform | enum | | amount | int | ---------------------- 这张表记…

生活中常见的操作系统

一、 操作系统 1.1 操作系统概念 操作系统(Operating System,简称 OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才能运行。 操…

Example3_1

import java.util.*;public class Example3_1{ public static void main(String args[]){ Scanner readernew Scanner(System.in); System.out.println("输入待移位的int型整数:"); int xreader.nextInt(); System.out.println("输入移位量:"); int n…

oracle事务重要属性,Oracle中的事务(2)--属性和隔离级别

事务的属性1.只读属性(read only)只读事务,只执行查询操作,而不允许执行DML(增、删、改)操作,使用只读事务,可以让用户只取到某个时间点的数据。假如有一个机票代售点,有一个管理员想在一个时间点进行统计总共卖出去的…

edge.js架起node.js和.net互操作桥梁

今天要介绍的是edge.js这个github上刚兴起的开源项目,它可以让node.js和.net之间在in-process下互操作。.net版本在4.5及以上,因为.net4.5带来的Task,asyn,await关键字和node.js的Event模型正好匹配。如果你感兴趣的话&#xff0c…

linux历史追溯

1. Linux 历史早在 linux 出现之前的 20 年(大约在 20 世纪 70 年代),就有一个相当稳定而成熟的操作系统存在了。那就是 Linux 的老大哥”Unix”。那么 Linux 和 Unix 有什么关系呢?Linux 的内核是由 Linus Torvalds 在 1991 年的时候给开发出来的&#…

php获取当前世界,php获取网站alexa世界流量排名代码

gooood个人博客网站phpfunction getAlexaRank ($Domain){$line "";$data "";$URL "http://data.alexa.com/data/?cli10&datsnba&url". $Domain ;$fp fopen ($URL ,"r");if ($fp ){while (!feof ($fp )){$line fgets ($f…

“函数调用的左操作数”的理解

参考下面这个网址中两段话,对《C Primer》中的这句话“函数调用的左操作数”进行理解: http://www.caole.net/diary/lvalue.html “C中引入了引用类型(reference type),引用总是引用到某一对象或者函数上,因此当我们使用引用时,相当于对其引用…

LeetCode MySQL 180. 连续出现的数字(cast)

文章目录1. 题目2. 解题1. 题目 编写一个 SQL 查询,查找所有至少连续出现三次的数字。 --------- | Id | Num | --------- | 1 | 1 | | 2 | 1 | | 3 | 1 | | 4 | 2 | | 5 | 1 | | 6 | 2 | | 7 | 2 | --------- 例如,给定上面的 L…

linux应用领域

Linux 应用领域个人桌面领域此领域是传统 linux 应用最薄弱的环节,传统 linux 由于界面简单、操作复杂、应用软件少的缺点,一直被 windows 所压制,但近些年来随着 ubuntu、fedora 等优秀桌面环境的兴起,同时各大硬件厂商对其支持…

怎么在linux下使用ftp服务器,怎么在Linux下建立安全的FTP服务器?

怎么在Linux下建立安全的FTP服务器?2018-08-31 15:53分享人:老牛学习Linux系统时,你可能会遇到网络服务的问题,这里将介绍linux FTP服务器安全及DHCP服务的实现的解决方法,在这里拿出来和大家分享一下。Linux系统相对于…

Linux基本操作指南

Linux 操作1 Linux 文件和目录Windows 和 Linux 文件系统在 windows 平台下,打开“计算机”,我们看到的是一个个的驱动器盘符:每个驱动器都有自己的根目录结构,这样形成了多个树并列的情形。在 Linux 下,我们是看不到这…

jar打包 jar line too long 异常处理方法

http://hi.baidu.com/hoszone/item/e5165353062e2e828d12eddb 在jar的manifest.mf中加入了所依赖的所有jar路径,结果报错说 IOException("line too long") 然后查看这个地方java.util.jar.Attributes.read方法里,针对每行读入的数据有个byte限…

LeetCode MySQL 178. 分数排名(dense_rank连续排名)

文章目录1. 题目2. 解题1. 题目 编写一个 SQL 查询来实现分数排名。 如果两个分数相同,则两个分数排名(Rank)相同。 请注意,平分后的下一个名次应该是下一个连续的整数值。 换句话说,名次之间不应该有“间隔”。 --…