mse均方误差计算公式_PCA的两种解读：方差最大与均方误差最小的推导

这张图片很关键，来自统计学习方法的PCA插图

又要考试了，推导一下方差最大化与均方差最小化，老师上课讲了一些均方差最小化，推导的过程很详细不过自己没有记下来，复习的时候再推一遍加深印象。感谢 @耳东陈老师的精彩课件！

一、方差的定义

去除均值，方便计算

将均值为0后，方差就可以表示成元素平方和除以个数，即

二、协方差的定义

由于均值为 0，所以我们的协方差公式可以表示为：

三、协方差矩阵

将和变量拼成一个矩阵

那么计算协方差矩阵

顺便说一下,的期望也就是它与它自身的协方差，记为

四、方差最大化

假设原来有两个变量x1,x2,三个样本点分别为ABC，样本分布在由轴x1x2组成的坐标系中。
对坐标系进行旋转变换，得到新的坐标轴y1，表示新的变量y1
样本点ABC在y1轴上投影，得到轴的坐标值为
坐标轴的平方和
为表示样本在变量y1上的方差和
主成分分析旨在选取正交变换中方差最大的变量，作为第一主成分，也就是旋转变换中坐标值平方和最大的轴
而我们知道，对于样本而言，本身的
为固有值，不变
因此可以通过勾股定理知道，方差最大
最大等价于样本点到轴的距离
最小

基于PCA的线性结合的第一个主成分为

那么最大化方差为

而经过了去掉均值化后，期望为0

去均值化期望为0的具体步骤如下，假设为未去除均值的情况，均值为

那么回到(9)式，继续计算这个方差，有两种理解办法，过程是一样的

第一种根据方差与期望的关系，通过(10)(11)算式推得到从而最大化方差等价于最大化
第二种根据(2)的算式，期望为0，得到以下形式，结果是相同的

最后得到的最优化问题是

五、均方误差最小化(MSE)

在方差最大化的图中，(勾股定理)可以知道Variance+MSE=定值，因此二者是等价的，换一种思路通过均方误差最小化进行推导。

向量的投影

以该图的B点为例，设B点的坐标为x1,x2,其所代表的向量为

,由于

,那么可以同样表示出直线的

单位方向向量为

,（注：由于该直线过原点就没有写截距项1）那么先算向量和向量的夹角

由于

,即

,可以继续化简为：

那么OB'的长度为

OB'的方向为

因此OB'的向量为

在这个部分，我们的目标是最小化均方误差，也就是

下一步就是表示出

,由向量的知识，（方向换一下没事，因为还要平方）可以得到

因此目标为

由于协方差

是定值，因此

越大，均方误差越小。

即得到的最优化问题为：

六、求解最优化问题

根据拉格朗日方程：

那么对w求导可以得到

因此代入后有

即寻找最大的特征值即为所求。

那么从大到小排列

，便得到了各个主成分。

高维小样本数据集的PCA方法预降维度方法及相关公式

例如:
这意味着在n很大的情况下，
，协方差矩阵太大并且不可逆很难分解
因此要采用预处理降维度的办法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/454145.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

mse均方误差计算公式_PCA的两种解读：方差最大与均方误差最小的推导

相关文章

《操作系统》OS学习（十）：进程控制

日志管理

GCC 命令选项使用详解

mvn 打包_Spark源码打包编译的过程

审计日志功能监控

清华大学《操作系统》（十一）：处理机调度

通过纯css实现图片居中的多种实现方式

GCC 命令行详解

Java网络编程从入门到精通（5）：使用InetAddress类的getHostName方法获得域名

猿辅导python面试_猿辅导面试经历—个人感受

对称加密与非对称加密

清华大学《操作系统》（十二）：临界区与锁

gcc生成静态库和动态库

python 流式计算框架_流式计算的三种框架：Storm、Spark和Flink

清华大学《操作系统》（十八）：管程于信号量

Iptalbes自动封杀暴力破解（Qmail邮件系统）者的IP地址

安装Postman

python红楼梦词频统计_用 Python 分析《红楼梦》（2）-阿里云开发者社区

清华大学《操作系统》（二十）：死锁和进程通信

python操作redis实例_Java，php，Python连接并操作redis实例