https://blog.51cto.com/u_16213589/7682076
残差图
多元回归-最小二乘法-残差分析笔记
一.多元线性回归模型的假设
我们需要进行以下六个假设,这些假设是经典的多元线性回归模型有效的前提:
1、因变量Y和自变量X1,X2,…,Xk之间的关系是线性的。
2、自变量(X1,X2,…,Xk)不是随机的。而且,两个或多个自变量之间不存在精确的线性关系。
3、以自变量为条件的残差的期望值为0:E(ε|X1,X2,…,Xk)=0。
4、残差项的方差对于所有观察值都是相同的:E(εi2)=σε2。
5、残差项在各个观测值之间是不相关的:E(εiεj)=0,j≠i。
6、残差项是正态分布的。
二.计量经济学中的普通最小二乘法(OLS)的4个基本假设条件分别为:
1、解释变量是确定变量,不是随机变量。
2、随机误差项具有零均值、同方差何不序列相关性。
3、随机误差项与解释变量之间不相关。
4、随机误差项服从零均值、同方差、零协方差的正态分布。
三.残差分析
(1)残差分析定义
在回归模型中,假定残差的期望值为0,方差相等且服从正态分布的一个随机变量。但是,若关于残差的假定不成立,此时所做的检验以及估计和预测也许站不住脚。确定有关残差的假定是否成立的方法之一是进行残差分析(residual analysis).
回归模型下的预测值和观测值之间的差异必须是随机不可预测的。
换句话说,在误差(error)中不应该含有任何可解释、可预测的信息。
(2)残差分析包括以下内容:
①残差是否服从均值为零的正态分布;
②残差是否为等方差的正态分布;
③残差序列是否独立;
④借助残差探测样本中的异常值。
(3)如何进行残差分析:
看分布-绘制残差图
看独立-DW检验
1.残差图
1-1残差图的定义:是指以某种残差为纵坐标,以其他适宜的量为横坐标的散点图。
这里横坐标有多种选择,最常见的选择是:
1.因变量的拟合值;
2. 某自变量的观察值;
3.在因变量的观察值Y1,…,Yn为一时间序列时, 横坐标可取为观察时间或观察序号。
1-2最常见的残差图——回归值与残差的残差图
不论回归值的大小,而残差(或)具有相同的分布,并满足模型的各假设条件;
表示回归值的大小与残差的波动大小有关系,即等方差性的假设有问题;
表示线性模型不合适的样本,可能有异常值存在。
参考链接:
https://baike.sogou.com/v7666692.htm?fromTitle=%E6%AE%8B%E5%B7%AE%E5%9B%BE