序列相关性
异方差性表现于模型的随机误差项。我们将讨论模型的随机误差项违背了互相独立的基本假设的情况,称为序列相关性。序列相关性同样表现于模型的随机误差项。
一、序列相关性(Serial Correlation )
对于模型
i=1,2,…,n
随机误差项互相独立的基本假设表现为:
i≠j,i,j=1,2,…,n
如果出现
i≠j,i,j=1,2,…,n
即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性。由于随机误差项都服从均值为0的正态分布,所以序列相关性可以表示为:
i≠j,i,j=1,2,…,n
如果仅存在
i=1,2,…,n-1
称为一阶序列相关,或自相关。这是最常见的一种序列相关问题。
二、实际经济问题中的序列相关性
在实际经济问题中,为什么会出现序列相关性?下面仍通过两个例子加以说明。
例如,我们建立一个行业生产函数模型,以产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,根据样本与母体一致性的要求,只能选择时间序列数据作为样本观测值。于是有:
t=1,2,…,n
在该模型中,资本、劳动、技术之外的因素,例如政策因素等,没有包括在解释变量中,但它们对产出量是有影响的,该影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,则可能出现序列相关性。为什么?对于不同的样本点,即对于不同的年份,由于政策等因素的连续性,它们对产出量的影响也是有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。更进一步分析,在这个例子中,随机误差项之间表现为正相关。
再例如,以绝对收入假设为理论假设、以时间序列数据作样本建立居民总消费函数模型:
t=1,2,…,n
我们知道,一般情况下居民总消费除受总收入影响外,还受其它因素影响,例如消费习惯等,但这些因素没有包括在解释变量中,它们对消费量的影响则被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,也可能出现序列相关性。为什么?对于不同的样本点,即对于不同的年份,由于消费习惯等因素的连续性,它们对消费量的影响也是具有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。更进一步分析,在这个例子中,随机误差项之间也表现为正相关。
在以上例子中,随机误差项之间的相关性主要表现为一阶序列相关。但是,连续的一阶序列相关实际上构成了多阶序列相关。负相关的情况也是有的。例如建立粮食生产模型,如果把自然条件排除在解释变量之外,那么由于它们的周期性变化,以及对粮食生产的实际影响,造成随机误差项之间出现负相关。
一般经验告诉我们,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其它因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。
三、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用普通最小二乘法估计模型参数,会产生下列不良后果:
⒈ 参数估计量非有效
根据参数估计量的无偏性和有效性的证明过程,可以看出,当计量经济学模型出现序列相关性,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。因为在有效性证明中利用了
即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。
⒉ 变量的显著性检验失去意义
在第三章中关于变量的显著性检验中,构造了统计量,以及该统计量服从自由度为的分布。这些只有当随机误差项具有同方差性和互相独立性时才能成立。如果出现了序列相关性,检验就失去意义。采用其它检验也是如此。
⒊ 模型的预测失效
由于上述后果,使得模型不具有良好的统计性质。所以,当模型出现序列相关性时,它的预测功能失效。
四、序列相关性的检验
关于序列相关性的检验方法,在一些计量经济学教科书和文献中,也可以见到多种。例如冯诺曼比检验法、回归检验法、D.W.检验等。这些检验方法的共同思路是,首先采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”,用表示:
然后通过分析这些“近似估计量”之间的相关性以达到判断随机误差项是否具有序列相关性的目的。
例如回归检验法,即是以为被解释变量,以各种可能的相关量,诸如以、、等为解释变量,建立各种方程:
i=2,…,n
i=3,…,n
…
对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。具体应用时需要反复试算。回归检验法的优点是一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它适用于任何类型的序列相关性问题的检验。
冯诺曼比检验法在于构造统计量
该统计量被称为冯诺曼比,其中为的平均值。当样本容量足够大时(大于30),该统计量近似服从正态分布。计算该统计量的值,将它与具有正态分布的理论分布值进行比较,如果大于临界值,表示不存在序列相关,如果小于临界值,表示存在序列相关。
最具有应用价值的是D.W.检验,但是它仅适用于一阶自相关的检验。构造统计量:
(4.2.1)
计算该统计量的值,根据样本容量和解释变量数目查D.W.分布表,得到临界值和,然后按照下列准则考察计算得到的D.W.值,以判断模型的自相关状态。
若 0
4-
4-
也就是说,当D.W.值为2左右时,模型不存在一阶自相关。
为什么可以通过D.W.值检验自相关的存在呢?从直观上看,如果模型存在正自相关,即对于相邻的样本点,都较大或较小,此时,较小,D.W.统计量的分子较小,D.W.值较小;如果模型存在负自相关,即对于相邻的样本点,若较大则较小,若较小则较大,此时,较大,D.W.统计量的分子较大,D.W.值也较大;如果模型不存在自相关,则与呈随机关系,此时,较为适中,则D.W.统计量取一个适中值。从数学上也容易证明,展开D.W.统计量:
(4.2.2)
当n较大时,大致相等,则(4.2.2)可以化简为:
如果存在完全一阶正相关,即
如果存在完全一阶负相关,即
如果完全不相关,即
从判断准则中看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关,而且经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。所以在实际应用中,对于序列相关问题一般只进行D.W.检验。
五、广义最小二乘法(GLS)
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型,最常用的方法是广义最小二乘法和差分法。
广义最小二乘法,顾名思义,是最具有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例。
对于模型
(4.2.3)
如果存在序列相关,同时存在异方差,即有
设
用左乘(4.2.3)两边,得到一个新的模型:
(4.2.4)
即
该模型具有同方差性和随机误差项互相独立性。因为
于是,可以用普通最小二乘法估计模型(4.2.4),得到参数估计量为:
(4.2.5)
这就是原模型(4.2.3)的广义最小二乘估计量,是无偏的、有效的估计量。
如何得到矩阵?仍然是对原模型(4.2.3)首先采用普通最小二乘法,得到随机误差项的近似估计量,以此构成矩阵的估计量,即
六、差分法
差分法是一类克服序列相关性的有效的方法,被广泛地采用。差分法是将原模型变换为差分模型,分为一阶差分法和广义差分法。
⒈ 一阶差分法
一阶差分法是将原模型
i=1,2,…,n
变换为
i=2,…,n (4.2.6)
其中
如果原模型存在完全一阶正相关,即
其中不存在序列相关。那么对于差分模型(4.2.6),则满足应用普通最小二乘法的基本假设,用普通最小二乘法估计差分模型(4.2.6)得到的参数估计量,即为原模型参数的无偏的、有效的估计量。
实际的计量经济学问题中,完全一阶正相关的情况并不多见。但人们还是经常直接差分模型,因为即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。当然也可以采用下面的广义差分法,但估计过程将变得较为复杂。
⒉ 广义差分法
广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。如果原模型存在:
(4.2.7)
可以将原模型变换为;
(4.2.8)
模型(4.2.8)为广义差分模型,该模型不存在序列相关问题。采用普通最小二乘法估计该模型得到的参数估计量,即为原模型参数的无偏的、有效的估计量。关于广义差分法的实际应用,读者可参阅本章§2.10中的发电量模型。
⒊ 随机误差项相关系数的估计
应用广义差分法,必须已知不同样本点之间随机误差项的相关系数。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。于是发展了许多估计方法,诸如迭代法、杜宾两步法等。其基本思路是采用普通最小二乘法估计原模型,得到随机误差项的“近似估计值”,然后利用该“近似估计值”求得随机误差项相关系数的估计量。不同的方法旨在力图使得这些估计量更加逼近实际。
例如杜宾两步法就是一种常用的方法。以采用普通最小二乘法估计原模型得到的随机误差项的“近似估计值”作为方程(4.2.7)的样本观测值,采用普通最小二乘法估计该方程,得到,作为随机误差项的相关系数的第一步估计值。变换方程(4.2.8)为下列形式:
(4.2.9)
即将的第一步估计值用于这一中间过程方程样本观测值的计算中,然后再采用普通最小二乘法估计该方程,目的不是为了得到原模型参数的估计量,而是为了得到的第二步估计值。这就是求得随机误差项的相关系数估计值的“两步法”。将第二步估计值用于方程(4.2.8)的样本观测值的计算中,然后再采用普通最小二乘法估计方程,得到原模型参数的估计量。
在TSP6.5计量经济学软件包中,可以采用很简单的方法实现广义差分法参数估计。(4.2.8)式可以改写为
即
(4.2.10)
当选择普通最小二乘法估计参数时,如果同时选择常数项、,作为解释变量,即可眼得到(4.2.10)中参数的估计值。其中表示随机误差项的阶自回归。在估计过程中自动完成了的迭代,并显示总迭代次数。
至于选择几阶随机误差项的自回归项作为解释变量,主要判断依据是D.W.统计量。所以,一般是先不引入自回归项,采用普通最小二乘法估计参数;根据显示的D.W.统计量,逐次引入,直到满意为止。
---------------------
作者:quant_zhang
来源:CSDN
原文:https://blog.csdn.net/QUANT_zhang/article/details/6722802
版权声明:本文为博主原创文章,转载请附上博文链接!