null第六章 自相关(或序列相关)
(Autocorrelation)第六章 自相关(或序列相关)
(Autocorrelation) 本章讨论线性回归模型的自相关问
,具体包括以下内容:
一、自相关的含义
二、自相关产生原因
三、自相关后果
四、自相关检验方法
五、自相关解决方法
6.1含义与产生原因6.1含义与产生原因含义: 随机误差项的各期值之间相关联,即随机误差项并不满足线性回归模型
假设中无序列相关性假定,亦即cov ( μi ,μj)≠0 ,则称随机误差项存在自相关或序列相关(在时间序列数据的线性回归分析中更加常见)。
如:现期消费水平受前期消费水平影响;本期某种农作物播种面积与前期该种农作物播种面积有关;
自相关的形式自相关的形式 随机误差项的自相关可以有多种形式,其中,最常见的是随机误差项之间存在一阶自相关或一阶自回归形式,即随机误差项只与它的前一期值μt-1相关:
cov ( μt,,μt-1)‡0 或者 μt,=f(μt-1),则称这种关系为一阶自相关。一阶自相关可以表示为:μt,=ρμt-1+vt,其中, ρ是μt,与μt-1的相关系数, vt为随机项。
自相关性的一般形式:
μt,=ρ1μt-1+ ρ2μt-2+ …+ ρpμt-p+ vt,称之为p阶自回归形式,或模型存在p阶自相关。
自相关性产生的原因(P130)自相关性产生的原因(P130)1、经济变量固有的惯性引起
经济变量作为对客观现象的具体反映,都存在着历史的延续性与发展的继承性,即现在的状况是在过去基础上发展来的,过去的水平、速度和特征都会对现在的状况产生重要影响。同一经济变量,前期与后续时期总是存在一定相关性,如,GDP,就业,消费,投资等,都呈现出周期性波动。因此,在涉及时间序列的回归模型中,连续的观察值之间很可能是相关的。
2、模型设定偏误引起
模型设定不当,即模型选择了不正确的函数形式(如非线性形式选择了线性形式)或者模型中遗漏了重要解释变量,则从错误模型中得到的残差会出现自相关。
3、观测数据处理引起
由于观测数据存在某种缺陷,为增强代表性,需要对其进行人为处理,这样,处理后的数据
与原始数据之间的差异会在随机误差项中反映出来,引起随机项自相关。
6.2自相关产生的后果6.2自相关产生的后果1、参数估计值非有效(即不再具有最小方差性)
根据前面学过的内容,我们知道,只有在符
方差和非自相关性假定条件下,OLS估计结果才具有最小方差性。当模型存在自相关,参数估计值方差不是最小(即估计结果不是最优)。
2、模型的显著检验(T检验)失效
t统计量被高估:
由于残差平方和虚假缩小,使得参数估计值的标准差增大,t统计量变小,进而低估了参数估计值显著性,最终把本来重要的解释变量认为是不重要的而删除掉。
接前页接前页3、降低预测精度
由于参数估计值方差虚假增大,致使预测区间的可信程度降低,预测结果将失去实际意义。
6.3自相关性检验方法6.3自相关性检验方法从上述内容的介绍我们可以发现,自相关对模型产生的不良后果是比较严重的,因此,必须采取相应措施加以修正或克服。但在修正或克服之前,应该对模型误差项序列是否存在自相关进行判断,即自相关检验。其方法主要有:
图示法
杜宾—瓦森检验(简称D-W检验)
(Durbin-Watson)(一)图示法检验(一)图示法检验如同对异方差的图示检验法一样,通过对残差分布图的分析,可以大致判断出随机误差项的变化特征。由于回归残差可以作为随机误差项的估计值,故随机误差项的性质应该在残差中反映出来。因此,我们可以通过对残差et是否存在自相关来判断随机项的自相关。
1、按时间顺序绘制残差分布图:
1.1 正自相关:残差e随时间t的变化并不频繁改变符号,而是几个正的后面有几个负的。
et O正自相关接前页接前页1.2 负自相关:e随t变化不断改变符号
Oet负自相关2.绘制残差et与残差滞后值et-1的散点图2.绘制残差et与残差滞后值et-1的散点图
2.1 正自相关:如左图
2.2 负自相关:如右图OOe(t-1)e(t)e(t)e(t-1)正自相关负自相关图示检验法:Eviews操作说明图示检验法:Eviews操作说明图示检验法作为判断随机项存在自相关性的简单方法,可以借助于Eviews软件来实现。在方程窗口(即回归后显示)中单击“resids”按钮,或者点击view/Actual,Fitted,Residual/Table都可以得到残差分布图。(二)杜宾—瓦森检验(Durbin—Watson)(二)杜宾—瓦森检验(Durbin—Watson)又可以译成“德宾—沃森”检验,是两位著名学者于1951年提出的一种检验自相关的方法,简称D—W检验。该法是目前检验自相关的最常用的方法,但它只适用于检验一阶自相关。
对于一般经济现象而言,两个随机误差项在时间上相隔越远,前者对后者的影响就越小,如果存在自相关的话,最强的自相关应表现在相邻两个随机项之间,即一阶自相关是主要的。因此,一般来说,自相关只讨论一阶自相关情形。(一)该方法的几个基本假定(一)该方法的几个基本假定解释变量x为非随机的;
随机误差项μt为一阶自相关,即μt,=ρμt-1+vt
线性回归模型中不应含有滞后内生变量(即被解释变量滞后值)Yt-1作为解释变量,即不应出现下列情形。
模型中包含截距项;
样本容量比较大。
(二)原理和步骤(二)原理和步骤1、提出原假设H0:ρ=0,即不存在(一阶)自相关性;
备择假设H1: ρ‡0,即存在(一阶)自相关性。
2、构造d统计量:
d=∑(et-et-1)2/ ∑et2
则有 d≈2(1-ρ ^ )
其中, ρ^=∑(etet-1)/ ∑et-12为样本自相关系数ρ的估计值
3、检验:
因为-1≤ ρ^≤+1,所以0≤ d= 2(1-ρ ^ ) ≤4,而且,
(1)d= 0,存在正自相关;
(2)d= 4,存在负自相关;
(3)d= 2,不存在(一阶)自相关。
因此,当d的值显著地接近于0或4时,则存在自相关性;而当d值接近于2时,则不存在(一阶)自相关性。
D—W检验过程图示D—W检验过程图示OfDWdldu4-du24-dl4正自相关无法判断无自相关无法判断负自相关说明说明给定5%或1%的显著性水平,通过查D—W检验的上、下限表(见教材P275)可以找到上限临界值du和下限临界值dl, 上下限值只与样本容量n和解释变量的个数k(教材中k为参数的个数,如,一元线性模型中, k=2)有关,而与解释变量取值无关。使用D—W检验法应注意以下几个问题
(局限性)使用D—W检验法应注意以下几个问题
(局限性)仅仅适用于判断是否存在一阶线性自相关性;
存在两个无法判断的区域;
出现这个问题时,一般可以采取扩大样本容量或改变模型函数形式。
不适用于用滞后被解释变量(Yt-1)作为解释变量的模型自相关检验。
不适用于联立方程组模型中各个单一方程随机误差项序列相关检验。
6.4自相关性解决方法
6.4自相关性解决方法
如果经过检验发现模型误差项存在自相关,就应该首先分析产生自相关的原因。引起自相关的原因不同,其相应的修正方法也不同。
如果是因为模型变量选择不当所引起的,就应该重新调整模型中的解释变量;
如果是因为模型的函数形式选择失误,就应该重新选择正确的模型形式。
如果排除了上述两个方面原因,则就可以采取广义差分法进行修正。广义差分法广义差分法所谓差分,就是所考察变量的本期值与以前某期值之差。一阶差分,就是变量的本期值与前一期值之差。
设线性回归模型yt=b0+b1xt+µt存在一阶自相关,μt,=ρμt-1+vt,其中vt为满足古典回归模型基本假设的随机误差项。将模型滞后一期,得
Yt-1=b0+b1xt-1+µt-1,在方程两边同乘以ρ,并与原模型相减得:
yt- ρ Yt-1 =b0(1- ρ )+b1(xt- ρ xt-1) +(µt- ρμt-1)
定义变量变换:yt*= yt- ρ Yt-1 , xt*= xt- ρ xt-1,
vt*= µt- ρμt-1
yt*=A+b1 xt*+ vt*,其中,A= b0(1- ρ )。模型称为广义差分模型。采用OLS方法进行估计,得到参数A和b1 的估计值,进而得到b0的估计值( b0= A/ 1- ρ ),该方法称为广义差分估计法。
广义差分法:缺陷广义差分法:缺陷缺陷一:差分变换会减少一个样本容量。解决方法:通常采用以下方法进行弥补,即通过对第一组数据作如下变换Y1*=Y1(1-ρ)1/2, X1*=X1(1-ρ)1/2后保留的方法予以解决;
缺陷二:一阶自回归系数ρ实际上是无法知道的,解决方法:Cochrane和Orcutt提出的迭代法(简称柯—奥迭代法)或者杜宾两步法,即可解决广义差分法无法准确得到一阶自回归系数ρ 的问题。柯—奥迭代法柯—奥迭代法基本步骤:
第一步,对原模型采用OLS法进行回归,并求出回归残差序列et,由et,=ρet-1+εt,进行OLS法回归即可得到ρ的估计值ρ^
第二步,用ρ^对原模型进行广义差分变换,得:
yt- ρ^ Yt-1 =b0(1- ρ ^)+b1(xt- ρ^ xt-1) +(µt- ρ^μt-1),即yt*=A+b1 xt*+ vt*。对差分变换模型随机项进行自相关检验(即D—W检验),若无自相关则迭代结束,将b0= A/ (1- ρ ^),b1作为原模型的两个参数估计值。
如果对差分模型检验后仍存在自相关,则可以用新的残差序列重新估计ρ的估计值ρ^(即重复第一步),再进行广义差分变换,并进行回归,检验自相关。
杜宾两步法杜宾两步法该方法也是通过获得比较准确的ρ的估计值来提高广义差分法的有效性。
第一步,将原模型的差分式
yt- ρ^ Yt-1 =b0(1- ρ ^)+b1(xt- ρ^ xt-1) +(µt- ρ^μt-1)改写成:
yt = b0(1- ρ )+ ρ Yt-1 +b1xt- b1ρ xt-1 +(µt- ρμt-1)
对该模型以Yt-1,xt, xt-1作为解释变量进行回归,求得ρ ^
第二步,对原数据进行广义差分变换,得:
yt*= yt- ρ Yt-1 , xt*= xt- ρ xt-1,再对模型
yt*=A+b1 xt*+ vt*进行回归,并根据回归结果得到原模型参数估计值b0= A/ (1- ρ ^)和b1总结说明总结说明迭代法:
是采用一系列迭代,而每一次迭代都能得到比前一次更好的一阶自回归系数ρ ^
杜宾两步法:
也是获得比较准确的一阶自回归系数ρ ^的方法
6.5
分析6.5案例分析自相关性检验:DW检验
自相关性修改:
第一步:通过差分模型估计一阶自相关系数ρ
第二步:做广义差分变换,建立模型。