为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

Panel Data

2012-03-08 19页 doc 320KB 118阅读

用户头像

is_106230

暂无简介

举报
Panel Data Panel Data分析的理论和应用发展综述 汪 涛 饶海斌 王丽娟 1.引 言 1 .1 Panel Data 的含义 Panel Data(或者Longitudinal Data)可译成“板面数据”、“时空数据”,按照比较权威的理解,是用来描述一个总体中给定样本在一段时间的情况,并对样本中每一个样本单位都进行多重观察。这种多重观察既包括对样本单位在某一时期(时点)上多个特性进行观察,也包括...
Panel Data
Panel Data分析的理论和应用发展综述 汪 涛 饶海斌 王丽娟 1.引 言 1 .1 Panel Data 的含义 Panel Data(或者Longitudinal Data)可译成“板面数据”、“时空数据”,按照比较权威的理解,是用来描述一个总体中给定样本在一段时间的情况,并对样本中每一个样本单位都进行多重观察。这种多重观察既包括对样本单位在某一时期(时点)上多个特性进行观察,也包括对该样本单位的这些特性在一段时间的连续观察,连续观察将得到数据集称为板面数据。最早是Mundlak(1961)、Balestra和 Nerlove(1966)把Panel Data引入到经济计量中。从此以后,大量关于Panel Data的分析方法、研究文章如雨后春笋般出现在经济学、管理学、社会学、心理学等领域。从1990年到目前为止,已有近1000篇有关 Panel Data理论性和应用性的文章发,Panel Data 研究成为近十年来经济计量学的一个热点。 伴随着经济理论,包括宏观经济理论和微观经济理论、计算机技术和统计方法的发展, Panel Data在经济学领域的应用逐渐被经济计量学家推广。在宏观经济领域,它被广泛应用于经济增长、技术创新、金融、税收政策等领域;在微观经济领域,它被大量应用于就业、家庭消费、入学、市场营销等领域。美国最著名的两个Panel Data 数据集,一个是俄亥俄大学的NLS 数据集(the National Longitudinal Surveys of Labor Market Experience);另一个是密西根大学的PSID数据集(the University of Michigan’s Panel Study of Income Dynamics)。NLS数据集包括5 个独立的与劳动力有关的板面数据集,这5个板面数据集的主体包括1966年45岁到59岁的成年男子、1966年14岁到24岁的青年男子、1967年30岁到44 岁的成年女子、1968年14岁到24岁的青年女子、1979年14岁到21岁的男女青年。前四个群体被连续(跟踪)??观察了15年,最后一个青年群体在被连续观察了15年后,又被继续观察了6年。调查的变量有上千个,主要侧重了解劳动力市场上供给方的情况。PSID数据集由从1968年起直到现在所收集的6000个家庭和15000个人的5000多个变量的数据构成,这5000多个变量涉及就业状态、收入、家庭资产、住房、上班交通工具、汽车拥有等方面。收集这些 Panel Data 数据集主要是为了研究美国贫穷人口状况及其贫穷原因。除此之外,这些数据集还被用来监测和解释经济状态变化以及经济和社会状况对人们生活的影响。 目前,世界上已经成立了专门研究 Panel Data 的协会,每两年举办一次全球性的Panel Data 学术交流大会。第九届国际Panel Data会议于2000年6月22-23日在日内瓦大学举行,入会者均是从事Panel Data研究的经济学家、经济计量学家、统计学家和社会学家。大会强调除了在经济计量学中以外,要扩展Panel Data的应用领域,以期发现Panel Data分析的新方法和新的应用领域,特别强调Panel Data在社会科学、医学和金融学这三个领域的应用。 1.2 Panel Data的 作用 Panel Data分析的作用体现在: (1)控制个体行为差异。 Panel Data数据库显示个体(包括个人、企业、地区或国家)之间存在差异,而单独的时间序列和横截面不能有效反映这种差异。如果只是简单使用时间序列和横截面分析就可能获得有偏结果。此外,Panel Data分析能够控制在时间序列和横截面研究中不能控制的涉及地区和时间为常数的情况。也就是说,当个体在时间或地区分布中存在着常数的变量(例如受教育程度、电视广告等)时,如果在模型中不考虑这些变量,有可能会得到有偏结果。Panel Data分析能够控制时间或地区分布中的恒变量,而普通时间序列和横截面研究中则不能。 (2)Panel Data能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。 (3)Panel Data能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,Panel Data由于包含较长时间,能够弄清诸如经济政策变化对失业状况的影响等问题。 (4)Panel Data能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响因素。 (5)相对于纯横截面和纯时间序列数据而言,Panel Data能够构造和检验更复杂的行为模型。 (6)通常,Panel Data可以收集到更准确的微观单位(个人、企业、家庭)的情况。由此得到的总体数据可以消去测量误差的影响。 尽管Panel Data研究的理论和应用发展很快,但目前仍然存在一些问题需要解决: (1)设计和收集数据困难。 同普通数据收集和管理一样,Panel Data也面临着设计不完整、无回答、核准、多次访问、访问间隔、对比参照期等问题。 (2)存在测量误差 由于不清楚的回答、记忆错误等带来的测量误差给Panel Data应用带来很大困难。 (3)存在选择性困难 主要指自选择无回答和磨损(样本丢失)。 (4)时间序列较短 由于收集数据时间跨度较短,为了满足渐近理论,就要求样本数量趋向于无穷。 2.Panel Data 分析发展的简要回顾 2.1 Panel Data 分析的基本框架 Panel Data的内容十分丰富,这里以Matyas和Sevestre(1996)再版的为框架,主要从研究这种时空数据的模型角度,简单回顾一下研究Panel Data方法的发展: 2.1.1线性模型 1、单变量模型 (1) 固定效应和固定系数模型(Fixed Effect Models and Fixed Coefficient Models):通常采用OLS估计。固定效应包括时间效应以及时间和个体效应,并可以进一步放宽条件,允许在有异方差、自相关性和等相关矩阵块情况下,用GLS估计。 (2)误差成分模型(Error Components Models):最常用的Panel Data模型。针对不同情况,通常可以用OLS估计、GLS估计、内部估计(Within Estimator)和FGLS估计,并检验误差成分中的个体效应以及个体和时间效应,同时将自相关和异方差情况也纳入该模型框架中。 (3)随机系数模型(Random Coefficient Models):即模型自变量的系数可能包含时间效应或个体效应,再加上一个随机数,系数通常用抽样方法或者贝叶斯方法来估计。 (4)带有随机自变量的线性模型(Linear models with random regressiors):通常用工具变量估计(IV估计)和GMM估计。同时,利用工具变量可以对相关的特定效应模型(the Correlated Specific Effect Models)估计,并对随机变量与特定效应之间的相关性进行检验。 (5)动态线性模型(Dynamic linear Models),该模型同样又包含固定效应自回归模型(通常用LSDV估计、Within估计、IV估计法估计参数)、动态误差成分模型(λ-类估计、IV估计、GMM估计和最大似然估计等方法估计参数)以及带有异方差的动态线性模型(联合估计 、组均值估计和截面估计等方法估计参数,并检验异方差性),成为近来Panel Data单位根和协整理论发展的基础。 2、联立方程模型 包括带特定误差成分和联立方程(用GLS、最大似然估计、G2SLS、EC2SLS、G3SLS、EC3SLS以及FIML等方法估计参数),以及带自相关特定效应或者带随机效应的联立方程模型。 3、带测量误差模型:包括基本回归模型、带一个误差成分结构测量误差模型,参数估计方法包括基本估计、集合估计、差分估计。还包括具有测量误差和异方差的模型(GLS估计),以及具有自相关性测量误差的模型。 4、伪Panel Data 伪Panel Data是指重复抽自一个横截面所构成的数据集,对伪Panel Data研究包括伪Panel Data的识别和估计。 除此之外,还有一些特殊问题如误差成分模型形式选择,豪斯曼(Hausman)特定检验,异方差问题等到处理。 2.1.2非线性模型 1、logit和probit模型 固定效应模型(ML估计、CMLE估计和半参估计方法估计模型参数)和随机效应模型(MLE估计)用二步骤方法来检验模型是否存在异方差。 2、非线性潜在变量模型 包括变量是线性的但模型是非线性的形式和变量非线性模型(估计方法包括非一致的IV估计、ML估计、最小距离MDE估计、二步估计、近似MLE 估计以及估计偏差调整)以及作为变量非线性模型中的一种特殊情况--二元选择情形,估计方法用重复ML估计或者条件ML估计。 3、生存模型 主要包括对Cox模型、加速生存模型、竞争风险模型研究。 4、点过程 主要包括对马氏过程、半马氏过程,以及用广义半参方法处理的点过程。 除此之外还包括: 5、处理Panel Data数据不完整而带来的选择偏差问题:通常不完整的Panel Data按照对研究结果的影响分为可忽略选择规则(机制)和不可忽略选择规则(机制)。可忽略选择规则(机制)模型参数通常用ML估计和EM算法,而不可忽略选择机制模型参数通常用二步估计,?是否是?(含义不清)不可忽略选择规则(机制)通常采用LM检验、Hausman检验、变量可加性检验。 6、GMM估计方法使用和对非线性模型进行特殊检验 包括使用GMM方法估计泊松模型、非均衡Panel Data和对Panel Probit利用Ward、LM、Hausman方法进行检验。 7、借助Gibbs抽样 利用MCMC方法对Panel Data 模型进行推断,主要是针对带随机效应高斯模型和带随机效应的Panel Probit模型。 2.2 Panel Data研究的学术专著 目前有关Panel Data的学术专著主要有: 1.Analysis of panel data / Cheng Hsiao. 1986. 2.Econometric analysis of panel data / Badi H.Baltagi. 1995. 3.The Econometrics of panel data : a handbook of the theory with applications / Matyas & Sevestre. c1996. 4.Panel data and structural labour market models / Henning Bunzel [et al.] c2000 2.3 Panel Data研究的代表人物 Mauel Arallano (CEMFL,Madrid) Pierto Baletra (University of Geneva) Badi Baltagi (Texas A&M University) Richard Blundell (University College London) Almas Heshmati ( Goteborg University) Alberto Holly (University of Lausanne) Cheng Hsiao (University of southern California) Jan Kiviet (University of Amsterdam) Anders Klevmarken (Uppsala University) Jaya Krishnakumar (University of Geneva) Michael Lechner (University of Saint-Gall) Jacque Mairesse (CREST-INSE and NBER) Esfandiar Maasoumi (Southern Methodist University) Laszlo Matyas (Budapest University of Economics) Marc Nerlove (University of Maryland) Hashem Pesaran (University of Cambridge) Patrick Sevestre (University of Paris XII ) Alain Trognon (GENES) Tom Wansbeek (University of Groningen) 3.Panel Data 分析的最新进展 目前,在Panel Data理论和应用研究中,主要有两个热点领域:一个是非线性模型研究,另一个是动态线性模型单位根和协整的理论联系和应用研究。 3.1 Panel Data非线性模型研究最新进展 Li 和Stengos(1996)借助工具变量对半参线性Panel Data模型进行估计,并且当T很小,N很大时,估计量是以N1/2一致收敛。Hsiao和Li(1998)又对半参Panel Data 模型给出了三个序列相关检验,第一个是1阶序列相关检验,第二个是检验高阶序列相关,第三个是检验个体行为,这种模型允许滞后因变量作为解释变量,在原假设为一个鞅差误差过程情况下,它们分别服从渐近正态或者卡方分布。 对模型Panel Probit,Bertschek和Lechner(1998)用一类GMM方法进行估计。这类GMM估计,由于它的条件矩仅仅涉及到二元因变量一阶矩而变得容易计算,同时,这类GMM估计利用非参数的方法(K-NN 方法)得到最优估计。一个蒙特卡洛模拟研究显示这类估计 有良好的小样本特性,与ML估计相比,它的估计效率损失较小。Inkmann(2000)同样证明,在小样本中,即使是存在时间异方差的情况下,这类GMM估计要优于模似最大似然方法SML(Simulated Maximum Likehihood)。 对未限制分布的乘法潜在成分的Panel Data模型(如固定效应-泊松模型FEP),Wooldridge(1999)认为只有当条件均值被正确描述时,半条件似然估计QCML(quasi-conditional maximum likehihood estimator))的结果才是一致。而一个GMM估计方法能为FEP模型增加正交条件,它能够提高估计的效率,并提供更方便的检验形式。 对于带有个体效应的删失回归Panel Data模型,Charlier等(2000)在一个模拟试验中用二步GMM 估计比Honore估计更具有效。对一个带个体效应的二元响应的Panel Data,Lee(1999)利用半参估计方法进行估计 ,这个估计具有N1/2一致收敛性。Honore和Kyriazidou(2000)对离散选择模型估计方法进行讨论,这种模型解释变量包括严格外生变量和滞后内生被解释变量,还包括未观察到个体效应。在logit模型假设条件被放宽,允许是一个半参数的情况下,Honore和Kyriazidou使用CMSE(Conditional maximum score estimator)方法对模型进行估计,并证明估计量具有一致性。 从以上分析可能看出,近几年对非线性模型研究主要集中在对半参数的Panel Data模型估计和检验研究,以及利用GMM估计等方法对非线性模型如何进行有效的估计并提高估计的效率。可以预见,在末来几年内,对半参Panel Data模型的研究和应用及如何提高非线性模型估计效率仍将是一个热点。 3.2 Panel Data单位根和协整分析最新进展 目前, 在Panel Data分析的理论和应用研究中,单位根和协整理论与应用是最热点。这里,我们将着重就此展开讨论。 近年来,有关专家对Panel Data的单位根和协整理论进行了大量的研究。该领域开创性研究工作可以追溯到Levin和Lin(1992,1993)及Quah(1994)。Panel Data的单位根和协整理论是对时间序列的单位根和协整理论研究的继续和发展,它综合了时间序列和横截面的特性,通过加入横截面能够更加直接、更加精确地推断单位根和协整的存在,尤其是在时间序列不长、可能获得类似国家、地区、企业等单位截面数据的情况下,Panel Data单位根和协整的应用更有价值。 在早期时间序列单位根过程的渐近理论研究中,Phillips(1987)、Engle和Granger(1987)发现,许多感兴趣的估计量和统计量被证明其极限分布是维纳过程的复杂函数。与之恰恰相反,在非平稳的Panel Data渐近过程中,Levin和Lin很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的Panel Data中。Panel Data极限行为由于受到时间和单位的影响,因此在研究Panel Data极限分布时需要发展和使用多变量Panel函数中心极限定理, Phillipa和Moon(1999a)给出了在非平稳Panel Data 中线性回归极限理论,他们指出:Panel Data极限行为仅仅依赖于单位数N 和时间长度T趋于无穷的方式。例如一种是固定N ,让T 趋于∞,接着N趋于∞,他们用(N,T趋于∞)seq表示;另一种是T=T(N),表示T的大小受N 控制,N 趋于∞, T(N)趋于∞,记为(T(n),n趋于∞);第三种是T、N分别趋于∞,没有相互约束,记为(N,T趋于∞)。这三种方式极限分别称为序贯、对角和联合极限。文章主要涉及序贯极限理论和联合极限理论研究,认为序贯极限在寻求极限行为快速渐近性上是有益的。尽管在一些更强条件下,联合极限理论是很难得到并加以应用,但幸运的是,在我们所面临的T 很大、N适中的情况中,联合极限理论研究和应用并没有多大困难。 3.2.1 单位根 有关Panel Data单位根研究的主要成果见Levin和Lin(1992,1993)、Quah(1994)、Im等(1997)、Maddala和Wu(1999)、Phillips和Moon(1999)的文献。 (1)Levin和Lin方法(LL检验)(1992,1993) Levin和Lin(1992)得到单位根模型如下: 这里,模型既包括时间趋势,也包括个体和时间特殊效应,并且序列自相关,用一个滞后的一阶差分作ADF检验。Levin和Lin原假设H0:ρi=0对所有i,备择假设H1: ρi<0对所有i ,Levin和Lin考虑了以下几种模型的情况。在每种情况下,极限分布均是按照N 趋于∞和T趋于∞,而且在每一种情况下,方程估计都是作为联合回归模型,用OLS来估计,这些模型如下: 在模型6中,截矩和时间趋势都有个体效应。在该模型的实际应用中,主要研究集中在对购买力评价PPP单位根检验上。Oh(1996)使用模型1和5,Wu使用模型5,但增加通过自己模拟计算精确有限样本的判别值,它比Levin和Lin(1992)制作中的判别数要高5-15%。Levin和Lin指出与时间序列单位根检验统计量的标准分布不同,Panel Data统计检验是极限正态分布,并且,当T趋于∞比N 趋于∞时收敛速度更快。 Levin和Lin(1993)提出了一些新的Panel Data单位根检验,这些检验考虑了误差过程存在着自相关性和异方差情况,他们的作法是:首先从数据中减去截面平均数以消除集合效应;然后使用ADF检验每个个体序列并标准化分布。 以模型5为例,ADF回归为: 就等于执行两个分别以 为因变量方程,(5)中其余变量为自变量的辅助回归,这两个辅助回归残差分别为 和 ,现作回归方程: 就得到 ,就等到于(5)式中直接用OLS估计,既然这里 存在着异方差,他们建议用接下来的标准化来控制它: 对于每个i而言, 是渐近i,i,d 接着估计每个个体序列长期标准差与短期标准差的比率,并计算平均比率: 这里长期方差用以下公式来估计: 表示滞后截断参数, 是一些滞后窗口。 最后计算Panel Data统计检验,这时考虑如下的回归方程: 对所有i,t ,t统计量的结果为: 这里: 和 在个体ADF回归方程作为平均滞后长度使用, 既然统计检验量的中心并非为0,Levin和Lin建议用如下调整后的t统计量:: 这里, Levin和Lin通过蒙特卡洛模拟和计算而得到调整后的均值和标准差,这些调整项从一个给定的回归模型得到, 从50到250, 从9到20,N是250。Levin和Lin的中心定理证明,当 ,ADF滞后阶数 以 速度增加,当 , 以速度 增长,这时在原假设H0: 下,有: 在备择假设中, 将以 速度趋于负无穷。 总之,在Levin和Lin文章中,几乎包括值得继续讨论的所有要点: (a)通过对渐近正态实证分析,使上述(3),(4)中的式子能获得更适合修正形式; (b)当N,T 趋于∞时的收敛速度如何; (c)同质对异质的问题,在Levin和Lin的公式中, 对每个i 是同质; (d)对横截面单位来说,互相独立的假设如何放宽; (e)对存在依赖和异方差误差过程和内生回归量的结果进行如修正; 后来在Panel Data单位根的更广泛工作主要从以上5个方面展开。 2、Im、Pesaran和Shin(IPS检验)(1997) 在LL检验中原假设和备择假设为: 备择假设对于某些情况下,要求显得太严一些,放弃原假设,并不意味就不存在有些单位的 趋于0。后来Im、Pesaran 和Shin(1997)放松了LL检验H1的条件,也就是针对刚谈到的要点(c)进行拓展,这是首先要提到Pesaran和Smith(1996)的文章。在文章中,他们证明在动态异质Panel Data模型使用联合或集合数据所得到估计量是不一致的,建议使用组平均估计量。这些结论成为Im等人IPS检验的基础,Im等人对Levin和Lin的模型形式进行小的修改,得到模型形式如下: 原假设和备择假设改为: 是序列自相关,形式见(16),不同单位其有不同序列相关。 Im等到人借助Pesaran和Smith(1995)的结论,提出使用组平均LM统计量来检验(15)。ADF回归方程估计如下: 并且定义: 这里 是单位的LM统计量,目标是检验 ,标准化 LM统计量是: 和 是 使用T,Pi不同值重复50000次随机模拟而计算出来,可以证明在H0: ,对所有i有: 当 T,N 趋于∞,并且N/T趋于K,K是一个正的有限常数。当在备择假设条件,检验是一致,同时它也要就 。在这个更松的假设条件下,在备择假设下, 以 速度趋于正无穷。 Im等到人(1997)也使用组平均 统计量: 这里: 是个体单位对检验 的统计量i=1,2,…,N, 和 在文中被计算, 的渐近结果也支持 ,当N 、T趋于无穷,且有N/T 趋于K,一致性也是有保证的。 3、Maddala和Wu(MW检验,1999) 在Im 等人的检验中,尽管放松单位之间的同质条件,但这里仍有一些问题,首先,与其它大多数Panel Data单位根检验一样,Im等人(1997)在他们基本框架中,假设时间T对所有截面单位是相同的,因此就有 和 ,这一点仅仅对均衡Panel Data来说有用,但对于不均衡Panel Data来说需要更多模拟来得到判别值;其次,LL检验判别值对ADF检验中的滞后长度的选择比较敏感;第三,这些文章的结果仅限于一些Panel Data的单位根检验,不能检验Elliott等人(1996)或者Perron-Ng(1996)提出Panel Data的数据形式;第四,更重要,与Im通过普通时间效应来考虑截面的有限数量相关(是指(1)式中 不为0)相比,Maddala和Wu认为在现实世界中所存在截面相关不可能采用这种简单形式(通过Yit减去截面平均值有效地消除这种相关),Maddala和Wu文章中,使用了“Meta Analysis”中Fish(1932)提出关于独立性的检验方法——即综合了每个截面单位的统计量P 值,来进行单位根检验,Fish 检验是一个非参检验,对于单位根,任何选择的检验都可以计算,其准确统计量为: 它服从于 分布。在原假设截面独立情况下, 是单位i的检验统计量的P值。这个检验明显优点是,它对统计量选择滞后长度和样本数大小比较稳健,更重要是Maddala和Wu证实使用自助法(Bootstrapping方法),扩展在Panel Data中单位根检验的框架,允许考虑截面相关,Maddlala和Wu迈出关键一步,从而使得Panel Data单位根检验进入一个更宽泛的框架中。 关于Panel Data单位根检验的应用,除了前面在PPP单位根检验外,其它研究包括:Culver和Papell(1997)应用单位根检验通货膨胀,Song和Wu(1998)用它调查失业与心理健康的关系,McCoskey和Selden (1998)用它进行用于健康照顾的支出和GDP的单位根检验。Lothgren和Karlsson(2000)通过蒙特卡洛模拟,利用LL方法和ISP方法证实,对于一个小的平稳序列而言,单位根检验有很高的功效值,而对于一个大的平稳序列而言,则可能缺乏功效值,因而拒绝或接受假设对于所有序列有单位根或者是平稳而言,并不能充分检验。Strauss(2000)使用三种方法(Abuaf和Jorion(1990),LL方法,IPS方法),对从1929年到1995年美国48州带趋势人均收入的数据进行单位根检验,结论是拒绝有单位根的存在,并说明收敛的速率取决于截距差异的假设、一阶自相关系数、滞后期和对1973年石油危机造成趋势中断的适应性。Strauss和Funk(2000)使用Panel的FM和DOLS估计揭示资本、创新对于生产率增长作用和滞后的生产率对资本有Granger因果关系,并证定了在446个制造业中资本和生产率存在着协整关系。Harris和Tzavalis (1999) 证实当时间长度是固定的,其单位根检验的统计量极限分布是正态的,其Panel每个单位模型中都包括一个个体线性趋势或固定个体效应。他们证实在这些模型中最小二乘估计得到估计量参数是不一致的。因此,统计量需要修正。 3.2.2 协整的检验 在Panel Data中关于协整的检验迄今为止,主要有两个方向,一个是原假设为非协整,使用类似Engle和Granger(1987)平稳回归方程,从Panel Data中得到残差构造统计检验,计算其分布,这一类问题解决可以从Pedroni(1995,1997a,1997)文章中找到,Kao(1999)同样也有类似相关的分析;一个是原假设为协整,基本的检验可能参照McCoskey和Kao(1998a)的文章,这也是基于残差的检验,类似时间序列中Harris和Inder(1994)、Shin(1994)、Leybourne和Mclabe(1994)和Kwiatouski等人(1992)分析框架,无论是哪一种方法,都使用序贯极限方式,即前面提到的(N,T趋于∞)seq方式。 1、Pedroni 方法 Pedroni的协整方法利用协整方程(23)的残差: 在这里,Panel公式中允许存在很大的差异,因为在模型中,单位之间的斜系数、固定效应系数和个体确定趋势系数是不同的。 是向量布朗运动,其渐近方差为 ,其中 。对于所有i, 都定义为相同的概率空间,并且 ,对所有s ,t 当 时。 因而 过程加上截面独立,但允许数据存在一定范围的时间依赖,尤其在(23)中没有外生变量的时候。 在这些假设下,Pedroni 讨论了7个Panel Data的协整统计,其中4个是用联合组内尺度描述,另外3个是用组间尺度来描述,作为组平均Panel协整统计量,在第一类四个检验中三个涉及到使用为人所知的Phillips和Perron (1988)工作中的非参修正,第四个是基于ADF的参数检验,在第二类三个中的二个使用非参修正,而第三个再一次用了ADF 检验。如果我们用 表示在第i单位横截面的残差自回归系数,则第一类检验使用下面特定的原假设和备择假设: 第二类使用的: 这种框架类似Levin和Lin(1993)和Im等人(1997)文章所提到框架,在备择假设下,利用存在的差异性。第一类情况是基于原始时间序列考虑,第二类情况从被估计残差中考虑自回归系数。 下面我们以第二个组内尺度的检验,被称为Panel ρ-统计量为例,来说明Pedroni的协整检验方法,其它检验可以参见Pedroni(1999)文章,这个非参统计检验要求估计 和长期 ,这里: 其中 是(23)中的残差,这个参数检验要估计: 并且,使用残差 去估计他们的方差,既然在(28)式中 为白噪声,这接下面一步是完成构造Panel ρ-统计量,首先(23)式被估计,并得到残差,然后,估计差分方程(29): 残差 被用来计算估计 ,记为 ,利用诸如Newey-West估计从 中得到 : 使用(27)中 计算长期方差 和 , 是简单方差(忽略截面相关),Panelρ-统计量为: 为了定义适合于推断的统计量,一个基于布朗函数的向量矩又一次要求用V和W作为互相独立标准布朗运动过程,其维度分别为l和M ,定义: 布朗函数的向量为: 用 表示这些函数平均数的向量,即: 的方差一协方差矩阵, ,表示 中 的上子矩阵且定义: ,Pedroni证明:在H0下: 这个统计量在备择假设下趋于负无穷大,因而提供了一个一致检验,即用大的负值来拒绝原假设——无协整,Pedroni指出每一个标准化统计量均趋于一个正态分布: 式中的修正因素 依赖于考虑的统计量、自变量的个数M以及是否包括个体特定的常数和(或)趋势。Pedroni(1995,1997a)给出了各种情况下蒙特卡洛模拟结果,并在(1999)给出了利用这些模拟结果构造的近似判别值。 2、McCoskey和Kao 的方法, 现在我们考虑McCoskey和Kao 采用LM方法对原假设协整进行检验,为了理解检验,将(23)中的 ,McCoskey和Kao 采用的公式是让 由两部分组成: 回归变量是由下列形式产生: 这里 是M 维,在原假设H0: 情况下,(23)是一个协整回归系统,当这些回归方程没有协整情况下,这些横截面单位之间独立是可以维持的。长期方差——协方差 被定义为: LM统计量为: 因此,构造这个统计量需要一个的一致估计。为了完成这个非参的修正,FM(Fully-modified)估计能够考虑(23)中的残差的序列自相关和回归方程的内生性,并提供了渐近的无偏估计。针对所有i,当 ,Kao(1998)等人提出了一个优良的FM估计。作为同质斜系数,FM估计量是由 Pedroni(1996)提出。后来Kao和Chiang(1998)以及Phillips和Moon(1999)也谈到该估计量,Kao和Chiang(1998)证明用OLS、FM和DOLS(Dynamic ordinary least Squares)得到的估计量都有渐近正态分布。 为了完成他们的检验,McCoskey和Kao定义一个调整LM统计量: 既然在备择假设下,统计量趋于很大值,就意味着拒绝原假设,修正因子 和 是Harris和Indei(1994)定义布朗运动的一个复杂函数的均值和方差,它(修正因子)不仅依赖于尺度M也依赖(23)中是否包括个体特定的常数和(或)趋势。 McCoskey和Kao(1999)使用他们的LM检验探讨在一个包含30个发展中国家和22个发过国家城市化、人均产出与人均资本之间的关系。尽管城市化对各国的影响大小差别各异,但他们发现有一个长期均衡关系存在,他们的这个结果对在协整方程中是否包括着一个趋势比较敏感,他们的结果同样对于其它的因素是否影响人均GDP的增长率也比较敏感。关于时间趋势和城市化之间重要相互关系,他们提供了一个有趣的解释。他们认为在各国之间有一些证据表明城市化作为经济增长率的一个潜在杠杆。 Kao等到人(1999)使用了21个OECD国家和以色列作为一个样本,证实国内资本和国外R&D资本储备对全要素生产率(TFP)都有着重要的影响,Kao等人使用FM和DOLS 方法,得出结论:当国内资本和TFP之间关系比较强时,国际资本和TFP之间的联系变相当弱,因而他们否认Coe和Helpman(1995)提出一个重要结论:国际R&D 的溢出是贸易相关的——全球化背景下,一国的生产率不仅依赖自已R&D投入,也依赖贸易伙伴的R&D投入。 3.2.3存在的问题和展望 在前面,我们给出了Phillips和Moon(1999a)对于非平稳Panel Data的渐近理论的一个方面。关于极限理论,这里再来给出他们研究在以下四种情况估计量渐近行为的一些结论。 (1) 无时间序列协整的伪Panel Data回归 (2) 异质Panel协整见(23)式 (3) 同质Panel协整(对所有i, ) (4) 接近同质Panel协整(与同质单位的差异很小,这种差异是由所谓局部参数引起的) 对于(1)和(2)两种情况,他们使用联合数据可以获得以 一致收敛的长期均衡系数。这个极限分布被证明为高斯分布,这一点不同于Pesaran和Smith(1995)的结论,当时,他们认为:如果在Panel Data不同单位之间存在异质的协整关系,不可能从联合数据中得到具有一致估计的均衡作用,分歧的出现是由于双方对长期均衡系数稳健定义的不同,而这种长期均衡是从Panel甚至在缺乏协整的Panel中存在的长期均衡方差这个角度来考虑的。 对于(3)和(4),他们得到联合FM估计,它是以 一致收敛,同样也有高斯极限分布,使用这些结论可以对样本的子集进行长期均衡参数的假设检验。 Phillips和Moon(1999b)发现在动态Panel中最大似然估计一些局部到整体的渐近特性。在缺乏确定趋势或者虽存在确定趋势但是同质的情况下,当局部到整体的参数能被一致估计的时候,异质的确定趋势导致最大似然估计是不一致的。这个不一致的出现是由于当N 趋于无穷时,伴随参数(确定性趋势)将趋于无穷。在众多的Panel Data文章中,诸如估计带固定效应的动态模型中,当T趋于无穷时,不一致性就会消失。Phillips和Moon证实在他们框架中,在N 趋于无穷和T趋于无穷时,伴随参数的困难依然存在。 有关Panel Data单位根和协整的理论尚需进一步研究。问题集中在估计量和检验的渐近特性的考虑和使用。显而易见,针对有限样本估计和检验的渐近理论需要大量系统化的模拟工作。更重要的是放松截面独立假设,以便得到与实际更吻合的渐近理论。因为在研究许多国家之间的Panel Data文章中,全球化趋势已经对独立假设提出了挑战。Phillips和Moon(1999a)探讨了这个问题。这个问题难度相当大,它不仅涉及把相互依赖考虑到分析中,而且要用合适的特征来描述它。目前,已有一些专家正在探讨这些问题,像Maddala和Wu(1999)自助法允许截面相关,Pedroni(1997b)在他的PPP研究中,提出用基于GLS修正来考虑在Panel个体之间存在的反馈情况。在Pedroni的研究中,对于作为妨碍PPP关系的截面单位依赖,它的修正并没有作为重要的角色,但这并不能否认它对研究工作的潜在影响。Hall等人(1999)对这个新的研究提供了一些想法。建立在Hall和Urga(1998)早期工作基础之上,Hall等人提供了另一个同Pesaran和Smith(1995)分析相反的例子,他们集中在Panel协整的回归结构上。Hall等人证实,在每个Panel单位中,回归量是由共同的随机趋势决定的,每个单位是协整的,接着用一个标准Panel Data估计,对这个Panel强加一个同质参数,即使这个真实模型有异质的参数,仍将得到一个反映长期均衡作用的一致估计。该文章继续发现可以用一个新的主成份方法对共有的随机趋势进行检验,并给出了在有限样本下,这些检验的样本容量和功效特性,即使在一个I(0)和I(1)的混合变量中,这些检验方法也是一致的。因此,避免了对Panel Data进行事前的单位根检验,他们所做的工作有两点非常重要:第一,针对单位不同的Pane Data,由于采用相同的趋势,截面依赖比较明显。然而,除了提供一致性,主成分估计的渐近理论并没有得到证明,特征分析过分依赖模拟结果。要得到渐近理论确实困难重重,但这里的分析却是朝着正确的方向迈出了很重要的一步:第二,这里考虑多协整向量,尽管仅仅是在回归量的集合中,但这对于估计和推断框架也是必要扩展。然而在这方面它仍是不完全,在Panel每个单位的协整向量通常是唯一的,标准化的问题则不存在。仅仅Larsson、Lyhagen和 Lothgren(1998)按照类似Johansen最大似然方法来研究Panel Data中的多协整向量的情况,他们的研究前提仍然是假设维护截面单位的独立性,他们建议的统计量是单位间Johansen似然比统计量的平均数,该统计量曾被Im等人(1997)用作单位根检验,他们声称一旦均值和方差被修正之后,它服从一个标准正态密度,这些均值和方差通常是通过随机模拟得到。 Larsson等人(1998)的主要结论只是一些想法,尚待证实。然而,一旦被证实是正确的,它可能标志着重要的进步。Hall等人(1999)综合了独立条件的放松以及Larsson等人的多协整向量,将可积动态Panel Data的研究向前迈出了巨大的一步。 就未来而言,重要的技术和思想将涉及: (1)在可积Panel序列中,Panel估计的渐近行为。包括收敛的速度、收敛的模式、极限分布的形式; (2)构造联合Panel和组平均来检验单位根; (3)作为考虑序列相关和残差序列异方差的处理方式,ADF回归与非参数修正两方法的对比; (4)在原假设为非协整和协整的特定条件下,构造统计量检验协整; (5)利用随机模拟,对计算所得到布朗运动函数的矩阵进行均植和方差的修正; (6)考虑回归量内生性的全面修改。 解决好这些问题,有助于帮助我们借助Panel Data更好地认识在经济增长、国际金融和产业结构等方面的实际问题。 当然,热点并不完全局限在以上两个领域,在线性模型关于时变系数或者个体时变效应的理论和应用研究也将成为一个热点。有关文章请参见 Alexandria(2001)和Ahn(2001)。 4.Panel Data分析在中国目前的应用 1、Lind (1992) 运用Panel Data分析中国农村改革和农业经济增长; 2、Wan (1996) 运用Panel Data估计中国城市食品消费的恩格尔函数; 3、Li (1997) 利用272个国有企业资料分析改革对国有企业全要素生产率的影响; 4、Liu和Yao (1999) 利用1985年到1994年省级GDP的情况分析政策对地方经济发展的影响; 5、Tong(1999)利用1988年到1993年各省的情况分析中国各省乡镇企业生产率发展的不平衡; 6、Zhou (2000) 利用Panel Data研究在中国农村改革前后的收入的决定因素; 7、Xu和Lou (2000) 利用各地区收入的Panel Data发现收入不平衡的影响因素; 5.对应用统计研究中心的建议 * 继续资助 Panel data的世界发展动态跟踪 * 出版介绍Panel data理论和应用的书籍 * 在宏观和微观领域广泛应用Panel data分析 * 举办经济计量学博士生论坛 参考文献: Balestra, P., and M. Nerlove (1966) Pooling Cross-Section and Time-Series Data in the Estimation of a Dynamic Economic Model: The Demand for Natural Gas, Econometric, 34, 585-612 Mundlak, Y., (1961) Empirical Productions Free of Management Bias, Journal of Farm Economics, 43, 44-56 Honore, E. Bo and Kyriazidou Ekaterini (2000) Panel Data Discrete Choice Models with Lagged Dependent Variables, Econometrica, Vol. 68,No.4,839-874 Lee Myoung-Jae (1999) A Root-N Consistent Semiparametric Estimation for Related-Effect Binary Response Panel Data, Econometrica, Vol.67, No.2, 427-433 Charlier Erwin, Melenberg Bertrand and Soest Arthur van (2000) Estimation of a censored regression panel data model using conditional moment restrictions efficiently, Journal of econometrics, Vol. 95,25-56 Inkmann Joachim (2000) Misspecified heteroskedasticity in the panel probit model:A small sample comparison of GMM and SML estimaitors, Journal of Econometrics , Vol. 97, 227-259 Wooldridge M. Jeffrey (1999) Distribution-free estimation of some nonlinear panel data models,Journal of Econometrics, Vol. 90, 77-97 Bertschek Irene and Lechner Michael (1998) Convenient estimators for the panel probit model, Journal of Econometrics, Vol.87,329-371 Li Q., and Hsiao C. (1998) Testing serial correlation in semiparametric panel data models, Journal of Econometrics, Vol. 87,207-237 Li Qi and Stengos Thanasis (1996) Semiparametric estimation of Partially linear panel data models,Juornal of Econometrics,Vol.71,389-397 A Kamil Tahmiscioglu (2001) Intertemporal variation in financial constraints on investment: A time-varying parameter approach using panel data ,Journal of Business & Econometric Statistics, Vol.19,Iss.2,153-166 Ahn Seung Chan (2001) GMM estimation of linear panel data models with time-varying individual effects, Journal of Econometrics, Vol.101, Iss. 2, 219 Banerjee Anindya (1999) Panel data unit roots and cointegration: An overview,Oxford Bulletin of Economics and Statistics,Special Issue,Vol.61,Vol.61,608-628 Culver S.E. and Papell D.H. (1997) Is there a unit root in the inflation rate? Evidence from sequential break and panel data models, Journal of Applied Economics,Vol. 12, 435-444 Fisher R.A. (1932) statistical Methods for Research Workers,Oliver & Boyd,Edinburgh,4th Edition Funk Mark and Strauss Jack (2000) The long-run relationship between productivity and capital, Economics Letters, Vol. 69 ,213-217 Hall S.G. and Urga G. (1998) Stochastic Common Trends and Long-run Relationship in Heterogeneous Panels, Centre for Economic Forecasting, London
/
本文档为【Panel Data】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索