为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 计量经济学精华

计量经济学精华

2009-09-19 9页 doc 1MB 46阅读

用户头像

is_938253

暂无简介

举报
计量经济学精华第二章 回归分析概述 一、变量间的关系及回归分析的基本概念 1、变量间的关系:△经济变量之间的关系,大体可分为两类:(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。 △对变量间统计依赖关系的考察主要是通过相关分析或回归分析来完成的: 2、回归分析的基本概念: •回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 • 这里前一个变量被称为被解释变量或应变量,后一个(些)变量被称为解释变量或自变量。 •由于变量间关系的...
计量经济学精华
第二章 回归概述 一、变量间的关系及回归分析的基本概念 1、变量间的关系:△经济变量之间的关系,大体可分为两类:(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。 △对变量间统计依赖关系的考察主要是通过相关分析或回归分析来完成的: 2、回归分析的基本概念: •回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 • 这里前一个变量被称为被解释变量或应变量,后一个(些)变量被称为解释变量或自变量。 •由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。 •回归分析构成计量经济学的方法论基础,其主要内容包括: (1)根据样本观察值对计量经济模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行检验;(3)利用回归方程进行分析、评价及预测。 二、总体回归函数 ⒈例子 例2.1:一个假想的社区有60户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。为达到此目的,将该60户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出(2.1)。 ⒉ 分析 : •由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; •但是,给定收入X的值Xi,可得消费支出Y的条件均值或条件期望: 。该例中:E(Y | X=800)=650 •从散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。 ⒊ 概念: •回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。 • 函数形式可以是线性或非线性的。 三、随机扰动项 ⒈随机扰动项的引入 总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。 但对某一个别的家庭,其消费支出可能与该平均水平有偏差。记 由(2.1.2)式,个别家庭的消费支出为: (2.1.3)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。 • 由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。 ⒉ 随机误差项的影响因素:在解释变量中被忽略的因素的影响;变量观测值的观测误差的影响;模型关系的设定误差的影响;其它随机因素的影响。 ⒊产生并随机误差项的主要原因:理论的含糊性;数据的欠缺;节省原则。 四、样本回归函数(SRF) ⒈问题的提出 由于总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一组样本。问题是能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 例2.2:在例2.1的总体中有如下一个样本,问:能否从该样本估计总体回归函数PRF? 该样本的散点图(scatter diagram): 样本散点图近似于一条直线,画一条直线以尽可能好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归线(sample regression lines),其函数形式记为: ⒉ 样本回归函数的随机形式/样本回归模型 由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型。 ⒊ 回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。 第三章 一元线性回归模型 3.1 模型的建立及其假定条件 1 、一元线性回归模型 一元线性回归模型表示如下: yi=β0+β1xi + ui yi 称为 被解释变量(因变量) xi 称为解释变量(自变量) β0、β1 ——回归系数(待定系数或待定参数) (0称作常数项(截距项),(1称作斜率系数。ui 是计量经济模型区别于数学模型的最关键的标志,称之为随机扰动项或误差项。正是u 的随机性使得我们可以采用统计推断方法对模型的设定进行严格的检验。 2 随机误差项的假定条件:1)零均值假定:E(ui) = 0 i=1,2,…… 这表示对X的每个观测值来说, u可以取不同的值,有些大于零,有些小于零,考虑u的所有可能取值,他们的总体平均值等于零. (2)同方差性假定:Var(ui )= (u2 i=1,2,…… 这表明在各次观测中u具有相同的方差,也就是各次观测所受的随机影响的程度相同. (3)无序列相关假定:Cov(ui , uj)=0 i≠j i,j= 1,2, … 这表明,在任意两次观测时, ui , uj是不相关的,即u 在某次观测中取的值与任何其它次观测中取的值互不影响。 (4)解释变量与误差项不相关假定:Cov(Xi, ui)=0 i=1,2,…… 这一假定表明随机项u与自变量x不相关.提出这一假定是因为在建立回归模型时,我们用随机项u综合了未包含在模型中的那些自变量以及其它因素对因变量Y的影响.因此,应该把X对Y的影响和u对Y的影响区分开来.如果两者相关,就不可能把各自对Y的影响区分开来 (5) 正态分布假定: ui~N(0, (u2 ) i=1,2, … 3.2 一元线性回归模型的参数估计 1、几个重要的概念 对于一元线性回归模型 ,随机误差项满足古典假设条件,这个线性回归模型称为X,Y之间的总体回归模型。 两边取条件均值,得一元线性回归方程: 简称总体回归方程(总体回归线)。其中总体回归系数β0 和β1是未知的,实际上总体回归线是无法求得的,它只是理论上的存在,所以称为理论回归方程。如果变量 x 和y之间存在线性相关关系,对于任意抽取的若干个观测样本值( xi ,yi),有 (3.3.1)。我们称(3.3.1)为样本回归模型, 、 为β0 、β1 的估计值或估计量 。样本回归模型由两部分组成: 称为系统分量,是可以被x解释的部分,也称为可解释分量; 是不能被解释的部分,称为残差,它是随机项ui 的代表值,也称为不可解释分量。将系统分量表示为 (3.2.2)。(3.2.2)称为一元线性样本回归方程,简称样本回归方程。又因(3.2.2)式的建立依赖于样本观测值(xi, yi ),所以我们又称其为经验回归方程。 、 为样本回归系数。其中 是估计的回归直线在y轴截距, 是直线的斜率。 的实际意义为x每变动一个单位时,y的平均变动值,即x的变动对y变动的边际贡献率;是实际观测值y 的拟合值或估计值我们用一个图来表示yi,E(yi) 、ui、ei 2、普通最小二乘法 给定一组样本观测值(Xi, Yi)(i=1,2,…n)要求样本回归函数尽可能好地拟合这组值.普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和最小 即在给定样本观测值之下,选择出 、 能使 yi , 之差的平方和最小(即为使残差平方和最小) 称为OLS估计量的离差形式。由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量。 3 最小二乘直线的性质:(1)残差ei的均值等于0; (2)残差ei与解释变量xi不相关,即 (3)样本回归直线经过点( );(4)被解释变量的样本平均值等于其估计值的平均值 例3.3.1题:一个假想的生活小区有100户家庭组成,要研究该小区每月家庭消费支出Y与每月家庭可支配收入X的关系。首先得到这100户家庭的每月家庭消费支出和每月家庭可支配收入的数据,并把100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出,分组如下: 因此,由该样本估计的回归方程为: 3.3最小二乘估计量的统计性质 : 2、无偏性,即估计量 、 的均值(期望)等于总体回归参数真值β0 和β1;3、有效性(最小方差性),即在所有线性无偏估计量中,最小二乘估计量 、 具有最小方差。 EMBED PBrush 3.4用样本可决系数检验回归方程的拟合优度 回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 主要包括拟合优度检验、变量的显著性检验及参数的区间估计。 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。基本思路:因变量Y的变异,能够被X的变异解释的比例越大,则OLS回归线对总体的解释程度就越好。也即是样本观测值距回归线越近,拟合优度越好,X对Y的解释程度就越强。 度量拟合优度的指标:样本决定系数r2 1 总离差平方和的分解 已知由一组样本观测值(Xi,Yi),i=1,2…,n得到如下样本回归直线: 而Y的第i个观测值与样本均值的离差可分解为两部分之和: 如果Yi=Ŷi 即实际观测值落在样本回归“线”上,则拟合最好。可认为,“离差”全部来自回归线,而与“残差”无关。 对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明: 记: 分别为总离差平方和回归平方和残差平方和 即:TSS=ESS+RSS Y的观测值围绕其均值的总离差可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此定义拟合优度:回归平方和ESS/Y的总离差TSS 2 样本可决系数 也可表示为 , 称 r2 为(样本)决定系数/判定系数,可决系数。可决系数的取值范围:[0,1]。r2越接近1,说明实际观测点离样本线越近,拟合优度越高。 在例3.1.1的收入-消费支出例中 这表示在消费支出的变异中,有97.66%的变异是由收入的变异所解释。即家庭每月的消费支出的97.66%取决于收入。 反映由模型中解释变量所解释的那部分离差大小的是( )。 A.总体平方和 B.回归平方和 C.残差平方和 3 样本相关系数 样本相关系数是变量X与Y之间线性相关程度的度量指标,其定义为: 样本相关系数表示x和y的线性相 关关系的密切程度。其取值范围为|r| ≤ 1,即-1 ≤ r ≤ 1。当r=-1时,表示x与y之间完全负相关;当r=1时,表示x与y之间完全正相关;当r=0时,表示x与y之间无线性相关关系,即说明x与y可能无相关关系或x与y之间存在非线性相关关系。 样本相关系数的检验:由于一元线性回归方程研究的是变量x与变量y之间的线性相关关系,所以我们可以用反映变量x与变量y之间的相关关系密切程度的相关系数来检验回归方程的显著性。 检验的步骤为:(1)提出原假设H0 :ρ=0,备择假设H1 :ρ≠0; (2)构造t统计量 (3)给出显著性水平 α,查自由度v=n-2的t分布表,得临界值 (4)当 时,接受原假设,认为总体相关系数等于零,X与Y之间没有显著的线性相关关系 当 时,拒绝原假设,接受备择假设,认为X与Y 之间具有显著的线性相关关系。 下图中“{”所指的距离是( ) 3.5回归系数估计值的显著性检验与置信区间 1、 随机变量u的方差 我们在证明最小二乘估计量的有效性的时候已经得出参数 和 的概率分布为: 在估计的参数 和 的方差表达式中,都还有随机扰动项ui的方差 ,由于 实际上是未知的,因此 和 的方差实际上是无法计算的,这就需要对其进行估计。由于随机项ui不可观测,只能从ui的估计—残差ei出发,对总体方差进行估计。可以证明 的最小二乘估计量为 。 它是关于 的无偏估计量 2 、回归系数估计值的显著性检验——t检验 回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。即是检验系数 和 是否显著地不等于零,也就是检验样本是否取自其真实参数为零的总体. 检验步骤:(1) (1) 对总体参数提出假设H0:β1=0,H1:β1≠0;(2)以原假设H0构造t统计量,并由样本计算其值; (3)给定显著性水平(,查t分布表,得临界值t (/2(n-2);(4) 比较,判断 若|t|> t (/2(n-2),则拒绝H0 ,接受H1;若 |t|( t (/2(n-2),则拒绝H1,接受H0 ; 对于一元线性回归方程中的β0,可构造如下t统计量进行显著性检验: 在上述收入-消费支出例中,首先计算的估计值 t统计量的计算结果分别为: SHAPE \* MERGEFORMAT 给定显著性水平(=0.05,查t分布表得临界值:t ( 8 )=3.306 |t |>3.306,说明家庭可支配收入在95%的置信度下显著,即是消费支出的主要解释变量;|t |<3.306,表明在95%的置信度下,无法拒绝截距项为零的假设。 3 、回归系数 β0 、β1 的置信区间 为了反映回归系数的估计精度,需给出其区间估计,即在置信水平为1-α下的置信区间。置信区间长度越短,说明估计值 和 和 参数β0和β1 就越接近,估计值就越精确;反之,就越不精确。 区间估计的步骤:1)找一个含有该参数的统计量;2)构造一个概率为1-α的事件;3)通过该事件解出该参数的区间估计。 1.对于参数β1,我们知道统计量中含有参数β1;2.构造关于统计量t的概率为1-α的事件 事件为:;把代入上面的式子整理得到: 3. 得到β1的1-α的 置信区间 根据同样的方法我们可以求出β0的置信区间 3.6一元线性回归方程的预测 1点预测 所谓点预测,是将X的一个特定值x 代入样本回归方程,计算得出的就是y 的点预测值。对于一元线性回归方程对于给定的样本以外的解释变量的观测值x ,可以得到被解释变量的预测值。我们还是以家庭收入与消费的例子的资料为例 我们已经估计出其一元线性回归方程: 预测收入为4000元的家庭的消费支出: 2区间预测 (1)个值的预测区间 由 Y =( +( X +u 知: 定义预测误差: ;于是 从而在1-(的置信度下, Y 的置信区间为 (2)总体均值的预测区间 于是 � EMBED Unknown ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� PAGE 2 _1274092961.unknown _1274094897.unknown _1274094910.unknown _1274095427.unknown _1274094863.unknown _1274094883.unknown _1274093073.unknown _1274094621.unknown _1274090669.unknown _1274091187.unknown _1274091210.unknown _1274091152.unknown _1274090716.unknown _1274090313.unknown _1274090569.unknown _1274015675.unknown _1274013306.unknown _1274011899.unknown _1274011935.unknown _1274011989.unknown _1274009982.unknown _1274006498.unknown
/
本文档为【计量经济学精华】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索