为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

基于SAS分析的各省消费支出

2016-12-18 18页 doc 314KB 124阅读

用户头像

is_894005

暂无简介

举报
基于SAS分析的各省消费支出本科课程设计论文统计软件课程设计题目:基于SAS分析的各省消费支出区域差异因素研究系别:统计系专业班级:统计学1410班姓名:童瑶函学号:2014162309指导教师:缪宁2016年12月12日1内容摘要本文以1999年国家级相关统计数据为样本,通过建立数据模型对消费支出的区域性差异进行实证分析。居民收入水平是影响居民消费需求最直接、最根本的因素,并最终决定着居民的消费层次和消费结构。全国10个省市区城镇居民的消费支出水平和结构有较大差异,经济发展较好的地区城镇居民的消费水平较高,消费结构也较合理。要提高居民消费水平和改善消费...
基于SAS分析的各省消费支出
本科课程设计统计软件课程设计题目:基于SAS的各省消费支出区域差异因素研究系别:统计系专业班级:统计学1410班姓名:童瑶函学号:2014162309指导教师:缪宁2016年12月12日1内容摘要本文以1999年国家级相关统计数据为样本,通过建立数据模型对消费支出的区域性差异进行实证分析。居民收入水平是影响居民消费需求最直接、最根本的因素,并最终决定着居民的消费层次和消费结构。全国10个省市区城镇居民的消费支出水平和结构有较大差异,经济发展较好的地区城镇居民的消费水平较高,消费结构也较合理。要提高居民消费水平和改善消费结构,不但要保持经济的快速增长、提高居民收入水平.也要引导居民正确消费、提高各地区城镇居民的生活质量。此外,就得到的分析结果提出了关于如何进一步增加消费支出,拉动内需提出几点针对性建议。关键词:消费支出;区域差异;实证分析AbstractBasdonthnationalrlatdstatisticaldatain1999assampl,throughthstablishmntofdatamodlforanmpiricalanalysisonthrgionaldiffrncsofconsumrspnding.Rsidntsincomllisthmostdirctinfluncconsumrdmand,thmostfundamntalfactor,andfinallydtrminthrsidnts'consumptionllandconsumptionstructur.10proincs,urbanrsidntsofthcountry'sconsumptionxpnditurllandstructurhabiggrdiffrnc,goodconomicdlopmntaraofurbanrsidntsconsumptionllishighr,thconsumptionstructurismorrasonabl.Toimprothllofrsidnts'consumptionandimprothconsumptionstructur,notonlytomaintainrapidconomicgrowth,improthllofincom.Alsowanttoguidthcorrctconsumption,improthqualityoflifofurbanrsidntsinariousaras.Inaddition,yougtthanalysisrsultsisputforwardonhowtofurthrincrasinconsumrspnding,stimulatingdomsticdmandsomtargtdSuggstionsarputforward.Kywords:consumrspnding;Thrgionaldiffrnc;Thmpiricalanalysis目录基于SAS分析各省农民收入区域差异因素 4一、引言 4二、研究对象及其经济意义 5一) 5二) 5三.分析变量时的理论支持 5 5四、数据收集 5五、数据分析 6一)建立数据集 6二)绘制饼状图与条形图 7 7三)描述统计量和直方图 8四)计算变量之间相关系数 9五)关于因子分析 10六)数据聚类分析 13 谱系图 14七)归分析 15 16六.结论与建议 16基于SAS分析各省农民收入区域差异因素一、引言城镇居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出来。改革开放以来,我国广大地区居民生活水平普遍有所提高,价值观念也发生了许多变化,但是,某些省份的消费水平与经济发达省份相比仍然偏低。甚至个别省份收入水平和消费水平极低,在整体上减弱了消费对经济增长的拉动作用,从而不利于社会的改革、发展和稳定,不利于我国统一的市场经济体制的建立,不利于经济和社会的全面发展。在当前全球性金融危机的大背景下,如何进一步促进我国各才省份的居民消费具有十分重要的现实意义。本文对我国十个省份居民消费的现状以及促进消费的对策等问题进行了系统分析。二、研究对象及其经济意义 一).消费性支出:居民或者家庭中支出的直接税、消费性贷款利息支出、经常性转移支出、以及各种损失款大致包括食品支出,衣着支出,家庭设备用品及服务支出,医疗保健支出,交通和通讯支出,娱乐教育文化服务支出,居住房屋支出,杂项商品和服务支出 二).研究对象:北京,天津,山西,内蒙古,辽宁,重庆,湖南,上海,浙江,安徽 主要对以上十个省份的城镇居民家庭平均每人全年消费性支出的8个主要变量数据作出分析 三.分析变量时的理论支持描述性统计分析方法,相关系数分析方法,因子分析方法,聚类分析方法,多元线性归模型分析方法四、数据收集数据来源:国家统计局官网;1999年数据为分析我国城镇居民家庭平均每人全年消费性支出状况,我们列出1999年10个地区的城镇居民家庭平均每人全年消费性支出的8个主要变量数据:X1:食品X2:衣着X3:家庭设备用品及服务X4:医疗保健X5:交通和通讯X6:娱乐教育文化服务X7:居住X8:杂项商品和服务原始数据见下: 地区 X1 X2 X3 X4 X5 X6 X7 X8 北京 2959 731 749 513 468 1142 478 458 天津 2460 495 697 303 284 736 571 305 山西 1406 478 290 209 202 415 282 212 内蒙古 1304 524 255 192 250 463 288 193 辽宁 1731 554 247 239 445 330 164 280 重庆 2303 590 516 237 404 730 438 226 湖南 1942 512 401 206 321 697 493 226 上海 3712 551 893 347 527 1035 720 462 浙江 2629 557 690 436 515 796 576 323 安徽 1845 430 271 126 251 513 314 151五、数据分析一)建立数据集Datab;inputb$x1x8@@;cards; 北京 2959 731 749 513 468 1142 478 458天津 2460 495 697 303 284 736 571 305山西 1406 478 290 209 202 415 282 212内蒙古 1304 524 255 192 250 463 288 193辽宁 1731 554 247 239 445 330 164 280重庆 2303 590 516 237 404 730 438 226湖南 1942 512 401 206 321 697 493 226上海 3712 551 893 347 527 1035 720 462浙江 2629 557 690 436 515 796 576 323安徽 1845 430 271 126 251 513 314 151run;图11这一步的作用是将数据导入SAS,并将它们重新命名。将成分命名为b,X1:食品X2:衣着X3:家庭设备用品及服务X4:医疗保健X5:交通和通讯X6:娱乐教育文化服务X7:居住X8:杂项商品和服务二)绘制饼状图与条形图procgchartdata=b;利用GCHART过程绘图pix3prcnt=outsid;对变量x3家庭设备用品及服务)绘制饼图 pix5prcnt=outsid;对变量x5交通和通讯)绘制饼图 pix8prcnt=outsid;对变量x8杂项商品和服务)绘制饼图 barx1lls=10;对变量x1食品)绘制条形图run;       图21 图22图23图24如“图21”所示,,在10个省市中,家庭设备用品及服务消费支出在900亿元以上的只有一个,其余省市在0300,300500,500800亿元)之间均有分布,最多的是0300之间的省市,分别占40%,20%,30%.如“图22”所示,交通和通讯支出方面,占比最大的是0300,300500阶段,共达70%。如“图23”所示,杂项商品和服务在消费支出中占比较低,主要集中在350亿元以下,占到80%。三)描述统计量和直方图procuniariatdata=b;histogramx1;run;直方图有8个,在这里截取其中两个procmansdata=bmaxdc=2manstdmaxminrangcskwnss;利用MEANS过程计算描述统计量arx1x8;run;表31由表31所示:食品支出均值为2229.1、标准差为742.5;衣着支出均值为542.2、标准差为80.66;家庭设备用品及服务支出均值为500.8、标准差为240.83,娱乐教育文化服务支出均值为685.70、标准差为263.78,居住支出均值为432.4、标准差为169.27。可以看出支出做多的部分仍然是人们日常生活中的吃穿住行四)计算变量之间相关系数proccorrdata=b;利用CORR过程计算变量之间的相关系数arx1x8;run; 表41表42如“表41”、“表42”所示,除了x2以外,x1与x3x4x5x6x7x8的相关系数都在0.7以上,x2与x4,x8的相关系数较高,分别为08,07,综合来看,x1x2x3x4x5x6x7x8具有一定相关性。五)关于因子分析1.因子分析因子分析factoranalysis)利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。就是要从数据中提取对变量起解释作用的少数公共因子因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)。procfactordata=bmthod=prinpriors=onsimplp=0.95;arx1x8;run;factor过程中的mthod=prin或写为mthod=principal)指出,这是因子模型中的主成份法,再由priors=on意思是说,在主成份法中,取初始公因子方差,即初始共同度,设为1,这就等价于主成份法。factor过程中的p=0.95指出,选取因子的个数这样决定,这些因子的累计贡献率在75%以上,或者说,主成分分析中几个主成分的累计贡献率在95%以上,就选几个因子。factor过程中的simpl关键字指出,输出变量的均值,标准差,样本的个数图51如图51所示,该图中输出部分为基本统计量,即各变量的均值,标准差及样本个数10。图52如图52所示,该图输出部分为解释的总方差,我们看到前4个因子的累计贡献率达到97,36%,所以选4个因子。图53图53是各公因子的方差贡献率和因子载荷矩阵。反映了公因子对各原始变量的解释能力。第一公共因子的方差贡献很高达到了6.1580083。但是由于我们得到的公因子的意义含糊不清,于是需要继续进行因子旋转。以下是因子旋转的过程:procfactordata=brotat=arimaxn=3;factor过程中的rotat=arimax指出,用方差最大正交旋转法对因子进行旋转,n=3指出计算3个因子arx1x8;run;旋转后的载荷矩阵图图54公因子与原有变量指标之间的关联程度由因子载荷值体现。因子载荷值越高,表明该因子包含指标的信息越多。为了更好解释因子分析的结果,用方差最大正交旋转法得到方差最大正交旋转矩阵。如图54所示,从旋转后的载荷矩阵我们可以得出下表: Factor1 Factor2 Factor3 高载荷变量 X1,X3,X7 X2,X4,X6,X8 X5 因子命名 吃住因子 衣着保健文娱其他因子 交通因子表11接下来进行因子得分,以便进行更好的分析:procfactordata=brotat=arimaxn=3scorout=b;arx1x8;run;procprintdata=b;arfactor1factor2factor3;run;只要在factor过程中,加入scor关键字,就指出了要计算因子得分。out=b指出,把因子得分的结果输出到数据集b中。后面print过程,是把b输出出来因子得分系数矩阵图图55得分最高的是1,2,8,9对应城市分别是北京,天津,上海,浙江,四地的综合消费支出比较高,其中,吃住类得分最高上海,衣着保健文娱其他得分最高的是北京,交通类得分最高的是辽宁,为了进一步解释10个省份的差异,对三个主因子计算因子得分,进行聚类分析。六)数据聚类分析聚类分析系统聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n1类;再按照前面的计算方法计算新类与其他类之间的距离或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n2类;如此下去,每次重复都减少一类,直到最后所有的样品或者变量)都归为一类为止。系统聚类分析中使用了ward法,ward法基于方差分析的基本思想:如果分类正确,同类样本间离差平方和应较小,类间离差平方和应较大。是最具数理统计特色的一种聚类分析方法,但该方法对异常值很敏感。procclustrdata=bmthod=wardouttr=otstandard;利用CLUSTER过程进行系统聚类,聚类方法为Ward最小方差法arx1x8;run;procclustrdata=bmthod=wardstdclustr过程,用来进行系统聚类,data的数据来自因子得分所输出的数据集b,mthod=ward表示类间距离使用离差平方和ward)法,std或standard选项,变量数据都标准化均值0,标准差1)以后,再计算距离outtr=bb;outtr=b641,将树形分类结果输出到数据集bbarx1x8;用x1、x2、、x8作为计算距离的变量proctrdata=bbhorizontalgraphicsn=3out=sj1;tr过程中,n=3out=sj1表示,分为3类时,分类的结果输出到数据集sj1中copyx1x8;copy语句,它表示要把sjb中的x1、、x8拷贝到sj1中去titl'使用Ward法的谱系聚类图';给输出的谱系图命名run;图61谱系图图62第一类:北京,上海,浙江;第二类:天津,重庆,湖南;第三类:山西,内蒙古,辽宁,安徽;正如62谱系图所示,我们可以看到按照这个结果分类较为理想,组内距离都很小,然后组间距离非常大。各分类的样品也基本符合它们的特点。从上表的分类可以看出,北上浙属于经济较为发达的省份,而天津重庆湖南属于发展较为中等的,山西,内蒙古,辽宁,安徽属于经济发展相对欠缺的省份,由此可以看出,经济发展很大程度上也影响着消费支出。七)归分析归分析描述的是一个变量与另一些变量间统计联系的关系式即:,以便用于解释和预测。确定归:x 确定变量:与哪些有关选择形式:与以什么形式相联系,即的表达式确定系数:确定中在多变量线性模型可同时研究Y与多个独立变量x1,x2,..,xp间的关系对多变量模型进行解释和选择最优要比单变量的模型复杂在试验结果的解释、分析、预测等方面,多变量线性模型是一个有力的工具。确定模型所包含的变量,因变量被解释变量)为y:x1(食品支出);自变量解释变量)有6个分别为:x2,x3,x4,x5,x6procrgdata=b;modlx1=x2x3x4x5x6;以x1为因变量,以x2、x3、x4x5和x6为自变量建立归模型plotstudnt.prdictd.;以标准化的残差值为纵轴,因变量的预测值为横轴绘图run;图71从残差图中和方差归图中可以得到归方程如下:Y=682.226061.0003x2+1.88446x31.62799x4+239109x5+105557x6 t检验:1.08)(0.55)1.97)(1.20)(2.82)(1.36)对应概率:0.3402)0.6098)0.1200)0.2969)0.0477)(0.2453)=0.9726,=0.9384,以上模型中,截据项的T检验和F检验在0.05的显著性水平下通过检验。通过以上分析我们可以得出:食品消费支出以及其他消费支出有显著的关系。X2的系数表明偿付能力每减少1个单位,食品支出将增加1.0003个单位,而x3系数表明资本状况每增加1个单位,食品支出将增加1.88446个单位,以此类推。六.结论与建议从聚类分析中可以看出,大部分低消费地区均处在中、西部,我国经济发展的地区不均衡性很明显。此外,中部地区相比于西部地区还是属于消费结构较好的。所以国家的发展重点应该在西部地区,尤其是教育文化娱乐方面,要加强西部教育文化发展。同时西部的家庭设备部分消费也很低,国家颁布的家电下乡政策也是为了解决这个问题。政府在产业政策制定和宏观经济调控时候,应该考虑居民消费结构的特点以及东、西、中部发展的差异,从而使经济能够健康持续地发展。第一类地区由北京、上海、浙江组成,它们是我国经济最发达的地区。在反映消费结构的八个方面都有较高的消费支出,结构合理。第二类地区是天津、重庆、湖南,经济发展仅次于第一类,综合得分略高于全国平均水平。反映出这几个省的消费结构需进一步调整,有待完善。第三类地区陕西、宁夏、湖南、四川、河北、黑龙江、河南、湖北、安徽、山西、广西综合略低于全国水平。第一主因子低于全国平均水平,而衣着和医疗保健方面均高于或略低于全国平均水平,反映出其生活资料方面的消费欠缺,消费结构需要调整。第三类地区山西,内蒙古,辽宁,安徽。这类地区基本上是我国经济发展落后的地区。尤其是消费结构的特点突出表现为医疗保健、教育文化娱乐服务和居住等项支出显著偏低。这是因为其气候条件恶劣,交通通信设施成本费用较高,而医疗设施以及教育文化水平相对落后,消费结构急需调整。具体建议:居民消费水平的高低与居民收入水平有关,居民收入水平又与该地区经济发展水平有关。一类地区均处于东部地区,这是目前我国经济最有活力的地区,有得天独厚的地理条件、便利的水利交通枢纽、开放的思想、政府的优惠政策等,使其发展迅速,经济比较发达,消费水平自然也就很高。相对的三类地区大部分属于中部地区,自然条件恶劣,交通不方便等原因使其经济发展不是很好,居民消费水平也相对较低。所以,综上所述,经济发展较好的地区,居民的消费水平较高,消费结构也较合理,适合相关企业进行投资。对于等次发达天津,重庆,湖南的二类地区来说,消费结构的调整是首要任务,这就需要政府引导居民正确消费,提高这些地区城镇居民的生活质量。接下来是一些略低于国家平均消费水平的中部地府区,政应继续出台切实有效的政策措施,增加居民消费积极性,并使之向着合理化方向发展。同时,这些地区的消费潜力也是最大的,市场尚未饱和,适合资产不实很雄厚的小企业进行投资,风险也相对较小。最后是类似新疆、青海等偏远的西部地区,这些地区有着自己独特的消费习惯,这些习惯会造成其消费结构的不合理,对于这部分地区国家不能一味的实施强硬政策,而是要因地制宜的制定政策,特别应对偏远地区实行政策倾斜,引导各地消费走健康发展之路。参考文献[1]李洁明等著,统计学原理.上海:复旦大学出版社,2011.[2]曾五一等.统计学导论[M].北京:科学出版社,2007.[3]李金昌.SAS统计分析[M].北京:科学出版社,2007.[4]梅长林等.数据分析方法[M].北京:高等教育出版社,2006.3
/
本文档为【基于SAS分析的各省消费支出】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索