用spss做一元线性回归分析
用SPSS做一元线性回归分析
粮食生产是一个关系到国家生存与发展的一个重要问题,粮食产量波动,制约着国民经济发展,影响着粮食的价格。因此,研究影响粮食产量波动的因素的意义不可小觑。本次分析主要通过SPSS以及线性回归分析
,研究分析粮食产量与土地灌溉面积之间的关系。大致的操作过程为:首先做散点图,查看两因素之间是否线性相关;如果线性相关,接着做线性回归分析,揭示其数量关系。最后对回归方程做显著性检验以及经济意义的检验。
一、模型设定
我们的研究目的在于分析粮食产量与土地灌溉之间的数量关系,选取了2012年我国各个省份的粮食产量(万吨)和有效土地灌溉面积(千公顷)数据,将“粮食产量”作为被解释变量Y,“有效土地灌溉面积”作为解释变量X。
1.建立数据文件
打开SPSS的数据编辑器,对变量视图中一些内容进行编辑,然后将EXCEL#
格#内数据拷贝到SPSS中。
有效土地灌溉面积(千公省份 粮食产量(万吨) 顷)
X Y
北 京 209.3 121.8
天 津 338.0 161.8
河 北 4596.6 3172.6
山 西 1319.9 1193.0
内蒙古 3072.4 2387.5
辽 宁 1588.4 2035.5
吉 林 1807.5 3171.0
黑龙江 4332.7 5570.6
上 海 199.6 122.0
江 苏 3817.9 3307.8
浙 江 1456.8 781.6
安 徽 3547.7 3135.5
福 建 967.5 672.8
江 西 1867.7 2052.8
山 东 4986.9 4426.3
河 南 5150.4 5542.5
湖 北 2455.7 2388.5
湖 南 2762.4 2939.4
广 东 1873.2 1361.0
广 西 1529.2 1429.9
海 南 247.5 188.0
重 庆 692.9 1126.9
四 川 2600.8 3291.6
贵 州 1201.2 876.9
云 南 1634.2 1673.6
西 藏 245.3 93.7
陕 西 1274.3 1194.7
甘 肃 1291.8 1014.6
青 海 251.7 103.4
宁 夏 477.6 359.0
新 疆 3884.6 1224.7
表一
2.画散点图
从菜单上依次点选:图形—旧对话框—散点/点状,定义简单分布,设置Y为粮食产量,X为有效土地灌溉面积,点击确定,即可出现下面的散点图 。
图一
由散点图发现,粮食产量与有效土地灌溉面积之间线性相关。所以建立如下线性模型:
二、线性回归分析
从菜单上依次点选:分析—回归—线性,出现线性回归对话框。
在主对话框中设置因变量为“粮食产量”,自变量为“有效土地灌溉面积”,“方法”选择默认的“进入”,即自变量一次全部进入的方法。
然后,单击右侧“保存”(注意:在“保存”中被选中的项目,都将在数据编辑窗口显示),在出现的界面中勾选95%的置信区间单值,未
化残差。
最后,关于“统计量”,在默认情况下有“估计”和“模型拟合度”复选框被选中,再勾
复选框。 选“R方变化”
上述操作完成后,单击确定。
“回归系数”复选框组定义回归系数的输出情况,勾选其中的“估计” 可输出回归系数及其标准误差,t值和p值,如下图所示。
a系数
非标准化系数 标准系数
模型 B 标准 误差 试用版 t Sig.
1 (常量) 36.006 212.826 .169 .867
有效土地灌溉面积X .908 .086 .892 10.613 .000 a. 因变量: 粮食产量Y
表二
表二中给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还给出非标化系数,由此得到粮食产量与有效土地灌溉面积之间的一元回归方程为:
=0.908X+36.006
三、模型检验
1.经济意义检验
所估计的
=0.908,有效土地灌溉面积每相差1千公顷,可导致粮食产量增加0.908万吨,这与经济学中边际消费倾向的意义相符。
2.统计检验
(1)拟合优度
勾选“统计量”中“模型拟合度”复选框,会出现模型拟合过程中进入、退出的变量的列表,以及R,R方和调整的R方, 标准误差等。
b模型汇总
更改统计量
模型 R R 方 调整 R 方 标准 估计的误差 R 方更改 F 更改 df1 df2 Sig. F 更改
a1 .892 .795 .788 711.2174 .795 112.631 1 29 .000
a. 预测变量: (常量), 有效土地灌溉面积X。
b. 因变量: 粮食产量Y
表三
此表为所拟合模型的情况汇总,相关系数R=0.892,拟合优度R方=0.795,调整后的拟合优度=0.788。
拟合优度的度量:由上表可以看出,本例中可决系数为0.795,说明所建模型整体上对样本数据拟合较好,即解释变量“有效土地灌溉面积”对被解释变量“粮食产量”的绝大部分差异作出了解释。
(2)t检验
H:0,,H:0,,0102对回归系数的t检验:针对和,由表二中可以看出,估计的回归
^
,1系数的t值为0.169,相伴概率为0.867,大于显著性水平α(取值为0.05),所以不应拒
^H:0,,,012绝;同理,的t值为10.613,相伴概率数值很小,远小于显著性水平α,所
H:0,,02以应拒绝。这表明,有效土地灌溉面积对粮食产量有显著影响。
(3)F检验
勾选“统计量”中的“R方变化”复选框,显示模型拟合过程中平方和、F值和p值的改变情况,如下图所示。
bAnova
模型 平方和 df 均方 F Sig.
a1 回归 5.697E7 1 5.697E7 112.631 .000
残差 1.467E7 29 505830.134
总计 7.164E7 30
a. 预测变量: (常量), 有效土地灌溉面积X。
b. 因变量: 粮食产量Y
表四
从表中数据可知F值为112.631,伴随概率数值很小,小于显著性水平α(值为0.05),又本
例为一元线性回归分析,所以结论同t检验结论相同,有效土地灌溉面积对粮食产量有显著
影响。