为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

统计学基础课后练习答案-贾俊平编著

2012-06-12 46页 doc 1MB 214阅读

用户头像

is_952903

暂无简介

举报
统计学基础课后练习答案-贾俊平编著附录1:各章练习题答案 第1章 统计和统计数据 1.1 (1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。 1.2 (1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3)分类变量。 1.3 (1)总体是“所有的网上购物者”。(2)分类变量。 第2章 数据的图表展示 2.1 (1) 属于顺序数据。数分布表如下: (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级 家庭数(频率) 频率% A 14 14 ...
统计学基础课后练习答案-贾俊平编著
附录1:各章答案 第1章 统计和统计数据 1.1 (1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。 1.2 (1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3)分类变量。 1.3 (1)总体是“所有的网上购物者”。(2)分类变量。 第2章 数据的图表展示 2.1 (1) 属于顺序数据。数分布表如下: (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级 家庭数(频率) 频率% A 14 14 B 21 21 C 32 32 D 18 18 E 15 15 合计 100 100 (3)条形图如下: (4)帕累托图如下: 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组 (万元) 企业数 (个) 频率 (%) 向上累积 向下累积 企业数 频率 企业数 频率 100以下 100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计 40 100.0 — — — — (2) 某管理局下属40个企分组表 按销售收入分组(万元) 企业数(个) 频率(%) 先进企业 良好企业 一般企业 落后企业 11 11 9 9 27.5 27.5 22.5 22.5 合计 40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元) 频数(天) 频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计 40 100.0 直方图如下: 2.4 (1)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时) 灯泡个数(只) 频率(%) 650~660 2 2 660~670 5 5 670~680 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计 100 100 (2)直方图如下: 从直方图可以看出,灯泡使用寿命的分布基本上是对称的。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 茎叶图与直方图所反映的数据分布是一致的,不同的是茎叶图中保留了原始数据。 2.5 (1)食品重量的频数分布表如下: 按重量分组 频率(包) 40~42 2 42~44 3 44~46 7 46~48 16 48~50 17 50~52 10 52~54 20 54~56 8 56~58 10 58~60 4 60~62 3 合计 100 (2)食品重量的频数分布的直方图如下: (3)从直方图可以看出,食品重量的分布基本上是对称分布。 2.6 (1)频数分布表如下: 按重量误差分组 频数/个 10~20 2 20~30 3 30~40 8 40~50 7 50~60 13 60~70 9 70~80 6 80~90 2 合计 50 (2)直方图如下: 从直方图可以看出,零件重量误差的分布基本上是对称的。 2.7 (1)属于数值型数据。 (2)为绘制直方图,首先对数据进行分组,将数据用5作为组距进行分组,得到的频数分布表如下: 分组 天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)根据分组数据绘制的直方图如下: 从直方图可以看出,该城市1~2月份气温的分布基本上是对称的,温度在-10~-5度之间的天数最多。 2.8 (1)成人自学考试年龄分布的直方图如下: (2)从直方图可以清楚地看出,成人自学考试人员年龄的分布为右偏,也就是年龄在21岁~24岁的人占绝大比例,而年龄在40岁以上的人所占的比例很小。 2.9 (1)两个班考试成绩的茎叶图如下: A班 树茎 B班 数据个数 树 叶 树叶 数据个数 0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)中茎叶图可以看出,A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。 2.10 散点图如下: 2.11 (1)对比条形图如下: 环形图如下(内环为甲班的成绩): (2)从对比条形图可以看出,甲班考试成绩在中等水平的人数较多,而优秀和良好的人数则较少,不及格的人数也比乙班要多。乙班则不同,考试成绩为优秀和良好的人数较多,而中等以下的人数则较少。这说明乙班学生的平均成绩比甲班要好。从环形图的百分比中也可以清楚地看出这一点。 (3)两个班考试成绩的雷达图如下: 从雷达图的形状可以看出,两个班考试成绩没有相似性。 2.12 (1)国产车和进口车销售量的对比条形图如下: (2)国产车和进口车销售量的环形图如下: 2.13 (1)国内生产总值的线图如下: (2)第一、二、三产业国内生产总值的线图如下: 2004年国内生产总值构成的饼图如下: 2.14 各城市各月份的平均相对湿度的箱线图如下: 从箱线图可以看出,各城市的月平均相对湿度有较大差异。离散程度较大的城市主要是北京和长春(箱子较大);离散程度较小的是成都、广州和武汉(箱子较小);相对湿度最大的城市主要有成都、广州、南京和武汉(中位数较大);相对湿度最小的城市是兰州(中位数较小);相对湿度分布比较对称的城市主要是北京、武汉、广州和兰州等(中位数大体上在箱子中间,最大值和最小值与箱子的距离大体相等);相对湿度不对称的城市主要有南京、郑州等。相对湿度存在极值的城市主要是长春和西安。 第3章 数据的概括性度量 3.1 (1)众数: 。 中位数: , 。 平均数: 。 (2) , 。 , 。 (3) (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。 3.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众数,即 和 。 将原始数据排序后,计算的中位数的位置为: ,第13个位置上的数值为23,所以中位数 。 (2) , 。 , 。 (3)平均数 。 (4)偏态系数: 。 峰态系数: 。 (5)分析:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。由于差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 3.3 (1)茎叶图如下: 茎 叶 数据个数 5 5 1 6 6 7 8 3 7 1 3 4 8 8 5 (2) 。 。 (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式: ; 。由于 ,表明第一种排队方式的离散程度大于第二种排队方式。 (4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。 3.4 (1) 。 , 。 (2) , 。 , 。 (3) 。 3.5 (1) 。 . 原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)平均数计算过程见下表: 按利润额分组 组中值 企业数 200~300 250 19 4750 300~400 350 30 10500 400~500 450 42 18900 500~600 550 18 9900 600以上 650 11 7150 合计 — 120 51200 。 标准差计算过程见下表: 按利润额分组 组中值 企业数 200~300 250 19 31212.3 593033.5 300~400 350 30 5878.3 176348.7 400~500 450 42 544.3 22860.1 500~600 550 18 15210.3 273785.2 600以上 650 11 49876.3 548639.2 合计 — 120 102721.5 1614666.7 。 (2)偏态系数和峰态系数的计算过程见下表: 按利润额分组 组中值 企业数 200~300 250 19 -104771226.5 18509932589.2 300~400 350 30 -13520652.3 1036628411.8 400~500 450 42 533326.9 12442517.1 500~600 550 18 33765928.7 4164351991.6 600以上 650 11 122527587.6 27364086138.8 合计 — 120 38534964.4 51087441648.4 偏态系数: 。 峰态系数: 。 3.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。 (2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为 ,男生体重的离散系数为 ,所以女生的体重差异大。 (2)男生: (磅), (磅); 女生: (磅), (磅); (3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg到65kg之间。 (4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,女生中大约有95%的人体重在40kg到60kg之间。 3.9 通过计算标准分数来判断: ; 。 该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以A项测试比较理想。 3.10 通过标准分数来判断,各天的标准分数如下表: 日期 周一 周二 周三 周四 周五 周六 周日 标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。 3.11 (1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。 (2)成年组身高的离散系数: ; 幼儿组身高的离散系数: ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 3.12 (1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。 (2)下表给出了用Excel计算一些主要描述统计量。 方法A 方法B 方法C 平均 165.6 平均 128.73 平均 125.53 中位数 165 中位数 129 中位数 126 众数 164 众数 128 众数 126 标准差 2.13 标准差 1.75 标准差 2.77 极差 8 极差 7 极差 12 最小值 162 最小值 125 最小值 116 最大值 170 最大值 132 最大值 128 从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为: , , 。方法A的离散程度最小。因此应选择方法A。 3.13 (1)用方差或标准差来评价投资的风险。 (2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。 (3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。 第4章 抽样与参数估计 4.1 (1)已知: , , , , 。 样本均值的抽样标准差 。 (2)估计误差 。 4.2 (1)已知: , , , , 。 样本均值的抽样标准差 。 (2)估计误差 。 (3)由于总体标准差已知,所以总体均值 的95%的置信区间为: ,即(115.8,124.2)。 4.3 已知: , , , , 。 由于总体标准差已知,所以总体均值 的95%的置信区间为: ,即(87818.856,121301.144)。 4.4 (1)已知: , , , , 。 由于 为大样本,所以总体均值 的90%的置信区间为: ,即(79.026,82.974)。 (2)已知: , 。 由于 为大样本,所以总体均值 的95%的置信区间为: ,即(78.648,83.352)。 (3)已知: , 。 由于 为大样本,所以总体均值 的99%的置信区间为: ,即(77.940,84.096)。 4.5 (1)已知: , , , , 。 由于总体标准差已知,所以总体均值 的95%的置信区间为: ,即(24.11,25.89)。 (2)已知: , , , , 。 由于 为大样本,所以总体均值 的98%的置信区间为: ,即(113.17,126.03)。 (3)已知: , , , , 。 由于 为大样本,所以总体均值 的90%的置信区间为: ,即(3.136,3.702)。 4.6 (1)已知:总体服从正态分布, , , , , 。 由于总体服从正态分布,所以总体均值 的95%的置信区间为: ,即(8646.97,9153.03)。 (2)已知:总体不服从正态分布, , , , , 。 虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的95%的置信区间为: ,即(8734.35,9065.65)。 (3)已知:总体不服从正态分布, 未知, , , , , 。 虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的90%的置信区间为: ,即(8760.97,9039.03)。 (4)已知:总体不服从正态分布, 未知, , , , , 。 虽然总体不服从正态分布,但由于 为大样本,所以总体均值 的99%的置信区间为: ,即(8681.95,9118.05)。 4.7 已知: ,当 为0.1、0.05、0.01时,相应的 、 、 。 根据样本数据计算得: , 。 由于 为大样本,所以平均上网时间的90%的置信区间为: ,即(2.88,3.76)。 平均上网时间的95%的置信区间为: ,即(2.79,3.85)。 平均上网时间的99%的置信区间为: ,即(2.63,4.01)。 4.8 已知:总体服从正态分布,但 未知, 为小样本, , 。 根据样本数据计算得: , 。 总体均值 的95%的置信区间为: ,即(7.11,12.89)。 4.9 已知:总体服从正态分布,但 未知, 为小样本, , 。 根据样本数据计算得: , 。 从家里到单位平均距离的95%的置信区间为: ,即(7.18,11.57)。 4.10 (1)已知: , , , 。 由于 为大样本,所以零件平均长度的95%的置信区间为: ,即(148.87,150.13)。 (2)在上面的估计中,使用了统计中的中心极限。该定理表明:从均值为 、方差为 的总体中,抽取容量为 的随机样本,当 充分大时(通常要求 ),样本均值 的抽样分布近似服从均值为 、方差为 的正态分布。 4.11 (1)已知:总体服从正态分布,但 未知, 为大样本, , 。 根据样本数据计算得: , 。 该种食品平均重量的95%的置信区间为: ,即(100.87,101.77)。 (2)根据样本数据可知,样本合格率为 。该种食品合格率的95%的置信区间为: ,即(0.82,0.98)。 4.12 已知:总体服从正态分布,但 未知, 为小样本, , 。 根据样本数据计算得: , 。 总体均值 的99%的置信区间为: ,即(15.64,16.62)。 4.13 已知:总体服从正态分布,但 未知, 为小样本, , 。 根据样本数据计算得: , 。 网络公司员工平均每周加班时间的90%的置信区间为: ,即(10.36,16.76)。 4.14 (1)已知: , , , 。 总体总比例 的99%的置信区间为: ,即(0.32,0.70); (2)已知: , , , 。 总体总比例 的95%的置信区间为: ,即(0.78,0.86); (3)已知: , , , 。 总体总比例 的90%的置信区间为: ,即(0.46,0.50)。 4.15 已知: , , 为0.1和0.05时,相应的 , 。 总体总比例 的90%的置信区间为: ,即(0.18,0.28)。 总体总比例 的95%的置信区间为: ,即(0.17,0.29)。 4.16 已知: ,估计误差 , , 。 应抽取的样本量为: 。 4.17 (1)已知: , , , 。 应抽取的样本量为: 。 (2)已知: , 未知, , 。 由于 未知,可用使用0.5。 应抽取的样本量为: 。 (3)已知: , , , 。 应抽取的样本量为: 。 4.18 (1)已知: , , , 。 总体中赞成该项改革的户数比例的95%的置信区间为: ,即(0.51,0.77)。 (2)已知: , , 。 应抽取的样本量为: 。 第5章 假设检验 5.1 (1)研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为: , 。 (2)如果不能拒绝原假设,表示没有充分的统计证据支持该开发小组认为新型弦线的抗拉强度得到了提高。 (3)如果有充足的理由拒绝原假设,表示开发小组可以相信新型弦线的抗拉强度超过了1035Mpa,因此可以进一步采取推广。 5.2 (1)该组织想要证实的假设是“每个月平均销售的汽车数量不足14辆”,所以提出的假设形式为, , 。 (2)当不能拒绝原假设时,该组织认为没有充分的理由怀疑汽车销售管理者的说法。 (3)当可以拒绝原假设时,该组织有充分的统计证据断定汽车销售管理者的声明不真实。 5.3 (1) , 。 (2)样本数据表明应该拒绝原假设时,意味着该生产线生产的玻璃纸平均横向延伸率不符合规格,必须对生产线进行调整。 (3)样本数据无法支持拒绝原假设时意味着质量控制监督人员没有充分的理由认为该生产线所处状态不正常,无需停产调整。 5.4 (1)发生第一类错误指的是实际上奖励并未提高销售人员的平均销售额,而公司董事长却认为它提高了销售人员的平均销售额,这将导致公司错误的推行新的奖励计划,却无法获得更高的销售额。 (2)发生第二类错误指的是实际上奖励计划提高了销售人员的平均销售额,公司董事长却没有意识到,这将使公司错过推行新的奖励计划的机会,也就无法进一步提高销售额。 5.5 (1)检验的临界值是 ,拒绝法则是:如果 >1.645,就拒绝 。 (2)检验统计量 ,所以拒绝原假设,认为新纤维的平均强力超过了6克。 5.6 (1) 。 =22.0时,检验统计量 < ,拒绝原假设。 (2) =24.0时,检验统计量 > ,不拒绝原假设。 (3) =23.5时,检验统计量 > ,不拒绝原假设。 (4) =22.8时,检验统计量 > ,不拒绝原假设。 5.7 (1)拒绝规则是:如果 >1.96或 <-1.96,则拒绝 。 (2)检验统计量 。 (3)在5%的显著性水平下,不能拒绝原假设。 5.8 建立原假设与备择假设为: , ; 检验统计量 <-2.33,拒绝原假设,认为该厂机器的平均开工成本的确有所下降。 5.9 建立原假设与备择假设为: , ; ,所以不拒绝原假设,也就是没有充分的理由怀疑该厂生产的工艺品框架宽与长的平均比例不是0.618。 5.10 (1) 。如果 和 都大于等于5。 (2) < ,不能拒绝原假设,因此没有充分的理由认为这部电视剧是成功的。 5.11 检验统计量 >1.96,所以拒绝原假设,认为该医生的声明并不属实。 第6章 相关与回归分析 6.1 (1)散点图如下: 从散点图可以看出,产量与生产费用之间为正的线性相关关系。 (2)利用Excel的“CORREL”函数计算的相关系数为 。 (3)首先提出如下假设: , 。 计算检验的统计量 当 时, 。由于检验统计量 ,拒绝原假设。表明产量与生产费用之间的线性关系显著。 6.2 (1)散点图如下: 从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。 (2)利用Excel的“CORREL”函数计算的相关系数为 。相关系数 ,表明复习时间与考试分数之间有较强的正线性相关关系。 6.3 (1) 表示当 时 的期望值为10。 (2) 表示 每增加一个单位, 平均下降0.5个单位。 (3) 时, 。 6.4 (1) 。 表示,在因变量 取值的变差中,有90%可以由 与 之间的线性关系来解释。 (2) 。 表示,当用 来预测 时,平均的预测误差为0.5。 6.5 (1)散点图如下: 从散点图可以看出,运送距离与运送时间之间为正的线性相关关系。 (2)利用Excel的“CORREL”函数计算的相关系数为 。相关系数 ,表明运送距离与运送时间之间有较强的正线性相关关系。 (3)由Excel输出的回归结果如下表: 回归统计 Multiple R 0.948943 R Square 0.900492 Adjusted R Square 0.888054 标准误差 0.480023 观测值 10 方差   df SS MS F Significance F 回归分析 1 16.68162 16.68162 72.39585 2.79E-05 残差 8 1.843379 0.230422 总计 9 18.525         Coefficients 标准误差 t Stat P-value Intercept 0.118129 0.355148 0.33262 0.74797 X Variable 1 0.003585 0.000421 8.508575 2.79E-05 0.002613 得到的回归方程为: 。 回归系数 表示运送距离每增加1公里,运送时间平均增加0.003585天。 6.6 (1)散点图如下: 从散点图可以看出,人均GDP与人均消费水平为正的线性相关关系。 (2)利用Excel的“CORREL”函数计算的相关系数为 。相关系数接近于1,表明人均GDP与人均消费水平之间有非常强的正线性相关关系。 (3)由Excel输出的回归结果如下表: 回归统计 Multiple R 0.998128 R Square 0.996259 Adjusted R Square 0.995511 标准误差 247.3035 观测值 7 方差分析   df SS MS F Significance F 回归 1 81444969 81444969 1331.692 2.91E-07 残差 5 305795 61159.01 总计 6 81750764         Coefficients 标准误差 t Stat P-value Intercept 734.6928 139.5403 5.265094 0.003285 X Variable 1 0.308683 0.008459 36.49236 2.91E-07 得到的回归方程为: 。回归系数 表示人均GDP每增加1元,人均消费水平平均增加0.308683元。 (4)判定系数 。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。. (5)首先提出如下假设: , 由于Significance F< ,拒绝原假设,表明人均GDP与人均消费水平之间的线性关系显著。 (6) (元)。 (7)当 时, , 。置信区间为: 即(1990.7,2565.5)。 预测区间为: 即(1580.3,2975.9)。 6.7 (1) 散点图如下: 从散点图可以看出,航班正点率与被投诉次数之间为负的线性相关关系。 (2)由Excel输出的回归结果如下表: 回归统计 Multiple R 0.868643 R Square 0.75454 Adjusted R Square 0.723858 标准误差 18.88722 观测值 10 方差分析   df SS MS F Significance F 回归分析 1 8772.584 8772.584 24.59187 0.001108 残差 8 2853.816 356.727 总计 9 11626.4         Coefficients 标准误差 t Stat P-value Intercept 430.1892 72.15483 5.962029 0.000337 X Variable 1 -4.70062 0.947894 -4.95902 0.001108 得到的回归方程为: 。回归系数 表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。 (3)回归系数检验的P-Value=0.001108< ),拒绝原假设,回归系数显著。 (4) (次)。 (5)当 时, , 。置信区间为: 即(37.7,70.7)。 预测区间为: 即(7.6,100.8)。 6.8 Excel输出的回归结果如下: Multiple R 0.7951 R Square 0.6322 Adjusted R Square 0.6117 标准误差 2.6858 观测值 20 方差分析   df SS MS F Significance F 回归 1 223.1403 223.1403 30.9332 2.79889E-05 残差 18 129.8452 7.2136 总计 19 352.9855         Coefficients 标准误差 t Stat P-value Intercept 49.3177 3.8050 12.9612 0.0000 X Variable 1 0.2492 0.0448 5.5618 0.0000 由上表结果可知,出租率与月租金之间的线性回归方程为: 。回归系数 表示:月租金每增加1元,出租率平均增加0.2492%。 ,表明在出租率的变差中被出租率与租金之间的线性关系所解释的比例为63.22%,回归方程的拟合程度一般。 估计标准误差 表示,当用月租金来预测出租率时,平均的预测误差为2.6858%,表明预测误差并不大。 由方差分析表可知,Significance F=2.79889E-05< 回归方程的线性关系显著。回归系数检验的P-value=0.0000< ,表明回归系数显著,即月租金是影响出租率的显著性因素。 6.9 (1)方差分析表中所缺的数值如下 方差分析表如下: 变差来源 df SS MS F Significance F 回归 1 1422708.6 1422708.6 354.277 2.17E-09 残差 10 40158.07 4015.807 — — 总计 11 1642866.67 — — — (2)根据方差分析表计算的判定系数 。表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。 (3)相关系数可由判定系数的平方根求得: 。 (4)回归方程为: 。回归系数 表示广告费用每增加一个单位,销售量平均增加1.420211个单位。 (5)由于Significance F=2.17E-09< ,表明广告费用与销售量之间的线性关系显著。 6.10 Excel输出的回归结果如下: 回归统计 Multiple R 0.968167 R Square 0.937348 Adjusted R Square 0.916463 标准误差 3.809241 观测值 5 方差分析   df SS MS F Significance F 回归分析 1 651.2691 651.2691 44.88318 0.006785 残差 3 43.53094 14.51031 总计 4 694.8         Coefficients 标准误差 t Stat P-value Intercept 13.62541 4.399428 3.097086 0.053417 X Variable 1 2.302932 0.343747 6.699491 0.006785 由上述结果可知:回归方程为 ,回归系数表明, 每增加一个单位 平均增加2.3029个单位;判定系数 ,表明回归方程的拟合程度较高;估计标准误差 ,表明用 来预测 时平均的预测误差为3.8092。 6.11 (1)检验统计量: 。 (2) 。 (3)由于 ,所以拒绝原假设 。 (4)根据相关系数与判定系数之间的关系可知, 。 (5)提出假设: , 由于 ,拒绝 ,线性关系显著。 6.12 (1)当 时, 。当 , 。 的平均值的95%的置信区间为: 即(15.95,18.05)。 (2)预测区间为: 即(14.65,19.35)。 6.13 Excel输出的回归结果如下: 回归统计 Multiple R 0.947663 R Square 0.898064 Adjusted R Square 0.881075 标准误差 108.7575 观测值 8 方差分析   df SS MS F Significance F 回归分析 1 625246.3 625246.3 52.86065 0.000344 残差 6 70969.2 11828.2 总计 7 696215.5         Coefficients 标准误差 t Stat P-value Intercept -46.2918 64.89096 -0.71338 0.502402 X Variable 1 15.23977 2.096101 7.270533 0.000344 得到的线性回归方程为: 。 当 时, 。当 , 。 (2)销售收入95%的置信区间为: 即(270.65,685.04)。 。 第7章 时间序列分析和预测 7.1 (1)时间序列图如下: 从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。 (2)年平均增长率为: 。 (3) 。 7.2 (1)时间序列图如下: (2)2001年的预测值为: (3)由Excel输出的指数平滑预测值如下表: 年份 单位面积产量 指数平滑预测 误差平方 指数平滑预测 误差平方 1981 1451 1982 1372 1451.0 6241.0 1451.0 6241.0 1983 1168 1427.3 67236.5 1411.5 59292.3 1984 1232 1349.5 13808.6 1289.8 3335.1 1985 1245 1314.3 4796.5 1260.9 252.0 1986 1200 1293.5 8738.5 1252.9 2802.4 1987 1260 1265.4 29.5 1226.5 1124.3 1988 1020 1263.8 59441.0 1243.2 49833.6 1989 1095 1190.7 9151.5 1131.6 1340.8 1990 1260 1162.0 9611.0 1113.3 21518.4 1991 1215 1191.4 558.1 1186.7 803.5 1992 1281 1198.5 6812.4 1200.8 6427.7 1993 1309 1223.2 7357.6 1240.9 4635.8 1994 1296 1249.0 2213.1 1275.0 442.8 1995 1416 1263.1 23387.7 1285.5 17035.9 1996 1367 1308.9 3369.9 1350.7 264.4 1997 1479 1326.4 23297.7 1358.9 14431.3 1998 1272 1372.2 10031.0 1418.9 21589.8 1999 1469 1342.1 16101.5 1345.5 15260.3 2000 1519 1380.2 19272.1 1407.2 12491.7 合计 — — 291455.2 — 239123.0 2001年 时的预测值为: 时的预测值为: 比较误差平方可知, 更合适。 7.3 (1)第19个月的3期移动平均预测值为: (2)由Excel输出的指数平滑预测值如下表: 月份 营业额 预测 0.3 误差平方 预测 0.4 误差平方 预测 0.5 误差平方 1 295 2 283 295.0 144.0 295.0 144.0 295.0 144.0 3 322 291.4 936.4 290.2 1011.2 289.0 1089.0 4 355 300.6 2961.5 302.9 2712.3 305.5 2450.3 5 286 316.9 955.2 323.8 1425.2 330.3 1958.1 6 379 307.6 5093.1 308.7 4949.0 308.1 5023.3 7 381 329.0 2699.4 336.8 1954.5 343.6 1401.6 8 431 344.6 7459.6 354.5 5856.2 362.3 4722.3 9 424 370.5 2857.8 385.1 1514.4 396.6 748.5 10 473 386.6 7468.6 400.7 5234.4 410.3 3928.7 11 470 412.5 3305.6 429.6 1632.9 441.7 803.1 12 481 429.8 2626.2 445.8 1242.3 455.8 633.5 13 449 445.1 15.0 459.9 117.8 468.4 376.9 14 544 446.3 9547.4 455.5 7830.2 458.7 7274.8 15 601 475.6 15724.5 490.9 12120.5 501.4 9929.4 16 587 513.2 5443.2 534.9 2709.8 551.2 1283.3 17 644 535.4 11803.7 555.8 7785.2 569.1 5611.7 18 660 567.9 8473.4 591.1 4752.7 606.5 2857.5 合计 — — 87514.7 — 62992.5 — 50236 时的预测值: ,误差均方=87514.7。 时的预测值: ,误差均方=62992.5.。 时的预测值: ,误差均方=50236。 比较各误差平方可知, 更合适。 (3)根据最小二乘法,利用Excel输出的回归结果如下: 回归统计 Multiple R 0.9673 R Square 0.9356 Adjusted R Square 0.9316 标准误差 31.6628 观测值 18 方差分析   df SS MS F Significance F 回归分析 1 232982.5 232982.5 232.3944 5.99E-11 残差 16 16040.49 1002.53 总计 17 249022.9         Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 239.73203 15.57055 15.3965 5.16E-11 206.7239 272.7401 X Variable 1 21.928793 1.438474 15.24449 5.99E-11 18.87936 24.97822 。 7.4 (1)趋势图如下: (2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。经线性变换后,利用Excel输出的回归结果如下: 回归统计 Multiple R 0.998423 R Square 0.996849 Adjusted R Square 0.996674 标准误差 0.022125 观测值 20 方差分析   df SS MS F Significance F 回归分析 1 2.787616 2.787616 5694.885 5.68E-24 残差 18 0.008811 0.000489 总计 19 2.796427         Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 2.163699 0.010278 210.5269 5.55E-32 2.142106 2.185291 X Variable 1 0.064745 0.000858 75.46446 5.68E-24 0.062942 0.066547 , ; , 。所以,指数曲线方程为: 。 2001年的预测值为: 。 7.5 (1)趋势图如下: (2)从图中可以看出,纱产量具有明显的线性趋势。用Excel求得的线性趋势方程为: 2000年预测值为: =585.65(万吨)。 7.6 (1)原煤产量趋势图如下: 从趋势图可以看出,拟合二阶曲线比较合适。 (2)用Excel求得的二阶曲线趋势方程为: 2001年的预测值为: 。 7.7 (1)趋势图如下: 从趋势图可以看出,每一年的各月份数据没有趋势存在,但从1997—2001年的变化看,订单金额存在一定的线性趋势。 (2)由于是预测各月份的订单金额,因此采用移动平均法或指数平滑法比较合适。 (3)用Excel采用12项移动平均法预测的结果为: 。 用Excel采用指数平滑法( )预测的预测结果为: 。 7.8 各季节指数如下: 1季度 2季度 3季度 4季度 季节指数 0.7517 0.8513 1.2343 1.1627 季节变动图如下: 根据分离季节因素后的数据计算的趋势方程为: 。 第8章 指数 8.1 (1)销售额指数如下: 。 (2)价格综合指数如下: 。 (3)销售量综合指数如下: 。 (4)由于销售量变动使销售额增加13.45%,增加的销售额为(32900-29000)=3900元;由于价格变动使销售额增加21%,增加的销售额为(39810-32900)=10810元。 8.2 价格综合指数为: 。 销售量综合指数为: 。 与8.1的结果差异的原因是由于采用的权数的时期不同。 8.3 (1)总成本指数为: 。 (2)产量总指数为: 。 (3)单位成本总指数为: (4)由于产量变动使销售额增加11.6%,增加销售额145.7532-130.6=15.1532万元;由于价格变动使销售额增加0.1%,增加销售额0.1468万元。 8.4 (1)销售价格增长了3.77%。 (2)货币购买力指数92.593%,表明由于该地区消费价格指数上涨,使货币购买力下降了7.407%。 8.5 缩减后的GDP序列如下表: 年份 缩减后的GDP(万元) 1996 3015.1 1997 3541.8 1998 4046.9 1999 4940.0 2000 5375.5 2001 5976.9 2002 6493.5 2003 6910.2 PAGE 38 _1216102786.unknown _1216127786.unknown _1320933125.unknown _1320935449.unknown _1320935474.unknown _1320935500.unknown _1320935506.unknown _1320935508.unknown _1320
/
本文档为【统计学基础课后练习答案-贾俊平编著】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索