2010-2011学年第一学期《统计学》期复习资料
一、单项选择
1.下列属于品质标志的有( B )。
A.工龄 B.健康状况 C.工资级别 D.劳动生产率
2.标志是说明( A )。
A.总体单位的特征的名称 B.总体单位量的特征的名称
C.总体质的特征的名称 D.总体量的特征的名称
4.调查某乡镇工业企业职工工资情况,则调查对象是( B )。
A.该乡镇全部工业企业 B.该乡镇全部工业企业的职工
C.该乡镇全部工业企业的职工的工资 D.该乡镇工业企业每一名职工的工资
5.对某地区三家不同部门进行某项改革的企业进行调查,以了解某近阶段生产情况和存在问题,以便为今后的普遍推广积累经验,这种调查是( C )
A.普查 B.重点调查 C.典型调查 D.抽样调查
6.按连续型变量分组,第一组为75以下,第二组为75~85,第三组为85~95,第四组为95以上,则数据( A )
A.75在第一组 B.85在第二组 C.85在第三组 D.95在第四组
7.按连续型变量分组,其末组为开口组,下限为2000。已知相邻组的组中值为1750,则末组组中值为( C )
A.2100 B.2200 C.2250 D.2500
第一步:
一般情况下,组中值=(上限+下限)/2
已知相邻组组中值为975,相邻组的上限即为末组的下限1000,即975=(1000+下限)/2
由该公式得到下限=950
所以,相邻组组距=1000-950=50
第二步:
计算开口组的组中值时,只有下限而无上限,则
组中值=下限+相邻组组距/2=1000+50/2=1025
8.在全国医院总体中,医院数(a)、医院医生人数(b)和病床张数(c)三个指标( )
A.都是总体单位总量 B.a是总体安慰总量,b、c是总体标志总量
C.都是总体标志总量 D.b是总体安慰总量,a、c是总体标志总量
9.某商店
规定本年费用水平比去年下降4%,实际下降了6%,则该商店费用水平计划完成程度是( A )
A.97.9% B.101.9% C.102.1% D.150%
10.不能全面反映总体各单位标志值变异程度的标志变异指标是( )
A.平均差 B.
差系数 C.标准差 D.全距
11.要了解某市工业企业生产设备情况,则统计总体是( )。
A.该市全部工业企业 B.该市每一个工业企业
C.该市工业企业的某一台设备 D.该市所有工业企业的全部生产设备
12.下列情况属于离散变量的是( C )。
A.营业额 B.工龄 C.工厂数 D.职工年收入
13.调查问卷中,开放式问题一般应该排在问题的( C )。
A.开头 B.中间 C.最后 D.都可以
14.标准差指标数值越小,则反映变量值( B )
A.越分散,平均数代表性越低 B.越集中,平均数代表性越高
C.越分散,平均数代表性越高 D.越集中,平均数代表性越低
15.某人的技术职称为工程师,“讲师”属于哪一统计学范畴( )。
A.标志 B.品质标志 C.标志表现 D.质量指标
16.调和平均数( )
A.是标志值的算术平均数 B.是算术平均数的倒数 C.不存在权数
D.其指标内容与算术平均数一致,也是总体标志总量与总体单位总量之比
16.反映抽样指标与总体指标之间抽样误差可能范围的指标是( )
A.抽样平均误差 B.抽样误差系数 C.抽样极限误差 D.概率度
17.简单随机重复抽样条件下,抽样单位数增加3倍,则抽样平均误差是原来的( B )
A.三分之一 B.二分之一 C.三倍 D.二倍
18.连续性生产产品的企业,按每隔5小时抽取10分钟的产品,作全部检验,并据此推断该企业全部产品的质量情况,这种组织形式属于( )
A.简单随机抽样 B.等距抽样 C.类型抽样 D.整群抽样
19.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( A )
A.函数关系 B.相关关系 C.随即关系 D.回归关系
20.两个变量之间的变化方向相反,一个上升而另一个下降,或者一个下降而另一个上升,这是( C )
A.完全相关 B.正相关 C.负相关 D.不完全相关
21.每一吨铸铁成本(元)依铸件废品率(%)变动的回归方程为
,这意味着( B )。
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8元
C.废品率每增加1%,成本每吨增加8%
D.如果废品率每增加1%,则每吨成本增加为56元
22.已知2001年某地区粮食产量的环比发展速度为105%,2002年为103.5%,2004年为104%,又知2004年的定基发展速度为116.4%,则2003年环比发展速度为( D )
A.105.2% B.109.2% C.102.4% D.103%
23.公式
的经济意义是( D )B
A.综合反映销售额变动的绝对额 B.反映价格变动而使消费者少付(多付)的金额
C.反映价格变动的绝对额 D.反映销售量变化引起的销售额变化的绝对额
24.以下哪一个指数是总指数:(甲)某地区零售商业商品销售额2003年与2002年对比为125%;(乙)某地区生产某种产品的产量2003年与2002年对比为115%。( )
A.甲是总指数 B.乙是总指数 C.两者均是 D.两者均不是
25.某市工业企业2009年生产经营成果年报呈报时间规定在2010年1月15日前,则调
查时限为( B )。
A.一日
B.十五天
C.一年
D.一年零十五天
26.抽样调查与重点调查的主要区别是(
D
)。
A.作用不同
B.组织方式不同
C.灵活程度不同 D.选取调查单位的
不同
26.某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,中位数为( C )
A.100 B.110 C.120 D.128
27.人均收入、人口密度、平均寿命、人口净增数,这四个指标中属于数量指标的有(A )。
A.1个 B.2个 C.3个 D.4个
28.下列资料中属于时点数列的有( )。
A.我国历年石油产量 B.我国历年出生人口数
C.某企业历年流通费用率 D.我国历年人口数
29.下列等式中,不正确的是( C )
A.发展速度=增长速度+1
B.定基发展速度=相应各环比发展速度的连乘积
C.定基增长速度=相应各环比增长速度的连乘积
D.平均增长速度=平均发展速度-1
30.若统计学成绩以百分制来计量,对某班学生期末经济学考试成绩进行分组,你认为应该进行( )分组。
A.单项式 B.组距式 C.品质标志 D.复合分组
31.某地有几万亩稻田,根据上年资料得知其中平均亩产的标准差为100公斤,若以95.45%的概率保证平均亩产的误差不超过10公斤,应抽选( )亩地作为样本进行抽样调查。(已知
,
,
)
A.100 B.250 C.400 D.1000
32.在进行职工收人水平问题的抽样调查中,有意把收入水平低的职工不算在内,这种作法必然导致( )。
A.登记性误差 B.系统性误差 C.随机性误差 D.工作误差
33.若对无锡苏宁电器去年空调的销售状况按照季度形成时间数列,会发现四个季度之间的销售量会有明显差异,你认为引起这个差异的因素是( B )。
A.长期趋势 B.季节变动 C.循环变动 D.不规则变动
34.一般来说,指标数值随研究范围的大小而增减的综合指标是( D )。
A、相对指标 B、质量指标 C、平均指标 D、总量指标
35.下列指标属于比例相对指标的是( B )
A、工人出勤率 B、一二三产业的产值的比例关系
C、每百元产值利税额 D、净产值占总产值的比重
36.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为( C )
A、 600元 B、 533.33元 C 、466.67元 D、 500元
37.当可靠度大于0.6827时,抽样极限误差( A )
A、大于抽样平均误差 B、小于平均误差
C、等于抽样平均误差 D、与抽样平均误差的大小关系依
38、在全国人口普查中(
)。
A、男性是品质标志
B、人的年龄是变量
C、人口的平均寿命是数量标志 D、全国人口是统计指标
39、下列调查中,调查单位与填报单位一致的是( )
A、企业设备调查
B、人口普查C、农村耕地调查
D、工业企业现状调查
40、抽样调查与重点调查的主要区别是(
)。
A、作用不同
B、组织方式不同
C、灵活程度不同
D、选取调查单位的方法不同
41.某班每个学生的平均年龄为22岁,这里的22岁为( D )。
A.指标 B.品质标志 C.变量 D.数量标志
42.一次性调查是( C )。
A.只调查一次,以后不再进行调查
B.只进行过一次的调查
C.间隔一定时间进行一次的调查
D.只隔一年就进行一次的调查
43.重点调查中的重点单位是( C )。
A.在我国经济中占主导地位的单位
B.被国家列为发展重点的单位
C.单位数较少但标志值占总体标志总值绝大比重的单位
D.单位数在总体中占绝大比重的单位
44.国有工业企业设备普查时,每个工业企业是( B )。
A.调查单位 B.填报单位
C.既是调查单位又是填报单位
D.既不是调查单位又不是填报单位
45.统计分组的关键是( C )。
A.确定组数和组距
B.抓住事物本质
C.选择分组标志和划分各级界限
D.统计表的形式
46.统计整理阶段最关键的问题是( B )。
A.对调查资料的审核 B.统计分组
C.统计汇总 D.编制统计表
47.某管理局对所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( C )。
A.80-89% B. 80% 以下
90-99% 80.1-90%
100-109% 90.1-100%
110%以上 100.1-110%
C.90% 以下 D.85% 以下
90-100% 85-95%
100-110% 95-105%
110%以上 105-115%
48.我国 2008年人均钢产量为150吨,该指标是( D )。
A.结构相对指标 B.比较相对指标
C.动态相对指标 D.强度相对指标
6.加权算术平均数( )。
A.只受各组标志值影响 B.只受各组次数影响
C.同时受A和B两种因素影响 D.无法确定
49.由相对数(或平均数)计算平均数时,如果掌握的资料是相对数(或平均数)的子项,则计算方法是( B )。
A.加权算术平均法 B.加权调和平均法
C.几何平均法 D.简单算术平均法
50.甲乙两班统计学考试的平均分数和标准差分别为:甲班平均分数为85分,σ为10分;乙班平均分数为72分,σ为9分,则( C )。
A.平均成绩代表性甲班高于乙班
B.两班平均成绩代表性相同
C.平均成绩代表性乙班高于甲班
D.无法确定
51.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( D )。
A.原来的2倍 B.原来的4倍
C.原来的1/2倍 D.原来的1/4倍
52.计算不重复抽样的平均误差可采用重复抽样公式的条件是( C )。
A.总体容量大 B.样本容量大
C.样本单位数占总体单位数比重很小
D.样本单位数占总体单位数比重很大
53.当所有观察值都落在回归直线yc=a+bx上时,x与y的相关系数( B )。
A.r=0 B.r=1或r=-1
C.-1<r<1 D.0<r<1
54.指数划分为个体指数和总指数的标准是( D )。
A.同度量因素是否相同 B.指数化标准是否相同
C.计算是否加权 D.包括范围是否相同
55.同度量因素的使用时期必须是( D )。
A.基期 B.报告期 C.计划期 D.同一时期
56.某厂报告期与基期相比,产量增长9%,单位产品成本下降9%,则总成本报告期与基期相比( C )。
A.不变 B.增加 C.减少 D.无法确定
57.数量指标综合指数(∑q1p0/∑q0p0)变形为加权算术平均数指数时的权数是( B )。
A.q1p1 B.q0p0
C.q1p0 D.q0p1
58.下列指数中,属于质量指标指数的是( A )。
A.产量指数 B.生产工时指数
C.单位产品工时指数 D.销售额指数
59.公式ΣP0Q1-ΣP0Q0的经济意义是( B )。
A.综合反映销售额变动的绝对额
B.反映销售量变化引起的销售额变化的绝对额
C.反映价格变动的绝对额
D.反映价格变动而使消费者少付(多付)的金额
60.采用不同时期的同度量因素所计算的指数,其结果是( A )。
A.不同的 B.相同的 C.不确定的 D.以上都不对
61.指数是表明现象变动的( B )。
A.绝对数 B.相对数
C.平均数 D.抽样数
62.编制数量指标综合指数的一般原则是采用( C )作同度量因素。
A.基期数量指标 B.报告期数量指标
C.基期质量指标 D.报告期质量指标
63.如果某企业利润额各年环比发展速度不变,则各年的环比增长速度是( B )。
A.年年增长 B.年年不变
C.年年递减 D.无法确定
64.环比发展速度和定基发展速度的关系是( B )。
A.前者是后者的连乘积 B.后者是前者的连乘积
C.后者是前者的商 D.二者之差是一个常数
65.关于平均增长速度说法正确的是( C )。
A.平均增长速度等于环比增长速度的几何平均数
B.平均增长速度等于环比增长速度的算术平均数
C.平均增长速度等于平均发展速度-1
D.平均增长速度等于环比发展速度的几何平均数
66.存款平均余额=期每日存款余额之和/报告期日历日数,该指标是B( )。
A.算术平均数 B.序时平均数
C.强度相对数 D.结构相对数
67.某种产品产量2005年比2004年增长了10%,2006年比2004年增长了15%,2006年与2005年相比增长了( D )
A.15%÷10% B.115%÷110%
C.(115%×110%)-1 D.(115%÷110%)-1
68.如果某现象各年的函期增长量相等,则该现象这段期间内的环比增长速度( A )
A.逐年下降
B.逐年提高
C.保持不变
D.无法作结论
69.已知一个数列的环比增长速度分别为3%、5%、8%,则该数列的定基增长速度为( D )
A.3%×5%×8% B.103%×105%×108%
C.3%×5%×8%+1 D.103%×105%×108%-1
70.要了解全国民营企业职工工资情况,则统计总体是( A )。
A.民营企业的全部职工 B.全部民营企业
C.每一个民营企业 D.民营企业中每个职工
71.在动态分析中,将所研究的那一时期的指标数值称为( C )。
A.最初水平
B.最末水平
C.报告期水平
D.基期水平
72.研究农民生活状况。“农民的纯收入”是(A)。
A.连续变量
B.离散变量
C.随机变量
D.不确定变量
73.假设计划任务数是五年计划中规定最后一年应达到的水平,计算计划完成程度相对指标可采用(B)。
A.累计法
B.水平法
C.简单平均法
D.加权平均法
74.历年的物资库存额动态数列是(B)。
A.时期数列
B.时点数列
C.平均数动态数列
D.相对数动态数列
75.我国第六次人口普查的登记时间是(D)。
A.2010年12月31日零时
B.2010月12月31日12时
C.2010年11月1日12时
D.2010年11月1日零时
76.公式:
称为()。
A.拉氏数量指标指数公式
B.派氏数量指标指数公式
C.拉氏质量指标指数公式
D.派氏质量指标指数公式
77.居民用多于基期15.5%的货币额只能购买多于基期5%的商品量,因为物价(C)。
A.上涨3.1%
B.上涨10.5%
C.上涨10%
D.下降10.5%
78.标准差系数抽象化了(C)。
A.总体指标数值多少的影响
B.总体单位数多少的影响
C.标志变异程度的影响
D.平均数大小的影响
79.典型调查的“典型单位”是(D)。
A.工作搞得很好的单位
B.工作中出现问题最多的单位
C.具有举足轻重地位的单位
D.具有代表性的少数单位
80.在医院总体中,医院所数(A)、医院职工人数(B)和病床张数(C)三个指标(B)。
A.都是总体单位总量
B.A是总体单位总量,B、C是总体标志总量
C.都是总体标志总量
D.B是总体单位总量,A、C是总体标志总量
二、计算题
1.某厂三个车间一季度生产情况如下:
车间
计划完成百分比
实际产量
单位产品成本
第一车间
第二车间
第三车间
90%
105%
110%
198
315
220
15
10
8
根据以上资料计算:(1)一季度三个车间产量平均计划完成百分比。
(2)一季度三个车间平均单位产品成本。
2.某企业各年的产量资料如下:(10分)
年份(年)
2000
2001
2002
2003
产量(吨)
60
70
78
90
试计算:(1)各逐期增长量和年平均增长量:
(2)产量的年平均增长速度(要写出计算过程)。
3.某单位职工人数和工资总额资料如表:
指标
符号
2005年
2006年
工资总额(万元)
职工人数(人)
平均工资(元/人)
E
a
b
500
1000
5000
567
1050
5400
要求:对该单位工资总额变动进行因素分析。
4.有甲乙两个生产小组,甲组平均每个工人的日产量为30件,标准差为9件。乙
组工人日产量资料如下:
日产件数
工人数(人)
10-20
20-30
30-40
40-50
15
38
34
13
要求:(1)计算乙组平均每个工人的日产量和标准差。
(2)比较甲、乙两生产小组哪个组的日产量差异程度大?
5.某超市三种主要商品的销售额及销售量变动资料如下:
商品名称
销售额(千元)
销售量
减少%
一月
二月
甲
乙
丙
4
5
1
6
8
2
25
80
50
试对该超市三种商品的销售额进行因素分析。
6.对某型号的电子元件进行耐用性抽查,样本资料如下表,耐用时数的误差范围
小时,试估计该批电子元件的平均耐用时数。(已知
,
,
)
耐用时数(小时)
组中值(小时)
元件数(个)
900以下
875
1
900~950
925
2
950~1000
975
6
1000~1050
1025
35
1050~1100
1075
43
1100~1150
1125
9
1150~1200
1175
3
1200以上
1225
1
合计
100
7.根据某企业产品销售额(万元)和销售利润率(%)资料得如下数据:n=7,
,
,
,
,
,要求根据这些数据:
(1)确定以利润率为因变量的直线回归方程;
(2)解释式中回归系数的经济含义;
(3)当销售额为500万元时,利润率为多少?
8.某工厂某年职工人数资料如下:
时间
上年末
2月初
5月初
8月初
10月初
12月末
职工人数
354
387
339
362
383
360
试计算该年月平均人数。(结果保留两位小数。)
9.某工厂有2000个工人,用简单随机不重复方法抽出100个工人作为样本,计算出平均工资560元,标准差32.45元。
要求:(1)计算抽样平均误差;
(2)以95.45%可可靠性估计该厂工人的月平均工资区间。
10.某地区国内生产总值资料如下:
2007年
2006年实际完成
(亿元)
2007年比2006年
增长(%)
实际完成(亿元)
比重(%)
国内生产总值
550
(3)
(6)
10
其中:第一产业
(1)
18.18
100
〔8〕
第二产业
180
(4)
150
(9)
第三产业
(2)
(5)
(7)
8
填写表中空格数字。(请写出计算过程)
11.某工业公司12个企业计划完成程度分组资料如下
按产值计划完成分组%
组中值%
企业数
实际产值(万元)
90~100
95
2
1200
100~110
105
7
12800
110~120
115
3
2000
试计算该公司平均计划完成程度指标。
12.2010年某月份甲乙两市场某产品价格及成交量、成交额资料如下:
品种
价格(元/斤)
甲市场成交额(万元)
乙市场成效量(万斤)
甲
1.2
1.2
2
乙
1.4
2.8
1
丙
1.5
1.5
1
合计
-
5.5
4
试问该产品哪一个市场的平均价格高,并说明原因。
13.某厂为检查产品(药品)瓶装的数量,随机抽检1000瓶,结果平均每瓶101片,标准差为3片,试以99.73%的把握程度推断该种药平均每瓶数量的置信区间。若允许误差为原来的1/2,其他条件不变,问至少应抽取多少瓶?
14.某企业三种产品的资料如下:
产 品 名 称
总生产成本(万元)
基期与报告期相比单位成本提高%
基 期
报 告 期
甲
15
18
10
乙
20
20
5
丙
16
160
3
试计算(1)总成本指数及总成本增加绝对值
(2)三种产品的单位成本总指数及由于单位成本变动而增加的总成本。
14.某公司2004—2009年销售利润(按可比价格计算)如下表:
单位:万元
年份
2004
2005
2006
2007
2008
2009
销售利润
500
650
1000
1100
1200
1400
试根据上述资料计算:
(1)逐期增长量和累计增长量、平均增长量。
(2)环比发展速度、定基发展速度和平均发展速度。
(3)环比增长速度、定基增长速度和平均增长速度。
(4)年平均销售利润。
15.某地高校教育经费(x)与高校学生人数(y)连续六年的统计资料如表:
教育经费
(万元)
316
343
373
393
418
455
在校学生数
(万人)
11
16
18
20
22
25
要求:(1)建立回归直线方程;
(2)估计教育经费为500万元的在校学生数。
三、综合应用题
1.某车间50名工人的资料如下:车工24人(其中女4人),钳工23人(其中女6人),杂工3人(其中女2人)。根据以上资料按工种、性别对工人进行复合分组并编制统计表。
2.某房地产公司为了解消费者对当前房地产市场的看法,想通过调查了解消费者购房的次数、价格、用途、面积大小、付款方式及以后房价的走势、面积大小等等。
(1)你认为这项调查采取什么方式比较合适?
(2)请设计一张调查问卷表。
3.2007年,我国GDP一季度增长11.1%,二季度增长11.9%,三季度增长11.5%,四季度增长11.2%。分产业看,第一产业增加值28910亿元,增长3.7%,回落1.3个百分点;第二产业增加值121381亿元,增长13.4%,加快0.4个百分点;第三产业增加值96328亿元,增长11.4%,加快0.6个百分点。
(1)根据上列资料编制一个2007年我国GDP在四个季度的动态数列,说明它们是什么类型的数列。(至少两组)
(2)请计算我国在2007年GDP的平均增长率。(用水平法计算)
4.无锡科技职业学院为了评估本院的办学水平,想通过调查比较无锡地区不同高职院校培养的毕业生收社会的欢迎程度,你认为应通过什么调查方法?获得哪些哪些统计指标?采用什么统计分析方法?
一、单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.下列哪个不属于一元回归中的基本假定( D )。
A.对于所有的X,误差项的方差都相同
B.误差项 服从正态分布
C.误差项 相互独立
D.
2.某组数据分布的偏度系数为负时,该数据的众数、中位数、均值的大小关系是( A )。
A.众数>中位数>均值
B.均值>中位数>众数
C.中位数>众数>均值
D.中位数>均值>众数
3.一元回归方程为y=11.64一0.25x,则下列说法中正确的是( C )。
A.自变量平均增长一个单位,因变量减少0.25个单位
B.自变量和因变量之间成正相关关系
C.
D.
4.有甲乙两组数列,则( A )数列平均数的代表性高。
A. 1< 2 1> 2,则乙数列平均数的代表性高
B. 1< 2 1> 2,则乙数列平均数的代表性低
C. 1= 2 1> 2,则甲数列平均数的代表性高
D. 1= 2 1< 2,则甲数列平均数的代表性低
5.某连续变量数列,其末组为开口组,下限为500,相邻组的组中值为480,则末组的组中值为( A )。
A.520 B.510 C.500 D.540
6.不受极端变量值影响的平均数是( D )。
A.算术平均数 B.调和平均数
C.几何平均数 D.众数
7.有20个工人看管机器台数资料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上资料编制频数分布数列应采用( A )。
A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
8.若无季节变动,则季节比率应为( B )。
A.0 B. 1 C. 大于1 D. 小于1
9.如果一个定性的变量有m类,则要引进( C )个虚拟变量。
A.m B.m+1
C.m-1 D.无法判断
10.第一组工人的平均工龄为5年,第二组为7年,第三组为10年,第一组工人数占总数的20%,第二组占60%,则三组工人的平均工龄为( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企业2007年各种产品的产量比2006年增长了8%,总生产费用增长了12%,则该厂2007年单位成本( D )
A.减少了0.62% B.增加了0.62%
C.减少了3.7% D.增加了3.7%
12.相关系数r与斜率b2的符号( A )。
A.相同 B.不同
C.无法判断
13.已知小姜买的两种股票的综合价格指数上涨了24点,本日股票的平均收盘价格为14元,前日股票的平均收盘价格为( C )
A.10.64 B.10.5
C.11.29 D.无法计算
14.若今年比去年的环比发展速度为112%,去年比前年的环比增长率为3%,那么今年比前年的平均增长率为( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增长1%的绝对值为0.54,去年比前年增长的绝对值为5,则去年比前年的增长率为( C )。
A.9.3% B.8.7%
C.10.2% D.无法计算
二、多项选择题(每小题2分,共16分)
在每小题列出的若干选项中有多个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.下列变量,属于离散变量的有( A D E F )。
A.库存产品数量 B.流动资产对流动负债的比率
C.货物总重量 D.按个计量的货物数量
E.一条收费公路上的交通量 F.公司年会的出席人数
2.指出下列数据收集属于通过实验的方法收集数据的有(A B E )
A.培训航空机票代理人的新方法与传统方法的比较结果
B.通过让两组可以比较的孩子分别使用两种不同的组装说明组装玩具来比较这两种组装说明
C.一份产品评价杂志给它的订阅者邮寄调查问卷,请他们为近期购买的产品排名
D.采访一个购物中心的顾客,询问他们为什么在那里购物
E.通过在两个可比较地区分别采用不同的方法,比较两种不同的养老金促销方法
3.下列组限的表示方法哪些是对的( A B D )。
A.按职工人数分组,相邻组的组限可以重叠,也可以间断
B.职工按工资分组,其组限必须重叠
C.学生按成绩分组,其组限必须间断
D.人按身高分组,其组限必须重叠
4.下列属于质量指标指数的有( A B D E )。
A.价格指数 B.单位成本指数
C.销售量指数 D.工资水平指数
E.劳动生产率指数
5.具体地说,如果出现下列( A B C )情况,暗示多元回归模型有可能存在多重共线性。
A.模型中各对自变量之间显著相关
B.线形关系显著,回归系数 的t检验却不显著
C.回归系数的正负号与预期相反
D.
6.算术平均数具有下列哪些性质( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在频数分布数列中( C D E )。
A.总次数一定,频数和频率成反比 B.各组的频数之和等于100
C.各组频率大于0,频率之和等于1 D.频率越小,则该组数值所起作用越小
E.频率表明各组变量值对总体的相对作用程度
8.标准差( C E )。
A.表明总体单位标志值的一般水平 B.反映总体单位的一般水平
C.反映总体单位标志值的离散程度 D.反映总体分布的集中趋势
E.反映总体分布的离中趋势
三、简答题(本大题共2题,每题5分,共10分)
1.什么是年度化增长率?它有何用途?
2.数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。( 错 )
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。( 错 )
3.连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。( 对 )
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。( 对 )
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。( 错 )
四、计算分析题(共54分)
1.将某邮局中外发邮包样本的重量近似到盎司为:21,18,30,12,14,17,28,10,16,25。计算这组数据的均值,中位数,众数,极差,四分位间距,从偏斜度的角度描述数据的分布形状(10分)。
2.表1中列出了在一个为期三周的商务统计课程中学生课外学习的小时数和他们在课程结束时的测试分数的样本数据如下:
表1 学生课外学习时间及考试分数统计表
学生样本 1 2 3 4 5 6 7 8
学习时间,X 20 16 34 23 27 32 18 22
考试分数,Y 64 61 84 70 88 92 72 77
利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
标准误差 6.157605
观测值 8
方差分析
df SS MS F Significance F
回归分析 1 658.5034 658.5034 17.36738233 0.005895457
残差 6 227.4966 37.9161
总计 7 886
Coefficients 标准误差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析并回答下列问题:
(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的? 86.21% 74.32%
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(3) 检验线性关系的显著性 。
(4) 根据标准化残差图判断关于随机误差项正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立
3.随机抽取了15家大型商场销售的同类产品的有关数据(单位:元),利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
标准误差 69.75121
观测值 15
方差分析
df SS MS F Significance F
回归分析 2 31778.15 15889.08 3.265842 0.073722186
残差 12 58382.78 4865.232
总计 14 90160.93
Coefficients 标准误差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相关系数矩阵
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
注:X Variable 1为购进价格/元
X Variable 2为销售费用/元
因变量Y为销售价格/元
(1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系? 0.3089 0.0012 没有,因为相关系数较小
(2)根据上诉结果,你认为用购进价格与销售费用来预测是否有用?没用
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。不显著
(4)解释判定系数R2,所得结论与问题(2)中是否一致? R2=35.25% , 在销售价价格的总变差中,被估计的回归方程所解释的比例是35.25%,一致。(+3)
(5)X1与X2之间的相关系数是什么?意味着什么?高度相关
(6)模型中是否存在多重共线性?你对模型有何特长建议?可能存在多重共线性;进一步检验是否存在多重共线性,对X1与X2的样本相关系数进行显著性检验(rx1x2=-0.8529),如果是显著,即可确定为存在多重共线性。(+2)
对模型有何特长建议:根据研究目的,删掉相对次要的解释变量。(+1)
4.一公司生产的三种产品的有关如下数据如下表所示 (共14分):
商品 计量单位 销售量 单价(万元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 吨 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)计算三种产品的销售额指数;
(2)计算三种产品的销售量指数;
(3)计算三种产品的单位价格指数;
(4)计算分析产量和单位价格的变动对销售额影响的相对数和绝对数。
北京信息科技大学
2007 ~2008学年第一学期
《统计学》课程期末考试试卷标准答案(A卷)
一、 单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多项选择题(每小题2分,共16分)
在每小题列出的五个选项中有二至五个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 简答题(本大题共2题,每题5分,共10分)
1. 什么是年度化增长率?它有何用途?
(1)增长率以年来表示时,称为年度化增长率或年率,(+2)
其计算公式为:
m 为一年中的时期个数;n 为所跨的时期总数
季度增长率被年度化时,m =4
月增长率被年度化时,m =12
当m = n 时,上述公式就是年增长率 (+2)
(2)可将月度增长率或季度增长率转换为年度增长率,实现增长率之间的可比性。(+1)
2. 数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。(×)
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。(×)
3.连续型变和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(√)
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。(√)
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。(×)
五、计算分析题(共55分)
中位数的位置:(10+1)/2=5.5
中位数
从偏斜度的角度描述数据的分布形状:均值>中位数,正向(右)偏
(+2)
2.(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的?
r=0.862109, (+1)
R2=0.743232, 考试分数的变差中有74.3232%是由于学习时间的变动引起的。(+2)
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(+3)
回归系数的含义表明学习时间每增加一个小时, 考试分数平均增加1.497分。(+2)
(3) 检验线形关系的显著性
Significance F=0.005895457〈 =5%
线性关系显著。(+3)
(4) 根据标准化残差图判断关于随机误差项服从正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立。(+4)
3. (1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系
(1)ryxi =0.308952067 ryx2=0.001214062,
没有证据。(+2)
(2)根据上述结果,你认为用购进价格与销售费用来预测是否有用?
没有用。(+2)
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。
Significance F=0.073722> =5%
线性关系不显著。(+3)
(4)解释判定系数R2,所得结论与问题(2)中是否一致
R2=35.25% , 在销售价价格