北京奥运会中国军团金牌数的预测
北京奥运会中国军团金牌数的预测
张海波,赵焕成
(中南财经政法大学 信息学院,武汉 430060)
摘 要:文章用Poisson回归的方法建立了奥运会主办国金牌成绩的预测模型,并根据中国军团
2004年雅 典奥运会 的金牌成绩预测 了中国军团 2008年 北京奥运会的金牌成绩。首先 用描述统计 的
方法分析了最近六届奥运会 东道主夺金情况,发现东道主具有夺金优势,并用 Wilcoxon符号秩和检
验的方法做了进一步验证 :其次利用历届奥运会主办国的金牌成绩建立了Poisson回,33模型;最后
用统计软...
北京奥运会中国军团金牌数的预测
张海波,赵焕成
(中南财经政法大学 信息学院,武汉 430060)
摘 要:文章用Poisson回归的方法建立了奥运会主办国金牌成绩的预测模型,并根据中国军团
2004年雅 典奥运会 的金牌成绩预测 了中国军团 2008年 北京奥运会的金牌成绩。首先 用描述统计 的
方法
了最近六届奥运会 东道主夺金情况,发现东道主具有夺金优势,并用 Wilcoxon符号秩和检
验的方法做了进一步验证 :其次利用历届奥运会主办国的金牌成绩建立了Poisson回,33模型;最后
用统计软件 SAS的GENMOD过程进行编程,完成了模型的计算。结果
明:中国军团 2008年北京
奥运会的预测金 牌数 ,期望 为 44块 ,预测 区间在 28~69之 间。
关键词 :Poisson回归 ;W ilcoxon符号秩和检验 ;北京奥运会预澳l;SAS软件
中图分类号 :0212 文献标识码 :A 文章编号 :1002—6487(2008)15—0076—02
中国体育代表团在第 28届雅典奥运会上以金牌 32枚,
总奖牌数 63枚的战绩,超过了悉尼奥运会的 28枚金牌和
59枚奖牌数,在奥运会上以前所未有的成绩取得了历史性
突破 2008年奥运会将在中国北京举办,中国作为东道主能
否取得好成绩成为亿万中国人民和世界人民普遍关注的问
题。把历届奥运会主办国的成绩与上一届该国成绩进行对
比,发现奥运会主办国的优势一般比较明显。因此有国内外
专家预测,2008年北京奥运会.中国代表团的金牌数有可能
超过 35枚 ,达到40枚左右,从而第一次压倒美国雄居首位[1j。
为此本文利用中国军团2004年雅典奥运会的金牌成绩来预
测中国军团2008年北京奥运会的金牌成绩,以便提前预知中
国军团在2008年北京奥运会所能获得金牌数的大致范围。
1 近 六 届 奥 运 会 东 道 主 夺 金 情 况 分 析
第 23届奥运会是奥运会历史上由衰到盛的转折点,也
是新中国走向世界的开始,从那时到现在的六届奥运会无论
是从规模、比赛项 目、参加人数,还是从它发挥的影响力等方
面来看 ,都是以往任何一届都不能与之相比的,而这几方面
均呈逐届扩大趋势,受到各国的广泛关注。我国自1984年参
加第 23届奥运会比赛,在起步就进入了体育大国。这期间虽
有一定的起伏,但多在第 4位徘徊,居第二集团军之首位。在
28届奥运会上出现良好势头 ,我国健儿英勇顽强、奋斗拼
搏,勇夺 32枚金牌,取得了排名第 2的好成绩[21。纵观最近的
几届奥运会 ,发现有一个共同点 ,即奥运会主办国凭借设项
表 1 六届 奥运会东道主夺金优势情况
1 本届情况 其它五届该国夺金情
届次 主办 金牌 夺金数 金牌 夺金数
国家 总数 n 1% 总数 %
。 。 一
23 美 国 226 83l 36.73 1102a 147 13.34
韩 国 241 12) 4 98 1358 42 3.09
25 西班牙 258 l3l 5.(J4 l34l l3 0.97
26 美 国 27l 44{16 24 l102 147 13.34
27 澳大利亚 302 16{ 5.3 l297 40 3.08
28 希腊 30l 6 1 1.99 1298 10 0.77
a美国因为六届中举办2届,所以只计算四届夺金数量。
76 统计与决策2008年第 l5期(总第 267期)
和天 时地 利 等 各
种 原因 .在获取金
牌上存在优势 。表
1分析 了最 近六
届 奥 运会 东 道 主
的 夺 金 优 势 情
况。
表 1显 示 近
六届 奥 运会 东 道
主及其在其它五
届 比赛时获得金牌情况和金牌 占总数比例(各国金牌数与奥
运会金牌总数相比1,可以看出主办国作为东道主时夺金比
例均高于不是东道 主时。如第 28届的希腊夺金 比例为
1.99%,而在其他五届奥运会 中,金牌比例只 占总数的
0.77%:而西班牙在前 五届 中总共 只得 13块金牌 ,金 牌 比例
只有 0.97%,但在第 25届中就赢得 13块金牌,金牌比例升
至 5.04%,提高数倍。由此可见,东道主凭借设项和天时地利
等各种原因.在获取金牌上占有绝对优势。
2 东 道 主 优 势 的统 计 检 验
上面用比较直观的方式说明了东道主存在优势,现在用
统计检验的方法进一 步证 实东道 主的优势 问题 。如果东道 主
存在优势的话,可以设想历届奥运会东道主所得金牌数在总
体上应该多于上一届奥运会该国的金牌数。因此可以把东道
主的金牌数与上一届的金牌数看成两个总体,然后检验这两
个总体是否相同 如果东道主金牌数总体多于上一届金牌数
总体,就可以认为东道主存在优势。检验两个总体是否相同
的常用方法是非参数检验方法 .由于这两个总体是相互对应
的,所以应该选择配对样本的Wilcoxon符号秩和检验。
Wileoxon符号秩和检验是一种常用的非参数检验方法,
其基本思想是 :如果两个总体分布的位置相同,这些配对数
据的差值应服从于以0为中心的对称分布,也就相当于把这
些差值按其绝对值大小编秩并标上原来差值的符号后,正秩
和与负秩和在理论上应该是相等的,即使有些差别,也只能
是一些随机因素造成的差别。在一定的范围内,如果差别太
大 ,就拒绝分布位置相同的假设。其检验假设是两个总体间
没有显著差异,备择假设是两个总体间有显著差异
选 取 1912~2004年夏奥会 东道 主金牌数和 上一届 的金
牌数作为样本数据 。其中 ,在 1980年的莫斯科奥运会及
1984年的洛杉矶奥运会 由于美国和苏联分别没有参加,金
牌数出现高度集中。为了防止出现它们对结果的不良影响,
决 定将 这两年 的数据剔除 。建立假设 :
H :东道主奖牌数 与上一届奖牌数没有显著差异 ,
H1:东道主奖牌数高于上一届奖牌数。
维普资讯 http://www.cqvip.com
表 2 Test Statistics(b、
东道主金牌数一上~届金牌数
Z 一3.643fa1
Asymp.Sig.(2一tailed) .000
用 统计 分 析
软 件 SPSS给 出
分析结果如下_引:
输出结果给
B 。“posit w co “ ignedRank。 出 的是 双 边 检验
的P值 ,除以2后的结果为单边检验的 P值。由于双边检验
的 P值为零,所以单边检验的 P值也为零。于是,拒绝原假
设 ,认为东道主奖牌数 明显 高于上一 届的奖牌数 。这就进一
步验证了东道主的优势问题。
3 :IV-京 奥 运 会 中 国 军 团 金 牌 数 预 测
基于上 面把东道 主奖牌数 和上一届 奖牌数看 成两个 总
体的想法,也可以把它们看成是两个变量,只不过这里的两
个变量都是计数变量。于是,便可以建立这两个变量之间的
关系 ,用上一届 的奖牌数去 预测 东道主的奖牌数 。由于 因变
量是计数变量,因此便可以用 Poisson回归的方法建立模型。
下面根据中国军团 2004年雅典奥运会的金牌成绩来预测中
国军团 20o8年北京奥运会的金牌成绩 。
3.1 建立模 型
设 定 v为东道主 当年 奥运会 的金牌 数 目.X为 东道主上
一 届奥运会的金牌数目。建立如下的Poisson回归模型:
(x)=E(ylx)=exp(a+13x)
其中 y-Poisson(h)x,d,13为未知参数 ,此为只含一个解释
变量 的简单 Poisson回归模型[41。
下面首先估计未知参数 d,13,给定样本数据{(y。,x1),i=l,2,3
⋯
,nl,此 时有 :
E(yilx●= =exp(ct+13xi)
可得似然 函数 :
n v n V1
Ⅱ exp[-Xi】=。 唧f_eXp
对上式两边分别取自然对数,得对数似然函数:
ln[L(a,p)]= {一exp(c~+13xi)+y (o~+13xi)-ln(y。!)}
分别对 d,p求偏导数,然后令它们等于零,得似然方程:
∑(yi-exp{o~+13x。}):0
= 1
∑x。(yi-exp{O~+13x }):0
= l
利用 SAS软件编程求解可得参数 d和 B的最大似然估
计&和B,同时输出结果还给出了&和6的标准误,由标准误
就可以计算 d和 B的置信区间。
在得到 d,p的最大似然估计后 ,就可以构造似然比统计
量来评价模型的拟合优度。假设:Ho:13=0,构造下面两个模型:
M1: (x)=E(ylx)=exp(c~+13x)
M2: (x)=E(yfx)=exp(d)
显然,Mz是由在 M 中令 13=o得到的。令£ 和£ 分别
表示模型M 和M 的最大似然函数值,则似然比检验统计量为:
D=(-21nL~)一(21n~t)一21n(L 12/ )
在原假设 H。成立的条件下,当样本容量足够大时.它服
从 自由度为 1的 x 分布。当d较大时,会倾向于拒绝原假
设 ,认为回归参数 p显著,模型拟合较好;相反当 D较小时,
认 为模 型拟合很差日。
3_2 模 型求解
在上面分析的基础上,利用 SAS软件的GENMOD过程
表 3 Analysis Of Parameter Estimates
Standard Waid 95% Confidence Chi-
P~ameter DF Estimate Error Limits ~Ouare Pr>ChiSq
【ntereept 1 3.3274 O.O516 3.2263 3.4285 4162.57 <.oo01
1 0.0152 O.oo1O 0.0133 0.0171 237.23 <.oo01
Scale O 1.0000 O.0000 1.0000 1_0000
NOTE:The scale parameter was held fixed
编 写 相 应 程 序 得
主要分析结果如
下问:
3-3 结果分析
由表 3参 数
Chi-
ouree Devianee DF 5quare Pr> ChiSq
Intercept 386.3208
191.7850 1 194.54 <.0001
估计结果可知 :d=2.3581,13=o.
0450fsd=0100451,且置信水 平
为 95%的置信 区间分别为f2.
1996,2.5166] 和 f0.0361,0.
0538]。于是有 13>0,同样可以
说明东道主有优势。另外参数
的显著 性检验 的 P值 O'r>
ChiSq列1较 小 .表 明上一 届 的
图 1 东道主金牌 数与上一 届金
牌数的散点图(圆点为拟合数目)
金牌数对东道主的奖牌数的解释能力是显著的,表 4的检验
统计量说明了同样的结果。图 1形象地描述了模型对数据的
拟合情况 ,从总体来看,模型较好地反映了数据的变化趋势,
为下面的预测奠定了一个较好的基础。
3.4 预 测
综合上 面的分析 .得到模型的回归方程为 :
(x)=E(ylx)=exp{2.3581+0.0450x}
对于给定的上一届金牌数X ,东道主金牌数的预测值为:
yo=E(yolxo)=exp{2.3581+0.0450x0}
置信水平为95%的预测区间为:
[exp{2.1996+0.0361~},exp{2.5166+0.0538x0}]
中国 2004年得金牌 32块 ,按照 2004年前的规律 ,2008年
作为东道主期望得到exp(2.358140.0450*32)=44块,置信水平为
95%的预测区间为 8.691。
4 结 语
奥运会作为世界的一大赛事 ,影响各国成绩的因素是多
种多样的。本文从东道主优势这个角度建立了一个简单的预
测模型,避免了用传统 回归需要选择对奥运成绩有显著影响
的因素的麻烦,使预测变得 比较简单。由于东道主优势的存
在 ,可以预测中 国军 团 2008年 北京 奥运会所获金牌数 的平
均水平可能远远超过 44块
参考文献:
[1]吴金章.q-国奥运军团对 2008年北京奥运的展望『J].哈尔滨体
育学院学报,2005,23 fO5).
[2W 运龙.23~27届奥运会奖牌走向趋势和项目分布特征研究m.解
放军体育学院学报,2001,20f011.
[3】薛薇.统计分析与SPSS的应用[M].北京:q-国人民大学出版社,2001.
1 4I郭志刚,巫锡炜.泊松回归在生育率研究q-的应用lJJ.中国人口科
学,2006,(O4).
[5]王济川,郭志刚.Logistic回归模型——方法与应用[M].北京:高
等教育 出版社 .2001.
[6]孟小平.Poisson回归模型的 SASGENMOD实现方法lJJ.山西医
科大学学报,2000,fO51.
(责任编辑/亦 民)
统计与决策2008年第 15期(总第 267期) 77
维普资讯 http://www.cqvip.com
本文档为【北京奥运会中国军团金牌数的预测】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。