为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

第三章 平均数、标准差与变异系数

2011-10-12 8页 doc 482KB 65阅读

用户头像

is_059051

暂无简介

举报
第三章 平均数、标准差与变异系数第3章​ 平均数、标准差与变异系数 第一节 平均数 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。并且可以作为代表与同类资料比较,平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean) 一、算术平均数 资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 样本含量n≤30以下、未经分组资...
第三章  平均数、标准差与变异系数
第3章​ 平均数、差与变异系数 第一节 平均数 平均数是统计学中最常用的统计量,用来明资料中各观测值相对集中较多的中心位置。并且可以作为代表与同类资料比较,平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean) 一、算术平均数 资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 样本含量n≤30以下、未经分组资料平均数的计算。 设某一资料包含n个观测值: x1、x2、…、xn, (3-1) 【例3.1】 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。 由于 Σx=500+520+535+560+58 +600+480+510+505+49 =5285, n=10 得: (二)加权法 对于样本含量 n≥30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数: (3-2) 式中: xi —第i组的组中值; fi —第i组的次数; k —分组数 第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得名。 【例3.2】 将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。 表3—1 100头长白母猪仔猪一月窝重次数分布表 利用(3—2)式得: 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。 【例3.3】 某牛群有黑白花奶牛 1500头,其平均体重为750 kg ,而另一牛群有黑白花奶牛1200头,平均体重为725 kg,如果将这两个牛群混合在一起,其混合后平均体重为多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即 (三)平均数的基本性质 1、离均差之和等于零。 证明。 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 (xi- )2 < (xi- a)2 (常数a≠ ) 或简写为: < 证明: = = +na2 > 对于总体,用μ表示总体平均数,有限总体的平均数为: (3-3) 式中,N表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数( )作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。 二、中位数 将所有观测值从小到大依次排列,位于中间的观测值,称为中位数,记为Md。 当观测值的个数是偶数时,以中间两个观测值的平均数作为中位数。 当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。 中位数的计算方法因资料是否分组而有所不同。 (一)未分组资料中位数的计算方法 1、当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数 2、当观测值个数为 偶 数 时 ,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即: 【例3.4】 观察得9只西农莎能奶山羊的妊娠天数为 144 、 145、 147、 149、150、151、153、156、157,求其中位数。 此例 n=9,为奇数,则: Md=x5= 150(天) 【例3.5】 某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。 此例n=10,为偶数,则: (天) 即10只仔犬从发现症状到死亡天数的中位数为11.5天。 (二)已分组资料中位数的计算方法 若资料已分组,可利用次数分布表来计算中位数,其计算公式为: (3—5) 式中:L — 中位数所在组的下限; i — 组距; f — 中位数所在组的次数; n — 总次数; c — 小于中数所在组的累加次数。 【例3.6】​ 某奶牛场68头健康母牛从分娩到第一次发情间隔时间 整理成次数分布表如表 3—2 所示,求中位数。 表3—2 68头母牛从分娩到第一次发情间隔时间次数分布表 由表3—2可见:i=15,n=68,因而中位数只能在累加头数为36所对应的“57—71”这一组,于是可确定L=57,f=20,c=16,代入公式(3—5)得: (天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。 三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为G。 它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽 、水产养殖的 增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下: (3-6) 为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即 (3-7) 【例3.7】 某波尔山羊群1997—2000年各年度的存栏数见表3—3,试求其年平均增长率。 表3—3 某波尔山羊群各年度存栏数与增长率 利用(3—7)式求年平均增长率 G= =lg-1[1/3(-0.368-0.398–0.602)] =lg-1(-0.456)=0.3501 即年平均增长率为0.3501或35.01%。 四、众 数 资料中出现次数最多的观测值或次数最多一组的组中值,称为众数,记为M0。 如表2-3 所列 的 50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数为22天。 又如 【例3.6】 所列出的次数分布表中,57—71这一组次数最多,其组中值为64天,则该资料的众数为64天。 五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即 (3—8) 调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 【例3.8】 某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220头,2世代210头; 3世代190头,4世代210头,试求其平均规模。 利用(3—9)式求平均规模: (头) 即保种群平均规模为208.33头。 对于同一资料: 算术平均数>几何平均数>调和平均数 上述五种平均数,最常用的是算术平均数。 第二节 标准差 一、标准差的意义 平均数作为样本的代表,代表性的强弱受样本资料中观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述不全面,需引入表示资料中观测值变异程度大小的统计量。 全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。 但只利用了资料中的最大值和最小值,不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 离均差:以平均数为标准,求出各个观测值与平均数的离差,( ) 。 离均差能表示一个观测值偏离平均数的性质和程度,但因为有正、有负 ,离均差之和为零,因而不能用离均差之和来表示资料中所有观测值的总偏离程度。 平均绝对离差:Σ| |/n。表示资料中各观测值的变异程度,由于平均绝对离差包含绝对值符号,在统计学中未被采用。 先将各个离均差平方,即 ( )2 ,再求离均差平方和,即 ,简称平方和,记为SS;为了消除样本大小的影响,用平方和除以样本大小,求出离均差平方和的平均数; 为了使所得的统计量是相应总体参数的无偏估计量,在求离均差平方和的平均数时,分 母不用样本含量n,而用自由度n-1,采用统计量 表示资料的变异程度。 统计量 称为均方(mean square缩写为MS),又称样本方差,记为S2,即 S2= (3—9) *​ 自由度:样本内能独立而自由变动的观察值的个数,DF=n-K,K为限制条件的个数。 相应的总体参数叫 总体方差,记为σ2。对于有限总体而言,σ2的计算公式为: (3—10) 需要与平均数配合使用,应将平方单位还原,即应求出样本方差的平方根。把样本方差 S2 的平方根叫做样本标准差,记为S,即: (3-11) 所以(3-11)式可改写为: (3-12) 相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为: (3-13) 常用样本标准差S估计总体标准差σ。 二、标准差的计算方法 (一)直接法 对于未分组或小样本资料,可直接利用(3—11)或(3-12)式来计算标准差。 【例3.9】 计算10只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的标准差。 此例n=10,经计算得:Σx=5400,Σx2=2955000,代入(3—12)式得: =65.828 (g) 即10只辽宁绒山羊产绒量的 标准差 为65.828g。 (二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为: (3—14) 式中,f为各组次数;x为各组的组中值;Σf = n为总次数。 【例3.10】 利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。 将表3-4中的Σf、Σfx、 代入(3—14)式得: (g ) 即某 纯 系 蛋 鸡200枚 蛋 重的标准差为3.5524g。 表3—4 某纯系蛋鸡200枚蛋重资料次数分布及标准差计算表 三、标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,标准差也大。 (二)在各观测值加上或减去一个常数,其数值不变。 (三)当观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。 (四)资料服从正态分布时, 68.26%的观测值在( ±S)范围内; 95.43%的观测值在( ±2S)范围内; 99.73%的观测值在( ±3S)范围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。 第三节 变异系数 衡量资料中各观测值变异程度的另一个统计量 。 标准差与平均数的比值称为变异系数,记为C·V。 变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较的影响。 计算公式为: (3—15) 【例3.11】 已知某良种猪场长白成年母猪平均体重为 190kg, 标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。 由于,长白成年母猪体重的变异系数: 大约克成年母猪体重的变异系数: 所以,长白成年母猪体重的变异程度大于大约克成年母猪。 注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。
/
本文档为【第三章 平均数、标准差与变异系数】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索