为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

生物统计第六章

2012-05-08 49页 doc 2MB 27阅读

用户头像

is_098585

暂无简介

举报
生物统计第六章第六章 方差分析 第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为: 1、检验过程烦琐 例如,一试验包含5个处理,采用t检验法要进行 =10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验...
生物统计第六章
第六章 方差分析 第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为: 1、检验过程烦琐 例如,一试验包含5个处理,采用t检验法要进行 =10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由于每次比较需计算一个 ,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有5个处理,每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。 3、推断的可靠性低,检验的I型错误率大 即使利用资料所提供的全部信息估计了试验误差,若用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。 由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。 方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。 本章在讨论方差分析基本原理的基础上,重点介绍单因素试验资料及两因素试验资料的方差分析法。在此之前,先介绍几个常用术语。 1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。 2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等示。 3、因素水平(level of factor) 试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,…,来表示。如A1、A2、…,B1、B2、…,等。 4、试验处理(treatment) 事先好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。 5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。 6、重复(repetition) 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。 第一节 方差分析的基本原理与步骤 方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。 一、线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。 表6-1 k个处理每个处理有n个观测值的数据模式 处理 观 测 值 合计 平均 A1 x11 x12 … x1j … x1n A2 x21 x22 … x2j … x2n … … Ai xi1 xi2 … xij … xin … … Ak xk1 xk2 … xkj … xkn xk. 合计 表中 表示第i个处理的第j个观测值(i=1,2,…,k;j=1,2,…,n); 表示第i个处理n个观测值的和; 表示全部观测值的总和; 表示第i个处理的平均数; 表示全部观测值的总平均数; 可以分解为 (6-1) 表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将 再进行分解,令 (6-2) (6-3) 则 (6-4) 其中μ表示全试验观测值总体的平均数, 是第i个处理的效应(treatment effects)表示处理i对试验结果产生的影响。显然有 (6-5) εij是试验误差,相互独立,且服从正态分布N(0,σ2)。 (6-4)式叫做单因素试验的线性模型(linear model)亦称数学模型。在这个模型中 表示为总平均数μ、处理效应αi、试验误差εij之和。由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数 可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。 若将表(6-1)中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则 (6-6) 与(6-4)式比较可知, 、 、 分别是μ、(μi-μ)= 、(xij- )= 的估计值。 (6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μi-μ或 ),与误差( 或 ),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。 二、平方和与自由度的剖分 我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(mean squares)来度量资料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。 (一)总平方和的剖分 在表6-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数 的离均差平方和,记为SST。即 因为 其中 所以 (6-7) (6-7)式中, 为各处理平均数 与总平均数 的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即 (6-7)式中, 为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即 于是有 SST =SSt+SSe (6-8) (6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系式。这个关系式中三种平方和的简便计算公式如下: (6-9) 其中,C=x2··/kn称为矫正数。 (二)总自由度的剖分 在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的总个数减一,即kn-1。总自由度记为dfT,即dfT=kn-1。 在计算处理间平方和时,各处理均数 要受 这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,即dft=k-1。 在计算处理内平方和时,要受k个条件的约束,即 (i=1,2,…,k)。故处理内自由度为资料中观测值的总个数减k,即kn-k 。处理内自由度记为dfe,即dfe=kn-k=k(n-1)。 因为 所以 (6-10) 综合以上各式得: (6-11) 各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为(MST或 )、MSt(或 )和MSe(或 )。即 (6-12) 总均方一般不等于处理间均方加处理内均方。 【例6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。 表6-2 饲喂不同饲料的鱼的增重 (单位:10g) 饲料 鱼的增重(xij) 合计 平均 A1 31.9 27.9 31.8 28.4 35.9 155.9 31.18 A2 24.8 25.7 26.8 27.9 26.2 131.4 26.28 A3 22.1 23.6 27.3 24.9 25.8 123.7 24.74 A4 27.0 30.8 29.0 24.5 28.5 139.8 27.96 合计 =550.8 这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下: 矫正数 总平方和 处理间平方和 处理内平方和 总自由度 处理间自由度 处理内自由度 用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。 因为方差分析中不涉及总均方的数值,所以不必计算之。 三、期望均方 如前所述,方差分析的一个基本假定是各处理观测值总体的方差相等,即 (i=1,2,…,k)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21,S22,…,S2k都是σ2的无偏估计(unbiased estimate)量。 (i=1,2,…,k)是由试验资料中第i个处理的n个观测值算得的方差。 显然,各 的合并方差 (以各处理内的自由度n-1为权的加权平均数)也是σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各 的合并。 其中SSi、dfi(i=1,2,…,k)分别表示由试验资料中第i个 处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差σ2的无偏估计量。 试验中各处理所属总体的本质差异体现在处理效应 的差异上。我们把 称为效应方差,它也反映了各处理观测值总体平均数 的变异程度,记为 。 (6-13) 因为各 未知,所以无法求得 的确切值,只能通过试验结果中各处理均数的差异去估计。然而, 并非 的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容:一是各处理本质上的差异即αi(或μi)间的差异,二是本身的抽样误差。统计学上已经证明, 是 +σ2/n的无偏估计量。因而,我们前面所计算的处理间均方MSt实际上是n +σ2的无偏估计量。 因为MSe是σ2的无偏估计量,MSt是n +σ2的无偏估计量,所以σ2为MSe的数学期望(mathematical expectation),n +σ2为MSt的数学期望。又因为它们是均方的期望值(expected value),故又称期望均方,简记为EMS(expected mean squares)。 当处理效应的方差 =0,亦即各处理观测值总体平均数 (i=1,2,…,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差σ2的估计值,方差分析就是通过MSt 与MSe的比较来推断 是否为零即 是否相等的。 四、F分布与F检验 (一)F分布 设想我们作这样的抽样试验,即在一正态总体N(μ,σ2)中随机抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的 和 都是误差方差 的估计量。以 为分母, 为分子,求其比值。统计学上把两个均方之比值称为F值。即 (6-14) F具有两个自由度: 。 若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布(F distribution)。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。 F分布的取值范围是(0,+∞),其平均值 =1。 用 表示F分布的概率密度函数,则其分布函数 为: (6-15) 因而F分布右尾从 到+∞的概率为: (6-16) 附表4列出的是不同df1和df2下,P(F≥ )=0.05和P(F≥ )=0.01时的F值,即右尾概率α=0.05和α=0.01时的临界F值,一般记作 , 。如查附表4,当df1=3,df2=18时,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3.16的仅为5%,而大于5.09的仅为1%。 (二)F检验 附表4是专门为检验 代表的总体方差是否比 代表的总体方差大而设计的。若实际计算的F值大于 ,则F值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断 代表的总体方差大于 代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。 在方差分析中所进行的F检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。 在单因素试验结果的方差分析中,无效假设为H0:μ1=μ2=…=μk,备择假设为HA:各 μi不全相等,或H0 : =0,HA: ≠0;F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。反过来理解:如果H0是正确的,那么MSt与MSe都是总体误差σ2的估计值,理论上讲F值等于1;如果H0是不正确的,那么MSt之期望均方中的 就不等于零,理论上讲F值就必大于1。但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。所以,只有F值大于1达到一定程度时,才有理由否定H0。 实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值 , 相比较作出统计推断的。 若F< ,即P>0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;若 ≤F< ,即0.01<P≤0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F≥ ,即P≤0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“**”。 对于【例6.1】,因为F=MSt/MSe=38.09/5.34=7.13**;根据df1=dft=3,df2=dfe=16查附表4,得F>F0.01(3,16) =5.29,P<0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。 在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表6-3。 表6-3 表6-2资料方差分析表 变异来源 平方和 自由度 均方 F值 处理间 114.27 3 38.09 7.13** 处理内 85.40 16 5.34 总变异 199.67 19 表中的F值应与相应的被检验因素齐行。因为经F检验差异极显著,故在F值7.13右上方标记“**”。 在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F值检验可在方差分析表上进行。 五、多重比较 F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。 多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。 (一)最小显著差数法 (LSD法,least significant difference) 此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数 ,然后将任意两个处理平均数的差数的绝对值 与其比较。若 >LSDa时,则 与 在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由(6-17)式计算。 (6-17) 式中: 为在F检验中误差自由度下,显著水平为α的临界t值, 为均数差异标准误,由(6-18)式算得。 (6-18)其中 为F检验中的误差均方,n为各处理的重复数。 当显著水平α=0.05和0.01时,从t值表中查出 和 ,代入(6-17)式得: (6-19) 利用LSD法进行多重比较时,可按如下步骤进行: (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列; (2)计算最小显著差数 和 ; (3)将平均数多重比较表中两两平均数的差数与 、 比较,作出统计推断。 对于【例6.1】,各处理的多重比较如表6-4所示。 表6-4 四种饲料平均增重的多重比较表(LSD法) 处理 平均数 -24.74 -26.28 -27.96 A1 31.18 6.44** 4.90** 3.22* A4 27.96 3.22* 1.68 ns A2 26.28 1.54ns A3 24.74 注:表中A4与 A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。 因为, ;查t值表得:t0.05(dfe) =t0.05(16) =2.120, t0.01(dfe)=t0.01(16)=2.921 所以,显著水平为0.05与0.01的最小显著差数为 将表6-4中的6个差数与 , 比较:小于 者不显著,在差数的右上方标记“ns”,或不标记符号;介于 与 之间者显著,在差数的右上方标记“*”;大于 者极显著,在差数的右上方标记“**”。检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4 与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。 关于 法的应用有以下几点说明: 1、 法实质上就是 检验法。它是将 检验中由所求得的 之绝对值 与临界 值的比较转为将各对均数差值的绝对值 与最小显著差数 的比较而作出统计推断的。但是,由于 法是利用F检验中的误差自由度 查临界 值,利用误差均方 计算均数差异标准误 ,因而 法又不同于每次利用两组数据进行多个平均数两两比较的 检验法。它解决了本章开头指出的 检验法检验过程烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。 2、有人提出,与检验任何两个均数间的差异相比较, 法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计籍)。 3、因为 法实质上是 检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有4个处理,设计时已确定只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较,而其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。 综上所述,对于多个处理平均数所有可能的两两比较, 法的优点在于方法比较简便,克服一般 检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。 (二)最小显著极差法(LSR法 ,Least significant ranges) 法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距) 的不同而采用不同的检验尺度,以克服 法的不足。这些在显著水平α上依秩次距 的不同而采用的不同的检验尺度叫做最小显著极差 。例如有10个 要相互比较,先将10个 依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距 =10时的最小显著极差决定(≥为显著,<为不显著=;而后是秩次距 =9的平均数的极差的显著性,则由极差是否大于 =9时的最小显著极差决定;……直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。因此,有 个平均数相互比较,就有 -1种秩次距( , -1, -2,…,2),因而需求得 -1个最小显著极差( ),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。 因为 法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。 法克服了 法的不足,但检验的工作量有所增加。常用的 法有 检验法和新复极差法两种。 1、 检验法(q test) 此法是以统计量 的概率分布为基础的。 值由下式求得: (6-20) 式中,ω为极差, 为标准误, 分布依赖于误差自由度dfe及秩次距k。 利用 检验法进行多重比较时,为了简便起见,不是将由(6-20)式算出的 值与临界 值 比较,而是将极差与 比较,从而作出统计推断。 即为α水平上的最小显著极差。 (6-21) 当显著水平α=0.05和0.01时,从附表5( 值表)中根据自由度 及秩次距 查出 和 代入(6-21)式得 (6-22) 实际利用 检验法进行多重比较时,可按如下步骤进行: (1)列出平均数多重比较表; (2)由自由度 、秩次距 查临界 值,计算最小显著极差 0.05,k, 0.01,k; (3)将平均数多重比较表中的各极差与相应的最小显著极差 0.05,k, 0.01,k比较,作出统计推断。 对于【例6.1】,各处理平均数多重比较表同表6-4。在表6-4中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。 因为, =5.34,故标准误 为 根据 =16, =2,3,4由附表5查出 0.05、0.01水平下临界 值,乘以标准误 求得各最小显著极差,所得结果列于表6-5。 表6-5 q值及LSR值 dfe 秩次距k q0.05 q0.01 LSR0.05 LSR0.01 16 2 3.00 4.13 3.099 4.266 3 3.65 4.79 3.770 4.948 4 4.05 5.19 4.184 5.361 将表6-4中的极差1.54、1.68、3.22与表6-5中的最小显著极差3.099、4.266比较;将极差3.22、4.90与3.770、4.948比较;将极差6.44与4.184、5.361比较。检验结果,除A4与 A3的差数3.22由LSD法比较时的差异显著变为差异不显著外,其余检验结果同 法。 2、新复极差法(new multiple range method) 此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。 新复极差法与 检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查 表(附表6)而不是查 值表。最小显著极差计算公式为 (6-23) 其中 是根据显著水平α、误差自由度 、秩次距 ,由 表查得的临界 值, 。α=0.05和α=0.01水平下的最小显著极差为: (6-24) 对于【例6.1】,各处理均数多重比较表同表6-4。 已算出 =1.033,依 =16, =2,3,4,由附表6查临界 0.05(16,k)和 0.01(16,k)值,乘以 =1.033,求得各最小显著极差,所得结果列于表6-6。 表6-6 SSR值与LSR值 dfe 秩次距k SSR0.05 SSR0.01 LSR0.05 LSR0.01 2 3.00 4.13 3.099 4.266 16 3 3.15 4.34 3.254 4.483 4 3.23 4.45 3.337 4.597 将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与 检验法相同。 当各处理重复数不等时,为简便起见,不论 法还是 法,可用(6-25)式计算出一个各处理平均的重复数n0,以代替计算 或 所需的n。 (6-25) 式中 为试验的处理数, (i=1,2,…,k)为第 处理的重复数。 以上介绍的三种多重比较方法,其检验尺度有如下关系: 法≤新复极差法≤ 检验法 当秩次距 =2时,取等号;秩次距 ≥3时,取小于号。在多重比较中, 法的尺度最小, 检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。一般地讲,一个试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。如果否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用 检验法较为妥当;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便,也可采用 法。 (三)多重比较结果的表示法 各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。 1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。 2、标记字母法 此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母 ,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母 ,直到某一个与其差异显著的平均数标记字母 ;再以标有字母 的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标 ,直至显著为止;再以标记有字母 的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母 ,直至某一个与其差异显著的平均数标记 ;……;如此重复下去,直至最小一个平均数被标记比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平α=0.05,用大写拉丁字母表示显著水平α=0.01。在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。 对于【例6.1】,现根据表6-4所表示的多重比较结果用字母标记如表6-7所示(用新复极差法检验,表6-4中A4与A3的差数3.22在α=0.05的水平上不显著,其余的与LSD法同)。 表6-7 表6-4多重比较结果的字母标记(SSR法) 处理 平均数 α=0.05 α=0.01 A1 31.18 a A A4 27.96 b AB A2 26.28 b B A3 24.74 b B 在表6-7中,先将各处理平均数由大到小自上而下排列。当显著水平α=0.05时,先在平均数31.18行上标记字母 ;由于31.18与27.96之差为3.22,在α=0.05水平上显著,所以在平均数27.96行上标记字母b;然后以标记字母b的平均数27.96与其下方的平均数26.28比较,差数为1.68,在α=0.05水平上不显著,所以在平均数26.28行上标记字母b;再将平均数27.96与平均数24.74比较,差数为3.22,在α=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在α=0.01将各处理平均数标记上字母,结果见表6-7。q检验结果与SSR法检验结果相同。 由表6-7看到,A1饲料对鱼的平均增重极显著地高于A2和A3饲料,显著高于A4饲料;A4、A2、A3三种饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增重效果最好。 应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。 *六、单一自由度的正交比较 在从事一项试验时,试验工作者往往有一些特殊问题需要回答。这可以通过有地安排一些处理,以便从中获得资料进行统计检验,据以回答各种问题。   【例6.2】 某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为用两个不同的中药组,A4、A5为用两个不同的西药组,各组小白鼠的存活天数如表6-8所示。 表6-8 用不同药物治疗患腹水癌的小白鼠的存活天数 药物 各鼠存活天数(xij) 合计 平均 A1 15 16 15 17 18 81 16.2 A2 45 42 50 38 39 214 42.8 A3 30 35 29 31 35 160 32.0 A4 31 28 20 25 30 134 26.8 A5 40 35 31 32 30 168 33.6 合计 =757 这是一个单因素试验,其中k=5,n=5,按照前面介绍的方法进行方差分析(具体计算过程略),可以得到方差分析表,见表6-9。 表6-9 表6-8资料方差分析表 变异来源 平方和 自由度 均方 F值 处理间 1905.44 4 476.36 34.22** 处理内 277.60 20 13.88 总变异 2183.04 24 对于【例6.2】资料,试验者可能对下述问题感兴趣: (1)不用药物治疗与用药物治疗; (2)中药与西药; (3)中药A2与中药A3; (4)西药A4与西药A5; 相比结果如何? 显然,用前述多重比较方法是无法回答或不能很好地回答这些问题的。如果事先按照一定的原则设计好(k-1)个正交比较,将处理间平方和根据设计要求剖分成有意义的各具一个自由度的比较项,然后用F检验(此时df1=1)便可明确地回答上述问题。这就是所谓单一自由度的正交比较(orthogonal comparison of single degree of freedom),也叫单一自由度的独立比较(independent comparison of single degree of freedom)。单一自由度的正交比较有成组比较和趋势比较两种情况,后者要涉及到回归分析。这里结合解答【例6.2】的上述四个问题,仅就成组比较予以介绍。 首先将表6-8各处理的总存活天数抄于表6-10,然后写出各预定比较的正交系数Ci(orthogonal coefficient)。 表6-10 【例6.2】资料单一自由度正交比较的正交系数和平方和的计算 比 较 处理和各处理存活总天数 Di ΣC2i SSi A1 A2 A3 A4 A5 81 214 160 134 168 A1与A2+ A3+ A4+ A5 +4 -1 -1 -1 -1 -352 20 1239.04 A2+ A3与A4+ A5 0 +1 +1 -1 -1 72 4 259.20 A2与A3 0 +1 -1 0 0 54 2 291.60 A4与A5 0 0 0 +1 -1 -34 2 115.60 合 计 1905.44 表6-10中各比较项的正交系数是按下述规则构成的: (1)如果比较的两个组包含的处理数目相等,则把系数+1分配给一个组的各处理,把系数-1分配给另一组的各处理,至于哪一组应取正号还是负号是无关紧要的。如A2+A3与A4+A5两组比较(属中药与西药比较),A2、A3两处理各记系数+1,A4、A5两处理各记系数-1。 (2)如果比较的两个组包含的处理数目不相等,则分配到第一组的系数等于第二组的处理数;而分配到第二组的系数等于第一组的处理数,但符号相反。如A1与A2+A3+A4+A5的比较,第一组只有1个处理,第二组有4个处理,故分配给A1处理的系数为+4,而分配给处理A2、A3、A4、A5的系数为-1。又如,假设在5个处理中,前2个处理与后3个处理比较,其系数应是+3、+3、-2、-2、-2。 (3)把系数约简成最小的整数。例如,2个处理为一组与4个处理为一组比较,依照规则(2)有系数+4、+4、-2、-2、-2、-2,这些系数应约简成+2、+2、-1、-1、-1、-1。 (4)有时,一个比较可能是另两个比较互作的结果。此时,这一比较的系数可用该两个比较的相应系数相乘求得。如包含4个处理的肥育试验中,两种水平的试畜(B1,B2)和两种水平的饲料(F1,F2),其比较举例如下: 比较 B1F1 B1F2 B2F1 B2F2 品种间(B) -1 -1 +1 +1 饲料间(F) -1 +1 -1 +1 B×F间 +1 -1 -1 +1 表中第1和第2两比较的系数是按照规则(1)得到的;互作的系数则是第1、2行系数相乘的结果。 各个比较的正交系数确定后,便可获得每一比较的总和数的差数Di,其通式为: (6-26) 其中Ci为正交系数,xi.为第i处理的总和。这样表6-10中各比较的Di为: D1=4×81-1×214-1×160-1×134-1×168=-352 D2=1×214+1×160-1×134-1×168=72 D3=1×214-1×160=54 D4=1×134-1×168=-34 进而可求得各比较的平方和SSi: (6-27) 式中的n为各处理的重复数,本例n=5。对第一个比较: 同理可计算出SS2=259.20,SS3=291.60,SS4=115.60。计算结果列入表6-10中。 这里注意到,SS1+SS2+SS3+SS4=1905.44,正是表6-9中处理间平方和SSt。这也就是说,利用上面的方法我们已将表6-9处理间具4个自由度的平方和再度分解为各具一个自由度的4个正交比较的平方和。因此,得到单一自由度正交比较的方差分析表6-11。 表6-11 表6-8资料单一自由度正交比较方差分析 变异来源 df SS MS F 处理间 4 1905.44 476.36 34.32** 不用药与用药 1 1239.04 1239.04 89.27** 中药与西药 1 259.20 259.20 18.67** 中药A2与中药A3 1 291.60 291.60 21.01** 西药A4与西药A5 1 115.60 115.60 8.33** 误 差 20 277.60 13.88 总变异 24 2183.04 将表6-11中各个比较的均方与误差均方MSe相比,得到F值。查F值表,df1=1,df2=20时,F0.05(1,20) =4.35,F0.01(1,20) =8.10。所以,在这一试验的上述4个比较差异都极显著。 正确进行单一自由度正交比较的关键是正确确定比较的内容和正确构造比较的正交系数。在具体实施时应注意以下三个条件: (1)设有k个处理,正交比较的数目最多能安排k-1个;若进行单一自由度正交比较,则比较数目必须为k-1,以使每一比较占有且仅占有一个自由度。 (2)每一比较的系数之和必须为零,即ΣCi=0,以使每一比较都是均衡的。 (3)任两个比较的相应系数乘积之和必须为零,即ΣCiCj=0,以保证SSt的独立分解。 对于条件(2),只要遵照上述确定比较项系数的四条规则即可。对于条件(3),主要是在确定比较内容时,若某一处理(或处理组)已经和其余处理(或处理组)作过一次比较,则该处理(或处理组)就不能再参加另外的比较。否则就会破坏ΣCiCj=0这一条件。只要同时满足了(2),(3)两个条件,就能保证所实施的比较是正交的,因而也是独立的。若这样的比较有k-1个,就是正确地进行了一次单一自由度的正交比较。 单一自由度正交比较的优点在于: (1)它能给人们解答有关处理效应的一些特殊重要的问题;处理有多少个自由度,就能解答多少个独立的问题,不过这些问题应在试验设计时就要计划好。 (2)计算简单。 (3)对处理间平方和提供了一个有用的核对方法。即单一自由度的平方和累加起来应等于被分解的处理间的平方和。否则,不是计算有误,就是分解并非独立。 七、方差分析的基本步骤 在本节中,结合单因素试验结果方差分析的实例,较详细地介绍了方差分析的基本原理和步骤。关于方差分析的基本步骤现归纳如下: (一)计算各项平方和与自由度。 (二)列出方差分析表,进行F检验。 (三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。 此外,若有一些特殊重要的问题需要回答,多重比较又无法或不能很好地回答这些问题时,则应考虑单一自由度正交比较法。对这些特殊问题正确而有效的回答,依赖于正确的试验设计和单一自由度正交比较法的正确应用。 第二节 单因素试验资料的方差分析 在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素各水平的优劣。根据各处理内重复数是否相等,单因素方差分析又分为重复数相等和重复数不等两种情况。上节讨论的是重复数相等的情况。当重复数不等时,各项平方和与自由度的计算,多重比较中标准误的计算略有不同。本节各举一例予以说明。 一、各处理重复数相等的方差分析 【例6.3】抽测5个不同品种的若干头母猪的窝产仔数,结果见表6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。 表6-12 五个不同品种母猪的窝产仔数 品种号 观 察 值xij (头/窝) xi. 1 8 13 12 9 9 51 10.2 2 7 8 10 9 7 41 8.2 3 13 14 10 11 12 60 12 4 13 9 8 8 10 48 9.6 5 12 11 15 14 13 65 13 合计 x.. =265 这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下: 1、计算各项平方和与自由度 2、列出方差分析表,进行F检验 表6-13 不同品种母猪的窝产仔数的方差分析表 变异来源 平方和 自由度 均方 F值 品种间 73.20 4 18.30 5.83** 误差 62.80 20 3.14 总变异 136.00 24 根据df1=dft=4,df2=dfe=20查临界F值得:F0.05(4,20) =2.87,F0.05(4,20) =4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产仔数的差异达到1%显著水平。 3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-14。 表6-14 不同品种母猪的平均窝产仔数多重比较表(SSR法) 品种 平均数 -8.2 -9.6 -10.2 -12.0 5 13.0 4.8** 3.4* 2.8* 1.0 3 12.0 3.8** 2.4 1.8 1 10.2 2.0 0.6 4 9.6 1.4 2 8.2 因为MSe=3.14,n=5,所以 为: 根据dfe=20,秩次距k=2,3,4,5由附表6查出α=0.05和α=0.01的各临界SSR值,乘以 =0.7925,即得各最小显著极差,所得结果列于表6-15。 表6-15 SSR值及LSR值 dfe 秩次距k SSR0.05 SSR0.01 LSR0.05 LSR0.01 20 2 2.95 4.02 2.339 3.188 3 3.10 4.22 2.458 3.346 4 3.18 4.33 2.522 3.434 5 3.25 4.40 2.577 3.489 将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。检验结果表明:5号品种母猪的平均窝产仔数极显著高于2号品种母猪,显著高于4号和1号品种,但与3号品种差异不显著;3号品种母猪的平均窝产仔数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以5号品种母猪的窝产仔数最高,3号品种次之,2号品种母猪的窝产仔数最低。 二、各处理重复数不等的方差分析 这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。 设处理数为k;各处理重复数为n1, n2,…, nk;试验观测值总数为N=Σni。则 (6-28) 【例6.4】 5个不同品种猪的育肥试验,后期30天增重(kg)如表6-16所示。试比较品种间增重有无差异。 表6-16 5个品种猪30天增重 品种 增 重 (kg) ni xi. B1 21.5 19.5 20.0 22.0 18.0 20.0 6 121.0 20.2 B2 16.0 18.5 17.0 15.5 20.0 16.0 6 103.0 17.2 B3 19.0 17.5 20.0 18.0 17.0 5 91.5 B4 21.0 18.5 19.0 20.0 4 78.5 19.6 B5 15.5 18.0 17.0 16.0 4 66.5 16.6 合计 25 460.5 此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下: 1、计算各项平方和与自由度 利用公式(6-28)计算 2、列出方差分析表,进行F检验 临界F值为:F0.05(4,20) =2.87,F0.01(4,20) =4.43,因为品种间的F值5.99>F0.01(4,20
/
本文档为【生物统计第六章】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索