非参数检验
确定出最优分割点后,还需对分割样本进行检验,看跳跃成分是否显著,本
[58]文采用非参数检验方法Mann-Whitney U检验和Kruskal-Wallis检验。
先对两样本的情况做Mann-Whitney U检验。
两独立样本的Mann-Whitney U检验的零假设H为样本来自的两独立总体均0
值没有显著差异。
两独立样本的Mann-Whitney U检验主要通过对平均秩的研究来实现推断。秩简单地说就是名次。如果将数据按照升序进行排序,这时每一个具体数据都会有一个在整体数据中的位置或名次,这就是该数据的秩,数据有多少个,秩便有多少个。
Mann-Whitney U检验的实现方法是:首先将两组样本数据(X,X,…,X)12m和(Y,Y,…,Y)混合并按升序排列(m和n是两组样本的样本容量),求出每12n
个数据各自的秩R;然后,分别对(X,X,…,X)和(Y,Y,…,Y)的秩求平i12m12n均,得到两个平均秩W/m和W/n。如果这两个平均秩相差很大,即一组样本xy
的秩普遍偏小,另一组样本的秩普遍偏大,则零假设不一定成立。
Mann-Whitney U检验还计算(X,X,…,X)每个秩优于(Y,Y,…,Y)每12m12n个秩的个数U,以及(Y,Y,…,Y)每个秩优于(X,X,…,X)每个秩的个数112n12mU,并对U和U进行比较。如果U和U相差很大,则零假设不一定成立。 21212
利用SPSS自动计算Wilcoxon W统计量和Mann-Whiteny U统计量,其中:
当m
n时,Wilcoxon W=W; x
当m=n时,Wilcoxon W=第一个观察值所属样本组的W值。
Mann-Whitney U统计量的计算如下:
n(1)n, U=W-2
其中W为Wilcoxon W统计量,n为W对应组的样本容量。
SPSS将计算出U值,然后依据Mann-Whitney分布表给出对应的相伴概率值。同时,SPSS还计算近似服从正态分布的Z统计量,计算公式如下:
mnU,2 (3-6) Z,
1mnmn(1),,12
同样,SPSS也会给出Z值对应的相伴概率值。
在样本个数小于30时,应以U统计量的相伴概率值作为判断,在样本个数大于30时,属于大样本情况下,应以Z统计量的相伴概率值作为判断标准。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H,认为两个,0样本来自的总体均值有显著差异;如果相伴概率值大于显著性水平,则不能拒,绝零假设H,认为两个样本来自的总体均值无显著差异。 0
再对多样本的情况做Kruskal-Wallis检验。
Kruskal-Wallis检验是一种推广的平均秩检验。其零假设为:样本来自的多个独立总体的分布无显著差异。
多独立样本的Kruskal-Wallis检验的基本办法是:首先将多组样本数据混合后按升序排列,并求出每个观察值的秩,然后对多组样本的秩分布求平均值。
如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著差异。如果各样本的平均秩相差很大,则拒绝零假设,不能认为多个独立总体的分布无显著差异。
SPSS将计算Kruskal-Wallis统计量Z,公式如下:
k122ZnRR,,() (3-7) ,iiNN,(1)i
其中:表示有组样本; kk
ni表示第组样本的观察值个数; i
R为平均秩。
SPSS将自动计算Kruskal-Wallis统计量,并依据Kruskal-Wallis统计量检验临界值表给出Kruskal-Wallis统计量对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H,认为多个样本来自的总体分布有显著,0
差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H,认为多个样本,0来自的总体分布无显著差异。