null
第七章 检验
(chi-square test)
第七章 检验
(chi-square test)
上海第二军医大学卫生统计学教研室
孟虹 分类数据组间比较的假设检验
计数资料组间的比较null 第七章 检验内容
(计数资料组间的比较)第一节 四格
资料的χ2检验*
第二节 配对四格表资料的χ2检验*
第三节 Fisher确切概率检验
第四节 行×列表资料的χ2检验*
第五节 多个样本率比较的χ2分割法
第六节 有序分组资料的线性趋势检验
第七节 频数分布的拟合优度检验*为重点掌握概念回顾概念回顾在总体率为π的二项分布总体中做n1和n2抽样,样本率p1和p2与π的差别,称为率抽样误差。
在总体率为π1和π2的不同总体中抽样,得p1和p2,在nπ>5,可通过率的u检验推断是否π1=π2。
二项分布的两个样本率的检验同样可用χ2检验。
第一节、四格表资料的 检验
第一节、四格表资料的 检验
一、χ2检验的基本思想
1. χ2 分布 1. χ2 分布
1875年 F. Helmet提出χ2 统计量,设Xi为来自正态总体的连续性变量。χ2分布是一个连续型变量的分布,分布的参数为自由度(ν)。
χ2分布的概率密度函数曲线χ2分布的概率密度函数曲线3.847.8112.59P=0.05的临界值null不同χ2分布的界值(附表 8 )823页在υ=1,K.Pearson的χ2统计量K.Pearson的χ2统计量1900年K.Pearson提出下述公式,在n≥40时下式值与χ2分布近似,在理论数>5,近似程度较好。上述公式实际应用于检验计数资料组间率、构成比一致程度的公式。
Pearson 检验的用途
Pearson 检验的用途
1. 用于检验计数资料的两组(多组)样本率差别有无统计意义。
如二项分布数据 ( binomial proportions)
2.检验两个事物的分类是否独立
列连表数据 ( Contingency Table)
2. χ2检验的基本思想
2. χ2检验的基本思想
例7-1:
某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将200名患者随机分为两组,试验组104例中有效的99例,对照组96例中有效的78例,问两种药物对降低颅内压疗效有无差别?
数据整理为四格表形式(二维交叉表)表 100例高血压患者治疗后临床记录表 100例高血压患者治疗后临床记录编号 年龄 性别 治疗组 舒张压 体温 疗效
X1 X2 X3 X4 X5 X6
1 37 男 A 11.27 37.5 有效
2 45 女 B 12.53 37.0 有效
3 43 男 A 10.93 36.5 有效
4 59 女 B 14.67 37.8 无效
100 54 男 B 16.80 37.6 无效
计数资料数据检验的列连表
两组或多组比较数据的交叉表
计数资料数据检验的列连表
两组或多组比较数据的交叉表
行(Row)×列(Column)表
行分类 列分类 (Y) 合计数
(X) 阳性数 阴性数
甲组 A11 A12 n1
乙组 A21 A22 n2
合计 A11 + A21 A12+ A22 n
A:表示某组某分类的例数(频数)
表7-1两组降低颅内压有效率比较表7-1两组降低颅内压有效率比较疗法 有效人数 无效数 合计 有效率%
试验组 99(A11) 5(A12) 104 95.20
对照组 75(A21) 21(A22) 96 78.13
合计 174 26 200 87.00
问:两组有效率差别是否是抽样误差或是不同药物的作用?
99 5
75 21四格表的数字组别 + —甲
乙Pearson 检验的基本公式
Pearson 检验的基本公式
式中符号含义:
A:实际频数,表中实际发生的阳性或阴性频数
T:理论频数,按某H0假设计算理论上的阳性或阴性频数(公式7-1)(公式7-3)表7-1两组疗法降低颅内压有效率(%)表7-1两组疗法降低颅内压有效率(%)疗法 有效人数 无效人数 合计 有效率
试验组 99(90.48) 5(13.52) 104 95.2
对照组 75(83.52) 21(12.48) 96 78.1
合计 174 26 200 87.0
注:括号内为理论数(T)
假设:
H0:1= 2 = c = 87.00 (两组总体有效率相等)
H1:1 2 (两组总体有效率不等)
假定两组有效率均为174/200=87%nullClass n Hypothesized Observed Expected=T
试验组 104 有效概率π=0.87 99 90.48
试验组 无效概率π1=0.13 5 13.52
对照组 96 有效概率π=0.87 75 83.52
对照组 无效概率π1=0.13 21 12.48 T=n ×π假定两组总体率相等的理论数与实际数假定两组总体率相等的理论数与实际数组别 死亡人数 生存数 合计 死亡率%
抗凝血组 20(20) 80(80) 100 20.0
对照组 20(20) 80(80) 100 20.0
合计 40 160 200 20.0
Χ2检验是考察实际频数与假设理论频数是否一 致 的统计量。
Pearson 检验计算与步骤Pearson 检验计算与步骤1.建立假设:
H0:1= 2 = c (两组总体率相等)
H1:1 2 (两组总体率不等)
2. =0.05
3.计算 统计量
4.确定概率(P)和自由度(ν)
自由度(ν)=(行数-1)×(列数-1)
本例ν=(2-1)×(2-1)=1
与 比较,得到p值
5.结论:在=0.05水准上,p<0.01,拒绝H0,两样本率差别有统计意义,具本例可认为试验组对降低颅内压有效率高于对照组。
本例二、四格表资料 检验
(两组样本率间差别 检验)二、四格表资料 检验
(两组样本率间差别 检验)两组样本率比较的设计分类:
1.两组(独立) 样本率的比较
组间数据是相互独立,非配对设计。
2.配对设计两组样本率的比较
组间数据是相关的。两组(不配对)样本率的比较
两组(不配对)样本率的比较
1)四格表形式
组别 阳性数 阴性数 合计 率%
甲组 a b a+b=n1 a/n1
乙组 c d c+d=n2 c/n2
合计 a+c b+d N
2)四格表不配对资料检验的专用公式(公式 7-4)二者结果等价各组样本例数是固定的表7-1两组降低颅内压有效率比较表7-1两组降低颅内压有效率比较疗法 有效人数 无效数 合计
试验组 99(a) 5(b) 104(a+b)
对照组 75(c) 21(d) 96 (c+d)
合计 174(a+c)26(b+d) 200 (N)
三、四格表χ2 检验的校正公式
(两组不配对资料) 三、四格表χ2 检验的校正公式
(两组不配对资料) (1) 校正公式的条件:
1
方法或两种培养基的阳性率是否有差别。
特点:对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。
资料整理为配对四格表形式.null例7-3:某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?
测定结果为:阳性、阴性(共116标本,58对)
方法(X)
乳胶凝集法 免疫荧光法 对子例数
+ + 11
- - 33
+ - 2
- + 12
58对结果配对设计资料的四格表及公式配对设计资料的四格表及公式例 表7-3 两种方法的检测结果
免疫 乳胶凝集法
荧光法 + - 合计
+ 11 (a) 12(b) 23 (a+b)
- 2( c) 33(d) 35(c+d)
合计 13(a+c) 45(b+d) 58(N)
公式7-8 b+c<40用 例:配对计数资料的比较例:配对计数资料的比较1.建立检验的假设
H0:b=c =(12+2)/2=7(两法总体阳性率相等)
H1:b c (两方法总体阳性率不等)
2. =0.05
3.计算 χ2 统计量(McNemer检验 )
null4.确定自由度(ν)和 χ2值 的概率P
ν=(行数-1)(列数-1)
本例:ν=1
本例χ2=5.79>3.84,P<0.05
5.结论:在α=0.05水准,拒绝H0,P<0.05
认为两方法的检测率不同,乳胶凝集法的阳性检测率22.41%低于免疫检测率39.66%。第三节.四格表的Fisher确切概率法
(条件:T<1,或n<40用)
第三节.四格表的Fisher确切概率法
(条件:T<1,或n<40用)
例:表7-4 两组新生儿HBV感染率的比较
组别 阳性 阴性 合计 感染率%
预防组 4 18 22 18.18
非预防组 5(3) 6 11 45.45
合计 9 24 33 27.27
了解方法,计算不
。公式7-9是四格表边际合计数固定时,出现表中频数为a,b,c,d的概率公式7-9是四格表边际合计数固定时,出现表中频数为a,b,c,d的概率
本例为双侧检验:
计算p=p1+p2+p3+p4+p5+p10=0.1210>α=0.05
结论:p >0.05,还不能认为预防注射和非预防注射组的HBV感染率不同.公式7-9null(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)单侧检验 H1: π1<π2,计算累计p值=p(1)+ p(2)+ p(3)+ p(4)+ p(5)
双侧检验H1: π1≠π2,计算累计p值=p(1)+ p(2)+ p(3)+ p(4)+ p(5)+p(10)Fisher确切概率法计算累计概率(p)ad-bc=D*=-66ad-bc=-99ad-bc=-132
ad-bc=66
ad-bc=99
null1)2)nullSPSS统计软件计算结果第四节 行×列表的χ2检验
第四节 行×列表的χ2检验
当比较组行或列分类数>2,称为行×列表。
研究者感兴趣的问
有:(也为χ2检验的目的)
1.多组(独立样本)样本率差别有无统计意义?
2.两组(独立样本)的构成比(分布)有无统计意义?
3.两个分类变量分布是否独立(有关联)?
行×列表的χ2检验公式行×列表的χ2检验公式
自由度=(行数-1)×(列数-1)公式7-10等价表7-8 三组疗法有效率的比较表7-8 三组疗法有效率的比较疗法 有效 无效 合计 有效率%
物理组 199(186.2) 7 206 96.6
药物组 164 18 182 90.1
外用组 118 26 144 81.9
合计 481 51 532 90.4一、多组样本率的比较H0:1= 2 = 3 =90.4(三组总体有效率相等)
H1:三组总体率不等或不全等
表7-8 三组疗法有效率的计算
表7-8 三组疗法有效率的计算
A为表中的实际频数自由度=(行数-1)(列数-1)=(3-1)(2-1)=2
表7-8资料SPSS软件计算结果表7-8资料SPSS软件计算结果结论:在α=0.05水准,拒绝H0,P<0.01,认为三组疗法有效率不等或不全等.
注意:此结果不能得到各两两组比较的结论.二、两组和多组构成比的比较
二、两组和多组构成比的比较
表7-9 两组Ⅱ型糖尿病患者ACE基因分布比较
ACE基因类型
糖尿病 DD ID I I 合计
有肾病 42(37.8) 48(43.3) 21(18.9) 111
无肾病 30(21.7) 75(52.2) 36(26.1) 138
合计 72(28.9) 120(48.2) 57(22.9) 249
括号内为行的构成比
问:两组糖尿病人在ACE基因类型分布上有无差别?
H0:两组总体各基因构成相等,均等于合计构成比
H1:两组总体构成分布不相等表7-9资料SPSS软件计算结果表7-9资料SPSS软件计算结果结论:在α=0.05水准,拒绝H0,P=0.019,认为两组糖尿病病人在ACE基因类型分布上有差别,有肾病糖尿病者DD基因比例多于无肾病.
三、两个分类变量的独立性检验 三、两个分类变量的独立性检验 目的:检验两事物分类(行分类和列分类)是否独立,从而说明两事物分类是否有关系。
检验公式:
两个事物之间有无关系关系的密切程度.
Contingency coefficient
列连系数两事物定性资料的独立性(相关)检验
两事物定性资料的独立性(相关)检验
数据类型:
1.双向无序分类数据(表7-10)
2.双向有序 分类数据(表7-13)
统计
:
1.回答两事物的分类是否独立(有关系)
用 Pearson χ2检验
2.如有关,关系密切程度如何,度量指标:
1) 列连系数(Contingency coefficient ,无序分类用)
2) 相关系数( spearman correlation,双向有序分类用)
见讲义148页,在0-1,近于1,关系愈密切.
双向有序分类的R×C表
表7-13年龄与冠状动脉硬化的关系双向有序分类的R×C表
表7-13年龄与冠状动脉硬化的关系问:年龄与冠状动脉硬化有无相关关系两分类变量独立与有关两分类变量独立与有关高血压病 年龄(A) 年龄(A)
(B) <60岁 ≥60岁 <60岁 ≥60岁
有 50(50) 50(50) 0 (50) 100(50)
无 50 (50) 50(50) 100(50) 0 (50)
合计 100 100 100 100
( )内为理论数
两事物独立假定成立:
即行或列各分类的构成比相同,或在 A事物不同水平下,B事物不同分类的作用(构成)相等.双向无序分类关联性研究双向无序分类关联性研究 表7-10 某地5810人按二种方式对血型的分类
ABO MN血型
血型 M N MN 合计
O 431(23.6) 490(26.8) 902(49.5) 1823
A 388(24.3) 410(25.7) 800(50.0) 1598
B 495(24.4) 587(28.9) 950 (46.8) 2032
AB 137(39.4) 179(51.4) 32( 9.2) 348
合计 1451(25.0) 1666(28.7) 2684(46.3) 5801
(括号内为行构成比)
问二种血型分类系统有无关系检验步骤检验步骤1.建立检验的假设
H0:两种血型系统分类无关联 (即行或列构成比相等)
H1:两种血型系统分类有关联 (即行或列构成比不等)
2. =0.05
3.计算 χ2 统计量
结论:两种血型系统分类有关联,列连系数为0.1883。AB型的人出现MN血型比例少于其他血型..系数波动0-1null双向有序分类的R×C表
表7-13年龄与冠状动脉硬化的关系双向有序分类的R×C表
表7-13年龄与冠状动脉硬化的关系问:年龄与冠状动脉硬化有无相关关系(线性趋势)nullad-bc=-99nullSPSS软件检验结果四、R×C表数据的注意事项四、R×C表数据的注意事项1. 多个样本率比较的χ2检验,当拒绝H0时,不能得出任何两组间都有差别。目前尚无公认的两两比较的方法,可考虑采用减小检验水准(α’),见讲义第五节.
2. R×C表有1/5以上格子的理论数小于5时,不宜直接计算χ2检验,可采用合并组的方法(或增加例数),增大理论数。多组样本率的两两比较的χ2 分割多组样本率的两两比较的χ2 分割当比较组k≥3时,χ2值有统计意义,可分解多个四格表了解各样本率两两间的差别。
方法(见149-151页):
1. 检验水准(α’)的分割
2.两两比较四格表的χ2值 与
(讲义第 五节)K为比较的组数表7-11 ν=1 时的χ2 界值表
表7-11 ν=1 时的χ2 界值表
Χ2 p χ2 p
6.24 0.01250 7.48 0.00625
6.96 0.00833 7.88 0.0050
7.24 0.00714 8.05 0.00455
α’=0.0125 ,表7-12计算:
当计算: H0
χ2=6.76 p<0.0125 拒绝
χ2=21.32 p<0.00313 拒绝
χ2=4.59 p>0.0125 不拒绝
小 结小 结基本公式不配对四格表和校正公式配对四格
表公式R×C表资料的公式一 . 公式二. χ2常解决的问题二. χ2常解决的问题 目的: 比较组间率和构成比的差别
设计:抽自2个或多个独立样本
目的: 两个变量间有无关系或关联
设计:2个变量来自同一对象或同一总体.相关的设计.
三. 应用时注意的问题三. 应用时注意的问题1.四格表资料χ2检验的适用条件
(1)n≥40且T≥5 用Pearsonχ2检验
(2)n≥40且1≤T<5连续性校正χ2检验(3)n<40或T<1 用Fisher确切概率法
2.单向有序数据2×C表,结果(y)数据为等级时,采用秩和检验效率高于χ2检验
单向有序数据,结果(y)数据为等级时,采用秩和检验效率高于χ2检验单向有序数据,结果(y)数据为等级时,采用秩和检验效率高于χ2检验 表 某病两组疗效的比较
比较组 无效 有效 显效 痊愈 合计
试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57
对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45
Total 39 33 23 7 102
(括号内为构成比)
计算χ2=4.81, p=0.186, p>0.05
计算两组秩和检验,u=2.64,p<0.01 null 本次内容结束
谢 谢