【doc】患病人数未知时患病率的点估计及区间估计方法
患病人数未知时患病率的点估计及区间估
计方法
中国卫生统计2007年l0月第24卷第5期
患病人数未知时患病率的点估计及区间估计方法*
刘沛朱凤才史志旭
【提要】目的研究患病人数未知时患病率的点估计及区间估计方法.方法根据概率论和数理统计原理导出
患病率和阳性检出率,实验灵敏度,特异度间的定量关系,用代数推导和医学实例验证导出的公式.结果在已知实验灵
敏度,特异度条件下,导出并验证了由阳性检出率计算患病率的点估计和区间估计方法.结论在患病人数未知条件下,
使用阳性检出率和检验方法灵敏度,特异度等信息,可准确估计患病率,这一方法具有重要的公共卫生学意义.
【关键词】患病率阳性检出率灵敏度特异度
患病率表示某特定时间人群巾疾病存在的频度,
是描述疾病分布,分析现患水平,制定卫生政策的一项
重要指标.当可获得患病数据时,此指标可使用患病
人数除调查人数直接算出.但在一些公共卫生学调查
研究中,有时得不到患病人数,往往得到的只是某一诊
断或筛检试验的阳性检出率(阳性人数除调查人数).
由于一般情况下阳性检出率越高,患病率也越高,因此
一
些研究者常常用阳性检出率代替患病率说明疾病严
重程度El,Z].但由于目前绝大多数医学检验方法的灵
敏度和特异度均达不到100%,因此在检测阳性者中
混杂有假阳性,在检测阴性者中也存在着假阴性,这样
使用阳性检出率估计患病率有时并不能正确反应疾病
现患的严重程度.本研究提出了一种在患病人数未知 时患病率计算的点估计及区间估计方法,现
如下. 原理与方法
1.点估计方法
应用概率论和数理统计原理L3J,通过分析患病率 与阳性检出率,检验方法灵敏度,特异度之间的关系, 导出患病率的点估计方法.以患病率和阳性检出率的 相对误差R=壁案嘉为指标,定量分析
两者间的差异.
2.区间估计方法
采用基于正态分布原理总体率可信区间计算的一 次近似法L4导出患病率的区间估计方法. 3.方法的验证与应用研究
对根据概率论和数理统计原理给出的点估计方法 应用代数推导方法进行验证.对使用正态分布原理给 出的区间估计方法使用Miettinen提出的基于二项分 布与F分布关系的精确计算法[]进行验证.应用 *:国家自然科学基金资助项目(30471501) 1.东南大学公共卫生学院流行病与卫生统计学系(210009)
2.江苏省疾病预防控制中心
3.徐州市中心血站
红外扫描方法筛检乳腺癌引,肥达氏反应诊断伤 寒引,心电图(ECG)筛检心肌梗死[.三个具有不同特 点的医学实例,进行实际应用研究.
所有计算均用SAS9.1编程完成.
结果
1.点估计
设T和T一分别代表检验方法测得的阳性和阴 性结果,D和D一代表疾病的真实阳性(患病或感染)
和真实阴性(未患病或未感染)结果,代表检验总例 数,P代表概率.则患病率为不D=P(D),阳性检出 率为不丁=P(T),实验灵敏度为S:P(T/D), 特异度为S=P(T一/D一).
由于目前绝大多数医学检验方法的灵敏度和特异 度均小于100%,因此某一诊断或筛检试验的阳性检 出率不下=P(T)由两部分构成,一部分是在检验结 果为阳性条件下真阳性的概率P(D/T),另一部 分是在检验结果为阳性条件下假阳性的概率P(D一/ 丁).由于在任一次检验中,这两种结果只能出现一 种,故它们为互不相容事件,根据概率论的加法定理, 乘法定理和条件概率定Ne3],我们可导出某一实验的 阳性检出率:
不下:P(T)=P(T/D)×P(D)+[1一P
(T一/D一)]×[1一P(D)](1)
将灵敏度S=P(T/D),特异度S=P(T一/D一) 的定义公式代入得:
不丁=S×P(D)+(1一SP)×[1一P(D)](2) 整理后得总体患病率的计算公式为:
不.=P(D)={{(3)
由于在实际工作中,往往无法获得总体阳性检出率 不丁,故用其样本率P丁=T/代表,根据最大似然法 原理[3]可获得总体患病率不D的点估计值PD为: 户.=?
?
484?
由公式(4)可知,与一般的患病率计算公式(患病 人数/调查人数)相比,我们导出的公式利用了患病率
与阳性检出率与检验方法灵敏度,特异度的关系,使得
在患病人数未知时也可计算患病率.
ChineseJournalofHealthStatistics,OCt2007,vo1.24.No.5
2.区间估计
根据基于正态分布原理和连续性校正原理的总体
率可信区间一次近似法[引,导出患病率可信区间计算
公式为:
+2(Po?)_4-?+4(D?)[1一(加?)J…
/rL,u..2(v2+)…一——L)厶,T,',
在公式(5)中,为在概率水准为a下正态分布证研究.在理论上,我们应用代数推导方法成功地证
的临界值,在计算总体率可信区间上限时,式(5)中的明了公式(4).对总体率可信区间估计方法,我们应用
?号项均取加号;计算下限时,?号项均取减号.Miettinen提出的基于二项分布与F分布关系的精确
3.方法的验证与应用研究计算法验证了公式(5)给出的区间估计方法.用于应 对本文提出的计算患病率的点估计与区间估计新用研究的3个医学实例见表1,应用研究结果见表2.
方法,我们分别从理论和实际应用两个方面进行了验
表1研究患病率与阳性检出率关系的三个医学实例
表2患病率和阳性检出率的点估计和区间估计结果比较
由表1和表2知,使用公式(4)推算的患病率(表
2)与根据患病率定义公式计算的结果(表1)完全相
同,提示在患病人数未知的条件下,若已知实验的灵敏
度和特异度,则可由阳性检出率估计患病率.
在实例1中,使用红外扫描方法筛检乳腺癌所得
阳性检出率为43.4%,与该受检人群乳腺癌患病率
44.0%非常接近[引,相对误差仅为一1.4%,显然此时
阳性检出率是患病率的一个良好估计值.在实例2
中,用肥达氏反应诊断伤寒的阳性检出率为19.3%, 而该人群伤寒的患病率则为9.8%【9J,相对误差高达 97.6%,即肥达氏反应的阳性检出率高估患病率近1 倍.实例3则说明,心电图对心肌梗死的阳性检出率 为60.7%,而该人群的心肌梗死患病率则为 74.3%【l0】,相对误差达一18.3%,此时阳性检出率显 着低估了患病率.
区间估计结果显示,一次近似法与精确法的计算 结果十分接近.在实例1中,患病率的95%可信区间 与阳性检出率的95%可信区间基本重合,说明两者的 统计推断结果一致;然而,在实例2和实例3中,患病 率的95%可信区间与阳性检出率的95%可信区间相 距甚远,互不包含,此时若用阳性检出率估计患病率将 会产生统计推断错误.
讨论
1.本文给出患病率计算方法的特点是:即使在患 病人数未知的条件下,使用阳性检出率和检验方法灵 敏度,特异度等信息,也可准确估计患病率.这一特点 具有重要的公共卫生学意义.如在一些以估计患病水 平为目的的公共卫生学人群调查研究中,有时现实不 允许(如在了解乙型肝炎感染水平的人群调查中,由于 没有经济,方便可供大规模人群调查使用的确诊手段, 只能得到乙肝免疫学标志物的阳性检出人数【1,2J),或
中国卫生统计2007年1O月第24卷第5期 无法对调查对象进行确诊(如对某些敏感人群进行的 性病,艾滋病匿名调查),在这些情况下,由于只能得到 某一检测方法的阳性检出人数而得不到患病人数,这 样采用患病率定义公式就无法计算患病率.实际工作
者常常不得不用阳性检出率估计患病水平,从而有可 能造成高估或低估的不良后果.本文为解决这一实际 问
提供了可行方法,这是本研究的创新之处. 2.在总体率的区间估计中,目前常用的有基于二 项分布与F分布关系的Miettinen精确计算法J和根 据中心极限定理的正态近似法J.我们以往的研究 发现,正态近似法在二项分布理论上存在缺陷,在实际 计算上可出现难以接受的误差J.Miettinen方法虽 然精确,但计算十分复杂,使得非统计学工作者难以应 用这一方法.本文给出的一次近似法与Miettinen精 确法的计算结果十分接近,但本法仅涉及简单的代数 运算,用普通计算器即可完成,这为该法的实际应用提 供了方便.
3.使用本方法的关键是准确获得调查所用试剂 的灵敏度和特异度.由于灵敏度,特异度具有不受患 病率影响的优点,因此一旦获得某一试剂的灵敏度,特 异度就可将其应用于不同患病率的人群l1l,J,这为本 方法的实际应用提供了理论基础.然而,需要注意的 是,虽然灵敏度,特异度不随患病率的改变而改变,但 它们却受调查对象疾病谱的影响(如典型病例更易被 检出而表现有较高的灵敏度),因此,在确定试剂的灵 敏度,特异度时必须注意考核血清对目标人群疾病谱 的代表性,要求考核血清既要包括典型的阴性和阳性 标本,也应包括容易漏诊和误诊的非典型标本,否则, 使用本文介绍的方法则会产生分析性偏倚. 4.本文的医学实例研究提示,虽然阳性检出率有 时可准确估计患病率(如例1),但有时可显着高估(如 例2)或低估(如例3)患病率,那么,在什么条件下阳性 检出率会高估患病率?什么条件下将低估?满足什么
条件才能正确估计?在患病率,阳性检出率,实验灵敏
度,特异度间存在着哪些可循的规律?我们将另文论
述
TheMethodofEstimationofPointandConfidenceIntervalof PrevalenceintheAbsenceofPatients'numberLiUPei.Z"
?
485?
Fengcai,ShiZhixu.DepartmentofEpidemiologyandBiostatis—
tics,SchoolofPubl@Health,SoutheastUniversity(210009), Naing
【Abstract】ObjectiveTostudyofthemethodofestimationof
pointandconfidenceintervalofprevalenceintheabsenceofpatients'num? her.MethodsTherelationshipbetweenpositivedetectiverateofdiagnos? ticandscreeningtestandprevalencewasstudiedbyprobabilityandstatisti? caltheoryandtheresultswerevalidatedbyalgebramethodandmedicalex? amples.ResultsUndertheconditionofpositivedetectiverate,sensitivity andspecificityknown,theequationsofprevalencewerededuced.Conclu? sionTheprevalencecanbeobtainedbycombinationinformationofposi—
tivedetectiverate,sensitivityandspecificityoftestkitsintheabsenceofpa, tients'number.Thismethodhasimportantsignificanceinpublichealth studies.
【Keywords】Prevalence;Positivedetectiverate;Sensitivity; Speeificity
参考文献
1.玄春山.李延志,陈航2002,2003年长春市部分健康人群乙型病毒
性肝炎感染状况分析.预防医学论坛,2005,ii(1):118—120
2.刘怀珠.刘旭祥,陆群,等.合肥市病毒性肝炎血清流行病学调查.疾
病控制杂志,2003,7(5):433—435
3.刘定远主编医药数理统计方法.第3版.北京:人民卫生出版社,
1999,80—89.
4.刘沛.总体率可信区间计算的一次近似法及其特征.中国卫生统计, 2004.21(5):297—299.
5.刘沛.四种方法计算总体率可信区间的比较研究.中国卫生统计, 2005,22(6):323—326.
6.刘沛正态近似法计算二项分布总体率95%可信区间的应用条件研 究.中国卫生统计,2004,21(2):85—89.
7.陆守曾主编.医学统计学.北京:中国统计出版社.2002:42. 8.MoskowimM,MilbrathJ,GartsideP,etal,Lackofefficacyofthermog— raphyasascreeningtoolforminimalandstagelbreastcancer.NEnglJ
Med.1984,295:249—252
9.朱世能.林果为主编.临床流行病学
集(1).上海:上海医科大学 出版社.1991.22.
1O.余松林主编.医学统计学.北京:人民卫生出版社,2002,164—178. 11.BernardRosner.FundamentalsofBiostatistics.5thedition.NewYork:
TomsonLearningandSciencePress,2000,194—197.
12.XiaohuaZhou,ObuchowskiNA,McClishDK.StatisticalMethodsinDi.
agnosticMedicine.NewYork:JohnWiley&Sons,Inc.,2002,56—62. 13.姜庆五主编.流行病学.北京:科学出版社,2003.17—19. ,