为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

医学统计学复习表格

2017-10-15 29页 doc 57KB 160阅读

用户头像

is_995397

暂无简介

举报
医学统计学复习表格医学统计学复习表格 篇一:医学统计学复习资料 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所...
医学统计学复习表格
医学统计学复习格 篇一:医学统计学复习资料 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分:计量资料、计数资料、等级资料。 2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。 1 3.统计表的结构为:标题、标目、线条、数字。 4.可信区间的两个要素是:准确度、精密度。 5.方差分析的应用条件为:?各组样本是相互独立的随机样本?来自正态总体?各组总体方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。 7.从集中趋势、离散趋势 两个方面来描述计量资料的分布特 征。 三、单项选择题(请把正确写在下面的表格里,每题2分,共20分) 1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方 法治疗,以服药前后血压的差值为疗效,欲比较三种方法 的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变 2 量为标准正态变量 B A ?? B ??? C ?? D ?? s s?4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 BA 均数 B 几何均数 C 标准差 D中位数5.配对设计的目的 D A 提高测量精度 B操作方便C为了可以使用t检验 D提高组间可比性 6.测定尿铅含量有甲乙两种方法。现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 A A 配对设计t检验 B 成组设计的t检验C均数的u检验 D 方差分析 7.应变量Y的离均差平方和划分,可出现 A A SS剩=SS回B SS总=SS剩C SS总=SS回 D 以上均可 8.相关系数r与决定系数r2 在含义上是有区别的,下面表述中最正确的是 C A r值的大小反映了两个变量之间是否有密切的关系B r值接近于零,表明两变量之间没有任何关系 C r2 值接近于零,表明直线回归的贡献很小 3 D r2 值大小反映了两个变量之间呈直线关系的密切程度和方向 9.以下统计量结果错误的是 D A t,-3.15 B b=-7.2 C r=-0.5Dχ2=-3.85 10.若x服从均数为μ,标准差为σ的正态分布,则x的第95百分位数等于 D A μ+1.64σ B μ+1.96σ C μ-2.32σ D μ+2.32σ 四、简答题(15分) 1.简述正态分布的特征。 答:1.正态分布曲线位于直角坐标系上方,以X=U为中心,左右完全对称,两端以X轴为渐近线2.在X=U出有F(x)最 大值,F(u)=1/??2,x越远离u,F(x)值越小3.正态分布有两个参数,即位置参数u和形态参数?,若固定?,u 值变小,曲线则沿X轴向左平移,u值变大,曲线则沿X轴向右平移,形状均不变,若固定u,?变小,曲线则陡峭,?增大,则曲线变平坦4.u=0,?=1时为标准正态分布记做u ?N(0,1) 2.简述应用相对数时的注意事项。 3.答:?率和构成比的关系;?计算相对数时分母不宜太小?注意指标的可比性?不能以构成比代替强度相对数;?对观察例数不等 4 的几个率不能直接相加求平均数。 3.简述线性回归的用途。答:?描述两个变量变化的依存关系;?利用回归方程进行预测预报;?用容易测的指标估计不宜测量的指标;?获得精度更高的医学参考值范围;?利用回归可以进行统计控制。 五、计算题 1.某地抽查144份黄连中小蘖碱含量(mg/100g)得均数为4.38,标准差为0.18,假设数据服从正态分布,问: ?95%的黄连样品中小蘖碱含量在什么范围, ?估计黄连中小蘖碱含量95%总体均数在什么范围, ?有一份黄连样品,小蘖碱含量为4.80,怎样评价, ?160份样品中,小蘖碱含量在4.0,4.4之间的样品理论上有多少份, Φ(-2.11)=0.0174,Φ(-2.33)=0.0099,Φ(-0.11) 2.用两种方法检查某疾病患者120名,甲法检出率为60%,乙 法检出率为50%,甲、乙法一致的检出率为35%,问两种方法 何者为优,(列出表格写出假设检验步骤)(15分) 一、名词解释 1.计数资料:将研究对象按照某种属性或类别进行分组,然后计算每组的观察例数。 2.抽样误差:由于样本的随机性引起的,统计量与参数的 5 差别,或同一总体的相同统计量之间的差别。 3.P值:在假设检验中根据P值的大小,与实现的检验水准a3.用t检验对直线回归系数进行假设检验,其自由度为 B A n-1 B n-2 C 2(n-1) D n 4.方差分析的目的是 C A 比较均数B 比较标准差C 比较均方 D 比较离均差平方和 5.某学院抽查两个年级学生HBsAg情况,结果甲:抽查35人, 进行比较的而作出拒绝Ho(p,a)或不拒绝Ho(p?a)。 4.r:即样本相关系数,用以表示两个随机变量之间的相关关系的密切程度和相关方向的统计指标。 5.参数:反映总体统计学指标特性的数字称为参数。 二、填空题 1.描述计量资料集中趋势的指标有_算数均数、几何均数_、_中位数。 2.统计工作的步骤分为_设计、_收集资料、_整理资料、_分析资料。 3.线性相关分为_正相关、负相关_、零相关_三种类型。 4.常用的相对数有_率、_构成比、速率_。 5.标准正态分布的均数等于___0__,标准差等于__1__。 6.用百分位数法计算血汞的95%参考值范围是 7.两独立样本率的χ2检验当_T,5且_n,_40时需连续性校正。 6 8.频数分布的的类型分为_正态分布_和_偏态分布。 三、单项选择题 1.比较 20 头河马体重和 20 只小白鼠体重变异程度大小宜采用 A A CV% B S2 C RD S 2.当自由度v??时, 横轴上,正态曲线下从0到1.96的面积为 D A 95% B 45% C 97.5% D 47.5% HBsAg(+)4人;乙年级40人,HBsAg(+)8人,该资料应选用的统计方法是 A A 连续性χ2检验 B 非连续性校正χ2 检验C t检验 D 秩和检验 6.下列哪一变量服从t分布 D A ?? B x??C ?? D??? ?s ? 7.已知r=1,则一定有 C A b=1 B Sy=0C Syx=0D 截距=0 8.完全随机设计的方差分析中,不正确的是 C A ?总=?处理+?误差B SS总=SS处理+SS误差 C ?处理=N-kD F=MS处理/MS误差 9.以下统计量结果错误的是 D 7 A t,-3.15 B b=-7.2 C r=-0.5D χ2 =-3.85 10.直方图可用于 B A 2001年5种疾病发病率比较 B 10个年龄组患病率比较C 身高和患病率的关系分析 D 描述O型血者血红蛋白含量分布 四、简答题 1.简述标准差的用途。(5分) 答:1.表示数据分布的离散程度2.常用X?S作为计量资料的数字特征,描述的专用符号计算临床上的各种生化,生理指 标的参考值的范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重依据之一5.可用来计算均数的抽样误差大小 2.简述应用相对数时的注意事项。(,分) 答:?率和构成比所说明的问题不同,构成比可以说明某事分) ?体重在14.6 kg到23.9 kg之间的男童的概率为多少,(7分) Φ(-2.13)=0.0166,Φ(-1.91)=0.0281,Φ(-0.61)=0.2709 物内部各组成部分的比重或分布,而率是说明某现象发生的频率或强度的,所以不能以构成比代替率。?计算相对数时分母不宜太小?注意指标的可比性?可比性指所比较指标,除研究因素外,其他影响因素应基本相同或相近,即在相同 8 条件下进行对比。通常应注意:1.观察对象同质,研究方法相同,观察时间相等,以及地区、民族、性别、年龄、病情及病程等客观条件均基本一致。2.某个对研究结果有影响的因素,在各组的内部构成是否相同。若因混杂因素干扰,使各对比组构成分布不同时,可采用标准化,平衡内部构成不同的影响后,再进行总率的比较。 3.简述线性回归的用途。(,分) 答:?描述两个变量变化的依存关系;?利用回归方程进行预测预报;?用容易测的指标估计不宜测量的指标;?获得精度更高的医学参考值范围;?利用回归可以进行统计控制。 五、计算分析题(共 30分) 1.假定 5岁男童的体重服从正态分布,平均体重?=19.5kg,标准差?=2.3kg。 ?95%的5岁男童的体重在什么范围,随机抽取一5岁男童的体重为20.9Kg,怎样评价,(5分) ?假设n=100,估计5岁男童的体重总体均数在什么范围,(3 2.为探讨MRI无创性测量肺脉舒张压的新途径,分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压,请回答: ?该研究的设计类型是什么,常用的形式有哪些,(7分) 答:实验性研究。常用形式: 9 ?根据下面表格的分析结果,写出统计结论。(写出具体的假设检验的步骤)(8分) 篇二:医学统计学总复习 一、最佳选择题 1(卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2(统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3(统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4(抽样误差是指 A.不同样本指标之间的差别 10 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6(描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数D.四分位数间距 E.方差 7(用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8(比较身高和体重两组数据变异度大小宜采用 A.变异系数B.方差 C.极差 D.标准差 E.四分位数间距 9(频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 11 E.样本与总体 10(正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数D.算术均数=几何均数=中位数 E.以上都没有 11(正态分布曲线下右侧5,对应的分位点为 A.μ+1.96σB.μ-1.96σ C.μ+2.58σD.μ+1.64σ E.μ-2.58σ 12(下列哪个变量为标准正态变量 A.????x?????? B. C.D. E. ss?s?13(某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14(下列哪一变量服从t分布 A. ?? ? B. x?? ?C. ?? ? D. x??? E.ss15.统计推断的主要内容为 12 A.统计描述与统计图表B.参数估计和假设检验 C.区间估计和点估计 D.统计预测与统计控制 E.参数估计与统计预测 16(可信区间估计的可信度是指 A.? B.1-?C.?D.1-? E.估计误差的自由度 17(下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大 A.变异系数 B.标准差 C.标准误 D.极差E.四分位数间距 18(两样本比较作t检验,差别有显著性时,P值越小说明 A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同 E. I型错误越大 19(两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 A.?=0.05B.?=0.01 C.?=0.10 D.?=0.20E.?=0.02 20.当样本含量n固定时,选择下列哪个检验水准得到的检验效能最高 A.?=0.01 B.?=0.10 C.?=0.05 13 D.?=0.20 E.?=0.02 21.在假设检验中,P值和?的关系为 A. P值越大,?值就越大 B. P值越大,?值就越小 C. P值和?值均可由研究者事先设定 D. P值和?值都不可以由研究者事先设定 E. P值的大小与?值的大小无关 22.假设检验中的第二类错误是指 A.拒绝了实际上成立的H0B.不拒绝实际上成立的H0 C.拒绝了实际上成立的H1D.不拒绝实际上不成立的H0 E.拒绝H0时所犯的错误 23.方差分析中,组内变异反映的是 A. 测量误差 B. 个体差异 C. 随机误差,包括个体差异及测量误差 D. 抽样误差 E. 系统误差 24.方差分析中,组间变异主要反映 A. 随机误差 B. 处理因素的作用 C. 抽样误差 D. 测量误差 E. 个体差异 25.多组均数的两两比较中,若不用q检验而用t检验,则 A. 结果更合理 B. 结果会一样 C. 会把一些无差别的总体判断有差别的概率加大 14 D. 会把一些有差别的总体判断无差别的概率加大 E. 以上都不对 26.说明某现象发生强度的指标为 A.构成比B.相对比 C.定基比D.环比 E. 率 27.对计数资料进行统计描述的主要指标是 A.平均数 B.相对数 C.标准差 D.变异系数 E.中位数 28.构成比用来反映 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 29. 样本含量分别为n1和n2的两样本率分别为p1和p2, 则其合并平均率pc为 A. p1+p2 B. (p1+p2)/2 C. p1?p2 D. n1p1?n2p2 n1?n2 E. (n1?1)p1?(n2?1)p2 n1?n2?2 30.下列哪一指标为相对比 A. 中位数 B. 几何均数 C. 均数 D. 标准差 E. 变异系数 15 31.发展速度和增长速度的关系为 A. 发展速度=增长速度一1 B. 增长速度=发展速度一1 C.发展速度=增长速度一100D.增长速度=发展速度一100 E.增长速度=(发展速度一1)/100 32.SMR表示 A.标化组实际死亡数与预期死亡数之比 B.标化组预期死亡数与实际死亡数之比 C.被标化组实际死亡数与预期死亡数之比 D.被标化组预期死亡数与实际死亡数之比 E.标准组与被标化组预期死亡数之比 33.两个样本率差别的假设检验,其目的是 A.推断两个样本率有无差别 B.推断两个总体率有无差别 C.推断两个样本率和两个总体率有无差别 D.推断两个样本率和两个总体率的差别有无统计意义 E.推断两个总体分布是否相同 34.用正态近似法进行总体率的区间估计时,应满足 A. n足够大B. p或(1-p)不太小 C. np或n(1-p)均大于5 D. 以上均要求 E. 以上均不要求 35.由两样本率的差别推断两总体率的差别,若P〈0.05,则 16 A. 两样本率相差很大 B. 两总体率相差很大 C. 两样本率和两总体率差别有统计意义 D. 两总体率相差有统计意义 E. 其中一个样本率和总体率的差别有统计意义 36.假设对两个率差别的显著性检验同时用u检验和?2检验,则所得到的统计量u与?2的关系为 A. u值较?2值准确 B. ?2值较u值准确 C. u=?2 D. u=?2 E. ?2= 37.四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求?2的条件为 A. A?5 B. T?5C. A?5 且 T?5 D. A?5 且n?40 E. T?5 且n?40 238.三个样本率比较得到?2?0.01(2),可以为 A.三个总体率不同或不全相同 B.三个总体率都不相同 C.三个样本率都不相同 D.三个样本率不同或不全相同 E.三个总体率中有两个不同 39.四格表?2检验的校正公式应用条件为 A. n40 且T5 B. n<40 且T5 C. n40 且 1<T<5D. n<40 且1<T<5 E. n40 且T<1 17 40.下述哪项不是非参数统计的优点 A.不受总体分布的限定 B.简便、易掌握 C.适用于等级资料D.检验效能高于参数检验 E.适用于未知分布型资料 41.秩和检验和t检验相比,其优点是 A. 计算简便,不受分布限制 B.公式更为合理 C.检验效能高 D.抽样误差小 E.第二类错误概率小 42.等级资料比较宜用 A. t检验 B. u检验 C.秩和检验 D. ?2检验 E. F检验 43.作两均数比较,已知n1、n2均小于30,总体方差不齐且分布呈极度偏态,宜用 A. t检验 B. u检验 C.秩和检验 D. F检验 E.?2检验 44.从文献中得到同类研究的两个率比较的四格表资料,其?2检验结果为:甲文 2?2??0.01(1),乙文?2??0.05(1),可认为 A.两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.乙文结果更可信 E.甲文说明总体间的差别更大 45.欲比较某地区1980年以来三种疾病的发病率在各年度 18 的发展速度,宜绘制 A.普通线图B.直方图 C.统计地图 D.半对数线图 E.圆形图 46.拟以图示某市1990,1994年三种传染病发病率随时间的变化,宜采用 A.普通线图B.直方图 C.统计地图 D.半对数线图 E.圆形图 47.调查某地高血压患者情况,以舒张压?90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是: A.计量资料 B.计数资料 C.多项分类资料D.等级资料 E.既是计量资料又是分类资料 48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。欲评价该资料的集中趋势 篇三:医学统计学复习 医学统计学复习 1.科研设计 (1)课题设计分类 分为两大类,?课题框架设计方案:类似课题课题申请书方面的内容,包括如课题经费、承担人员、具体分工、负责人等。?课题统计设计方案:主要包括试验设计方案、临床 19 试验设计方案和调查设计方案。 (2)各大类再分成小类 根据课题的规模或级别将课题框架设计方案划分为:总课题框架设计方案、分课题框架设计方案和子课题框架设计方案。 根据课题的性质将课题统计设计方案划分为:试验设计方案、临床试验设计方案和调查设计方案。 (3)两大类中核心内容 课题框架设计方案核心内容:?课题概况(意义、目的、规模);?课题承担情况(人、任务);?课题技术问题(学术、技术);?课题进度安排(、时间);?课题经费预算(物力、财力)。 课题统计设计方案核心内容:?精准把握三要素。三要素包括受试对象、影响因素和观测指标;?严格遵循四原则。四原则指随机原则、对照原则、重复原则和均衡原则;?合理选定设计类型。试验设计类型是因素及其水平所决定的一种结构,试验类型的选择需要根据因素及其水平组合情况、因素作用于受试对象的时间、因素对观测结果的影响情况等方面来判定;?科学预见并严格实施质量控制。 (4)试验记录应记什么 其一,不以实验为研究手段实验记录填写: 应将查阅文献、分析文献、形成论文的思路、选题、定题、 20 开题、制定实施方案、调查或咨询或思考过程、分析加工、整理、撰写或修改等过程,按时间顺序一一记录下来。也就是说,真实地记录下论文的形成过程。也应有各阶段上导师的检查、签字和签字日期。 其二,以实验为研究手段实验记录应记录: 时间、参与人、记录人、实验名称、具体实验设计方案编号; 受试对象:确定种类的依据;质量要求(制定纳入、排除、中止、终止、剔除标准);数量要求(包括计算过程或公式或程序及结果); 影响因素(大多数属于实验材料,有些属于环境和条件):全部实验因素及其水平;全部重要非实验因素及其水平。 观测指标(诊断、疗效评价、安全性评价指标三大类):应分出主要、次要指标;指标的测定方法、测定时间和测定次数。 采用合适的随机分组方法设置了合理的对照组,有根据地给出了样本含量,被证实的高质量组间均衡。 以表格形式呈现的设计类型和测量与记录实验数据的具体方法和要求,表格见229~262页。 实验过程中的质量控制:如何及时发现并严格控制环境、条件和心理因素等的变化对实验结果造成的影响;可能出现的异常情况及处置方法。 21 实验结束后的分析小结:本次实验存在哪些问题;下次实验应把握哪些要点;记录错误如何修改;如何在实验记录本上贴照片;实验者签字;负责人检查、评价、签字。 2统计表达 (1)编制统计表的要领 统计表关键是要能够自明。 简单明了。一张统计表最好只表达一个中心内容,不要很多内容堆在一起。 分组标志清晰。一般情况下,把统计表的“原因变量(分组标志)”放在表的左侧,作为横标目;把统计表的“结果变量(观测指标)”放在表的右上侧,作为纵标目,一般情况,定性资料是例数,定量指标就是具体指标名称。 (2)统计表中常见的错误 ?表中数据的含义未表达清楚,令人费解;?标题过长、主题不突出;?线条过多;?纵横标目颠倒,即分组原因变量与结果变量位置颠倒;?同一张表中的内容过多;?分母很小也算相对数;?用简化形式表达多组定量资料时,不假思索地选用“x ?S”或者“x ?Sx ”;?数字小数位点不统一等。其中,最严重的错误是表中数据的含义未表达清楚,令人费解。 (3)绘制统计图的要领 ?根据资料的性质选用相应的统计图;?要确保坐标轴上 22 所标的刻度符合数学原则。 (4)统计图中常见错误 ?资料类型与所选图形类型不吻合。如用最简单的条图表达各种各样的资料,尤其是运用条图表达连续性资料,这就割裂了数据之间的内在联系;横坐标为连续型变量,划成条图;横坐标为定性变量,划成线图;?在坐标轴上刻度值标注不正确或违背数学原则。如随意将定量数据放在横坐标轴上,等长间隔代表数据不等,XY轴数字方向标反,横坐标上直接标很大的值等等。 3.统计描述1 (1)五种平均指标选用(P54-55) ?算术平均值适用一组性质相同呈单峰且近似服从对称分布(最好服从正态分布)的定量资料;?几何平均数适用于一组性质相同呈单峰且服从正偏态分布(最好服从对数正态分布,即数据取对数变换后服从正态分布)定量资料;?调和平均值可应用于表达一组性质相同呈极严重正偏态分布(即高峰出现在全部数据取值范围的中心店左边)定量资料的平均水平;?中位数可以应用于任何定量资料,通常用于不适合用几何均值及调和均值的偏态分布资料中,尤其适用于包含不完全信息的资料中,比如特别小和特别大的数据只知道个数,没有具体数据,只给出了中间的数据则可选用中位数表示;?实际问题中希望表达出大多数个体都出现某 23 种情况的数据则可选用众数,比如表示某病或某次食物中毒的潜伏期选用众数可以起到“形象生动”的效果。 (2)多种变异指标选用 变异指标一般分两大类,一类是数据近似服从正态分布,可选的变异指标有标准差、方差、标准误、变异系数;一类是数据不是近似正态分布,可选用的变异指标最粗略的是极差,比之稍细致的变异指标是用两个分位数来表示。 标准差与变异系数的用法比较: 一组数据时,两者均可使用。 当比较两组或多组定量资料的离散度大小时,在下面两种情形下,必须使用变异系数;1)当各组定量资料的单位不同时;2)当各组定量资料的算术平均值相差悬殊时。 标准差与方差的用法比较: 在可以计算标准差和方差的资料中,为了反映资料的离散度大小时,通常只用标准差,而不用方差;当比较两组或者多组定量数据的平均值差别有无统计学意义时选用方差,而不用标准差。即标准差用来反映离散度大小而方差是用来间接实现平均值比较。 极差与四分位数的用法比较。 极差粗略,较少使用;四分位数间距反映了一组性质相同的定量数据中居中的50%的数据所在的范围,比极差更有参考价值。 24 (3)标准差与标准误区别 首先,定量的指标才有标准差和标准误,而定性的指标只有标准误。 其次,在定量的指标中,标准差是用原始数据算出来的离散度大小。原始数据多次抽样后算出的多个平均值的标准差称为平均值的标准误。此时,标准差是度量每一个个体值的离散度大小,标准误是度量样本平均数的离散度大小的变异指标。对于定量的指标,两者关系是:Sx 再次,用“x ?S”或“x ? “x ?SX”来表达一组定量数据是有区别的。“x ?S”强调的是这一组数据个体的变化大小,SX”强调的是这一组数据对应的总体的平均数大概是多少。前者可近似理解为容许区间,后者可近似理解为置信区间。 最后,标准差适合用来反映一组性质相同的定量数据离开其算术平均值的波动大小,它反映了在相同条件下实验的重现性好坏(即精密度的高低),标准误则更适合用来反映在相同条件下实验的准确度的高低。在表达实验结果离散度大小时,建议使用标准差。 (4)两种简化表达单组设计一元定量资料的方法 常见表示方法为“x ?S”和中位数M(Q1~Q3)两种:“x ?S”表达呈对称分布的一组定量资料的简化方法;M(Q1~Q3)表达呈非对称分布的一组定量资料的简化方法。 25 3.统计描述2 (1)相对数种类与作用 相对数即两个有联系的数据的比值,可分为百分比和百分率。百分比又可分为构成比和相对比,相对比包括定基比、环比等。定基比和环比表示发展速度,减1叫增长速度。 绝对数反映事物的规模和水平,不可比。相对数是两个有联系的数据的比值,是将基数化为相同,便于比较。比绝对数反映问题更到位、合理。 (2)RR与OR的异同点 RR值为相对危险度(relative ratio),适合于队列研究(前瞻性研究),是队列研究中暴露组的发病率与非暴露组的发病率之比。即暴露于某个危险条件下的发病率是不暴露于这个危险条件下的发病率的多少倍。OR值即比值比(优势比,odds ratio),是病例对照研究(回顾性研究)中常用的说明暴露因素与疾病之间关联强度的指标,其含义是暴露组的疾病危险度是非暴露组的疾病危险度的多少倍。 在病例对照研究中,由于不能计算发病率,亦即不能计算发病率比(RR)。暴露和疾病联系强度就用比值比(OR)来近似表示RR。但有两个条件:1.所研究的疾病发病率率低;2.病例和对照的选择要有代表性,特别是对照的选择,即对照必须从产生病例的源人群中并以独立于暴露的方式来抽样。 26 RR与OR的共同点是两者均是相对比值。不同点是RR解释问题更清楚。OR是间接想达到RR结果的相对数,其结果准确程度相对较差。即OR目标与RR相近,但实现途径有区别。 (3)频率与概率的异同 共同点:都是用来描述随机事件发生的可能性大小的度量。即我们关心的事情发生了多少次,总的有多少可能性。 不同点:频率是相对样本而言;概率则是相对总体而言,反映总体的属性。 (4)百分比与率的异同 共同点:两者都是观察单位数与观察单位总数之比,即我们关心的事情出现的次数为分子,总的可能的情况为分母。 不同点:百分比说明某事物内部各组成部分所占的比重或分布,把整体划分为互不相交、互不重叠的几个部分,然后用关心的一部分数量做分子,所有的数量做分母。比可相加,之和等于100%。百分率说明某现象在其可能发生的范围内实际发生的频率或强度,反映事物的普遍及严重程度。百分率一般情况下,不能将整体划分为几个互不相交、互不重叠的几个部分。率讨论的问题在受试对象上有可能出现重叠。率不可直接相加,合计率应为分子、分母分别相加后再相除。 4.概率分布(不会考) (1)何为概率分布 27 概率分布就是概率1被分配给某个随机变量不同取值的详细情况。由某随机变量的全部取值以及其取不同值的概率这两部分信息组成的一个结构被称为该随机变量的概率分布。连续型随机变量概率分布是?给定连续型随机变量X的全部取值空间;?可算出X任何小区间上取值的概率;两者结合,则称为X概率分布。 (2)何为正态与t分布 正态分布:P45 t分布:P48 (3)何为卡方和F分布 卡方分布:P46 F分布:P49 (4)何为极限分布 当一个分布规律一开始不是正态分布,当样本量趋于无限大时可变为正态,则称此分布为以正态分布为其极限分布的分布。 5.区间估计 (1)何为点与区间分布(P71) 参数估计是用样本统计量推断总体参数,有点估计和区间估计两种。 点估计是用相应样本统计量直接作为其总体参数的估计值。点估计比较简单,但未考虑抽样误差的大小。 区间估 28 计是指通过样本统计量及其分布规律,计算出一个下限和一个上限,并以它们所决定的范围或称为区间来估计待估计的那个量。 (2)何为置信区间(P71) 按预先给定的概率1??确定包含未知总体参数的一个范围,该范围叫做参数的置信区间,也称为可信区间(confidence interval,CI)。置信区间是用来估计总体中某一个参数的区间。预先给定的概率1??称为置信度或可信 度,一般取95%或99%。置信区间通常由两个数值即置信限表示,较小者称为置信下限,较大者称为置信上限。常见的总体参数置信区间估计:总体平均数、总体方差和标准差、总体率、总体相关系数。 (3)何为容许区间(P72) 容许区间是以置信水平为γ估计样本所代表的总体中某定量指标的取值范围,此范围包括总体中比例为β的个体。容许区间是用来估计总体中多个个体测定值所在的范围。容许区间需要两个相对数:把握和比例。把握是指区间估计正确的概率;比例是指区间包括了总体中多大比例的个体测定值在此区间内。 (4)何为预测区间(P72) 预测区间是用来估计总体中未来将被抽到的k个个体在指定指标上的取值区间。 k通常取值1,2,3。预测区间是 29 对样本之外的未来的再抽样的个体的取值所在范围的估计。只有一个相对数,即有多大把握推测未来个体测定值在什么范围内。 (5)几种区间异同点(P72~73) 6.假设检验1 (1)何为假设检验(P279下) 假设检验是指根据样本的信息去推论总体的情况的解决问题的一种方法。假设检验包括假设和检验两个方面,其中假设又包括原假设和备择假设。 (2)如何识别单因素设计 识别单因素设计的要点:不用“组别”、“方案”、“处理”等笼统的词而可以找到一个专业上的词汇来概括所有分组,则此设计为单因素设计。 (3)分析单因素设计一元定量资料的策略 首先,明确分析目的:差异性分析、相互关系、依赖关系、分类、判别等。最常见分析定量资料的目的是差异性分析。 (来自:WwW.xltkwJ.cOm 小龙 文档 网:医学统计学复习表格)其次,明确单因素设计类型:单组设计、配对设计、单因素两水平设计、单因素多水平设计。 再次,明确此定量资料是否满足参数检验的前提条件。单组设计和配对设计的前提条件相同,即独立性和正态性。单因素两水平设计和单因素多水平设计前提条件:独立性、正 30 态性和方差齐性。 最后,若前提条件均满足,那么单组设计可选择单组设计一元定量资料t检验;配对设计可选择配对设计一元定量资料t检验;单因素两水平设计可选用单因素两水平设计一元定量资料t检验;单因素多水平设计可选用单因素多水平设计一元定量资料方差分析。 此外,单组设计和配对设计若独立性不满足应想办法让其满足;若正态性不满足,可有两种办法:?直接做相应设计的符号秩检验,?进行合适的变量变换使之满足。单因素两水平设计独立性不满足,消除不独立的部分数据;方差齐性不满足,选用两种近似t检验之一,其中Satterthwaite近似法结果更准;正态性不满足,合适的变量变换或者进行Wilcoxon秩和检验。单因素多水平设计不满足方差齐性时采用单因素多水平设计一元定量资料秩和检验(Krukal-Wallis 秩和检验)或Welch近似方差分析;不满足正态性可采用单因素多水平设计一元定量资料秩(Krukal-Wallis秩和检验)和检验或找到合适的变量变换后采用方差分析。 (4)分析单因素设计一元设计定性资料策略 定性资料统计分析的关键点:?认准列联表类型;?弄清分析目的;?检查资料的前提条件。 首先,明确分析目的:最常用的有两类,即差异性分析和回归分析。 31 其次,正确判定列联表的类型。粗分为2×2列联表、R×C列联表、高维列联表。 2×2列联表又细分为:横断面研究设计2×2表、队列研究设计2×2表、病例-对照研究设计2×2表、配对研究设计2×2表。 横断面研究设计2×2表、队列研究设计2×2表、病例-对照研究设计2×2 表共同假设都是独立性假设,专业 上的假设可化为两个率的比较。第一步算法可选用一般的?2检验、校正的?2检验或者Fisher精确检验,根据具体情况选择。队列研究设计2×2表、病例-对照研究设计2×2表中第一步若得到P<0.05的结果时,需要进行第二步,否则,停止计算。第二步,计算相对危险度RR(即Relative Risk,简称RR)(对应队列研究设计的2×2表)或者计算比数比OR(即Odds Ratio,简称OR)(对应病例-对照研究设计2×2表);第三步,检验总体RR或OR与1之间的差别是否具有统计学意义,需要运用MH?2检验公式计算。配对研究设计2×2表有两种计算,一种是看对角线上的数占总数,即一致性是否有统计学意义,称为一致性检验(Kappa检验);另一种是看不一致的两个数差别有没有统计学意义,即对称性检验(McNemar检验)。 R×C列联表又分为:双向无序R×C表、结果变量为有序 32 变量的单向有序R×C表、双向有序且属性不同的R×C表、双向有序且属性相同的R×C表。 双向无序R×C表是看各行上频数分布规律是否相同。可选用一般的?2检验或者Fisher精确检验。当整个表中小于5的理论频数的格子数没有超过1/5时,选择一般?2检验,否则选Fisher精确检验。 结果变量为有序变量的单向有序R×C表的差异性分析统计方法是秩和检验 双向有序且属性不同的R×C表资料应根据具体的分析目来确定分析方法:第一个分析目的,只关心各组结果变量取值之间的差别是否具有统计学意义,此时,原因变量的有序性就变得无关紧要了,可将此时的“双向有序R×C列联表资料”视为“结果变量为有序变量的单向有序R×C列联表资料”,可以选用的统计分析方法有秩和检验、Ridit分析和有序变量的logistic回归分析;第二个分析目的,希望考察原因变量与结果变量之间是否存在相关关系,此时,需要选用处理定性资料的相关分析方法,通常采用Spearman秩相关分析方法;第三个分析目的,若两个有序变量之间存在的相关关系有统计学意义,研究者希望进一步了解这两个有序变量之间的变化关系是呈直线关系还是呈某种曲线关系,此时宜选用线性趋势检验;第四个分析目的,希望考察各行上的频数分布是否相同,此时,将此资料视为双向无序的R?C 33 列联表资料,可根据资料具备的前提条件,选用一般?2检验或Fisher精确检验。若P,0.05,不能认为两有序变量之间有相关关系,而只能认为各行上的频数分布不同。 双向有序且属性相同的R×C表是配对设计2×2列联表资料的“扩大”,在处理这类资料时,人们关心的是两种检测方法检测的结果之间是否具有一致性,故常用的统计分析方法叫做一致性检验或称为Kappa检验。当然,也可考察不一致部分的差别是否具有统计学意义,称为对称性检验。 6.假设检验2(P288) 与假设检验有关的概念 (1)非劣效性检验 指主要研究目的是显示试验药的治疗效果在临床上不比阳性对照药差的试验。在试验设计阶段需要依据具体情况和临床经验事先设定一个非劣效界值δ,来界定试验药的疗效是否不比对照药差过预先设定的这个界值。 (2)等效性检验 两个等效性界值分别称为优侧和劣侧界值,两侧界值可以不等距,实际中一般取等距,分别用δ和-δ来表示。等效性试验的应用多见于对同一活性成分的生物等效性以及血浆无法测定时的临床等效性验证。 (3)优效性检验 指主要研究目的是显示试验药的治疗效果优于对照药(安 34 慰剂或阳性对照)的试验。在试验设计阶段需要依据具体情况和临床经验事先设定一个优效界值δ,来界定试验药的疗效是否比对照药好过预先设定的这个界值。 6.假设检验3 假设检验SAS实现: (1)单因素设计定量资料 单组设计一元定量资料差异性检验:P281(抽样样本所代表总体均值与已知总体均值是否有差异) 配对设计一元定量资料差异性检验:P283(后者减去前者,与0相比是否有差异) 成组设计一元定量资料差异性检验:P286(总体随机抽样本分两组,不同处理,比较是否有差异) 单因素多水平设计一元定量资料差异性检验:P293(总体随机抽样本分多组,不同处理,比较是否有差异) (2)R×C列联表资料 P322-354(需要分清哪种,分析目的是什么,希望做哪种分析。) (3)简单相关分析 Pearson乘积—矩相关分析(360页下):服从双变量正态分布,数据对应的点呈线性分布 Spearman秩相关分析(363页下):适应于单因素两水平设计定量资料或有序资料的秩相关分析 35 Kendall’tau-b相关分析(366页下):配对设计扩大形式,测同一个样品的两个数据之间相关性。 (4)简单回归分析 36
/
本文档为【医学统计学复习表格】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索