统计学知识点归纳
作者:Johnny
医学统计学知识点归纳
一、概念
(1) 同质(homogeneity):是指观察单位或观察指标受共同因素制约的部分,即性质相
同的事物,是统计
的前提。
(2) 变异(variation):是指同质的基础上个体间的差异,也称个体变异,包括个体与个
体间的差别和同一个体重复测量值间的差别,具有一定的随机性和不可预测性,是
普遍存在的。
(3) 样本(sample):是指从总体中随机抽取部分观察单位其某项指标实测值的集合。 (4) 抽样误差:样本指标与总体指标之间的差异称为抽样误差,这是由于观察存在的个
体差异造成的。
(5) 相关系数(correlation coefficcient):又称Pearson积差相关系数,是描述两个变量间
直线相关的密切程度与方向的统计指标,样本相关系数用
示,总体相关系数用,r
表示。相关系数没有单位,其值波动在-1和1之间。
二、考点
(1)、统计资料的类型:计量资料、计数资料和等级分组资料。
(2)、医学统计工作的基本步骤:
、收集资料和整理。
(3)、常用的平均数有:算术平均数、几何平均数和中位数
(4)、频数分布的两个特征:集中趋势和离散趋势。
表1常用统计图的使用
图名 意义
线图 表示指标的变化趋势或一指标虽另一指标的变化趋势 百分条图、圆图 表示事物内部各组成部分的百分构成
半对数线图 表示事物的发展速度,相对变化趋势,
散点图 表示两变量间的数量关系和变化趋势
直方图 表示连续性变量的频数分布
(5)、参考范围估计:未知:x,1.96s或x,2.58s ,
(6)、置信区间估计:1)已知:或 (x,1.96,,x,1.96,)(x,2.58,,x,2.58,),xxxx
2)未知 ,
,100,(,1.96,,1.96)(,2.58,,2.58)nxsxsorxsxs,xxxx,,
nxtsxtsorxtsxts,100,(,,,)(,,,),0.05,、x0.05,、,x0.01、,x0.01、,x,
(7)、常用相对数:率、构成比、相对比
,,,/n;s,s/n(8)、标准误的计算: xx
(9)、假设检验的步骤:
1)建立假设、确定检验水准
,,H:,00
,, H:,1:0
,0.05,
2)选定检验方法和计算统计量
?3)确定P值和作出推断结论
1
作者:Johnny
,|t|,t;p,,,, ?结论为按所取检验水平,尚不能拒绝,无统计学意义,还p,,H,0|t|,t;p,,,,,
不能认为……不同或不等;?结论为按所取检验水平,拒绝,接受,可认p,,HH,01为……不同或不等。……方法有效(或差异显著)或……偏高或偏低。(若,还得看p,,
0.01,p,0.05p,0.01差异的显著性,差异显著;差异不显著) (10)、假设检验应注意的问题:
1)要有严密的研究设计(资料间的可比性);
2)正确使用能够统计方法;
3)正确理解差别有无显著性的统计意义;
4)结结论不能绝对化;
5)报告结果对应写出P值的确切范围;
6)正确选择单侧和双侧检验;
表2计量资料的u、t检验小结
t-test u-test 设计类建立假设 型 条件 公式 条件 公式
未知 ?,X,,样本均?正态、方0 H:,,,u,,,,n,100数与总 差齐 且n,50 s/n H:,,,X,,100 t,,,,n,1体均数 未知?,,单/?已知,,0.05,s/n,X,X与0 u,,,,n,1双, 且n?50 ,/n0,且n,50
X,X 12t,22n,s,n,s(1)(1)11两个样 1122X,X,()12n,n,nn2u,1212H:,,,本均数 01222ss12或?及,nnnn||,X,X121212 H:,,,t,与X1121nn222212()/()/X,Xn,X,Xn11,,,,111222(),,单/50 50 ,,0.052n,n,nn1212 双, ,,n,n,2 X122
,,n,n,212
H:,,0 0d配对设 H:,,0d 1d~=对子数-1 t,,无 计 u,单/,,0.05s/ndd 双,
X,X12t,注:或 22n,s,n,s(1)(1)111122,()n,n,nn21212
X,X||12t, 2222X,Xn,X,Xn()/()/11,,,,111222(,)n,n,nn21212
2
作者:Johnny
表3数值变量资料的统计描述
集中趋势 离散趋势
名称 使用条件 计算公式 名称 概念 计算公式
全距一组同质观察值中算术均x,i对称分布资料 亦称最大值与最小值之 R,最大值,最小值 x, 数 n极差 差
xlg,i,1n上四分位数与下四G,xx...x,lg() 12n四分抗体的平均滴n几何均分位数之差,一般适度、平均抗体位数四分位数间距= P,P 7525数 用于与中位数偏锋fxlg效价 间距 ,ii,1 分布资料的特征 G,lg()f,i
?为奇数时: M,Xn[(n,1)/2]2X(,,),2 ,,描述各种分描述所有观察值与1N?为偶数时:或nM,[X,X]n/2(n/2),1中位数 布,尤其是偏方差 均数的平均离散程 22(X,X)锋分布 度的指标 ,2is, M,P,L,(n,50%,f) ,50Ln,1fx
2X(,,), ,,N
2(X,X), s,n,1标准方差的正平方根 差 22X,(X)/n,, s,n,1
i百分位22 fX,(fX)/nM,P,L,(n,x%,f)各种分布 ,,,50L s,f数 xf,1,
标准差与算术均数
之比,描述了观察值
的变异相对于其平
变异均水平的大小,多用s CV,,100% 系数 于观察指标的单位X
不同或均数相差较
大时两组(或多组资
料变异程度的比较)
3
作者:Johnny
2表4分类变量资料的检验小结 ,
表格类型 检验假设 使用条件 公式
?n?40
2 (ad,bc)n2 ,?,且Tmin?成组资料表格 (a,b)(c,d)(a,c)(b,d) H:,,,00药物 有效 无效 合计 5 H:,,,10甲 a b a+b ?n?40 ,,0.052乙 c d c+d 且1?(|ad,bc|,n/2)n2 ,,(a,b)(c,d)(a,c)(b,d)合计 a+c b+d n ,5 Tmin
2?b,cb,c()2 ?配对资料表格 ,, H:B,C0?40 b,c甲法 合计 乙法 H:B,C1+ -
2+ a b a+b ?,,0.05b,cb,c(||-1)2,, - c d c+d ,40 b,c合计 a+c b+d n
?行×列表 :个样,H0
药物 有效 无效 合计 本率相同, 甲 2A2 n,,(,1):个样,H乙 ,1nnRC丙 本率不全相合计 n 同或全不相
同
注:=,行-1,,列-1, ,
(11)、非
统计——秩和检验,使用条件:方差不齐、分布不齐资料。
l22XY(12)相关系数的计算 r,,l,X,(X)/n,,xxllXXYY
22l,Y,(Y)/nl,XY,(X)(Y)/n,;假设检验 ,,,,,YYXY
r,n,2,,,0,,0:;:;~~亦可直接查表 Ht,,r,H,,0.050r12s1,rr
:lxyY,a,bX(13)、直线回归, b,,a,Y,bXlxx
26d,(14)、等级相关: r,1,,,1,r,1s2n(n,1)
4
作者:Johnny
表5秩和检验小结
样本类型 条件及公式 检验步骤 结果判定
1、建立假设
:差值的总体中H0
?若直接计算秩和 6,n,25位数为0 ?若 n,25?若 T,TorT,T0.010.05:差值的总体中H1|T,n(n,1)/4|,0.5 ,,则 P,0.01orP,0.05位数不为0 n(n,1)(2n,1)/24配对资料 ,,0.05?若T,TorT,T 0.010.05当有相同秩次时,用校正公式 2、 求差值~编秩~|T,n(n,1)/4|,0.5 则 P,0.01orP,0.05,,求秩和T 1 3n(n,1)(2n,1)/24-((t,t),jj48T3、= |T,T|,,min
4、确定P值
1、建立假设
? 若n,10接计算秩和 :两总体分布位H0?若n,10
置相同 |T,n(N,1)/2|,0.5?若 T,TorT,T10.010.05,, :两总体分布位Hnn(N,1)/12112两个样本则P,0.01orP,0.05
置不同 比较 当有相同秩次较多时,用校正公式 T,TorT,T?若 0.010.05 ,,0.05,,,/C cT2、 编秩~求秩和 则P,0.01orP,0.05
T3、=样本含量较33C,1,(t,t)/(N,N) ,jj少组秩和
4、确定P值
1、建立假设
:多个总体分布H0
2R12位置相同 i H,,3(N,1),N(N,1)ni:多个总体分布H个样本比1
较(H检与上类似 校正 H,H/C位置不同或不全相c验) 同 33 C,1,(t,t)/(N,N) ,,0.05,jj
2、求差值~编秩~
求H
4、确定P值
5