中西医结合学报 竺叫 年 ‘ 月第 石卷第 期
‘ ’ 、。、。 、一 。 。〔 , 。 。 、、一。 。 。 叫 。 几
鹰翻日令
医学论文中定性资料统计分析方面的错误辨析与释疑
胡 良平 ’ , 刘惠刚 竺
军事医学科学院生物医学统计学咨询中心 北京
首都医科大学基础医学院 北 京 。。
关键词 统计学 医学 论 文 统计分析 非参数统计
中图分类号 文献标识码 文章编号 一 〔 一 。 洲 一例
一 ’ , 一 止
、。 〔一。呀 , , 、 八 、 一。
·
工。一 石 , 〔
’
’ 、 一 。、 , 一 一 · 〕 性 一
旧 旧 丫 ,
, 让 汇”
,
亡 及。 , 叭 £
一 ,
问题的提 出
在医学论 文或稿件中 若观测结果是足 性资料
常需研 究定性的原因 变量 有 时也 可 包含定量 的原
因 变量 对其影响情况 此 时
, 称 为定性资料的统计
分析 。 如何才能 正 确地 实现 定性 资料 的统 计 分析
呢 关键是三 点 其 一 , 给定性资料所对应 的列联表
命名 其 二 , 弄清统计分析的 目的 其三
,
检查定性资
料是否具 备某些特定分析方法所要求的前提 条件
。
令 人感到奇怪 的是 , 很 多人把 才检验误 认 为是
处理 定性资料的万 能工 具
, 因此
,
在医学论 文或稿件
中
, 这 方面 的错误不计其数 。
要想正 确处理定性资料 , 务必要弄清列联表资料
的 种形式
。
来 自横断面 研 究设 计 的 只 表
来 自队列研 究设 计的 只 表 来 自病例对照
研 究设 计 的 只 表 来 自配 对 研 究 设 计 的
火 表 幼 双 向无 序的 又 列联表 结果变量
为有序变量 的单 向有序的 只 列联表 双 向有
序且 属性不 同的 只 列联表 双 向有序且 属性
相同的 丫 列联表 结果变量 为二 值 变量 的高
维列联表 结果变量 为多值有序变量 的高维列联
表 结果变量 为多值名义 变量的高维列联表 。 与
这 种列联表资料对应的统计分析方 法是相对固足
的 , 只 要能准确辨识 各种定性资料所对应 的列联 表
再结合统计分析 目的和资料所具 备的前提 条件 正 确
选择统计分析方法就会水到渠成 ’
· 止 。
忽视定性资料的前提条件
例
题 目 新 生儿 筛查滤纸 干 血 样测 足
的影响因素探讨
。 目的 探 讨 新 生 儿 筛查滤纸 干血
样法检 测 过 程 中 , 可 能 影 响 促 甲状 腺 素
、 , 。 , 及苯丙 氨酸
, 飞 测 定 的因素 , 以 建 立 有效 的改进措 施 。
方法 观 察采血 时 间 等 因 素对 酶 免疫 标 记 法
和细 菌抑制 法结果 的影 响 , 观 察其 变 化规
律 。 结果 新生儿筛查试验影响 因素众 多
。 测
定 , 采 血 后结 果 稳定 , 季 节 间
尸
水 平 有 差
异 滤纸血 样 自然干燥易于 洗脱 。 测定 后
采血 可 减 少假 阳 性
。
结论 采血 时 间 川亩界 值
、
血 片
处理 等因素可 影响筛查结果 , 选择最 佳实验 条件 能
较好地保证 新生儿 筛查试 验 质量 。 资料 见表 。
对差错 的辨析与释疑 原 作者 用的 是 一 般 方
检验 但在这 里 并 不 合 适 , 因 为 爪 以 上 格 内的理
论 频 数小 于 , 需改用 的精确检验
。
、 。 一 一 卯 、 一 一 恤
厂 、
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
中西医结合学报 年 月第 卷第 期 , 之 ,
表 采血时间对滤纸干血样 测定结果的影响采血时间
采血时间 升高例数
暂时性高 血症 苯丙酮尿症
例数 百分比
播
例数 百分比
丫一 别
‘ 尸 , 与 采血结果比较
。
误用 才检验实现相关分析
例 目的 检测 与分析 蛋 白在食管癌 组
织 中的表达 , 从而探讨其与食管癌发生
、
发展及预后
的关系 。 实验背景 抑癌基 因编码 的蛋 白是周
期素依赖激酶抑制蛋 白的一 种 , 在细 胞周 期进程 中
起负调控作用
。 蛋 白缺失或异常可 导致周期素
依赖激酶活性上升 , 引起细 胞增殖失控 。 免疫组 化
检测方法 用 试 剂盒 , 按 常规 方法操作
。 细 胞
核及胞浆 内出现棕黄色颗 粒为阳性结果判断
,
采用双 盲法 , 根 据 阳性细 胞 百 分 率分 为 四 个 等级 。
“ 一 ”无 阳性反应细 胞 “ ” 阳性细 胞小于 “
” 阳性细胞在 一 之 间 。 “ ” 阳 性细
胞 以上 。 统计学分析 以 丫检验分析 表达
水平与食管癌临床分期 的相关性
。 经 丫检验 , 高分
化组 与中 、低分化组之 间 表达水平存在显著性
差异 尸 一 。 中分化组 与低分化组 表达
水平无 显著性差异 。 见表 。 结论 高分化食管癌
表达 明显高于 中 、 低分化者 , 两 者之 间存在显著
性差别 , 表 明 表达 与食管癌分化程度呈正 相关 。
料 , 根据分析 目的不 同有 四 类不 同的分析方法 。 其
一 , 如果只 关心 实验分组 变量取 不 同水平 时 , 有序结
果变量 表达水平 之 间的差别是否具有统计学
意义 , 则仍将其视为结果 变量为有序变量 的单 向有
序列联表资料 , 可供选用 的统计分析方法有秩和检
验 、 记 分析或有序变量的 回归分析等 其
二 , 若研 究两个有序变量之 间是否有相关关系 , 就要
用 秩相关分析或典型相关分析 其 三 , 若
两个变量之 间有相关关 系 , 希望进 一 步知道这 两个
变量之 间是否呈线性变化趋势 , 就 需要进行线性趋
势检验 其 四 , 若 研 究 行 的频数分布规律 是 否相
同 , 宜选用 丫检验
。 本例 的研 究 目的是第二 个 , 因
此 , 应 当选用 秩相关分析 。
表 在食管癌不 同组织学分级中的表达情况
组织学分级
表达例数
阳性率
高分化 一
中分化 , , “
低分化 , , 一
对差错的辨析与释疑 原文作者误 用 了 丫检
验 , 因为此方法 与变量 的有序性没有任何联 系 。 表
应该是双 向有 序且 属 性 不 同的 只 列联 表 资
误用 才检验处理各种列联表资料
例 很多临床 医生 习惯用表 的形式表达 临
床资料 , 治愈到无效的信息仅仅为显示资料 , 进行统
计分析时 , 则只 关心 组 的“ 总有效率 ” , 运 用一
般 丫检验来分析
。 这样做 有什 么 不 妥 正 确 的做
法是什么
对差错的辨析与释疑 在临床上 , 总有效率很
重要 , 运 用 一 般 丫检验来比较 个 药物组 总有效率
之 间的差别是否具有统计学意义是 正 确的 , 但 “ 治愈
到无 效的信息 ”也应该充分发挥作用
。 此时 , 该定性
资料称为结果 变量为有序变量 的 列联表资料 ,
采用秩和检 验 可 较全 面 地评 价 种 药物退 热 的效
果 。
例 有人用 一 般 丫检验 分析表 的资料 , 请
辨析其错误所在 , 正 确的统计分析方法是什么
表 组患者退 热疗效比较
仁例数
组别
月卤清热组
结合组
西药组
例数 治愈 显效 有效 无效 总有效
朋
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
中西医结合学报 。 年 月第 卷第 爪 期 。 〔
’ 飞 。、。 , 。 , 。 叩 。 。 , 污
表 中医证型与肾脏病理 分级的关 系
巨例数 习
中医证 型 例数
。。 分级
脾肺气虚
气阴两虚
月干肾阴虚
脾肾阳虚
飞 幻
了
飞
万 通
性
,
牛
对差错的辨析与释疑 用 一 般 才检验分析表
资料 , 若得到 尸 , 只 能认 为表 中 行 的频数
分布规律不相 同 , 尚不 能得 出 种 中医证 型的患者
在“ 分级 ” 上 的差别具有统计 学意义 , 而 后 者通
常是临床 医生希望 回答的问题
。
能较好地解答这 个
问题 的统计分析方法有秩和检验 、 分析和有序
变量的 回 归分析等
, 因 为这 些统 计分析方
法都能较好地利用“ 有序变量的信 息 ”
。
例 有人用 一 般 才检验分析表 资料 , 请辨
析其错误所在 , 正 确的统计分析方 法是什么
对差错的辨析与释疑 用 一 般 丫检验分析表
资料是不妥的 , 因为它根本 不是二 维列联表资料 , 即
使是二 维列联表资料
, 也不 能一 概用 一 般 才检验 来
处理 。 分析这 个定性资料时必 需明确“ 结果变量 ” 是
什么 , 可 以是“ 愈显率 ” , 也 可 以是 “ 临床控制 到
无 效 假 定 是 由好 到差 的顺序 ”
。 若使 用
“‘
愈显 率
” 作 为临 床观 察的疗效指标 , 分析时 应写 成 两
列 , 即“ 愈显例数和未愈显例数 ” , 它们 与表 中前两 列
的原 因变量一 起构成一 个 “ 结果 变量 为二 值 变量 的
三 维列联表资料 ” , 可 选 用 的统计 分析 方 法 有加 权
丫检验
、 多重 从 回 归分析和对数线性模型 若
使用 个 等级 作 为临床 观 察 的疗 效指 标 , 可 选 用
校正 秩和 检验或 有序 变量 的 多重 回
归分析处理资料
。
例 有人用 一 般 才检验 分析表 资料
, 请辨
析其错误所在 , 正 确的统计分析方法是什么
对差错的辨析与释疑 与前 面 例子 同样 的道
理 , 可知用一 般 才检验分析表 资料是不妥 的
。 此
定性资料在本质上 与表 完全相 同 , 正 确 的处理 方
法 见前例的解释 , 此处从略
。
例 有人用 一 般 丫检验 分析表 资料
, 请 辨
析其错误所在 , 正 确的统计分析方法是什公
对差错的辨析与释疑 用 一 般 才检验分析表
资料是不妥的 , 因为它根本不是二 维列联表资料 , 即
使是二 维列联表资料 , 也不 能一 概 用 一 般 才检验 来
处理 。 表中最后 列的表头反映 了结果 变量是有序
的 , 故这是一 个结果 变量 为 多值有 序变量 的三 维 列
联表资料 , 可 以选用 的统计 分析方 法 有 校 正
的秩和检验和有序变量的多重 回 归分析
。
误用秩和检验处理某些列联表资料
例 有人 用秩和检验 分析 表 资料 , 请 辨析
其错误所在 , 正 确的统计分析方法是什 么
表 两组患者不 同类型高脂血症降脂疗效 比较
组 别 总例数 临床控制例数 显 效例数 有效例数 无效例数 愈显率
治疗组
对照组
高总胆 固醇
高甘油三 酉旨
混 合性
高总胆 固醇
高甘油三酉旨
混 合性
厂
表 两组患者不 同病情程度疗效
组 别
台疗组
病情程度 例数 痊 愈 显效 有效 无效 总有效
飞 忍
冬
‘ 〔
咬至
牛 夕
刊
汤 戈 吕
〕 吸
‘
飞丈
了 冬
冬
〔
之
几
,,
︺。
对照组
〔
轻中重轻中重
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
中西 医结合学报 年 月第 卷第 期 , 一 、
表 各组患者超声影像学改善情况的比校
组别 患者例数 正常例数 轻度脂肪肝例数 中度脂肪肝例数 重度脂肪肝例数
清肝活血方组
小柴胡冲剂组
一般治疗组
治疗前
治疗后
治疗前
治疗后
治疗前
治疗后
表 组红细胞 密度基因型 、数 表达及砧附活性比较
组 别 例数
密度基因型 例数 」 数量表达
值 , 于 士 、
勃附率
于 士 、
血寮症组
非血疲症组
健康对照组
士
士
士
士
士 要
石 士 乌
对差错的辨析与释疑 有人将 、
、 三
种基 因型视为有序 , 采用秩和检验分析此表 中的定
性资料 表中最后两列为定量资料 , 不在本文讨论之
列 , 这是不 正 确 的 。 种基 因型之 间是 无 序 的 , 即
使 组 受试者之 间可 以视 为有序 , 也没必要将其 当
作有序变量来看待 , 故该表中的定性资料应为“ 双 向
无序的 汉 列联表资料 ”
。
若表中小 于 的理论频
数的个数未超过总格子 数的 , 可 以选用 一 般 丫
检验分析 此定 性资料 , 否则 , 以选用 的精确
检验处理 为宜 。
例 有人 用秩和检验分析表 资料 , 请辨析
其错误所在 , 正 确的统计分析方法是什 么
选用秩和检验 , 这 显然是错误 的 因为在进 行秩和
检验的定性资料中 , 结果变量必须是有序的 , 而原 因
变量是否为有序变量无关紧要 。 若统计分析的 目的
是比较三 种分期的患者 阳性率之 间的差异是否具有
统计学意义 , 应将该定性资料视为“ 双 向无 序的 火
列联表资料 ” , 此处“ ”代表 三 行 , “ ” 代表检测结
果为“ 阳性 ”与“ 阴性 ”两列
。
若 个格子 中小于 的
理论频数的个 数没超过 总格子 数 的 , 就 可 以用
一 般 丫检验分析 此定性资料 , 否 则
, 以选用
的精确检验处理 为宜
。 经 检查 , 本例确 实需要选用
的精确检验处理 。
表 细胞猫附分子一 和 的表达
与食管癌 分期的关 系
分期 ,
对差错的辨析与释疑 表 中“ ”代表检测结果
为阳性的人 数 , “ ”代表各组被检测 的总人 数 , “ ”
代表秩和检验 的检 验 统计量 , “ 尸 ”代 表 与 对应
的 尸 值 概率
。
原作者认为“ 分期 ” 是有序 变量 , 故
, 、
歇 一 , 一
胡良平 , 李子建 医学统计学基础 与典型错误辨析 北
京 军事医学科学出版社 一 , 一
, , , “
’ 一
胡 良平 , 刘惠刚 , 李子建 , 等 检验 医 学科研设 计与统
计分析 北京 人 民军医 出版社 。。 一
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net