医学统计方法常见错误剖析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表2是某医院统计门诊沙眼病人年龄构成的数据。 作者由此得出了20~岁组人口最易患沙眼的结论。
表2 某医院门诊沙眼病人的年龄构成
年龄组(岁) 0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计 沙眼人数 47 198 330 198 128 80 38 8 1027 % 4.6 19.3 32.1 19.3 12.4 7.8 3.7 0.8 100.0
研究者依据P值认为两组在α,k10两项指 标上差异无统计学意义。 忽视t检验的前提条件。
实例 研究单味中药对小鼠细胞免疫机能的影响,把 40只小鼠随机均分为4组,每组10只,雌雄各半,用药 15d后测定E-玫瑰结形成率(%),结果如下,试比较 各组总体均值之间的差别有无统计学意义?
对照组: 党参组: 黄芪组: 淫羊藿组:
可大致概括为以下两种情况:
1)不考虑t检验的应用前提,对两组的比较一律 用t检验; 2)对多组的资料的比较,多次用t检验进行均值 之间的两两比较。
实例 : 为确定老年人围手术期头孢唑啉钠 的合理用法和用量,某研究小组对60岁以 上与60岁以下者的头孢唑啉钠药物动力学 特征分别进行了测量,并进行了比较,部 分结果见表4。
医学统计学方法常见错误分析
统计分析思路
先统计描述后统计学推断
先单因素分析后多因素分析 先计量资料后计数、等级资料
一、统计描述中的常见错误:
1. 频数表 分类变量与有序分类变量直接列表 比较各类别频数分布的均匀性 比较各组间分布形态的一致性 数值变量 最小值、最大值、分组数、组距、频数表 观察频数分布的对称性 比较两组分布的一致性
表4 两组患者头孢唑啉钠药物动力学参数比较
组 别 α(h-1) k10(h-1) 0.2856±0.0427 0.8257±3.5329 1.60 >0.05 60 岁以上组(n=7) 0.6213±0.1177 60 岁以下组(n=5) 3.5505±3.5553 成组 t 检验的 t 值 1.84 P值 >0.05
表1
两组褥疮愈合时间指数对比(X S )
组
别
愈合时间指数 1.34±2.63 0.75±1.47
猪皮组 对照组
资料描述有无问题?
应用相对数应注意的问题
1. 计算相对数的分母一般不宜过小:观察单位 足够多时,计算出的相对数比较稳定,一般要 求观察单位数不小于 30。 2. 分析时不能以构成比代替率。 3. 在比较相对数时应注意可比性。影响率与构 成比变化的因素很多,除了研究因素外,其余 的影响因素应尽可能相同或相近。 4. 两个样本率比较时应该进行假设检验。
实例:研究大豆黄酮对sp2/0肿瘤细胞DNA合成影响,在大 豆黄酮组中,加入[3H]TdR后0.5h,1h,2h,4h分别测 Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设 一式3份,结果取平均值。数据均以平均值±标准差表示。
表5 大豆黄酮sp2/0肿瘤细胞DNA合成影响的时间-效应关系
时间(h) 对照组(Cpm) 大豆黄酮组 (Cpm) 抑制率(%) 0.5 1 2 4 2973±515 3934±633 4623±987 4760±733 1737±583** 3635±428* 4313±783* 5472±873* 41.6 7.6 6.7 5.0
2. 统计量 分类变量与有序分类变量
构成比、率、比
数值变量
均数、标准差、最小值、最大值、中位数
在资料的表达和描述中,常见的错误有:
1.编制统计表时,分组标志(横标目)与观测指标 (纵标目)位臵颠倒、线条过多或过少、数字的 小数点位数不一致或单位重复出现在数字之后, 最严重的问题是表中数据的含义未表达清楚,令 人费解。 2.绘制统计图时,坐标轴上的刻度值标得不符合数 学原则、资料与所选用的统计图类型不匹配。 3.选用统计指标来描述平均水平和离散趋势时,使 用正态分布方法表达呈偏态分布的资料;运用相 对数来描述计数资料时,比与率混淆。
表3 两种方法治愈率的比较
新 疗 法 组别 成人 儿童 合计 治疗人数 42 80 120 治愈人数 32 40 72 治愈率 (%) 80 50 60 一般疗法 治疗人数 治愈人数 70 30 100 49 12 61 治愈率 (%) 70 40 61
需要标准化
二、统计学推断常见错误
单因素分析(处理因素为分类变量)
t检验是目前医学研究中使用频率最高,医学论文 中最常见到的处理定量资料的假设检验方法。
t检验得到如此广泛的应用,究其原因: 现有的医学期刊多在统计学方面作出了要求, 研究结论需要统计学支持。
传统的医学统计教学都把t检验作为假设检验的 入门方法进行介绍。 t检验方法简单,其结果便于解释。
由于有些人对该方法理解不全面,导致在应 用过程中出现不少问题,有些甚至是非常严 重的错误,直接影响到结论的可靠性。
14 21 24 35
10 24 20 27
百度文库
12 18 22 23
16 17 18 29
13 22 17 31
14 19 21 40
12 18 18 35
10 23 22 30
13 20 19 28
9 18 23 36
常见的错误做法是:重复运用成组设计资 料的t检验对4个组的均值进行6次两两比较。
而正确的做法是,先进行单因素4水平设 计资料的方差分析,若4个总体均值之间 的差别有统计学意义,再用q检验等方法 进行多个均值之间的两两比较。
(1)结果变量为数值变量:注意应用条件 t检验或方差分析、秩和检验 (2)结果变量为有序分类变量:秩和检验 (3)结果变量为分类变量:卡方检验
两个定性变量资料的统计分析
R×C表资料 2检验 单向有序R×C表资料 秩和检验 双向有序且属性不同 双相有序且属性相同 等级相关分析 Kappa检验
1.t检验应用时常见的错误
率与比的区别
率是指某种事物发生的频率或强度,是事物实际发 生的例数与可能发生某事物总人口数之比。 比(构成比):说明某一事物内部组成部分所占的 比重。 将构成比错误地当作率来使用,这是临床科研中最 常见的错误之一。由于医院中资料的局限性,所得 的数据一般只能计算构成比。由于构成比通常不能 说明事物发生的强度,而且某一类别的构成比的大 小受到其他类别数量变化的影响,因而其应用有较 大的局限性。