常见统计学错误(2013)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.5
胆固醇(mg%)的对数
6.0 5.5 5.0 4.5 4.0 3.5 实验前
血药浓度(μ mol/L)
处理组 对wenku.baidu.com组
180 150 120 90 60 30
旧剂型 新剂型
5周后
10周后
0 图22.2
4
8
图22.1 两组家兔血清胆固醇的对数随时间的变化
2
2 1.96 0.14(1 0.14) 0.84 2 0.20(1 0.20) 2 0.08(1 0.08) 0 . 20 0 . 08 2 1.96 0.14(1 0.14) 0.84 2 0.20(1 0.20) 2 0.08(1 0.08) 0 . 20 0 . 08 1.3602 0.5742 259.85 0.12
欧洲研究的样本量估算
( Z / 2 Z ) N 4
2
(1.96 0.84) 0.35 4 0.18
2
(1.96 0.84) 0.35 4 118.6 0.18
2
决定每组含61名患者。
比较两组发生某结局的百分比
回归方程: Y=61.786 - 6.886 log(剂量) 决定系数: R2=0.914。
) 数 均 ( 率 菌 噬
对 数 剂 量
为什麽不对? 均数做因变量造成“好”的假象 ! * 回归方程是否有统计学意义与反应的变异状况有关 * 以诸个体反应值的均数作回归计算, 掩盖变异性
正确作法:用个体资料作回归分析
家兔号 1 2 3 4 5 6 7 处理组 实验前 0.744741 0.904141 0.357641 1.077741 0.584441 0.985041 1.050841 5周后 2.013341 2.054141 1.137841 1.948741 1.668441 1.926241 1.638641 10周后 2.621341 1.628441 2.196741 2.239241 0.985041 2.915641 1.225541 家兔号 8 9 10 11 12 13 14 对照组 实验前 0.375741 0.994741 0.598841 0.719741 0.157041 0.861241 0.872141 5周后 0.667841 0.584441 0.955541 1.354241 0.246141 0.882941 0.555041 10周后 0.569941 0.461241 0.598841 1.032441 0.613041 0.757041 0.540041
处理分配的随机化为什么这么重要? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使有可能利用概率论来描述各干预组之间 的差异有多大可能仅仅是由偶然性造成的。 将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德?
说错和做错
将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德? 将“随意分组”当作随机化 将“机械分组”当作随机化 略去筛选过程,简单地报告将多少人随机分 组 略去实施过程中丢失对象,将最后两组人数 说成是随机分组人数
做法 1:单因素方差分析?!
F=0.701,P>0.5, 均数间差别无统计学意义
为什麽不对?
有负初衷 —— 探讨反应随剂量变化的趋势 * 由多个剂量组的比较只能得知均数间是否有差异 * 有统计学差异也不等于有剂量-反应关系
做法 2: 反应的均数关于剂量作回归分析 ?!
62 60 58 56 54 52 50 48 46 44 -. 5 0. 0 .5 1. 0 1. 5 2. 0 2. 5
0.05, k 10,
/ k 0.005
2. 事后分析,见机行事
事后分析(Post hoc analysis) 看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认 不鼓励事先并未计划的亚组分析和校正分析
为何不鼓励事后分析?
数据是现象,现象具有偶然性; 看到数据后进行的“分析”属于故作姿态, 变偶然为“必然” —— 忽悠! 看到数据后增加的“分析”,也属于多重 分析,增加假阳性的机会
南韩对比剂研究
南韩研究
(1)预计两组发生某结局的百分比约为 20%和 8% (2)允许犯假阳性错误的机会 5% (3)允许犯假阴性错误的机会 1 80% 20% 可能会有一部分患者失访、数据不全、违反研究方案, 计划每组 150 名
南韩研究的样本量估算
2 Z / 2 c (1 c ) Z 2 1 (1 1 ) 2 2 (1 2 ) N 1 2
例 某药物有新、旧两种剂型。为比较两种剂型的 代谢情况,对16例某病患者服药后0、4、8、12小 时的血药浓度作了测量,问该药新旧两种剂型的 血药浓度-时间曲线的差别是否具有统计学意义。
表 5 4 个时点的某药新旧剂型血药浓度( m o l / L) 编 号 1 2 3 4 5 6 7 0 小时 90.53 88.43 100.01 46.32 73.69 105.27 86.32 旧剂型 4 小时 142.12 163.17 144.75 126.33 138.96 126.33 121.06 8 小时 65.54 48.95 86.06 48.95 70.02 75.01 78.95 12 小时 73.28 71.77 80.01 39.54 60.89 83.66 70.24 编 号 8 9 10 11 12 13 14 15 16 新剂型 0 小时 70.53 68.43 57.37 105.80 80.01 56.32 53.69 85.27 66.32 4 小时 97.38 95.27 78.43 120.54 104.75 75.27 110.02 110.01 115.27 8 小时 112.12 133.17 83.16 136.33 114.75 96.33 138.96 126.33 129.06 12 小时 58.50 56.90 48.34 84.03 65.61 47.52 45.44 69.47 55.29
Nature常见错误之一
多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
应当如何?
主要终点(primary end point) :只能一个 次要终点(secondary end point) : 可以几个, 但勿过多 Bonfferoni 校正 当同一组数据同时作k次分析时,若限定 犯假阳性错误的概率总共不超过 , 则每次分析要用 / k 来控制假阳性的概率。 例
仅分析一个指标时, P(假阳性) 0.05, P(一次分析不犯错误) 0.95 同时分析 2 个指标时, 2 P(两次分析均不犯错误) [ P(两次分析均不犯错误) ]
P(假阳性) 1 - 0.952 1 0.90 同时分析 3 个指标时, P(假阳性) 1- 0.953 1 0.86 0.14 同时分析 10 个指标时, 10 P(假阳性) 1 - 0.95 1 0.60 0.40
应当如何?
必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效 亚组分析和校正分析必须事先在研究计划 里规定,并说明理由;写文章时,申明这 类分析是事前计划好的 事后决定做的分析,如果想写,不能算是 正式结果,只能视为探索性分析。
3. 随机化,说而不做,做而不严
参加者的流程图 (强烈推荐)
合格对象82例
拒绝参与7例
随机分组75例 分配至实验组38例 接受干预38例
随访例数: 7 周 n=38 , 11 周 n=38 , 15 周 n=38 , 19 周n=36 分配至对照组37例。接受 干预36例,1例因颈部损伤未 接受干预
随访例数:7周n=37,11 周 n=36 , 15 周 n=36 , 19 周n=35
应当如何?
成功的随机化取决于: (1) 产生一个不可预见的分配序列; (2) “隐蔽” (allocation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。 报告如何随机分组,如何“隐蔽” :谁做随 机序列,谁收病人,谁分药和发药;分组方 案如何保管……
2
2
2
5.剂量-反应关系 不能作均数比较或回归
例 有人分析蛇毒因子(CVF)的剂量对血液白细 胞噬菌率的影响,得如下数据,欲讨论剂量-反应 关系。
组数 1 2 3 4 5 6 CVF 剂量 0 10 20 40 80 160 例数 5 5 5 5 5 5 噬菌率(均数) 60.0±17.0 57.0±15.2 54.0±16.6 51.0±17.2 48.0±16.0 45.0±16.4
比较两组测定值的均数
(1)预计欲比较的两总体参数的差值 1 2 (2)预计总体标准差 (3)允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会
( Z / 2 Z ) N 4
2
欧洲对比剂研究
0.20
(1)预计欲比较的两总体参数的差值 0.18m g / dL (2)预计总体标准差 0.35m g / dL (3)允许出现假阳性结果的机会 0.05 (4)允许出现假阴性结果的机会 0.20
错在哪里?
哪些指标可能有组间差异,必须心中有数。 科研的结果应当预见 —— 假说是科研的灵 魂 心中无数,不要“先上马再说” 指标多,实验工作量大。 大海捞针—— 碰运气,不是科研 指标多,翻来覆去分析,制造假阳性 Nature杂志统计学指南:常见错误之一
为何翻来覆去分析,会制造假阳性?
(1)预计两组发生某结局的百分比约为 (2)允许犯假阳性错误的机会 (3)允许犯假阴性错误的机会
1, 2
c
1 2
2
2
2Z / 2 c (1 c ) Z 21 (1 1 ) 2 2 (1 2 ) N 1 2
常见统计学错误与纠正
---- 设计与分析
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2013年12月
1. 终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差 异; “确定某个指标后,万一组间没有差异,岂 不被动!” 生理、生化、组织学、基因,都做; “内容丰富,显得水平高!” 许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告 哪个指标标”
纳入分析例 数 n=35 ,排除 分析例数n=2(1例失访,1例 颈部损伤)
纳入分析例数n=36 排除分析例数n=2(因失 访)
4. 样本量随意决定, 无依据
样本量太小? ---- 真理应经得起重复 研究的功效太低 样本量越大越好? ---- 时间长、经费不足 不能保证数据质量 需要事先估算最小样本量 论文必须报告估算最小样本量的根据
90
80
噬 菌 率 ( 原
70
60
50
40
30
始 数 据
20 -.5 0.0 .5 1.0 1.5 2.0 2.5
对数剂量
回归方程: Y = 61.782-6.884 log(剂量) 决定系数: R2=0.095 回归方程无统计学意义,无剂量-反应关系!
6. 重复测量资料不能时点间两两比较
例 各取7只兔子,分别以正常食物和待研究食物喂 养,在实验前、喂养5周、10周后,各取血测量其中 胆固醇浓度,自然对数转换后, 数据见表22.1, 问血清 胆固醇浓度随时间变化的趋势是否受该食物影响。