常见统计学错误与纠正

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

应当如何？
成功的随机化取决于： (1) 产生一个不可预见的分配序列; (2) “隐蔽” （allocation concealment ）这个序列，直到分配完毕（必须建立一个分配处理的系统）。报告如何随机分组，如何“隐蔽” ：谁做随机序列，谁收病人，谁分药和发药；分组方案如何保管……
Nature常见错误之一
多重比较: 对一组数据作多项比较时，必须说明如何校正α 水平，以避免增大第一类错误的机会
应当如何？
主要终点(primary end point) ：只能一个次要终点(secondary end point) : 可以几个, 但勿过多 Bonfferoni 校正当同一组数据同时作k次分析时，若限定犯假阳性错误的概率总共不超过，则每次分析要用 / k 来控制假阳性的概率。例
0.05, k 10,
/ k 0.005
2. 事后分析，见机行事
事后分析（Post hoc analysis）看到数据之后才想起来做的分析其结果往往不能被进一步研究所确认不鼓励事先并未计划的亚组分析和校正分析
为何不鼓励事后分析？
数据是现象，现象具有偶然性；看到数据后进行的“分析”属于故作姿态，变偶然为“必然” —— 忽悠！看到数据后增加的“分析”，也属于多重分析，增加假阳性的机会
南韩对比剂研究
仅分析一个指标时， P(假阳性) 0.05, P(一次分析不犯错误） 0.95 同时分析 2 个指标时， 2 P(两次分析均不犯错误） [ P(两次分析均不犯错误） ]
P(假阳性） 1 - 0.952 1 0.90 同时分析 3 个指标时， P(假阳性） 1- 0.953 1 0.86 0.14 同时分析 10 个指标时， 10 P(假阳性） 1 - 0.95 1 0.60 0.40
欧洲研究的样本量估算
( Z / 2 Z ) N 4
2
(1.96 0.84) 0.35 4 0.18
2
(1.96 0.84) 0.35 4 118.6 0.18
2
决定每组含61名患者。
比较两组发生某结局的百分比
比较两组测定值的均数
（1）预计欲比较的两总体参数的差值 1 2 （2）预计总体标准差（3）允许出现假阳性结果的机会（4）允许出现假阴性结果的机会
( Z / 2 Z ) N 4
2
欧洲对比剂研究
0.20

（1）预计欲比较的两总体参数的差值 0.18m g / dL （2）预计总体标准差 0.35m g / dL （3）允许出现假阳性结果的机会 0.05 （4）允许出现假阴性结果的机会 0.20
参加者的流程图（强烈推荐）
合格对象82例
拒绝参与7例
随机分组75例分配至实验组38例接受干预38例
随访例数： 7 周 n=38 ， 11 周 n=38 ， 15 周 n=38 ， 19 周n=36 分配至对照组37例。接受干预36例,1例因颈部损伤未接受干预
随访例数： 7周n=37，11 周 n=36 ， 15 周 n=36 ， 19 周n=35
错在哪里？
哪些指标可能有组间差异，必须心中有数。科研的结果应当预见 —— 假说是科研的灵魂心中无数，不要“先上马再说” 指标多，实验工作量大。大海捞针—— 碰运气，不是科研指标多，翻来覆去分析，制造假阳性 Nature杂志统计学指南：常见错误之一
为何翻来覆去分析，会制造假阳性？
纳入分析例数 n=35 ，排除分析例数n=2（1例失访,1例颈部损伤）
纳入分析例数n=36 排除分析例数n=2(因失访)
4. 样本量随意决定, 无依据
样本量太小？ ---- 真理应经得起重复研究的功效太低样本量越大越好？ ---- 时间长、经费不足不能保证数据质量需要事先估算最小样本量论文必须报告估算最小样本量的根据
（1）预计两组发生某结局的百分比约为（2）允许犯假阳性错误的机会（3）允许犯假阴性错误的机会
1, 2
c
1 2
2
2
2Z / 2 c (1 c ) Z 21 (1 1 ) 2 2 (1 2 ) N 1 2
常见统计学错误与纠正
---- 设计与分析
1. 终点指标过多, 大海捞针
临床试验时，不知道哪个指标在组与组间有差异； “确定某个指标后，万一组间没有差异，岂不被动！” 生理、生化、组织学、基因，都做； “内容丰富，显得水平高！” 许多仪器一下子可以做许多项目； “许多项目一一分析，哪个有意义，就报告哪个指标标”
处理分配的随机化为什么这么重要? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使有可能利用概率论来描述各干预组之间的差异有多大可能仅仅是由偶然性造成的。将随机化当作“廉价名词”，实际没做，却写“随机分成两组” —— 科研道德？
Hale Waihona Puke 说错和做错将随机化当作“廉价名词”，实际没做，却写“随机分成两组” —— 科研道德？将“随意分组”当作随机化将“机械分组”当作随机化略去筛选过程，简单地报告将多少人随机分组略去实施过程中丢失对象，将最后两组人数说成是随机分组人数
应当如何？
必要的亚组分析有助于发现适应症，指导个体化治疗；必要的校正分析有助于消除混杂偏倚，公平、公正地比较疗效亚组分析和校正分析必须事先在研究计划里规定，并说明理由；写文章时，申明这类分析是事前计划好的事后决定做的分析，如果想写，不能算是正式结果，只能视为探索性分析。
3. 随机化，说而不做，做而不严