常见统计学错误与纠正

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应当如何?
成功的随机化取决于: (1) 产生一个不可预见的分配序列; (2) “隐蔽” (allocation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。 报告如何随机分组,如何“隐蔽” :谁做随 机序列,谁收病人,谁分药和发药;分组方 案如何保管……
Nature常见错误之一
多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
应当如何?
主要终点(primary end point) :只能一个 次要终点(secondary end point) : 可以几个, 但勿过多 Bonfferoni 校正 当同一组数据同时作k次分析时,若限定 犯假阳性错误的概率总共不超过 , 则每次分析要用 / k 来控制假阳性的概率。 例
0.05, k 10,
/ k 0.005
2. 事后分析,见机行事
事后分析(Post hoc analysis) 看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认 不鼓励事先并未计划的亚组分析和校正分析
为何不鼓励事后分析?
数据是现象,现象具有偶然性; 看到数据后进行的“分析”属于故作姿态, 变偶然为“必然” —— 忽悠! 看到数据后增加的“分析”,也属于多重 分析,增加假阳性的机会
南韩对比剂研究
仅分析一个指标时, P(假阳性) 0.05, P(一次分析不犯错误) 0.95 同时分析 2 个指标时, 2 P(两次分析均不犯错误) [ P(两次分析均不犯错误) ]
P(假阳性) 1 - 0.952 1 0.90 同时分析 3 个指标时, P(假阳性) 1- 0.953 1 0.86 0.14 同时分析 10 个指标时, 10 P(假阳性) 1 - 0.95 1 0.60 0.40
欧洲研究的样本量估算
( Z / 2 Z ) N 4
2
(1.96 0.84) 0.35 4 0.18
2
(1.96 0.84) 0.35 4 118.6 0.18
2
决定每组含61名患者。
比较两组发生某结局的百分比
比较两组测定值的均数
(1)预计欲比较的两总体参数的差值 1 2 (2)预计总体标准差 (3)允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会
( Z / 2 Z ) N 4
2
欧洲对比剂研究
0.20

(1)预计欲比较的两总体参数的差值 0.18m g / dL (2)预计总体标准差 0.35m g / dL (3)允许出现假阳性结果的机会 0.05 (4)允许出现假阴性结果的机会 0.20
参加者的流程图 (强烈推荐)
合格对象82例
拒绝参与7例
随机分组75例 分配至实验组38例 接受干预38例
随访例数: 7 周 n=38 , 11 周 n=38 , 15 周 n=38 , 19 周n=36 分配至对照组37例。接受 干预36例,1例因颈部损伤未 接受干预
随访例数: 7周n=37,11 周 n=36 , 15 周 n=36 , 19 周n=35
错在哪里?
哪些指标可能有组间差异,必须心中有数。 科研的结果应当预见 —— 假说是科研的灵 魂 心中无数,不要“先上马再说” 指标多,实验工作量大。 大海捞针—— 碰运气,不是科研 指标多,翻来覆去分析,制造假阳性 Nature杂志统计学指南:常见错误之一
为何翻来覆去分析,会制造假阳性?
纳入分析例 数 n=35 , 排除 分析例数n=2(1例失访,1例 颈部损伤)
纳入分析例数n=36 排除分析例数n=2(因失 访)
4. 样本量随意决定, 无依据
样本量太小? ---- 真理应经得起重复 研究的功效太低 样本量越大越好? ---- 时间长、经费不足 不能保证数据质量 需要事先估算最小样本量 论文必须报告估算最小样本量的根据
(1)预计两组发生某结局的百分比约为 (2)允许犯假阳性错误的机会 (3)允许犯假阴性错误的机会
1, 2
c
1 2
2
2
2Z / 2 c (1 c ) Z 21 (1 1 ) 2 2 (1 2 ) N 1 2
常见统计学错误与纠正
---- 设计与分析
1. 终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差 异; “确定某个指标后,万一组间没有差异,岂 不被动!” 生理、生化、组织学、基因,都做; “内容丰富,显得水平高!” 许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告 哪个指标标”
处理分配的随机化为什么这么重要? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使有可能利用概率论来描述各干预组之间 的差异有多大可能仅仅是由偶然性造成的。 将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德?
Hale Waihona Puke 说错和做错 将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德? 将“随意分组”当作随机化 将“机械分组”当作随机化 略去筛选过程,简单地报告将多少人随机分 组 略去实施过程中丢失对象,将最后两组人数 说成是随机分组人数
应当如何?
必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效 亚组分析和校正分析必须事先在研究计划 里规定,并说明理由;写文章时,申明这 类分析是事前计划好的 事后决定做的分析,如果想写,不能算是 正式结果,只能视为探索性分析。
3. 随机化,说而不做,做而不严
相关文档
最新文档