常见统计学错误(2013)[文字可编辑]
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
?
0.84) ? 0.18
0.35 ?2 ??
?
118.6
决定每组含61名患者。
比较两组发生某结局的百分比
(1)预计两组发生某结局的百分比约为 ? 1,? 2
(2)允许犯假阳性错误的机会 ?
(3)允许犯假阴性错误的机会 ?
?c
?
?1
??2
2
N ? ??2Z? / 2 ?
? c (1 ?
?c)
?
Z?
比较两组测定值的均数
(1)预计欲比较的两总体参数的差值 ? ? ?1 ? ? 2
(2)预计总体标准差 ? (3)允许出现假阳性结果的机会 ?
(4)允许出现假阴性结果的机会 ?
N
?
?( 4??
Z?
/2
?
?
Z?
)?
?2 ??
欧洲对比剂研究
? ? 0.20 ?
(1)预计欲比较的两总体参数的差值 ? ? 0.18mg / dL
?亚组分析和校正分析必须事先在研究计划 里规定,并说明理由;写文章时,申明这 类分析是事前计划好的
?事后决定做的分析,如果想写,不能算是 正式结果,只能视为探索性分析。
3. 随机化,说而不做,做而不严
?处理分配的随机化为什么这么重要 ? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使有可能利用概率论来描述各干预组之间 的差异有多大可能仅仅是由偶然性造成的。
说成是随机分组人数
应当如何?
?成功的随机化取决于: (1) 产生一个不可预见的分配序列; (2) “隐蔽” (allocation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。
?报告如何随机分组,如何“隐蔽” :谁做随 机序列,谁收病人,谁分药和发药;分组方 案如何保管……
为何不鼓励事后分析?
?数据是现象,现象具有偶然性; 看到数据后进行的“分析”属于故作姿态, 变偶然为“必然” —— 忽悠!
?看到数据后增加的“分析”,也属于多重 分析,增加假阳性的机会
应当如何?
?必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效
错在哪里?
?哪些指标可能有组间差异,必须心中有数。 科研的结果应当预见 —— 假说是科研的灵 魂 心中无数,不要“先上马再说”
?指标多,实验工作量大。 大海捞针—— 碰运气,不是科研
?指标多,翻来覆去分析,制造假阳性 Nature 杂志统计学指南:常见错误之一
为何翻来覆去分析,会制造假阳性?
仅分析一个指标时, P(假阳性) ? 0.05, P(一次分析不犯错误)? 0.95 同时分析 2 个指标时,
常见统计学错误与纠正
---- 设计与分析
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2013年12月
1. 终点指标过多, 大海捞针
?临床试验时,不知道哪个指标在组与组间有差 异; “确定某个指标后,万一组间没有差异,岂 不被动!”
?生理、生化、组织学、基因,都做; “内容丰富,显得水平高!”
?许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告 哪个指标标”
犯假阳性错误的概率总共不超过 ? , 则每次分析要用 ? / k 来控制假阳性的概率。
例 ? ? 0.05, k ? 10, ? / k ? 0.005
2. 事后分析,见机行事
?事后分析(Post hoc analysis ) 看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认
?不鼓励事先并未计划的亚组分析和校正分析
P(两次分析均不犯错误)? [ P(两次分析均不犯错误)]2 P(假阳性)? 1- 0.952 ? 1? 0.90
同时分析 3 个指标时, P(假阳性)? 1- 0.953 ? 1 ? 0.86 ? 0.14 同时分析 10 个指标时, P(假阳性)? 1 - 0.9510 ? 1 ? 0.60 ? 0.40
?1
2? 1(1 ? ? ?2
? 1)
?
2? 2 (1 ?
?2)
?2 ? ?
南韩对比剂研究
南韩研究
(1)预计两组发生某结局的百分比约为 20% 和 8%
(2)允许犯假阳性错误的机会 ? ? 5%
(3)允许犯假阴性错误的机会 ? ? 1 ? 80% ? 20%
可能会有一部分患者失访、数据不全、违反研究方案, 计划每组 150 名
参加者的流程图 (强烈推荐)
合格对象82例 随机分组75例
拒绝参与7例
分配至实验组38例 接受干预38例
分配至对照组37例。接受 干预36例,1例因颈部损伤未
接受干预
随访例数: 7周n=38,11 随访例数: 7周n=37,11
周 n=38 , 15 周 n=38 , 19 周n=36 ,15 周n=36 ,19
?将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德?
说错和做错
?将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德?
?将“随意分组”当作随机化 ?将“机械分组”当作随机化 ?略去筛选过程,简单地报告将多少人随机分
组 ?略去实施过程中丢失对象,将最后两组人数
(2)预计总体标准差 ? ? 0.35mg / dL
(3)允许出现假阳性结果的机会 ? ? 0.05
(4)允许出现假阴性结果的机会 ? ? 0.20
欧洲研究的样本量估算
N
?
4???(Z?
/2
?
?
Z?
)?
?2 ??
?
4???(1.96
?
0.84) ? 0.18
0.35 ?2 ??
?
4???(1.96
Nature常见错误之一
?多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
应当如何?
?主要终点(primary end point) :只能一个 次要终点(secondary end point) : 可以几个, 但勿过多
?Bonfferoni 校正 当同一组数据同时作k次分析时,若限定
周n=36
周n=35
纳入分析例数n=36
纳入分析例数 n=35 ,排除
排除分析例数 n=2(因失 分析例数n=2(1例失访,1例
访)
颈部损伤)
4. 样本量随意决定, 无依据
?样本量太小? ---- 真理应经得起重复 研究的功效太低
?样本量越大越好? ---- 时间长、经费不足 不能保证数据质量
?需要事先估算Biblioteka Baidu小样本量 论文必须报告估算最小样本量的根据