科研设计中的误差分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究中存在某些既与疾病有关联,又与所研究暴露 因素有联系的外部因素影响,使暴露因素与疾病真 实关联性被人为歪曲,这种导致研究结果存在误差 的现象叫混杂。这些外部因素称混杂因素,由它们 产生的偏倚称混杂偏倚。
口服避孕药 (OC) 与心机梗死 (MI) 病例对照研究 (未分层的分析结果)
-------------------------------------------------------------------------
实验性研究(有干预):
优点: 能够较好地控制非处理因素(即混杂因素)的影响,避
免人为造成的偏倚,使要比较的组之间具有均衡性和可比性。
缺点: 如果样本量小时,不能保证非处理因素(即混杂因素)
在组间有较好的均衡性和可比性。
对实验因素作有计划安排: 以人为受试对象的称谓 临床试验设计 以动物为实验对象的称谓 实验设计
科研设计中的误 差分析
第一节 流行病学研究基本思维方法
一、研究的外部真实性与内部真实性
1.外部真实性:指研究样本的结果和结论可以外 推到研究的总体人群。遵循随机抽样原则和避免 产生严重的选择偏倚是保证样本代表性的重要措 施。
2.内部真实性:指研究样本的结果真实可靠。严 格控制和减少测量偏倚和混杂偏倚对结果的影响, 保证研究结果真实性的关键。
对差错的分析:
这里显然忽视了受试对象的分组应遵守“随机化原 则”的要求。因为随机化是削弱或消除非试验因素对 试验结果干扰和影响的重要措施之一。病人就诊的先 后顺序,往往暗示其病情不同, 尤其是当病人的病情轻重 难以判断时, 若将先来就诊者分为一组, 后来就诊的分 为另一组, 则不可避免地引入顺序误差, 从而得出错误 的结论。
4、 组间均衡性差
在研究耐力训练与提高战士体质的关系时,设计了如 下的实验:以血乳酸为主要观察指标,用20名连队的战士 按训练方案进行耐力训练,以机关同龄的20名战士为对照, 对照组进行日常活动,观察经4周训练后,两组战士进行 一定量的运动时血乳酸的变化。
两组战士训练前后血乳酸(mg/L)的观测结果
服源自文库C
未服OC
合计
-------------------------------------------------------------------------
MI
39
114
153
对照
24
154
178
-------------------------------------------------------------------------
合计 38
85 123
25 183
208
----------------------------------------------------------------------------------
OR1=2.80
OR2=2.78
对照:76/178=0.43; MI:47/153=0.31; <40岁: 38/123=0.31; >40岁:25/208=0.12
合计
63
268
331
-----------------------------------------------------------------------cOR = (39/114)/(24/154) =2.20
口服避孕药 (OC) 与心机梗死 (MI) 病例对照研究
(按年龄分层后的结果)
正确的制表:
不同溶液冲洗伤口的效果
----------------------------------------------------------------------------------
< 40岁
>=40岁
----------------------------------- -------------------------------------
三、比较与对照 试验组和对照组间的良好可比性是分析性比
较研究的基础,是保证研究结果内部真实性的关 键。 1.可比性:指比较的各组间在下述方面的一致
(1)影响结局产生的非研究(外部混杂)因素在 比较组间分布应相同。
研究(暴露)因素----------结局 ↗
外部混杂因素
对于观察性研究:
病例对照研究病例组和对照组间,或定群研究暴 露组和非暴露组间的外部因素分布频率应该完全 相同;
P > 0.05: 无论是观察性研究还是实验性研究所获的结果,如 经统计学检验无显着意义时,不能由此便下结论认 为因素和结局之间没有本质的关联或药物无疗效, 可能还有样本数量是否足够大的问题需要考虑。
3. 按判断因果关系的原则确定研究结果的因果性质: 任何一项观察性研究或实验性研究所获结果,
若要下因果关系的结论,除要保证研究结果不存在 任何偏倚的影响和经统计学检验证实存在统计学显 著意义外,还必须按严格的判断因果关系的下述法 则进行逻辑关系的检验:
病例—对照研究(case control study)
三、统计学方法
实验设计 资料收集整理 统计分析
参数估计(点估计、区间估计)
假设检验:样本均数差数间的显著性检验 样本率的差数间的显著性检验 变量间的回归和相关问题
四、应用中的错误-- 1.实验设计
1、随机化概念不清
某文报道“120例肩周炎不同疗法的对比研究”中明确交代病 人的分组方法, 即“根据病情和就诊先后顺序分组,每组40人” 。
对错误地分析:
本研究试图利用两个幼儿园并随机设立对照来说明ADI 药物有预防肠道传染病的作用。但设计出现了问题,即使 两个幼儿园参加此项试验的儿童的饮食、作息时间和体育 活动情况是完全相同的,但还有一些目前不了解的影响因 素,因此,目前的设计不能得出作者的结论。
正确的设计:
在甲、乙幼儿园分别随机抽取大、中、小班儿童各50 名,然后按随机的原则,每个儿童均有相同的机会被分配 到对照组或实验组,这样在每个幼儿园的每个班,均有对 照组和实验组,已达到均衡可比。
二、误差与偏倚
医学研究中,从研究设计、指标测量、数据 分析到结果推论均可因设计和处理不当而产生各 种各样的误差(error),其中因人为因素造成的观 察结果偏离真实值则被称为偏倚(bias)。
2. 观察偏倚(observational bias or information bias)
3. 混杂偏倚(confounding bias) 当研究某个暴露因素与某疾病的关联时,由于
组别
训练前
训练后
训练组
38.2 3.5 33.1 3.1 **
对照组
40.0 4.0 38.9 3.5
** 与训练前比 p<0.01 ; 与对照组比 p<0.01
对错误地分析:
对照组选择不合理,对照组除训练因素外,其它应尽 可能与实验组一致,而机关兵和连队的战士由于工作性质 的不同,体能的基础可能存在较大的不同,一开始两组就 不具备可比性。
观察性研究(无干预) 属于调查设计。
实验设计的三要素: 实验因素 实验单位 实验效应
实验设计的四个基本原则: 随机 对照 重复 盲法
实验设计类型:
随机对照试验 (randomized control trail , RCT)
交叉试验 (cross-over design)
队列研究
(cohort study)
• 关联性研究获得的结果可做三种解释: (1)真实的效应; (2)机遇(随机误差)所致; (3)由偏倚所致。
• 统计学检验: 帮助研究者了解该OR、RR或RD值由机遇所致的 概率(P值)
P 0.05 或 P 0.01: 所获样本的OR、RR或RD值是因机遇而非暴露因 素所致的可能性 5%或 1%;
如果患者都必须接受某种治疗, 就必须具有两种或两 种以上的不同治疗方法。
3、对照不全
研究者为研究ADI药物预防肠道传染病的效果,设计如 下试验:在甲幼儿园随机抽取大、中、小班儿童各50名组 成试验组,服用ADI 药物(剂量按年龄、体重严格计算); 在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组, 不服用ADI 药物。但两个幼儿园参加此项试验的儿童的饮 食、作息时间和体育活动情况是完全相同的。结果发现: 甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园 150名儿童肠道传染病的发病率(P<0.001 )。于是,研究者 得出结论:ADI药物有预防肠道传染病的作用。
结论: 此药有明显的驱铅作用。
对错误地分析:
本研究试图利用前后对照来说明此药的驱铅效果,统 计分析的结果清楚的显示两组之间的差别具有非常显著性。 但不能说明此药具有驱铅作用,因为脱离现场后即使不治 疗亦有尿铅排出,实际上此研究成了具有“假对照”的研 究。
正确的设计:
如果仅有一种治疗方法需要考察其疗效, 就必须有不 给于任何治疗的空白对照组。
统计学是描述、归纳、探索数据分布规律、解释数据的 科学和艺术, 也是研究人员合理地、灵活地运用统计学原理 和方法, 充分提取试验信息, 深入揭示研究事物客观规律的 一种手段。
二、 统计学的内容
1 统计研究设计 2 统计资料的收集、 整理 、 描述和表达 3 统计分析方法的选择 4 统计结果的解释
统计研究设计
OC(+) OC(-) 合计 OC(+) OC(-) 合计
----------------------------------------------------------------------------------
MI 21
26
47
18
88
106
对照 17
59
76
7
95
102
----------------------------------------------------------------------------------
• 原因和结局的时间顺续(temporality) • 剂量反应关系(dose response relationship) • 联系的强度(strength) • 一致性(consistency) • 合理性(plausibility) • 实验证据(experiment evidence)
在有了严格的临床设计并实施后,会得到许多研究所需 要的信息,如何运用概率论和数理统计的原理和方法来分 析医学信息就是医学统计学的任务了。
2、假对照
某人在研究某药物的治疗铅中毒的驱铅效果时,涉及 如下试验,
30名铅中毒工人脱离现场后住院治疗的结果
观测指标
治疗前
治疗后
血铅(mg/L) 0.181 0.029
0.073 0.019**
尿铅 (mg/L) 0.116 0.009 0.087 0.010**
** 与治疗前比 p<0.01
正确的设计:
此研究回答了耐力训练提高了战士的耐力, 这种结论 是毫无意义的. 因为这早已是人们认识到的结论了. 本项 目应研究不同训练方案对提高战士体质之间的差别有无显 著性意义, 以探索最大限度地提高战士体质的最佳方案.
另外, 分组时应将连队战士和机关战士随机分组, 以达 到均衡可比.
应用中的错误-- 2.资料表达与描述
1、 统计表的表达 不同溶液冲洗伤口效果比较
试验组
对照组
庆大霉素 新洁尔灭 生理盐水冲
(8万单位
洗并服四环
/10毫升) (0.1%) 素3天
生理盐水 冲洗
总例数 感染例数 百分比
30 1 3.3%
30 3 10.0%
30 5 16.7%
30 8 26.7%
对错误的分析:
1、主谓语位置颠倒 2、表格线条太多,竖线不可用。 3、误用“百分比”取代“感染率” 4、无合计数
对于实验研究:
临床试验(或人群干预试验)中的治疗(或干预)组与 对照组间外部因素的分布频率应该完全相同。
(2) 研究指标定义在任何研究时点、任何研究参 加单位或研究者均应该采用相同的指标定义,如病例 诊断标准等。
(3) 组间采用的实验室检测方法应该相同。 (4) 组间资料收集方法应该相同。
2.统计学推断:以拒绝无效假设和接受备择假设作 为判断比较组间有无差异的根据。此外,比较两组 95%可信限区间也是精确估计真实差异的重要方法。
四、因果推论
现场观察研究和临床试验或现场实验研究所 获得的因素与结局之间的关联,究竟是表面上的 虚假联系还是本质上的因果关系,必须经过因果 推论的论证。
1. 首先确定研究结果有无偏倚的影响: 存在严重偏倚的研究资料不宜用来进行统计
学检验,不能用来确立因果关系。
2. 确定因素与结局是否存在统计学上的关联:
相关文档
最新文档