科研设计中的误差分析

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

研究中存在某些既与疾病有关联，又与所研究暴露因素有联系的外部因素影响，使暴露因素与疾病真实关联性被人为歪曲，这种导致研究结果存在误差的现象叫混杂。这些外部因素称混杂因素，由它们产生的偏倚称混杂偏倚。
口服避孕药 (OC) 与心机梗死 (MI) 病例对照研究 (未分层的分析结果)
-------------------------------------------------------------------------
实验性研究（有干预）：
优点：能够较好地控制非处理因素（即混杂因素）的影响，避
免人为造成的偏倚，使要比较的组之间具有均衡性和可比性。
缺点：如果样本量小时，不能保证非处理因素（即混杂因素）
在组间有较好的均衡性和可比性。
对实验因素作有计划安排: 以人为受试对象的称谓临床试验设计以动物为实验对象的称谓实验设计
科研设计中的误差分析
第一节流行病学研究基本思维方法
一、研究的外部真实性与内部真实性
1．外部真实性：指研究样本的结果和结论可以外推到研究的总体人群。遵循随机抽样原则和避免产生严重的选择偏倚是保证样本代表性的重要措施。
2．内部真实性：指研究样本的结果真实可靠。严格控制和减少测量偏倚和混杂偏倚对结果的影响，保证研究结果真实性的关键。
对差错的分析:
这里显然忽视了受试对象的分组应遵守“随机化原则”的要求。因为随机化是削弱或消除非试验因素对试验结果干扰和影响的重要措施之一。病人就诊的先后顺序,往往暗示其病情不同, 尤其是当病人的病情轻重难以判断时, 若将先来就诊者分为一组, 后来就诊的分为另一组, 则不可避免地引入顺序误差, 从而得出错误的结论。
4、组间均衡性差
在研究耐力训练与提高战士体质的关系时，设计了如下的实验：以血乳酸为主要观察指标，用20名连队的战士按训练方案进行耐力训练，以机关同龄的20名战士为对照，对照组进行日常活动，观察经4周训练后，两组战士进行一定量的运动时血乳酸的变化。
两组战士训练前后血乳酸（mg/L）的观测结果
服源自文库Ｃ
未服ＯＣ
合计
-------------------------------------------------------------------------
ＭＩ
３９
１１４
１５３
对照
２４
１５４
１７８
-------------------------------------------------------------------------
合计 38
85 123
25 183
208
----------------------------------------------------------------------------------
OR1＝2.80
OR2＝2.78
对照:76/178=0.43; MI:47/153=0.31; <40岁: 38/123=0.31; >40岁:25/208=0.12
合计
６３
２６８
３３１
-----------------------------------------------------------------------cOR = (39/114)/(24/154) =２.20
口服避孕药 (OC) 与心机梗死 (MI) 病例对照研究
(按年龄分层后的结果)
正确的制表：
不同溶液冲洗伤口的效果
----------------------------------------------------------------------------------
< 40岁
>=40岁
----------------------------------- -------------------------------------
三、比较与对照试验组和对照组间的良好可比性是分析性比
较研究的基础，是保证研究结果内部真实性的关键。 1．可比性：指比较的各组间在下述方面的一致
（1）影响结局产生的非研究(外部混杂)因素在比较组间分布应相同。
研究(暴露)因素----------结局 ↗
外部混杂因素
对于观察性研究：
病例对照研究病例组和对照组间，或定群研究暴露组和非暴露组间的外部因素分布频率应该完全相同；
P > 0.05：无论是观察性研究还是实验性研究所获的结果，如经统计学检验无显着意义时，不能由此便下结论认为因素和结局之间没有本质的关联或药物无疗效，可能还有样本数量是否足够大的问题需要考虑。
3. 按判断因果关系的原则确定研究结果的因果性质：任何一项观察性研究或实验性研究所获结果，
若要下因果关系的结论，除要保证研究结果不存在任何偏倚的影响和经统计学检验证实存在统计学显著意义外，还必须按严格的判断因果关系的下述法则进行逻辑关系的检验：
病例—对照研究（case control study)
三、统计学方法
实验设计资料收集整理统计分析
参数估计（点估计、区间估计）
假设检验：样本均数差数间的显著性检验样本率的差数间的显著性检验变量间的回归和相关问题
四、应用中的错误-- 1.实验设计
1、随机化概念不清
某文报道“120例肩周炎不同疗法的对比研究”中明确交代病人的分组方法, 即“根据病情和就诊先后顺序分组,每组40人” 。
对错误地分析:
本研究试图利用两个幼儿园并随机设立对照来说明ADI 药物有预防肠道传染病的作用。但设计出现了问题，即使两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的，但还有一些目前不了解的影响因素，因此，目前的设计不能得出作者的结论。
正确的设计：
在甲、乙幼儿园分别随机抽取大、中、小班儿童各50 名，然后按随机的原则，每个儿童均有相同的机会被分配到对照组或实验组，这样在每个幼儿园的每个班，均有对照组和实验组，已达到均衡可比。
二、误差与偏倚
医学研究中，从研究设计、指标测量、数据分析到结果推论均可因设计和处理不当而产生各种各样的误差(error)，其中因人为因素造成的观察结果偏离真实值则被称为偏倚(bias)。
2. 观察偏倚(observational bias or information bias)
3. 混杂偏倚(confounding bias) 当研究某个暴露因素与某疾病的关联时，由于
组别
训练前
训练后
训练组
38.2 3.5 33.1 3.1 **
对照组
40.0 4.0 38.9 3.5
** 与训练前比 p<0.01 ; 与对照组比 p<0.01
对错误地分析:
对照组选择不合理，对照组除训练因素外，其它应尽可能与实验组一致，而机关兵和连队的战士由于工作性质的不同，体能的基础可能存在较大的不同，一开始两组就不具备可比性。
观察性研究（无干预）属于调查设计。
实验设计的三要素: 实验因素实验单位实验效应
实验设计的四个基本原则: 随机对照重复盲法
实验设计类型:
随机对照试验（randomized control trail , RCT)
交叉试验（cross-over design)
队列研究
(cohort study)
• 关联性研究获得的结果可做三种解释：（1）真实的效应；（2）机遇(随机误差)所致；（3）由偏倚所致。
• 统计学检验：帮助研究者了解该OR、RR或RD值由机遇所致的概率(P值)
P 0.05 或 P 0.01：所获样本的OR、RR或RD值是因机遇而非暴露因素所致的可能性 5%或 1%；
如果患者都必须接受某种治疗, 就必须具有两种或两种以上的不同治疗方法。
3、对照不全
研究者为研究ADI药物预防肠道传染病的效果，设计如下试验：在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组，服用ADI 药物（剂量按年龄、体重严格计算）；在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组，不服用ADI 药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现：甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园 150名儿童肠道传染病的发病率（P<0.001 )。于是，研究者得出结论：ADI药物有预防肠道传染病的作用。
结论: 此药有明显的驱铅作用。
对错误地分析:
本研究试图利用前后对照来说明此药的驱铅效果，统计分析的结果清楚的显示两组之间的差别具有非常显著性。但不能说明此药具有驱铅作用，因为脱离现场后即使不治疗亦有尿铅排出，实际上此研究成了具有“假对照”的研究。
正确的设计:
如果仅有一种治疗方法需要考察其疗效, 就必须有不给于任何治疗的空白对照组。
统计学是描述、归纳、探索数据分布规律、解释数据的科学和艺术, 也是研究人员合理地、灵活地运用统计学原理和方法, 充分提取试验信息, 深入揭示研究事物客观规律的一种手段。
二、统计学的内容
1 统计研究设计 2 统计资料的收集、整理、描述和表达 3 统计分析方法的选择 4 统计结果的解释
统计研究设计
ＯＣ(+) ＯＣ(-) 合计ＯＣ(+) ＯＣ(-) 合计
----------------------------------------------------------------------------------
ＭＩ 21
26
47
18
88
106
对照 17
59
76
7
95
102
----------------------------------------------------------------------------------
• 原因和结局的时间顺续(temporality) • 剂量反应关系(dose response relationship) • 联系的强度(strength) • 一致性(consistency) • 合理性(plausibility) • 实验证据(experiment evidence)
在有了严格的临床设计并实施后，会得到许多研究所需要的信息，如何运用概率论和数理统计的原理和方法来分析医学信息就是医学统计学的任务了。
2、假对照
某人在研究某药物的治疗铅中毒的驱铅效果时，涉及如下试验,
30名铅中毒工人脱离现场后住院治疗的结果
观测指标
治疗前
治疗后
血铅(mg/L) 0.181 0.029
0.073 0.019**
尿铅 (mg/L) 0.116 0.009 0.087 0.010**
** 与治疗前比 p<0.01
正确的设计:
此研究回答了耐力训练提高了战士的耐力, 这种结论是毫无意义的. 因为这早已是人们认识到的结论了. 本项目应研究不同训练方案对提高战士体质之间的差别有无显著性意义, 以探索最大限度地提高战士体质的最佳方案.
另外, 分组时应将连队战士和机关战士随机分组, 以达到均衡可比.
应用中的错误-- 2.资料表达与描述
1、统计表的表达不同溶液冲洗伤口效果比较
试验组
对照组
庆大霉素新洁尔灭生理盐水冲
（8万单位
洗并服四环
/10毫升）（0.1%）素3天
生理盐水冲洗
总例数感染例数百分比
30 1 3.3%
30 3 10.0%
30 5 16.7%
30 8 26.7%
对错误的分析：
1、主谓语位置颠倒 2、表格线条太多，竖线不可用。 3、误用“百分比”取代“感染率” 4、无合计数
对于实验研究：
临床试验(或人群干预试验)中的治疗(或干预)组与对照组间外部因素的分布频率应该完全相同。
(2) 研究指标定义在任何研究时点、任何研究参加单位或研究者均应该采用相同的指标定义，如病例诊断标准等。
(3) 组间采用的实验室检测方法应该相同。 (4) 组间资料收集方法应该相同。
2．统计学推断：以拒绝无效假设和接受备择假设作为判断比较组间有无差异的根据。此外，比较两组 95%可信限区间也是精确估计真实差异的重要方法。
四、因果推论
现场观察研究和临床试验或现场实验研究所获得的因素与结局之间的关联，究竟是表面上的虚假联系还是本质上的因果关系，必须经过因果推论的论证。
1. 首先确定研究结果有无偏倚的影响：存在严重偏倚的研究资料不宜用来进行统计
学检验，不能用来确立因果关系。
2. 确定因素与结局是否存在统计学上的关联：