临床科研中常见的偏倚及其防止
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
防止方法:采用新发病例作为调查对象
4. 健康工人偏倚
发生在职业性肿瘤的前瞻性病因调查时
5. 前瞻性调查中的移动偏倚
研究运动和冠心病的关系 (Am J Epid,1979 110:52)
码头工人3975人,按劳动强度分组,随 访22年。发现各组冠心病发生率差别不大.
如每年把工种分类一次,观察一次并经 和其他因素校正后,证明坐着的工种冠心病 发生率为强劳力的2倍.
偏倚(Bias)
偏倚是组间变量差异时产生的系统误差。是对真实情况的偏离, 导致研究结果不能真实地(validly),精确地(precisely)反映实际正确 的结果.
是选择研究对象,收集资料及分析资料过程中人为产生的。 临床科研的特点决定了Bias的普遍性和不可避免性。 在科研设计阶段、实施阶段设法防止它的形成,或资料分析阶段
偏倚的防止和处理
一、强调严格的科研设计
多数偏倚发生于科研设计阶段,来源于选择研 究对象或对照的不妥,如抽样方法不正确,诊断标 准不统一,样本大小不适当,使观察组和对照组缺 乏可比性。
也可来源于决定调查方法和资料收集方法时考虑 不周,如调查表格设计不好,实验室指标缺乏质控 ,判断结果缺乏客观方法。这些偏倚如一旦发生, 很难在资料分析阶段加以消除。
P=0.006
不吸烟 心梗 对照 饮酒 有 8 16 无 22 44 合计 30 60
吸烟 心梗 对照
63 36 74 70 40
RR=1 RR=1
三、混杂性偏倚(续)
不存在混杂的几种情况:
E
E
E
E
D
D
D
D
F
F
F
F
【例】:饮酒和心梗关系
TG是冠心病的病因吗?
TG
CHD
Ch
四、几种偏倚可同时存在
选择性偏倚(Selection bias) 测量性偏倚(Measurement bias) 混杂性偏倚(Confounding bias)
是系统误差,可发生在设计阶段,在分析阶段易暴露 出来,可用分层方法加以消除,而一般偏倚则不易消 除,混杂不易在设计阶段识别加以均衡
存在混杂的几种情况:
E
E
E
D
D
D
F
F
F
三、混杂性偏倚(续)
分层 STRATIFICATION
心梗 对照
饮酒 有 无
合计
71 52 29 48 100 100
RR=2.26 X²=7.62
分层分组的Mantel-Haenszel法 来平衡混杂因素的影响
研究吸烟和冠心病发病的关系,按年龄性别分层
男
女
<45岁 >45岁 冠心对照 冠心对照 吸 a1 b1 吸 a2 b2 不吸 c1 d1 不吸 c2 d2
<45岁
>45岁
冠心对照 冠心对照
吸 a3 b3 吸 a4 b4
不吸 c3 d3 不吸 c4 d4
分层分析纵隔肿块大小和何杰金病预后关系
分组
II III 症状 无 有
纵隔肿块的大小
大
小或无
复发率(%)
10/14(71)
6/32(19)
4/4(100)
7/13(54)
10/14(71) 4/4(100)
11/41(27) 2/4(50)
五、分层(Stratification)
病例对照和队列研究的分层分析 Mantel-Haenszel 方法
二、随机化的方法和盲法
真正的随机化方法,随机化分组后比较两组的 基本特征
双盲法-- 考核疗效,实验室报告,调查性 研究
三、限制(Restriction)
理论上:两组进行比较,除研究因素外, 其他因素两组应相同
事实上不可能 可采用限制法,其缺点是结论的局限性。
如: 研究年龄对急性心梗预后的影响,可限 于白人男性无并发症,前壁心梗中进行 研究。
A病有吸烟者 【1200×60%=720】+【(1200-720)×40%】=912
B病有吸烟者
【1200×25%=300】+【(1200-300)×40%】=660
A病不伴吸烟者
4800×60%=2880
B病不伴吸烟者
4800×25%=1200
912+2880=3792
B病总数:
660+1200=1860
经性别和年龄校正后的相对危险度(RR)或比数比(OR)
RRmh
ORmh
冠脉搭桥手术病死率比较(虚构资料)
术前危险 甲医院(高危42%) 因素(年龄、 心功能, 病人 死亡 % 梗塞程度
高
500 30 6
中
400 16 4
低
300 2 0.67
合计
1200 48 4
乙医院(高危17%) 病人 死亡 %
1. 检测偏倚(Detection Bias)
服用雌激素和子宫内膜癌发病的关系OR=9.8
结论错误原因: 服用雌激素导致一些无症状的病人发生阴
道流血,从而较早去就医造成检出率提高。
2. BerKson’s Bias
因入院率不同导致的偏倚
防止方法:采用人群对照 A 为肺癌患者 B为冠心病患者
5.将结论推广,应 用于其他病人。
4.分析结果自 样本得出结论
混杂性偏倚
内部准确度
样本偏倚(Sampling Bias)
80
70
癫 60 痫 发 50 生 40 率 % 30
急性心肌梗塞的病死率 人群为基础统计 三级医院统计
20
10
0 人群中 调查
医院的 调查
婴儿高热惊厥,以后癫痫的发生率(JAMA 1980; 243:1337)
A病人中有吸烟者: 912/3792=24.1%
B病人中吸烟者: 660/1860=35.5%
3. Neyman’s Bias
发生于调查时间距离初诊时间过长,有不少 调查对象已死亡,而被调查者只是那些幸存者。
一病例对照调查发现大量饮用咖啡者心梗发 病危险性是其他人的两倍。如做医院内病例对照 调查却不能获此结论。因为50%心梗病例未调查 到。
400 24
6
800 32
4
1200 8 0.67
2400 64 2.6
六、标准化(Standardization)
比较两个率,如两组对象内部构成不同,可用 率标准化加以校正
甲乙医院所用的权相等
甲医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
乙医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
建立后 病死率 15% 医院间差别>药物本身疗
同期做RCT发现CCUS病
效差别
死率并不降低
二、测量偏倚(观察性偏倚)
两组测量或观察方法不一致造成系统误 差,产生于科研的实施阶段
防止方法:采用严格的盲法
1. 询问者偏倚或观察者偏倚
(Interviewer Bias, Observer Bias)
双亲均无 55
27
50
双亲之一有 37
58
42
双亲均有 8
15
8
3. 霍桑效应(Hawthome effect)
发生在考核治疗效果时 特别是志愿者(volunteer)
三、混杂性偏倚
(第三者)
外部变量全部或部分地掩盖或夸大了所研究的暴露因 子和研究结果间的真实联系
外部变量往往是危险因子
群体观念 的重要性
临床科研中常见的偏倚
选择性偏倚(Selection bias) 测量性偏倚(Measurement bias) 混杂性偏倚(Confounding bias)
一、选择性偏倚
在选择研究对象时方法的不正确所致,产 生于研究设计阶段。
纠正方法: 强调严格的科研设计 强调随机化原则进行分组
结论:两组在生长发育上并无差异
五、分层(Stratification)
分层是常用于消除可能存在的混杂的基本方法, 主要用于资料分析阶段。
如何杰金病预后和初诊时纵隔肿块大小有关。经 过根治性淋巴结放疗进入缓解期,但复发率不同。
肿块大者:74%,肿块小者:27%,无者:19%。
五、分层(Stratification)
七、多变量分析
Mantel-Haenszel法只能平衡个别少数的 混杂因素,且对连续性的变量只能用等级分层 法(不太合理)。
60年代起,Comfield提出了Logistic回归 模型进行多变量分析,能在复杂关系中平衡多 种混杂因素的作用,进一步筛选出主要的危险 因素或预后因素,决定在病因及预后中的相对 比重。
四、配对(Matching)
配对常可消除可能存在的混杂偏倚
经常配对的因素为年龄,性别和种族,其他因 素也可配对,如研究预后,病期、严重度、先 前治疗也可配对
四、配对(Matching)
过度配对(Over matching) 研究镰状细胞特征(HbAS)是否比正常Hb(HbAA) 婴儿的生长发育、智力发育为差? 作者将七项因素进行配对: 种族、性别、出生日期、出生时体重、胎龄、5分钟 Apgar积分、社会经济状况 50例HbAS,50例HbAA,从出生随访到3-5岁
6.在自然病程有波动或有自限性的疾 病,采用自身对照考核疗效时所产 生的偏倚。如研究某些治疗感冒药 物。
7. 临床试验中选择对照的时间和 地点不同的偏倚
不同时间的对照(历史对照) 不同地点(医院间对照)
冠心病监护室的效果
抗凝剂治疗急性心梗
监护室:
(22所医院):
建立前 病死率 25% 21天病死率 0-40%
是一种随机抽样误差
偏倚可在设计,实施和分析阶段设法避免,但机遇所致 的随机误差只能缩小,不能避免
准确度(Validity)
研究结论的正确性 分为内部准确度和外部准确度
准确度(Validity)
外部准确度
1.样本病人
样本偏倚 机遇
2.将病人编组 3.进行测量
选择性偏倚 机遇
测量性偏倚 机遇
用统计学的方法加以纠正。
识别和防止Bias是科研工作者的基本功。
机遇(Chance)
机遇是观察结果的精确性(precision)及可重复性( reproducibility, reliability)受到影响
是各测量结果间受机会影响的变异度的大小。使样本的 实际观察结果和总体人群的真实情况相偏离
例如 :
入院率 住院病人中 A病总数:
A病在人群中共6000例
其中20%吸烟
B病在人群中共6000例
其中20%吸烟
A病有吸烟者
6000×20%=1200例
B病有吸烟者
6000×20%=1200例
A病不伴吸烟者
6000×80%=4800例
B病不伴吸烟者
6000×80%=4800例
A病60%
B病25%
吸烟者40%
发生在采集病史记录做病因调查,采用了 解科研目的观察者,询问病例和对照采用不同 询问法。如研究氯霉素和再障的关系。
包括作为判断科研结果的主要实验室指标 的打报告者。
2. 回忆偏倚(Recall Bias)
类风湿性关节炎的家族史调查
关节炎兄弟(%)
4. 健康工人偏倚
发生在职业性肿瘤的前瞻性病因调查时
5. 前瞻性调查中的移动偏倚
研究运动和冠心病的关系 (Am J Epid,1979 110:52)
码头工人3975人,按劳动强度分组,随 访22年。发现各组冠心病发生率差别不大.
如每年把工种分类一次,观察一次并经 和其他因素校正后,证明坐着的工种冠心病 发生率为强劳力的2倍.
偏倚(Bias)
偏倚是组间变量差异时产生的系统误差。是对真实情况的偏离, 导致研究结果不能真实地(validly),精确地(precisely)反映实际正确 的结果.
是选择研究对象,收集资料及分析资料过程中人为产生的。 临床科研的特点决定了Bias的普遍性和不可避免性。 在科研设计阶段、实施阶段设法防止它的形成,或资料分析阶段
偏倚的防止和处理
一、强调严格的科研设计
多数偏倚发生于科研设计阶段,来源于选择研 究对象或对照的不妥,如抽样方法不正确,诊断标 准不统一,样本大小不适当,使观察组和对照组缺 乏可比性。
也可来源于决定调查方法和资料收集方法时考虑 不周,如调查表格设计不好,实验室指标缺乏质控 ,判断结果缺乏客观方法。这些偏倚如一旦发生, 很难在资料分析阶段加以消除。
P=0.006
不吸烟 心梗 对照 饮酒 有 8 16 无 22 44 合计 30 60
吸烟 心梗 对照
63 36 74 70 40
RR=1 RR=1
三、混杂性偏倚(续)
不存在混杂的几种情况:
E
E
E
E
D
D
D
D
F
F
F
F
【例】:饮酒和心梗关系
TG是冠心病的病因吗?
TG
CHD
Ch
四、几种偏倚可同时存在
选择性偏倚(Selection bias) 测量性偏倚(Measurement bias) 混杂性偏倚(Confounding bias)
是系统误差,可发生在设计阶段,在分析阶段易暴露 出来,可用分层方法加以消除,而一般偏倚则不易消 除,混杂不易在设计阶段识别加以均衡
存在混杂的几种情况:
E
E
E
D
D
D
F
F
F
三、混杂性偏倚(续)
分层 STRATIFICATION
心梗 对照
饮酒 有 无
合计
71 52 29 48 100 100
RR=2.26 X²=7.62
分层分组的Mantel-Haenszel法 来平衡混杂因素的影响
研究吸烟和冠心病发病的关系,按年龄性别分层
男
女
<45岁 >45岁 冠心对照 冠心对照 吸 a1 b1 吸 a2 b2 不吸 c1 d1 不吸 c2 d2
<45岁
>45岁
冠心对照 冠心对照
吸 a3 b3 吸 a4 b4
不吸 c3 d3 不吸 c4 d4
分层分析纵隔肿块大小和何杰金病预后关系
分组
II III 症状 无 有
纵隔肿块的大小
大
小或无
复发率(%)
10/14(71)
6/32(19)
4/4(100)
7/13(54)
10/14(71) 4/4(100)
11/41(27) 2/4(50)
五、分层(Stratification)
病例对照和队列研究的分层分析 Mantel-Haenszel 方法
二、随机化的方法和盲法
真正的随机化方法,随机化分组后比较两组的 基本特征
双盲法-- 考核疗效,实验室报告,调查性 研究
三、限制(Restriction)
理论上:两组进行比较,除研究因素外, 其他因素两组应相同
事实上不可能 可采用限制法,其缺点是结论的局限性。
如: 研究年龄对急性心梗预后的影响,可限 于白人男性无并发症,前壁心梗中进行 研究。
A病有吸烟者 【1200×60%=720】+【(1200-720)×40%】=912
B病有吸烟者
【1200×25%=300】+【(1200-300)×40%】=660
A病不伴吸烟者
4800×60%=2880
B病不伴吸烟者
4800×25%=1200
912+2880=3792
B病总数:
660+1200=1860
经性别和年龄校正后的相对危险度(RR)或比数比(OR)
RRmh
ORmh
冠脉搭桥手术病死率比较(虚构资料)
术前危险 甲医院(高危42%) 因素(年龄、 心功能, 病人 死亡 % 梗塞程度
高
500 30 6
中
400 16 4
低
300 2 0.67
合计
1200 48 4
乙医院(高危17%) 病人 死亡 %
1. 检测偏倚(Detection Bias)
服用雌激素和子宫内膜癌发病的关系OR=9.8
结论错误原因: 服用雌激素导致一些无症状的病人发生阴
道流血,从而较早去就医造成检出率提高。
2. BerKson’s Bias
因入院率不同导致的偏倚
防止方法:采用人群对照 A 为肺癌患者 B为冠心病患者
5.将结论推广,应 用于其他病人。
4.分析结果自 样本得出结论
混杂性偏倚
内部准确度
样本偏倚(Sampling Bias)
80
70
癫 60 痫 发 50 生 40 率 % 30
急性心肌梗塞的病死率 人群为基础统计 三级医院统计
20
10
0 人群中 调查
医院的 调查
婴儿高热惊厥,以后癫痫的发生率(JAMA 1980; 243:1337)
A病人中有吸烟者: 912/3792=24.1%
B病人中吸烟者: 660/1860=35.5%
3. Neyman’s Bias
发生于调查时间距离初诊时间过长,有不少 调查对象已死亡,而被调查者只是那些幸存者。
一病例对照调查发现大量饮用咖啡者心梗发 病危险性是其他人的两倍。如做医院内病例对照 调查却不能获此结论。因为50%心梗病例未调查 到。
400 24
6
800 32
4
1200 8 0.67
2400 64 2.6
六、标准化(Standardization)
比较两个率,如两组对象内部构成不同,可用 率标准化加以校正
甲乙医院所用的权相等
甲医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
乙医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
建立后 病死率 15% 医院间差别>药物本身疗
同期做RCT发现CCUS病
效差别
死率并不降低
二、测量偏倚(观察性偏倚)
两组测量或观察方法不一致造成系统误 差,产生于科研的实施阶段
防止方法:采用严格的盲法
1. 询问者偏倚或观察者偏倚
(Interviewer Bias, Observer Bias)
双亲均无 55
27
50
双亲之一有 37
58
42
双亲均有 8
15
8
3. 霍桑效应(Hawthome effect)
发生在考核治疗效果时 特别是志愿者(volunteer)
三、混杂性偏倚
(第三者)
外部变量全部或部分地掩盖或夸大了所研究的暴露因 子和研究结果间的真实联系
外部变量往往是危险因子
群体观念 的重要性
临床科研中常见的偏倚
选择性偏倚(Selection bias) 测量性偏倚(Measurement bias) 混杂性偏倚(Confounding bias)
一、选择性偏倚
在选择研究对象时方法的不正确所致,产 生于研究设计阶段。
纠正方法: 强调严格的科研设计 强调随机化原则进行分组
结论:两组在生长发育上并无差异
五、分层(Stratification)
分层是常用于消除可能存在的混杂的基本方法, 主要用于资料分析阶段。
如何杰金病预后和初诊时纵隔肿块大小有关。经 过根治性淋巴结放疗进入缓解期,但复发率不同。
肿块大者:74%,肿块小者:27%,无者:19%。
五、分层(Stratification)
七、多变量分析
Mantel-Haenszel法只能平衡个别少数的 混杂因素,且对连续性的变量只能用等级分层 法(不太合理)。
60年代起,Comfield提出了Logistic回归 模型进行多变量分析,能在复杂关系中平衡多 种混杂因素的作用,进一步筛选出主要的危险 因素或预后因素,决定在病因及预后中的相对 比重。
四、配对(Matching)
配对常可消除可能存在的混杂偏倚
经常配对的因素为年龄,性别和种族,其他因 素也可配对,如研究预后,病期、严重度、先 前治疗也可配对
四、配对(Matching)
过度配对(Over matching) 研究镰状细胞特征(HbAS)是否比正常Hb(HbAA) 婴儿的生长发育、智力发育为差? 作者将七项因素进行配对: 种族、性别、出生日期、出生时体重、胎龄、5分钟 Apgar积分、社会经济状况 50例HbAS,50例HbAA,从出生随访到3-5岁
6.在自然病程有波动或有自限性的疾 病,采用自身对照考核疗效时所产 生的偏倚。如研究某些治疗感冒药 物。
7. 临床试验中选择对照的时间和 地点不同的偏倚
不同时间的对照(历史对照) 不同地点(医院间对照)
冠心病监护室的效果
抗凝剂治疗急性心梗
监护室:
(22所医院):
建立前 病死率 25% 21天病死率 0-40%
是一种随机抽样误差
偏倚可在设计,实施和分析阶段设法避免,但机遇所致 的随机误差只能缩小,不能避免
准确度(Validity)
研究结论的正确性 分为内部准确度和外部准确度
准确度(Validity)
外部准确度
1.样本病人
样本偏倚 机遇
2.将病人编组 3.进行测量
选择性偏倚 机遇
测量性偏倚 机遇
用统计学的方法加以纠正。
识别和防止Bias是科研工作者的基本功。
机遇(Chance)
机遇是观察结果的精确性(precision)及可重复性( reproducibility, reliability)受到影响
是各测量结果间受机会影响的变异度的大小。使样本的 实际观察结果和总体人群的真实情况相偏离
例如 :
入院率 住院病人中 A病总数:
A病在人群中共6000例
其中20%吸烟
B病在人群中共6000例
其中20%吸烟
A病有吸烟者
6000×20%=1200例
B病有吸烟者
6000×20%=1200例
A病不伴吸烟者
6000×80%=4800例
B病不伴吸烟者
6000×80%=4800例
A病60%
B病25%
吸烟者40%
发生在采集病史记录做病因调查,采用了 解科研目的观察者,询问病例和对照采用不同 询问法。如研究氯霉素和再障的关系。
包括作为判断科研结果的主要实验室指标 的打报告者。
2. 回忆偏倚(Recall Bias)
类风湿性关节炎的家族史调查
关节炎兄弟(%)