流行病学-第九章-常见偏倚及其控制
临床研究中常见偏倚及其控制

临床研究中常见偏倚及其控制临床研究是为了探究特定治疗方法的有效性和安全性而进行的科学研究。
然而,由于人类研究的复杂性和不确定性,所得结果可能存在偏倚(Bias)。
偏倚是指在研究设计、数据收集、数据分析和结果报告过程中,由于意外或有意的错误,导致了对真实效应的错误解释。
偏倚的存在可能导致结果的不准确性和不可靠性,从而影响临床决策和指导实践。
常见的临床研究偏倚包括:1. 选择偏倚(Selection Bias):指研究中选择样本的方式与研究目标或总体特征不一致,导致样本无法代表目标总体。
例如,使用方便采样(Convenience Sampling)而非随机抽样可能导致选择偏倚。
2. 信息偏倚(Information Bias):指研究中信息的收集和报告存在错误或不完整,导致结果产生误导性。
信息偏倚可以分为观察时偏倚(Observational Bias)和报告偏倚(Reporting Bias)。
观察时偏倚可能由于测量方法、测量工具或观察者主观判断等因素引起。
报告偏倚可能是由于研究结果的重要性、正向结果的偏好或权威压力等原因导致重要结果未能完整报告。
3. 记忆偏倚(Recall Bias):指研究参与者回忆过去事件或情况时存在的系统性错误。
例如,研究关注过去暴露与结果的关系,参与者的回忆可能不准确或受先入为主的认知影响。
4. 探测偏倚(Detection Bias):指评估结果的方法对不同干预或参与者有不同的敏感性,导致研究结果的估计值存在误差。
例如,如果评估员知道受试者接受的治疗方法,可能在测量结果时有意无意地做出倾向性判断。
为了控制这些偏倚,研究者可以采取一些方法:1. 随机分组(Randomization):随机分组可以减少选择偏倚,并使得不同组之间的人口学和疾病特征基本相似,从而降低混杂因素的影响。
2. 盲法(Blinding):盲法分为单盲和双盲。
单盲指研究参与者或评估结果的人员不知道干预措施的分组情况;双盲指干预的研究人员和参与者都不知道他们所处的组别。
第九章 流行病学研究中的偏倚及其控制

检出症候偏倚
某人进行了一项更年期服用雌激素与子宫内膜 癌关系的病例对照研究,分别在同一个医院的 不同科室选择了研究对象,经分析得到下表结 果
检出症候偏倚
在肿瘤科,子宫内膜癌病人多由于她们服用雌激素后出 现子宫出血而到医院检查,能及早发现该人群中的子宫 内膜癌病人,且多为早期的病人,而没有服用者,由于 没有子宫出血症状,减少了就诊机会,使该病不易及早 被诊断出来,因而能得出雌激素和子宫内膜癌之间相关 联的结论 在妇科,这些患者大多数接受妇科检查,因此子宫内膜 癌的检出与是否服用雌激素使妇科检查几率增加之间没 有关系
健康工人效应
为了探讨职业暴露对人类健康的危害,McMichael等在 美国俄亥俄州的一个轮胎生产工厂,选择在岗及退休男 性工人6678人作为暴露组,进行了回顾性队列研究。观 察期间为1964~1972年共9年时间。以国家卫生统计中 心编制的1968年美国男性年龄别死亡率作参比 下表是同时期与钢铁工人、俄亥俄州人口及美国全国人 口相比较的橡胶工人全死因死亡率(1/10万人年)
现患-新发病例偏倚
现患病例-新病例偏倚的测量可依据队列研究 和病例对照研究两研究不同的联系强度来估计 假设队列研究的联系强度为OR1,病例对照研 究的联系强度为OR2,现患病例-新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚= 0.517 OR1 2.40
为负值,说明由于该偏倚的存在,使得病例对 照研究中高血胆固醇与冠心病之间的联系强度 降低了51.7%
假如在人群进行一项病例对照研究,以B病为对照,研 究A病与某因素X的关系。设人群中患A病与B病者各为 5000人,暴露于因素X者各为750人,不暴露于因素X者 各为4250人,X 在A、B患者中的暴露率均为15% 暴露X 有 无 A病 750 4250 B病 750 4250 合计 1500 8500
流行病学研究中常见偏倚及其控制

偏倚
定义
属于系统误差,在研究或推论过程 中所获得的结果系统地偏离其真实值 特点 具有单方向性 ,有正、负 可高于真值,也可低于真值 分类 选择偏倚、信息偏倚、混杂偏倚
选择偏倚
产生于设计阶段,是由于选择研究对象的 方法不当而导致研究结果偏离真实情况。 常见种类
入院率偏倚 现患-新发病例偏倚 无应答偏倚 检出征候偏倚 易感性偏倚
随机误差
布
随机误差 广义 因机遇不同估计总体参数时所产生的 误差,如选择的机遇、时间的机遇 狭义 随机抽样所得均值对总体均值的误差 特点 没有固定方向和固定大小 一般呈正态分布
偏
倚
偏倚概念:是指在流行病学研究中样 本人群所测得的某变量值系统地 偏离了目标人群中该变量的真实 值,使研究结果或推论的结果与 真实情况之间出现偏差,这是由 系统误差造成的。
入院率偏倚(admission rate bias) 利用医院就诊或住院病人作为研究对 象时,由于入院率或就诊机会不同而导 致的偏差
现患-新发病例偏倚 ( prevalenceincidence bias) 又称奈曼偏倚,凡因现患病例与新病 例的构成不同,只调查典型病例或者现 患病例的暴露情况,致使调查结果出现 的系统误差都属于本类误差
常见种类 回忆偏倚 诊断怀疑偏倚 暴露怀疑偏倚 报告偏倚 检出偏倚 诱导偏倚
回忆偏倚(recalling bias) 研究对象在回忆以往发生的事 件或经历时,由于记忆失真或不完 整在准确性和完整性上的差异所致 的系统误差
诊断怀疑偏倚(diagnostic suspicion bias) 常发生在前瞻性研究中,在 病例对照研究中也可发生,特别 是诊断亚临床病例,判断药物的 毒副作用时,研究者主观偏见和 研究对象的主观因素
流行病学研究中的常见偏倚

4. 志愿者偏倚(volunteer
bias)
一般情况下,志愿者与非志愿者在关心健康、 注意饮食习惯、禁烟、禁酒及体育锻炼等方 面可能存在系统的差别,因而,志愿者被入 选为观察对象,而非志愿者落选,这样的研 究结果往往有选择偏倚。例如,一项以“体 力活动预防冠心病”的研究,干预组都是志 愿者,而将非志愿者作对照,以比较该项措 施的效果,这样就可能会得出不正确的结论。
第一节 选择偏倚及控制
一、选择偏倚概念及类型
选择偏倚(selection bias)是由于选择研究 对象的方法有问题,使入选者与未入选 者在某些特征上存在着系统差异,从而 导致研究结果偏离真实情况。在各类流 行病学研究中均可发生选择偏倚,以病 例对照研究中较为常见,如入院率偏倚、 现患病例-新病例偏倚、检出症候群偏倚 等。
1.入院率偏倚(admission rate bias)
入院率偏倚是由于各种疾病的入院率不 同而致的偏倚。现举例说明。
某研究者计划研究A病与X因素的关系, A病例取自某医院,同时,他以同一医院 随机抽取相应人数的B病人作对照。
X因 素
有 无
表 6-1 人群中病例对对照研究
A 病(病例
B 病(对照
二、选择偏倚的测量与防制
(一)、选择偏倚的测量
选择偏倚在理论上可以通过总人群与实 际抽样人群疾病与暴露分布情况进行测 量。下面以病例对照研究为例,总人群 与实际抽样人群中疾病与暴露因素的分 布分别如表6-5和表6-6所示:
表6-5 总人群疾病与暴露分布
病例
暴露
A
非暴露
B
非病例
C
D
总人群比数比: OR AD
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其 有代表性的样本)作为研究对象。如以医院 病例为研究对象,宜在多个医院选择对象, 且最好有2个对照组,其中一个对照组来自 社区一般人群,在队列研究中,最好也应设 多种对照,以减少选择偏倚对结果的影响。
流行病学中常见的偏倚及其控制

膳膳食食改改良组组
降降低胆胆固固醇醇药品物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
流行病学中常见的偏倚及其控制
五年内发生 心肌梗死风险(%)
7
第7页
如图8-2, 研究A和B中膳食改良组五年内发生心机梗死风险为 9%, 而降胆固醇药品组为6%。
研究A样本较小(200人), 两组效应指标(心肌梗死风险) 95%可信限较大, 发生重合, 无显著性差异。
若θ<θ’<1,则为趋向无效值偏倚。
(三)不论θ>1或θ<1,若θ和θ’在1两侧,则 为颠倒偏倚。
流行病学中常见的偏倚及其控制
17
第17页
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值 负偏倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
流行病学中常见的偏倚及其控制
28
第28页
在美国弗明汉地域对心血管系统疾病研究中发觉: 男性居民在队列研究中,含有高胆固醇水平者,患 冠心病OR 值为2.4,而在病例对照研究中,病例 组和对照组却无显著差异(OR =1.16)。
原因: 病例对照研究中现患病例已改变了他们高胆固
醇饮食习惯。
流行病学中常见的偏倚及其控制
Hale Waihona Puke 流行病学中常见的偏倚及其控制
36
第36页
有些人以病例对照研究发觉, 子宫内膜癌患者雌 激素百分比显著高于对照组, 认为子宫内膜癌与服 用雌激素亲密相关。
流行病学中常见的偏倚及其控制
37
第37页
1978年,Horwitz和Feinstein: 口服雌激 素与子宫内膜癌高度关联是虚假,是一个 检出偏倚。
流行病学研究中常见的偏倚及其控制

举例:用动脉血压计测量某人血压,各次读数的均值为 100mmHg,系统误差和随机误差可用以下图示
发 生 频 次
系统误差
随机误差
80
100
舒张压 (mmHg)
图1
血压计法测量舒张压值的分布
9
二、偏倚的概念
定义
偏倚(Bias)是在研究的设计、实施、分析阶段发 生的系统误差。 特点 是影响流行病学内部真实性的主要原因。 具有方向性,夸大真实值为正偏倚,缩小真实值为 负偏倚 分类 选择偏倚,信息偏倚,混杂偏倚
10
第二节 选择偏倚
一 选择偏倚的概念 选择偏倚(selection bias)指由于研究对象与目标人群的 特征存在着系统误差,使效应估计值与真值之间发生的 偏差。
是研究者在挑选研究人群时由于选择条件受限制或设计 失误所造成的。既可产生与研究开始选择研究对象的时 候,也可产生与收集资料过程中出现失访或无应答。常 见于现况研究、病例对照研究与回顾性队列研究。
16
二 选择偏倚的常见种类 2、现患-新发病例偏倚
又称奈曼偏倚,在病例对照研究中,用于研究的 通常是现患病例,而不包括死亡病例或者病程短、 轻型、不典型的病例,由此而所产生的系统误差。 如: Friedman 等人进行的心血管疾病的研究中发现, 队列研究中,高胆固醇水平者患冠心病的 OR 值为 2.4 ,而在病例对照研究中,病例组与对照组无明 显差别OR为1.16。
一、研究结果的误差和真实性
随机误差
定义
由于多种无法控制及不能预测的因素引起的 一类表现不恒定、随机变化的误差。 特点 没有固定方向和固定大小 一般呈正态分布
7
一、研究结果的误差和真实性
系统误差 定义 指研究过程中,由一些可控制的因素引起的使 研究结果或推论偏离真实情况的误差。 特点
第9章 偏倚及其控制

– 病例常常努力回忆暴露来理解为什么会得病 – 对照可能不大记得起暴露,因为那对他们不重要
常见的信息偏倚
2. 报告偏倚(reporting bias)
– 在研究信息收集时,由于某些原因,研究对象有意 夸大或缩小某些信息而导致的系统误差
常见的选择偏倚
2. 检出症侯偏倚
– 某一因素与某一疾病并无因果联系,但因该因素能 促进类似的症状和体征出现,使病人急于求医,医 生注意这种临床表现和疾病的早期诊断,使该病的 检出率大为提高,从而得出某因素与该病有因果关 系的联系 – 该偏倚常发生在以医院为基础的病例对照研究
Байду номын сангаас
雌激素
导致
子宫出血
虚假关联
• 涉及劳保、福利时,职业人群可能会夸大某些有害 因素的暴露信息 • 涉及健康状况时,研究对象可能为继续从事该项工 作而有意掩盖某些患病信息 • 盲法使用不当导致研究对象知道分组情况,可能有 意夸大或缩小疗效或不良反应 • 敏感问题的调查较易出现瞒报
• 度量
– 金标准
【知识点9-2】
(1) 偏倚是指在研究过程中,由于某种或某组因素的 影响,使研究的结果或结论系统地偏离真实情况, 其偏离的方向一致或基本一致,这种系统误差称 为偏倚 (2) 偏倚有两个方向:正偏倚和负偏倚
第 2 节 偏倚的分类及其产生的原因
Section 2 Categories and Causes of Bias
• 研究的真实性或效度(validity)
– 研究收集的数据、分析结果和所得结论与客观真实 值的符合程度 – 测量值与真实值之间的差异来源于误差 – 误差
流行病学—偏倚与控制

第一节 概述
一、偏倚的概念:指在流行病学调查或推论过程中 所获结论系统地偏离真实值,属于系统误差。 二、偏倚的方向: (一)正偏倚和负偏倚: 凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为θ ,而测得值为θ ’。 θ =1.0为零效应; θ >1为危险效应; θ <1为保 护效应。
二、信息偏倚的控制 (一)制定明细的资料收集方法和严格的质量控制 方法 (二)尽可能采用“盲法” (三)尽量收集客观指标的资料。 (四)收集资料的范围可以适当有意识地扩大些, 借以分散调查人员和研究对象对某项因素的注意 力,减少某些偏见带来的偏倚。 (五)通过调查知情人或采用相应的调查技术,获 取正确信息,避免报告偏倚。 (六)选择一个与暴露史有联系的鲜明的记忆目标 帮助其联想记忆或选择新病例作为对象。
¶ ÔÕ£ ¨£ ¥£ © 55 37 8
À à· çÊ ª¹ ؽ ÚÑ ×» ¼Õ ß £ ¨£ ¥£ © 27 58 15
À à· çÊ ª¹ ؽ ÚÑ ×» ¼Õ ßµ ÄÍ ¬° û £ ¨£ ¥£ © 50 42 8
类风湿关节炎患者 比其同胞、对照更能提供阳性家族史
(二)报告偏倚:研究对象有意夸大或缩 小某些信息而导致的偏倚。 如隐瞒与隐私有关的暴露史 保护调查对象声誉隐瞒不良暴露史 夸大职业暴露
(六)无应答偏倚: 某个样本中的无应答者的患病状况,以及对 某一或某些研究因素的暴露情况与应答者不同, 由此产生的偏倚称为无应答偏倚。 安阳县食管癌普查,普查率仅20%左右,不 能代表总体。 造成无应答的主要原因: 研究对象不了解研究目的;调查内容不当, 过于繁琐,涉及隐私;对象不能正理解调查内容 (文化低、高龄等);对象病重、外出。
流行病学研究中的常见偏倚

一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效 果,这样就可能会得出不正确的结论。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR=1,χ2检验差异无显著性,说明A病与X因素无关系。
假设A病住院率为25%,B病住院率为60%,具 有X因素也有一定的入院率为40%。现就上述 不同的入院率计算住院人数:
A病无X因素住院人数=4800×0.25=1200人
A病有X因素住院人数=1200×0.25+(1200 -300)×0.4=660人
7
72
110
117
117
9.8
妇科
暴露
非暴露
59
42
89
108
148
148
1.7
1978年,Horwitz指出,这一结论是由检 出征候偏倚所致,两者之间的高度关联 是虚假的。因为在人群中有一定量的无 症状的子宫内膜癌早期病人,她们若不 服用雌激素,子宫不致出血,因而不去 医院就诊,而不能被发现。
4. 志愿者偏倚(volunteer
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其 有代表性的样本)作为研究对象。如以医院 病例为研究对象,宜在多个医院选择对象, 且最好有2个对照组,其中一个对照组来自 社区一般人群,在队列研究中,最好也应设 多种对照,以减少选择偏倚对结果的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
22
(2)现患病例-新病例偏倚( bias) (2)现患病例-新病例偏倚(Neyman bias) 现患病例 病例对照研究中如选择现患病例作 病例, 病例,他们是过去一段时间新发病例的幸 存着, 存着,如果幸存者所反映的暴露情况比新 发病例高或低,则会导致此种偏倚的出现。 发病例高或低,则会导致此种偏倚的出现。 如性别与结肠癌关系的研究: 如性别与结肠癌关系的研究:发病率男性稍 高于女性,但生存期女性明显高于男性。 高于女性,但生存期女性明显高于男性。 现患病例的样本比新发病例样本女病人比 例较大。 例较大。
第九章 流行病学的常见偏倚及控制
重点: 重点: 掌握选择偏倚、信息偏倚和混杂偏倚概念; 掌握选择偏倚、信息偏倚和混杂偏倚概念; 掌握各种偏倚产生原因及控制措施; 掌握各种偏倚产生原因及控制措施;
1
本章内容 第一节 第二节 第三节 误差与研究的真实性 研究的真实性 偏倚
2
第一节
误差
一、随机误差 二、系统误差 三、随机误差与系统误差的区别
15
分析性研究的选择偏倚
主要体现 研究对象进入、排除、 研究对象进入、排除 、 不参与或失访等与研 究暴露或处理因素存在关联, 究暴露或处理因素存在关联,由此增大或减少暴露与疾 病、处理与效应的关联,导致效应估计的偏倚。 处理与效应的关联,导致效应估计的偏倚。 控制方法 选取具体环节或已选取人群的具体特征 分析研究对象的选取是否同暴露或处理因素有关
11
三、外部真实性
外部真实性( 外部真实性(external validity) ) 定义 研究结果与推论对象真实情况的 符合程度,又称为普遍性( 符合程度,又称为普遍性(generalizability)。 )。 它回答一个研究能否推广应用到研究对象以外 的人群。 的人群。 改善措施 增加研究对象的异质性, 增加研究对象的异质性,使得研究对象的 代表性范围扩大。 代表性范围扩大。
23
以医院中心肌梗死病人为病例进行病 以医院中心肌梗死病人为病例进行病 例对照研究,得到结论: 例对照研究,得到结论:大量饮用咖啡与 心肌梗死无关。 心肌梗死无关。 而队列研究表明: 而队列研究表明:大量饮用咖啡 者心肌梗死发病危险性是对照的2 者心肌梗死发病危险性是对照的2倍。 原因: 原因: Neyman bias 50%的心肌梗死患者入院前死亡。 50%的心肌梗死患者入院前死亡。调查对 象只是心肌梗死后的幸存者; 象只是心肌梗死后的幸存者; 死亡者多是大量饮用咖啡者且时间较长; 死亡者多是大量饮用咖啡者且时间较长; 入院的未死亡病例只是一般的饮用者; 入院的未死亡病例只是一般的饮用者;
24
此外, 此外,现患病例有时会主动改变其对危 险因素的暴露, 险因素的暴露,导致对危险因素与疾病关 系的低估。 系的低估。 队列研究发现高胆固醇血症与冠心病 RR为2.4。而病例对照研究中,RR为1.16。 的RR为2.4。而病例对照研究中,RR为1.16。 原因: 原因:病例对照研究中的现患病例 已改变了他们高胆固醇的饮食习惯。 已改变了他们高胆固醇的饮食习惯。
25
(3)检出偏倚:指某因素与某疾病无关联, 检出偏倚:指某因素与某疾病无关联, 但由于该因素的存在而引起某些症状或 体征的出现,从而使患者及早就医, 体征的出现,从而使患者及早就医,接 受多种检查, 受多种检查,导致该人群该病的检出率 较高, 较高,以致得出该因素与该疾病有关联 的错误结论。 的错误结论。 雌激素与子宫内膜癌 1975年 Ziel和Finkle: 1975年,Ziel和Finkle:口服雌 激素是子宫内膜癌危险因素(高度联系, 激素是子宫内膜癌危险因素(高度联系, 方法病例对照研究) 方法病例对照研究)
6
系统误差来自于对象选取、 系统误差来自于对象选取、测量和 统计分析等的方法学缺陷, 统计分析等的方法学缺陷,有固定方向 和固定大小的误差 。
7
三、随机误差和系统误 差的区别
随机误差 来源 系统误差 测量工具、 测量工具、 测量工具、个体内及 测量工具、个体内及 个体间的无规律变异 个体间的无规律变异, 个体间的无规律变异, 及不合理的抽样、 及不合理的抽样、测 分析、 量、分析、结果解释 等 不可预测, 不可预测,但可用统 对结果的方向和大小 计学方法检验和量化 大多可预测,但不可 大多可预测, 用统计学方法检验和 量化 可通过改善研究设计、 可通过改善研究设计、根据误差来源及对结 增大样本量减少 果影响的规律采取针 对性的措施以避免和 控制
18
社会地位 病例组(颈椎病) 对照组(冠心病) 上等阶层 1200 1200 非上等阶层 4800 4800 合计 6000 6000
OR=1200×4800/1200×4800=1 = × × = χ2=1 , P>0.05
合计 2400 9600 12000
19
又假定患冠心病者入院率为60%, 又假定患冠心病者入院率为60%,颈椎病为 60% 25%, 25%,上等阶层者因接受保健检查的入院 率为40% 那么实际入院人数为: 40%。 率为40%。那么实际入院人数为: 1.患冠心病并属上等阶层 患冠心病并属上等阶层: 1200人 1.患冠心病并属上等阶层:共1200人, 正常入院:1200×60%=720人 正常入院:1200×60%=720人 接受保健检查入院:480×40%=192人 接受保健检查入院:480×40%=192人 实际入院人数:720+192=912人 实际入院人数:720+192=912人 2.患冠心病不属上等阶层 患冠心病不属上等阶层: 4800人 2.患冠心病不属上等阶层:共4800人 正常入院:4800×60%= 正常入院:4800×60%=2880 实际入院人数: 实际入院人数: 2880
3
一、随机误差 定义: 定义:由于多种无法控制及不能预测 的因素引起的一类表现不恒定、 的因素引起的一类表现不恒定、随机变化 的误差叫随机误差。又叫机会。来源包括: 的误差叫随机误差。又叫机会。来源包括: 1、测量方法或测量工具本身产生随机 变异; 变异; 个体内的随机生物学变异; 2、个体内的随机生物学变异; 个体间的随机变异。 3、个体间的随机变异。
26
1978年 Horwitz和Feinstein: 1978年,Horwitz和Feinstein:口服雌 激素与子宫内膜癌的高度关联是虚假的, 激素与子宫内膜癌的高度关联是虚假的, 是一种检出偏倚。 是一种检出偏倚。 (1)人群中有一定量无症状的子宫内膜癌早 期病人。 期病人。 (2)无症状的子宫内膜癌早期病人如服用雌 激素易发生子宫出血而就诊, 激素易发生子宫出血而就诊,由此被发现 而选入病例组。 而选入病例组。 对照组为一般住院病人。 (3)对照组为一般住院病人。 结果:雌激素服用率高于对照组。 结果:雌激素服用率高于对照组。
27
Feinstein从同一医院中随机选取妇 Feinstein从同一医院中随机选取妇 科其他良性肿瘤患者为对照进行研究: 科其他良性肿瘤患者为对照进行研究:口 服雌激素与子宫内膜癌无关联。 服雌激素与子宫内膜癌无关联。
28
(4)无应答偏倚: 无应答偏倚: 某个样本中的无应答者的患病状况, 某个样本中的无应答者的患病状况,以 及对某一或某些研究因素的暴露情况与应答者不 由此产生的偏倚称为无应答偏倚。 同,由此产生的偏倚称为无应答偏倚。 安阳县食管癌普查,普查率仅20%左 安阳县食管癌普查,普查率仅20% 20 不能代表总体。 右,不能代表总体。 造成无应答的主要原因: 造成无应答的主要原因: 研究对象不了解研究目的; 研究对象不了解研究目的;调查内容 不当,过于繁琐,涉及隐私; 不当,过于繁琐,涉及隐私;对象不能正理解调 查内容(文化低、高龄等);对象病重、外出。 );对象病重 查内容(文化低、高龄等);对象病重、外出。
12
第三节 研究的偏倚
选择偏倚 信息偏倚 混杂偏倚
13
一、选择偏倚(selection bias) 选择偏倚
(一) 定义 研究对象的选取过程中, 研究对象的选取过程中,由于选取方式不 当,导致入选对象与未入选对象之间存在系统 差异,由此造成的偏倚称为选择偏倚。 差异,由此造成的偏倚称为选择偏倚。例如研 究对象采用志愿者,方便样本, 究对象采用志愿者,方便样本,或者研究对象 的无应答或失访等。 的无应答或失访等。
8
大小和方向
减少和控制
第二节
研究的真实性
定义 内部真实性 外部真实性
9
一、定义 定义
真实性(效度) 真实性(效度): 指研究收集的数据、 指研究收集的数据、分析结果和所得结 论与客观实际的符合程度。 论与客观实际的符合程度。
10
二、内部真实性
内部真实性( 内部真实性(internal validity) ) 定义 研究结果与实际研究对象真实情 况的符合程度,它回答一个研究本身是否真 况的符合程度 , 它回答一个研究本身是否真 实或有效。 实或有效。 改善措施 限制研究对象的类型和研究的环境条 件。
4
随机误差 可用统计学方法来估计, 可用统计学方法来估计,增大样本 含量可减少,没有固定方向和固定大小, 含量可减少,没有固定方向和固定大小, 一般呈正态分布。 一般呈正态分布。
5
二、系统误差 定义:是指研究过程中, 定义:是指研究过程中,由一些已 知或可控制的因素引起的使研究结果或 推论系统地偏离真实情况的的误差。 推论系统地偏离真实情况的的误差。在 研究设计、资料的收集、分析、 研究设计、资料的收集、分析、解释或 发表过程中,都有可能发生系统误差, 发表过程中,都有可能发生系统误差, 导致结论系统地与真实值不同。 导致结论系统地与真实值不同。 系统误差又叫偏倚。 系统误差又叫偏倚。
16
(二)、选择偏倚的种类 二)、选择偏倚的种类 入院率偏倚(Berkson’s bias) (1)入院率偏倚(Berkson s bias) 指利用医院门诊或住院病人作为 研究对象时, 研究对象时,由于入院率的不同而导致的 偏椎病 假定某人群中有6000 6000人患颈椎 假定某人群中有6000人患颈椎 6000人患冠心病 人患冠心病, 病,6000人患冠心病,并且在患这两种 疾病的人中各有20% 20%的人属于上等社会阶 疾病的人中各有20%的人属于上等社会阶 层。 这两种疾病的病人社会阶层情况: 这两种疾病的病人社会阶层情况: 1.患冠心病并属上等阶层 1200人 患冠心病并属上等阶层: 1.患冠心病并属上等阶层:1200人 2.患颈椎病并属上等阶层 1200人 患颈椎病并属上等阶层: 2.患颈椎病并属上等阶层:1200人 3.患冠心病不属上等阶层 4800人 患冠心病不属上等阶层: 3.患冠心病不属上等阶层:4800人 2.患颈椎病不属上等阶层 4800人 患颈椎病不属上等阶层: 2.患颈椎病不属上等阶层:4800人