第九章 常见偏倚及其控制

合集下载

临床科研中常见偏倚及防止方法

临床科研中常见偏倚及防止方法

第九章临床科研中常见偏倚及其控制方法第一节真实性、偏倚与机遇的概念一、真实性指一项观察或研究所推论观点的正确性及可靠程度,即所得结果反映研究对象的真实情况。

临床医学研究的目的是从样本人群,通过观察或研究,努力取得研究变量同结果变量间的真实联系,并将此真实联系推广到样本人群及其所属目标人群(或参照人群)范围内。

流行病学上将能正确反映样本人群及目标人群真实状况的研究结果的外延性称作内部真实性,若将该项研究成果推广到目标人群以外的其他人群仍然得到同样的结果,表明该项研究成果不但具有内部真实性,而且同时具有外部真实性。

一项没有内部真实的研究结果,不可能具有外部真实性,但有内部真实性的研究成果,不一定具有外部真实性。

样本偏倚是临床科研中特别值得注意的问题,许多临床研究是在三级医院中进行的,而三级医院是重病集中的场所,容易将疾病描绘得严重一些,在三级医院中所获得的研究结论有时并不适用于一般人群。

例如急性心肌梗死病死率,三级医院的资料常低于一般社会人群,原因是心肌梗死死亡的病人50%是发生在未送医院之前。

样本偏倚与后面要讲的选择性偏倚不同,样本偏倚仅涉及将医院里的研究结论推广到群体时产生,而不涉及内部真实性,而选择性偏倚涉及内部真实性,因此,临床工作者必须注意树立群体观点。

(见图9-1)(图9-1内部真实性与外部真实性二、偏倚指研究所得资料的推论偏离真值。

或者说,自样本人群所得变量与结果变量的联系,不能反映目标人群的暴露变量与结果变量的真实联系。

在临床科研中,偏倚是在研究对象各组间某变量有否差异的过程中产生的一种系统误差。

例如,甲治疗组的疗效优于乙治疗组;急性心肌梗死范围大的患者其预后比梗死范围小的患者要差;CT诊断脑瘤的符合率比放射性核素扫描为高等。

临床研究中所获得之各组变量间的差异,有时并非代表真实情况,这种现象就是偏倚(对真实情况的偏离)。

必须指出,与基础科学研究相比较,临床科研特别容易产生偏倚,因为临床科研的对象是人,不可能象动物那样做到组间基本情况均相等,而且病人还有心理变化,拒绝试验或中途退出试验等影响科研结果正确性的情况。

第九章 流行病学研究中的偏倚及其控制

第九章  流行病学研究中的偏倚及其控制

检出症候偏倚

某人进行了一项更年期服用雌激素与子宫内膜 癌关系的病例对照研究,分别在同一个医院的 不同科室选择了研究对象,经分析得到下表结 果
检出症候偏倚

在肿瘤科,子宫内膜癌病人多由于她们服用雌激素后出 现子宫出血而到医院检查,能及早发现该人群中的子宫 内膜癌病人,且多为早期的病人,而没有服用者,由于 没有子宫出血症状,减少了就诊机会,使该病不易及早 被诊断出来,因而能得出雌激素和子宫内膜癌之间相关 联的结论 在妇科,这些患者大多数接受妇科检查,因此子宫内膜 癌的检出与是否服用雌激素使妇科检查几率增加之间没 有关系

健康工人效应

为了探讨职业暴露对人类健康的危害,McMichael等在 美国俄亥俄州的一个轮胎生产工厂,选择在岗及退休男 性工人6678人作为暴露组,进行了回顾性队列研究。观 察期间为1964~1972年共9年时间。以国家卫生统计中 心编制的1968年美国男性年龄别死亡率作参比 下表是同时期与钢铁工人、俄亥俄州人口及美国全国人 口相比较的橡胶工人全死因死亡率(1/10万人年)

现患-新发病例偏倚

现患病例-新病例偏倚的测量可依据队列研究 和病例对照研究两研究不同的联系强度来估计 假设队列研究的联系强度为OR1,病例对照研 究的联系强度为OR2,现患病例-新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚= 0.517 OR1 2.40

为负值,说明由于该偏倚的存在,使得病例对 照研究中高血胆固醇与冠心病之间的联系强度 降低了51.7%

假如在人群进行一项病例对照研究,以B病为对照,研 究A病与某因素X的关系。设人群中患A病与B病者各为 5000人,暴露于因素X者各为750人,不暴露于因素X者 各为4250人,X 在A、B患者中的暴露率均为15% 暴露X 有 无 A病 750 4250 B病 750 4250 合计 1500 8500

第九章常见偏倚及其控制

第九章常见偏倚及其控制

第九章常见偏倚及其控制(Biases and Their Control)第一节研究结果的变异性1、研究结果的变异性(Variability)数据(指标)的变动或波动。

它可存在于不同水平,包括个体水平,群体水平和样本(研究)水平。

2、变异性的来源:⑴生物学(真实)变异和测量变异:物学变异反映真实的客观变异,测量变异反映测量过程的误差。

⑵随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。

系统变异(误差)的绝对值和方向保持恒定。

测量误差分为随机误差和系统误差。

3变异的水平:⑴个体水平的变异性:指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化⑵群体水平的变异性:可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。

群体的变异程度常常大于个体的变异。

也受到测量误差的影响。

⑶样本水平的变异性:指通过不同样本的研究所得结果的差异性。

第二节研究的真实性一、概述研究真实性或效度(Validity)指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

研究误差是研究真实性的反面。

研究误差的两种常见类型:随机误差(random error)系统误差(systematic error)随机误差(random error):指随机抽样所得统计量与总体参数的差异由抽样(机遇)所致,通常与测量过程及其它变量的影响无关,无方向性可通过统计学方法估计和评价是不可避免的,但通过合理的设计、正确的抽样(加大样本量等)可使之减小系统误差(systematic error)随机误差以外的误差,任何研究都有发生的可能在流行病学调查研究中系统误差又叫偏倚(bias)可以通过严格的设计、实施、分析来尽可能地控制重复试验及增加样本含量并不能减小系统误差研究的可靠性或信度(reliability)亦称精确度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。

流行病学中常见的偏倚及其控制

流行病学中常见的偏倚及其控制

膳膳食食改改良组组
降降低胆胆固固醇醇药品物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
流行病学中常见的偏倚及其控制
五年内发生 心肌梗死风险(%)
7
第7页
如图8-2, 研究A和B中膳食改良组五年内发生心机梗死风险为 9%, 而降胆固醇药品组为6%。
研究A样本较小(200人), 两组效应指标(心肌梗死风险) 95%可信限较大, 发生重合, 无显著性差异。
若θ<θ’<1,则为趋向无效值偏倚。
(三)不论θ>1或θ<1,若θ和θ’在1两侧,则 为颠倒偏倚。
流行病学中常见的偏倚及其控制
17
第17页
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值 负偏倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
流行病学中常见的偏倚及其控制
28
第28页
在美国弗明汉地域对心血管系统疾病研究中发觉: 男性居民在队列研究中,含有高胆固醇水平者,患 冠心病OR 值为2.4,而在病例对照研究中,病例 组和对照组却无显著差异(OR =1.16)。
原因: 病例对照研究中现患病例已改变了他们高胆固
醇饮食习惯。
流行病学中常见的偏倚及其控制
Hale Waihona Puke 流行病学中常见的偏倚及其控制
36
第36页
有些人以病例对照研究发觉, 子宫内膜癌患者雌 激素百分比显著高于对照组, 认为子宫内膜癌与服 用雌激素亲密相关。
流行病学中常见的偏倚及其控制
37
第37页
1978年,Horwitz和Feinstein: 口服雌激 素与子宫内膜癌高度关联是虚假,是一个 检出偏倚。

第九章偏倚及其控制

第九章偏倚及其控制

第九章偏倚及其控制1.error2.bias3.validity4.reliability5.internal validity6.external validity7.selection bias8.information bias 9.confounding bias选择题1.下列偏倚中不属于选择偏倚的是A 入院偏倚B 现患病例偏倚C 回忆偏倚D 志愿者偏倚E 失访偏倚2.下列措施中不能控制混杂的是(A 匹配B 随机化C 分层分析D 多变量分析E 盲法简答题1.研究变异的来源有哪些?2.何谓选择偏倚,如何对其进行控制?填空题1.偏倚的类型分为、、。

信息偏倚的种类:和,后者常见类型有和。

参考答案1.误差:是指研究结果与真实性的偏差,可分为随机误差和系统误差。

2.偏倚:即系统误差。

样本人群测得的变量值系统地偏离了目标人群中该变量值的真实值,使在研究结果或推论结果时与真实情况间出现的偏差。

可分为选择偏倚、信息偏倚和混杂偏倚。

3.真实性:也称效度,是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

4.可靠性:也称信度或精确度,是反映研究结果重随机误差大小的程度,随即误差小择研究信度高。

5.内部真实性:是指研究结果与实际研究对象真实情况的符合程度。

6.外部真实性:是指研究结果与推论对象真实情况的符合程度。

7.选择偏倚:是在研究对象的选取过程重,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异。

8.信息偏倚:又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题。

9.混杂偏倚:是指混杂因素对暴露因素与疾病发生的相关(关联)程度产生的歪曲或干扰。

选择题1.C2.E简答题1.研究变异的来源有哪些?答:变异的来源分为两个层次:①生物学(真实)变异和测量变异,生物学变异反映真实的客观变异,测量的变异反映测量过程的误差。

②随机变异和系统变异,随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。

第九章 偏倚

第九章 偏倚
、调查资料的质量、检验方法的灵敏度和特异 度)以及工作人员的技术和责任心引起的。
(二)随机误差(Random error):
随机误差指因机遇不同估计总体参数时所 产生的误差、机遇,即可指选择的机遇也可指 时间的机遇。
抽样误差是一种随机误差,其大小与抽样 设计和研究变量的变异程度有关。
(二)随机误差
不准确,检测条件不标准,不统一。
(二)信息偏倚(Information bias)
说谎偏倚 诱导偏倚
信息偏倚的控制
研究设计阶段明确各个研究因素的定义 采用“盲法”搜集资料 掩盖研究假说 测量工具校准
3、混杂偏倚(Confounding bias)
(1)定义:由于混杂因素在比较的不同组间 分布不同,使研究的危险因素与疾病的关系发 生曲解,称为混杂偏倚。
准确性和真实情况间存在系统误差。
研究孕妇照射X线与小儿白血病的关系时, 比较医院记录与母亲回忆照射史其符合率为 73%.
2、信息偏倚(Information bias)
暴露怀疑偏倚(exposure suspicion bias) 指在病例对照研究中,调查员事先知道
调查对象的患病情况,在搜集资料时对病例 和对照的询问尺度不同,导致两组间产生系 统误差。
1、真实 2、偏倚所致:
可能病例分组存在偏倚,西药组的病人病 情较轻。(选择偏倚)
主观因素造成偏倚,西药风行一时,患者 与医生倾向认为新药疗效好。(估计偏倚)
乳腺癌两种治疗方法的五年生存率
方法 甲 乙 合计
例数 474 360 834
存活数 320 230 550
生存率(%) 67.5 63.9 65.9
甲法
乙法
分期
x2 P

流行病学研究中常见的偏倚及其控制

流行病学研究中常见的偏倚及其控制
8
举例:用动脉血压计测量某人血压,各次读数的均值为 100mmHg,系统误差和随机误差可用以下图示
发 生 频 次
系统误差
随机误差
80
100
舒张压 (mmHg)
图1
血压计法测量舒张压值的分布
9
二、偏倚的概念
定义
偏倚(Bias)是在研究的设计、实施、分析阶段发 生的系统误差。 特点 是影响流行病学内部真实性的主要原因。 具有方向性,夸大真实值为正偏倚,缩小真实值为 负偏倚 分类 选择偏倚,信息偏倚,混杂偏倚
10
第二节 选择偏倚
一 选择偏倚的概念 选择偏倚(selection bias)指由于研究对象与目标人群的 特征存在着系统误差,使效应估计值与真值之间发生的 偏差。
是研究者在挑选研究人群时由于选择条件受限制或设计 失误所造成的。既可产生与研究开始选择研究对象的时 候,也可产生与收集资料过程中出现失访或无应答。常 见于现况研究、病例对照研究与回顾性队列研究。
16
二 选择偏倚的常见种类 2、现患-新发病例偏倚
又称奈曼偏倚,在病例对照研究中,用于研究的 通常是现患病例,而不包括死亡病例或者病程短、 轻型、不典型的病例,由此而所产生的系统误差。 如: Friedman 等人进行的心血管疾病的研究中发现, 队列研究中,高胆固醇水平者患冠心病的 OR 值为 2.4 ,而在病例对照研究中,病例组与对照组无明 显差别OR为1.16。
一、研究结果的误差和真实性
随机误差
定义
由于多种无法控制及不能预测的因素引起的 一类表现不恒定、随机变化的误差。 特点 没有固定方向和固定大小 一般呈正态分布
7
一、研究结果的误差和真实性
系统误差 定义 指研究过程中,由一些可控制的因素引起的使 研究结果或推论偏离真实情况的误差。 特点

常见偏倚及其控制

常见偏倚及其控制
整理资料时 对于有缺项或漏项的对象进行补查
3
3、信息偏倚(information bias) 在获取暴露、结局或其他信息时所出现的系统
误差或偏差叫信息偏倚。信息偏倚又称为错分偏 倚(misclassification bias)
错分偏倚(misclasfication bias):暴露错分; 疾病错分;联合错分 原因:仪器不准;检验技术不熟;定义不明 影响:无差异错分;有差异错分
常见偏倚(bias)及其控制
1、选择偏倚(selection bias) :
有人拒绝参加; 有些人的档案丢失了或记录不全; 研究对象由志愿者组成,他们往往或是较健康的或是有 某种特殊倾向或习惯的; 早期病人,在研究开始时未能发现等。
控制: 预防为主,抽样方法正确,严格按规定标准选择对象
1
2、失访偏倚(lost to follow-up) 这是队列研究中不可避免的偏倚。失访从本质上是
4
控制
➢ 提高临床诊断技术、明确各项标准 ➢ 选择精确稳定的测量方法 ➢ 事前调准仪器 ➢ 严格实验操作规程 ➢ 同等对待每个研究对象 ➢ 培训调查员,提高技巧,统一标准
5
4、混杂偏倚:由于混杂因子的影响造成
控制 研究化或多因素分析
6
破坏了原有样本的代表性,因而实质上属于选择偏倚。 一项研究的失访率最好不超过10%。
队列研究最常见、最不易控制的偏倚 原因:迁出;外出;不再合作;死亡(不>10% ) 影响:失访率;失访者特征;两组失访差异
2
控制
设计时 选择便于随访的人群 在计算的研究样本的基础上扩大10%
实施时 加强对随访员的管理 制定随访计划和监测措施 期中分析

流行病学-第九章-常见偏倚及其控制

流行病学-第九章-常见偏倚及其控制
26
1978年 Horwitz和Feinstein: 1978年,Horwitz和Feinstein:口服雌 激素与子宫内膜癌的高度关联是虚假的, 激素与子宫内膜癌的高度关联是虚假的, 是一种检出偏倚。 是一种检出偏倚。 (1)人群中有一定量无症状的子宫内膜癌早 期病人。 期病人。 (2)无症状的子宫内膜癌早期病人如服用雌 激素易发生子宫出血而就诊, 激素易发生子宫出血而就诊,由此被发现 而选入病例组。 而选入病例组。 对照组为一般住院病人。 (3)对照组为一般住院病人。 结果:雌激素服用率高于对照组。 结果:雌激素服用率高于对照组。
27
Feinstein从同一医院中随机选取妇 Feinstein从同一医院中随机选取妇 科其他良性肿瘤患者为对照进行研究: 科其他良性肿瘤患者为对照进行研究:口 服雌激素与子宫内膜癌无关联。 服雌激素与子宫内膜癌无关联。
28
(4)无应答偏倚: 无应答偏倚: 某个样本中的无应答者的患病状况, 某个样本中的无应答者的患病状况,以 及对某一或某些研究因素的暴露情况与应答者不 由此产生的偏倚称为无应答偏倚。 同,由此产生的偏倚称为无应答偏倚。 安阳县食管癌普查,普查率仅20%左 安阳县食管癌普查,普查率仅20% 20 不能代表总体。 右,不能代表总体。 造成无应答的主要原因: 造成无应答的主要原因: 研究对象不了解研究目的; 研究对象不了解研究目的;调查内容 不当,过于繁琐,涉及隐私; 不当,过于繁琐,涉及隐私;对象不能正理解调 查内容(文化低、高龄等);对象病重、外出。 );对象病重 查内容(文化低、高龄等);对象病重、外出。
3
一、随机误差 定义: 定义:由于多种无法控制及不能预测 的因素引起的一类表现不恒定、 的因素引起的一类表现不恒定、随机变化 的误差叫随机误差。又叫机会。来源包括: 的误差叫随机误差。又叫机会。来源包括: 1、测量方法或测量工具本身产生随机 变异; 变异; 个体内的随机生物学变异; 2、个体内的随机生物学变异; 个体间的随机变异。 3、个体间的随机变异。

第九章 偏倚及其控制概要

第九章 偏倚及其控制概要

第九章偏倚及其控制一、学习要求1. 应掌握内容偏倚的概念,以及流行病学三种主要偏倚的概念;控制混杂偏倚的分层分析方法的基本思路。

2. 需熟悉的内容研究真实性的概念,分类;选择偏倚、信息偏倚及混杂偏倚产生的原因及对结果真实性的影响。

3. 需了解的内容研究结果变异的概念及来源;分层分析的计算方法。

二、学习要点(一)研究结果的变异性1. 变异性的概念研究结果包括描述性和分析性数据(指标)的变动或波动,称为研究结果的变异性(variability)。

2. 变异性的来源与水平(1)变异的来源:包括生物学真实变异和测量误差,其中测量误差可再分为随机误差和系统误差。

(2)变异的水平:包括个体水平、群体水平和样本水平三个层次。

个体水平的变异性是指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。

群体水平的变异性可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。

样本(研究)水平的变异性是指通过不同样本的研究所得结果的差异性。

(二)研究的真实性1. 真实性的概念及与研究变异性的关系(1)研究的真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

(2)研究的误差是研究真实性的反面,反映了研究数据的测量误差的程度,因此包括系统误差和随机误差两部分。

研究中的系统误差部分称为偏倚(bias)。

研究中的随机误差大小用信度(reliability)来反映,信度越高则随机误差越小,反之则随机误差越大。

2. 内部真实性和外部真实性(1)内部真实性(internal validity):是指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。

(2)外部真实性(external validity):是指研究结果与推论对象真实情况的符合程度,它回答一个研究能否推广应用到研究对象以外的人群。

(三)研究的偏倚1. 偏倚(bias)的概念研究误差中的系统误差部分称为偏倚。

第9章 偏倚及其控制

第9章  偏倚及其控制
• 被调查事件发生时间已久,研究对象记忆不清 • 被调查事件发生频率很低,未留下深刻印象 • 研究对象对调查内容关心程度不同导致回忆认真程 度不同
– 病例常常努力回忆暴露来理解为什么会得病 – 对照可能不大记得起暴露,因为那对他们不重要
常见的信息偏倚
2. 报告偏倚(reporting bias)
– 在研究信息收集时,由于某些原因,研究对象有意 夸大或缩小某些信息而导致的系统误差
常见的选择偏倚
2. 检出症侯偏倚
– 某一因素与某一疾病并无因果联系,但因该因素能 促进类似的症状和体征出现,使病人急于求医,医 生注意这种临床表现和疾病的早期诊断,使该病的 检出率大为提高,从而得出某因素与该病有因果关 系的联系 – 该偏倚常发生在以医院为基础的病例对照研究
Байду номын сангаас
雌激素
导致
子宫出血
虚假关联
• 涉及劳保、福利时,职业人群可能会夸大某些有害 因素的暴露信息 • 涉及健康状况时,研究对象可能为继续从事该项工 作而有意掩盖某些患病信息 • 盲法使用不当导致研究对象知道分组情况,可能有 意夸大或缩小疗效或不良反应 • 敏感问题的调查较易出现瞒报
• 度量
– 金标准
【知识点9-2】
(1) 偏倚是指在研究过程中,由于某种或某组因素的 影响,使研究的结果或结论系统地偏离真实情况, 其偏离的方向一致或基本一致,这种系统误差称 为偏倚 (2) 偏倚有两个方向:正偏倚和负偏倚
第 2 节 偏倚的分类及其产生的原因
Section 2 Categories and Causes of Bias
• 研究的真实性或效度(validity)
– 研究收集的数据、分析结果和所得结论与客观真实 值的符合程度 – 测量值与真实值之间的差异来源于误差 – 误差

流行病学研究中的常见偏倚及其控制 ppt课件

流行病学研究中的常见偏倚及其控制  ppt课件

ppt课件
16
4. 志愿者偏倚(volunteer
bias)
一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效果, 这样就可能会得出不正确的结论。
存在明显的差异。
ppt课件
12
3.检出征候群偏倚(detection signal bias)
检出征候群偏倚是指某因素与某疾病在 病因学上虽无关系,但由于该因素的存 在会引起该病的临床症状或体征的出现, 从而使患者及早就医,接受多种检查, 导致该人群有较高的检出率,致使过高 地估计该因素与该疾病的关联。
ppt课件
13
例如,1975年,Ziel等以病例对照 研究,从美国加州洛杉矶妇女中调查口 服雌激素与子宫内膜癌的关系,结果表 明子宫内膜癌患者雌激素暴露比例明显 高于对照组,认为子宫内膜癌与服用雌 激素密切相关。
ppt课件
14
表6-4 更年期服用雌激素与子宫内膜癌的关系
雌激素服 用史 有 无 合计 OR
病例
暴露
A
非暴露
B
非病例
C
D
总人群比数比: OR AD
BC
表6-6 实际抽样人群疾病与暴露分布
暴露
非暴露
病例
Ao
Bo
非病例
Co
样本比数比:
OR
Ao Do Bo Co
ppt课件
Do
26
选择概率为:
Ao
A
Bo
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章常见偏倚及其控制(Biases and Their Control)第一节研究结果的变异性1、研究结果的变异性(Variability)数据(指标)的变动或波动。

它可存在于不同水平,包括个体水平,群体水平和样本(研究)水平。

2、变异性的来源:⑴生物学(真实)变异和测量变异:物学变异反映真实的客观变异,测量变异反映测量过程的误差。

⑵随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。

系统变异(误差)的绝对值和方向保持恒定。

测量误差分为随机误差和系统误差。

3变异的水平:⑴个体水平的变异性:指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化⑵群体水平的变异性:可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。

群体的变异程度常常大于个体的变异。

也受到测量误差的影响。

⑶样本水平的变异性:指通过不同样本的研究所得结果的差异性。

第二节研究的真实性一、概述研究真实性或效度(Validity)指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

研究误差是研究真实性的反面。

研究误差的两种常见类型:随机误差(random error)系统误差(systematic error)随机误差(random error):指随机抽样所得统计量与总体参数的差异▪由抽样(机遇)所致,通常与测量过程及其它变量的影响无关,无方向性▪可通过统计学方法估计和评价▪是不可避免的,但通过合理的设计、正确的抽样(加大样本量等)可使之减小系统误差(systematic error)▪随机误差以外的误差,任何研究都有发生的可能▪在流行病学调查研究中系统误差又叫偏倚(bias)▪可以通过严格的设计、实施、分析来尽可能地控制▪重复试验及增加样本含量并不能减小系统误差研究的可靠性或信度(reliability)亦称精确度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。

二、内部真实性内部真实性internal validity指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。

改善措施:限制研究对象的类型和研究的环境条件。

三、外部真实性外部真实性(external validity)研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。

它回答一个研究能否推广应用到研究对象以外的人群。

改善措施:增加研究对象的异质性,使得研究对象的代表性范围扩大。

如:多中心临床试验的开展第三节研究的偏倚1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。

选择偏倚1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类信息偏倚混杂偏倚一、选择偏倚(selection bias)㈠定义:研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。

例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。

㈡常见的种类:1、入院率偏倚(admission rate bias)也叫Berkson偏倚,当利用医院病人作为病例和对照时,由于各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异而导致的系统误差常见于以医院为基础的病例对照研究、临床防治试验、预后判断等。

2、现患病例—新病例偏倚(prevalence-incidence bias)也称奈曼偏倚(Neyman’s bias)在病例对照研究或现况研究中,用于研究的病例一般是现患病例或存活病例,由于形成的病例样本与单纯由新病例构成的样本暴露特点等不同,致使调查结果出现的系统误差在病例对照和现况研究中产生此偏倚的原因:⑴用于研究的病例一般是研究时的存活者- 现患病例(暴露特点和死亡病例不同)⑵某些病人在患病后,可能会改变其原来某些因素的暴露状况3、检出征候偏倚(detection signal bias)在疾病和暴露之外存在一个征候因素,即一种临床症状或体征;这种症状或体征不是疾病的危险因素,但人们因具有这种征候去就诊,从而提高了早期病例的检出率;致使过高地估计了暴露程度,因而发生了系统误差,最终可能得出该征候因素与该疾病有联系的错误结论4、无应答偏倚和志愿者偏倚(non-respondent and volunteer bias):无应答者是指研究对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。

一项研究工作中的无应答者可能在某些重要特征或暴露上与应答者不同,由此产生的偏倚称为无应答偏倚。

常见于现况研究和队列研究。

大学生健康状况调查志愿者偏倚是与无应答偏倚相对的情况5、时间效应偏倚:㈢选择偏倚控制方法1、建立健全的健康信息系统(health information system,HIS)2、采用严格的科学的研究设计,了解整个研究中可能出现的选择偏倚严格掌握研究对象纳入排除标准取得研究对象合作,减少无应答、失访病例对照研究中尽量选择新诊断的病人作研究对象;用医院病人作研究对象时,尽量采用多种对照二、信息偏倚(information bias)㈠定义又称测量偏倚(measurement bias)或观察偏倚(observation bias),是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。

由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类(错分)偏倚(misclassification bias)。

表现为研究对象的特征被错误分类由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象的归类错误差异错分(differential misclassification)暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;由于错误分类组间存在差异的偏向可能不同,所以造成高估或低估研究效应值无差异错分(non-differential misclassification)暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;在多数情况下模糊了研究组的差异,一般使研的效应值偏低(OR趋向1)㈡差异性信息偏倚的两种常见类型回忆偏倚(recall bias)产生于研究对象记忆过去活动和暴露能力的差异。

不可避免调查者偏倚(interviewer bias)产生于调查者对研究对象有差异性地收集信息。

采取盲法,可以降低调查者偏倚。

㈢信息偏倚的控制:①明确资料收集方法和严格质量控制②尽可能采用“盲法”收集资料③尽量收集客观指标的资料铅暴露④采用调查技巧避免回忆偏倚⑤严格的调查设计和研究人员的科学态度⑥调查之前应开展预调查三、混杂偏倚(confounding bias)㈠定义是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。

混杂的本来含义是“混合掺杂”( mixing together ),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏差。

㈡混杂因素的判断条件:必须同时具备以下三个条件:①必须是所研究疾病的独立危险因素②必须与所研究的暴露因素存在统计学联系以上是判断可疑混杂因素的两项基本条件③不应是暴露因素与疾病因果链中的一个环节或中间变量(否定或排除条件)(饮酒-肝硬化-肝癌)㈢混杂偏倚引起的假关联Ⅰ继发关联(secondary association)是一种纯粹由混杂偏倚产生的关联。

即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。

Ⅱ直接因果关联的歪曲:如果怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联或与其他危险(保护)因素F存在相关,E与D的总关联等于E-D直接关联同E-F-D间接关联之和。

如果直接关联与间接关联混在一起,而将其作为直接关联的估计,就会出现混杂偏倚。

㈣判定原则:比较混杂因素调控前后的暴露因素效应估计值,如果存在专业上有意义的差异(注意不是统计学的显著性差异),就产生了混杂偏倚。

㈤混杂偏倚的控制设计阶段:采用随机化(randomization)、限制(restriction)进入或匹配(matching)分析阶段:采用分层分析、标准化率分析、多变量分析四、混杂偏倚的分层分析M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较五、混杂偏倚与其它偏倚(选择及信息偏倚)的异同相同:是一种系统误差,不能通过增大样本量来控制不同:①后两种偏倚主要都限于样本内,即人群中实际无此误差。

②而混杂偏倚不止是样本的问题。

首先是某第三因子在目标人群中同所研究的结果变量存在固有的联系。

③一般偏倚(选择及信息偏倚)是一种错误,所造成的误差是我们不愿看到的,因此应尽量避免。

④对混杂偏倚来说,它告戒我们在下结论时应特别谨慎,但同时它在认识整个病因网的过程中起了一定的作用。

因为混杂因子往往正是某个结果变量的危险因子,应尽量去发现。

⑤有时受科学知识的限制,在设计和分析阶段未对其作适当的处理,结论仍会有第三因子、第四因子的混杂。

相关文档
最新文档