病例对照研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p0;p1为目标人群中对照组和病例组估计暴露率
例:研究口服避孕药与先天性心脏病的关系,设a=0.05(双侧),
b=0.1;对照组暴露比例p0=0.3;预期RR=2.0
求:需要的总对子数? 解:查表得: Ua=1.96 Ub=1.28 p1=P0RR/[1+p0(RR-1)]=0.3×2/[1+0.3(2-1)]=0.46 p=RR/(1+RR)=2/(1+2)=2/3=0.67
第五章 病例对照研究 (case-control study)
1.基本原理 2.研究类型 3.研究实例 4.研究设计与实施 5.资料的整理与分析 6.常见偏倚及其控制 7.实施病例对照研究应注意的问题 8.与队列研究优缺点的比较
病例对照研究设计应用史
1843年Guy:职业暴露与肺结核的关系(最早的 病例对照研究) 1884年Louis:著作(最早的概念提出) 1926年Claypon:生殖因素与乳腺癌关系(最早的 符合现代病例对照概念的研究) 二战后应用广泛 60年代以来方法逐步完善
匹配过度(over matching):匹配增加了对照选择的 难度,把不必要项目列入匹配,丢失了信息,降低了 研究效率。 匹配程度:连续变量可划分为若干组,按组匹配;离散 变量可完全匹配。
(1)研究因素和中间变量: 吸烟——→血脂↑——→心血管病
(2)只与可疑因素有关而与疾病无关的因素 避孕药——→子宫内膜癌 ↑ ↓
总对子数:M≈m/(p0q1+p1q0)
m = Ua / 2 Ub
m为结果不一致的对子数
p (1 p )
2
/( p 1 / 2) 2
p = OR /(1 OR) RR /(1 RR) p1 = p 0 RR / 1 p 0( RR 1) q1 = 1 p1 q0 = 1 p0
第二节 研究类型
一、病例与对照不匹配:对照数目与病例相等或略多 二、病例与对照匹配(matching):要求对照在某些因素上与病例保持 一致。 如年龄匹配 1、频数匹配(frequency matching):匹配因素所占比例在病例 组和对照组一致。如病例组男女各半,平均年龄56岁。对照组亦应如 此(无显著性差异)。 2、个体匹配(individual matching):病例和对照以个体为单位 进行匹配。 目的:提高研究效率(study efficiency) 匹配因素:已知或疑为混杂因子(confounding factor) 常见匹配:1:1(配对);1:2;……1:R
ORca=(A11A00)/(A10A01) 无对照病例研究资料整理表
环境致病因素 0 环境致病因素 0 易感基因型 1
* 1:暴露 0:非暴露
易感基因型 1 A01 A11
A00 A10
A:病例例数
第三节
研究实例
Herbst关于年轻女性阴道腺癌的研究
美国波士顿Vincent记念医院,1966-69年发现7例年轻女性阴道腺 癌 该病为罕见病:占女性生殖系统癌症0.1%-0.2%,50岁以上多见 怀疑因素:使用阴道局部刺激物、阴道冲洗、阴道塞史;性交史; 避孕药应用史,均无意义。 重新研究目的:用病例对照研究比较病例从胚胎期至发病前的情况。 研究对象:7例加1例另一医院的阴道透明细胞癌患者。 1:4配对:要求对照与病例在同等级病房中出生,时间前后≯10天 使用统一调查表,培训调查员 结果:此次怀孕流血、以往流产史及此次怀孕使用雌激素史三个因 素有显著意义。 结论:母亲怀孕早期服用保胎药已烯雌酚使其女儿发生阴道腺癌的 危险性增加。
1:4以上,效率增加缓慢,但对照选择难度增加,故≯1:4
(三)病例与对照的来源与选择 1、病例的选择: (1)以医院为基础(hospital-based):某期间内全部门诊 或住院病人;病案及出院记录 (2)以社区人群为基础(community-based):社区的监测、 普查、抽样调查中发现的病例 注意:明确的诊断标准(国内外统一;自定);与对照的 可比性(性别、年龄等);新发、现患、死亡病例 2、对照:(理想:全人群或非病人群的随机样本
3、病例交叉研究(case-crossover design): 比较相同研究对象在急性事件发生前一段时间 的暴露情况与未发生事件的某段时间内的暴露 情况,如果暴露与少见事件(疾病)有关,则 在事件发生前的这一段时间内的暴露频率应该 高于更早时间内的暴露频率。
4、单纯病例研究(case only study);(病例系列研究case series study);( 病例-病例研究 case-only studies):仅用 病例作为研究对象来评估所研究的环境因素与易感基因型的相互作 用。其设计原理是以是否暴露与环境致病因素和易感基因型为标准 将资料整理成2×2表 计算公式为:
第四节 研究设计与实施
一、一般步骤
提出病因假设 制定研究计划 收集资料 对收集到的资料进行Hale Waihona Puke Baidu理与分析
总结并提交研究报告
二、具体实施
(一)提出假设:可发现或检验病因线索 (二)明确研究目的,选择适应的对照形式: 不匹配或频数匹配:探讨病因线索 个体匹配:提高统计效率,适于罕见疾病 对照数目:按Pitman效率递增公式: 效率=2R/(R+1) 1:1时,效率=2×1/(1+1)=1 1:2时,效率 =2×2/(2+1)=1.3 1:3时,效率=1.5 1:4时,效率=1.6
(二)统计推断 分析类型:
不分层资料 非个体匹配资料 分层资料
个体匹配资料
1:1配对 1:2配对 1:M配对
分级暴露资料 多因素分析
病例对照研究中表示联系强度的指标
比值比( 比数比; 优势比; 交叉乘积比; odds ratio; OR ) :病例组 暴露比值与对照组暴露比值之比。 病例组暴露比值: a /(a c) = a / c 对照组暴露比值: b /(b d ) = b / d d / b d) c /(a c) 比值比:
宗教
三、衍生的研究类型 1、巢式病例对照研究(套迭式;嵌入式) (nested case-control study):通过队列 研究,确认随访时发生的病例,作为病例组,以 同一队列的未发病者为对照。 优点:(1)暴露资料在发病或死亡前获得, 时间顺序清楚,无回忆偏倚。 (2)两组可比性好 (3)可提高统计及检验效率 暴露率高;共同暴露开始时间 缺点:只能比较暴露的等级 例:Kent(1988):血胆固醇与癌症
(2)非匹配调查:病例数≠对照数
设:病例数:对照数=1:c; 则病例数为:
n = (1 1 / c) pq (Ua Ub ) 2 /( p1 p 0) 2 p = ( p1 cp0) /(1 c) q = 1 p
p1计算同上式;对照数=cn
(3)1:1配对设计:Schlesselman公式:
(六)资料收集
调查问卷;查阅档案;采样化验;实地查看等。
第五节 资料的整理与分析
一、资料的整理与分析原则 1、比较两组暴露比例有无显著性差异 2、用暴露优势比估计患病优势比(联系强度) 3、控制混杂因素:匹配;分层;多因素分析
二、方资料的分析 (一)描述性统计 1、研究对象的一般特征 2、均衡性检验
现实:病例的定义可确定其源人群,对照应为病例源人群 的随机样本)
(1)同一或多个医院其他病人:那些与暴露没联系者 吸烟与肺癌:排除呼吸道疾病入院者做对照 (2)人群对照(社区、社团非病例或健康人):随机抽样;随 机数字拨号 (3)朋友、同事、亲属及死亡对照
(四)确定样本量(size of sample) 1、影响样本量的因素 (1)对照组的暴露率(P0) (2)估计的RR或OR (3)希望的显著性水平(a=0.05 or =0.01)
类型:
(1)前瞻性(prospective nested case-control study):研究开始时据一定条件选择某一人群 作为队列,前瞻性地随访一定时间确定病例组 和对照组。
(2)回顾性(retrospective nested casecontrol study):据研究之前一段特定时间的 情况选择某一人群作为队列,据现在的情况确 定病例组和对照组。
m = Ua / 2 Ub p(1 p) /( p 1 / 2) 2 = 1.96 / 2 1.28 0.67(1 0.67) /(0.67 1 / 2) 2 = 9091.9
2
2
q1=1-p1=1-0.46=0.54 q0=1-p0=1-0.3=0.7 总对子数:M≈m/(p0q1+p1q0) =90/(0.3×0.45+0.46×0.7)=186(人)
(五)获取研究因素的信息
1、变量的选定:与目的有关的变量不能少,且要细致(吸烟: 量、时间、种类、方式、戒烟时间等);无关的项目不能有。 2、变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少 一支,持续一年以上者) 3、变量的测量:定性(是、否);半定量(经常、偶尔、不); 定量(平均每周几次?平均每次多少?) 4、使变量符合规定:以客观手段与证据为准绳(病情用医疗档 案核准;职业史以工厂档案核准;空气、水污染用检测结果核准; 吸烟量由亲属核准等)
2、估计方法
(1)非匹配设计:病例数=对照数
n = 2 pq (Ua Ub ) 2 /( p1 p 0) 2 p1 = p 0 RR /[1 p 0( RR 1)] p = 0.5( p1 p 0) q = 1 p
例:吸烟与肺癌,预期RR=2.0,人群吸烟率(p0)=20%, 定:a=0.05(双侧)b=0.1 查表得: Ua=1.96 Ub=1.28 p1=(0.2×2)/(1+0.2×1)=0.333 =1-0.267=0.733 p =(0.2+0.333)/2=0.267 q n=2×0.267×0.733(1.96+1.282)2/0.333-0.2)2 =232 (查表得:n=229)
第一节 基本原理
过去
比较 人数 暴露
+ 病 例
-
现在
a
a/(a+c)
c
b/(b+d) b d
+
-
对 照
病例对照研究(case control study):以一组患有 某病者(病例)和一组或几组未患该病但在某些已知 因素方面与病例组相似者(对照)为研究对象,调查 他们过去是否暴露于某个或某些可疑致病因素或暴露 剂量,比较两组暴露比值,推断研究因子作为病因的 可能性。 暴露(exposure):指研究对象接触某些因素,或具 备某些特征,或处于某种状态。 暴露因素(exposure factor):可以是机体固有的、 先天的,也可以是体外的、后天的,暴露因素也叫研 究变量(variable)。 混杂与混杂因素(confounding and confounding factor):研究某因素与某疾病关联时,由于某个既与 疾病有制约关系,又与所研究的因素有联系的外来因 素的影响,掩盖或扩大了所研究的因素与疾病的联系, 这种现象或影响叫混杂,其所带来的偏倚叫混杂偏倚, 该外来因素叫混杂因素。
假阳性错误(false positive error)或称第一类错误(type I error) 即由于判断失误,从而拒绝了原本正确的无效假设。在统计推断
上指允许犯假阳性的概率。1- a 称为精确度。
(4)希望的把握度(power)或称功效,(1- b)
b为假阴性错误(false negative error or type II error),指由于 统 计量(t)没有超过显著水平,从而接受了原本不正确的无效假设。
2、病例队列研究(case-cohort study)(病例参 比式研究,case-base reference study):队 列研究开始时,在队列中按一定比例随机抽取 一个一定量的有代表性的样本作为对照组,观 察结束时,队列中出现的全部所研究的病例为 病例组,与上述对照组比较。
特点: 1)对照是随机选取的,不与病例进行匹配 2)事先抽中的对照组成员如发生所研究的疾病,既 可作为病例组,也可作为对照组 3)可以研究几种疾病,但对照组是同一样本
例:研究口服避孕药与先天性心脏病的关系,设a=0.05(双侧),
b=0.1;对照组暴露比例p0=0.3;预期RR=2.0
求:需要的总对子数? 解:查表得: Ua=1.96 Ub=1.28 p1=P0RR/[1+p0(RR-1)]=0.3×2/[1+0.3(2-1)]=0.46 p=RR/(1+RR)=2/(1+2)=2/3=0.67
第五章 病例对照研究 (case-control study)
1.基本原理 2.研究类型 3.研究实例 4.研究设计与实施 5.资料的整理与分析 6.常见偏倚及其控制 7.实施病例对照研究应注意的问题 8.与队列研究优缺点的比较
病例对照研究设计应用史
1843年Guy:职业暴露与肺结核的关系(最早的 病例对照研究) 1884年Louis:著作(最早的概念提出) 1926年Claypon:生殖因素与乳腺癌关系(最早的 符合现代病例对照概念的研究) 二战后应用广泛 60年代以来方法逐步完善
匹配过度(over matching):匹配增加了对照选择的 难度,把不必要项目列入匹配,丢失了信息,降低了 研究效率。 匹配程度:连续变量可划分为若干组,按组匹配;离散 变量可完全匹配。
(1)研究因素和中间变量: 吸烟——→血脂↑——→心血管病
(2)只与可疑因素有关而与疾病无关的因素 避孕药——→子宫内膜癌 ↑ ↓
总对子数:M≈m/(p0q1+p1q0)
m = Ua / 2 Ub
m为结果不一致的对子数
p (1 p )
2
/( p 1 / 2) 2
p = OR /(1 OR) RR /(1 RR) p1 = p 0 RR / 1 p 0( RR 1) q1 = 1 p1 q0 = 1 p0
第二节 研究类型
一、病例与对照不匹配:对照数目与病例相等或略多 二、病例与对照匹配(matching):要求对照在某些因素上与病例保持 一致。 如年龄匹配 1、频数匹配(frequency matching):匹配因素所占比例在病例 组和对照组一致。如病例组男女各半,平均年龄56岁。对照组亦应如 此(无显著性差异)。 2、个体匹配(individual matching):病例和对照以个体为单位 进行匹配。 目的:提高研究效率(study efficiency) 匹配因素:已知或疑为混杂因子(confounding factor) 常见匹配:1:1(配对);1:2;……1:R
ORca=(A11A00)/(A10A01) 无对照病例研究资料整理表
环境致病因素 0 环境致病因素 0 易感基因型 1
* 1:暴露 0:非暴露
易感基因型 1 A01 A11
A00 A10
A:病例例数
第三节
研究实例
Herbst关于年轻女性阴道腺癌的研究
美国波士顿Vincent记念医院,1966-69年发现7例年轻女性阴道腺 癌 该病为罕见病:占女性生殖系统癌症0.1%-0.2%,50岁以上多见 怀疑因素:使用阴道局部刺激物、阴道冲洗、阴道塞史;性交史; 避孕药应用史,均无意义。 重新研究目的:用病例对照研究比较病例从胚胎期至发病前的情况。 研究对象:7例加1例另一医院的阴道透明细胞癌患者。 1:4配对:要求对照与病例在同等级病房中出生,时间前后≯10天 使用统一调查表,培训调查员 结果:此次怀孕流血、以往流产史及此次怀孕使用雌激素史三个因 素有显著意义。 结论:母亲怀孕早期服用保胎药已烯雌酚使其女儿发生阴道腺癌的 危险性增加。
1:4以上,效率增加缓慢,但对照选择难度增加,故≯1:4
(三)病例与对照的来源与选择 1、病例的选择: (1)以医院为基础(hospital-based):某期间内全部门诊 或住院病人;病案及出院记录 (2)以社区人群为基础(community-based):社区的监测、 普查、抽样调查中发现的病例 注意:明确的诊断标准(国内外统一;自定);与对照的 可比性(性别、年龄等);新发、现患、死亡病例 2、对照:(理想:全人群或非病人群的随机样本
3、病例交叉研究(case-crossover design): 比较相同研究对象在急性事件发生前一段时间 的暴露情况与未发生事件的某段时间内的暴露 情况,如果暴露与少见事件(疾病)有关,则 在事件发生前的这一段时间内的暴露频率应该 高于更早时间内的暴露频率。
4、单纯病例研究(case only study);(病例系列研究case series study);( 病例-病例研究 case-only studies):仅用 病例作为研究对象来评估所研究的环境因素与易感基因型的相互作 用。其设计原理是以是否暴露与环境致病因素和易感基因型为标准 将资料整理成2×2表 计算公式为:
第四节 研究设计与实施
一、一般步骤
提出病因假设 制定研究计划 收集资料 对收集到的资料进行Hale Waihona Puke Baidu理与分析
总结并提交研究报告
二、具体实施
(一)提出假设:可发现或检验病因线索 (二)明确研究目的,选择适应的对照形式: 不匹配或频数匹配:探讨病因线索 个体匹配:提高统计效率,适于罕见疾病 对照数目:按Pitman效率递增公式: 效率=2R/(R+1) 1:1时,效率=2×1/(1+1)=1 1:2时,效率 =2×2/(2+1)=1.3 1:3时,效率=1.5 1:4时,效率=1.6
(二)统计推断 分析类型:
不分层资料 非个体匹配资料 分层资料
个体匹配资料
1:1配对 1:2配对 1:M配对
分级暴露资料 多因素分析
病例对照研究中表示联系强度的指标
比值比( 比数比; 优势比; 交叉乘积比; odds ratio; OR ) :病例组 暴露比值与对照组暴露比值之比。 病例组暴露比值: a /(a c) = a / c 对照组暴露比值: b /(b d ) = b / d d / b d) c /(a c) 比值比:
宗教
三、衍生的研究类型 1、巢式病例对照研究(套迭式;嵌入式) (nested case-control study):通过队列 研究,确认随访时发生的病例,作为病例组,以 同一队列的未发病者为对照。 优点:(1)暴露资料在发病或死亡前获得, 时间顺序清楚,无回忆偏倚。 (2)两组可比性好 (3)可提高统计及检验效率 暴露率高;共同暴露开始时间 缺点:只能比较暴露的等级 例:Kent(1988):血胆固醇与癌症
(2)非匹配调查:病例数≠对照数
设:病例数:对照数=1:c; 则病例数为:
n = (1 1 / c) pq (Ua Ub ) 2 /( p1 p 0) 2 p = ( p1 cp0) /(1 c) q = 1 p
p1计算同上式;对照数=cn
(3)1:1配对设计:Schlesselman公式:
(六)资料收集
调查问卷;查阅档案;采样化验;实地查看等。
第五节 资料的整理与分析
一、资料的整理与分析原则 1、比较两组暴露比例有无显著性差异 2、用暴露优势比估计患病优势比(联系强度) 3、控制混杂因素:匹配;分层;多因素分析
二、方资料的分析 (一)描述性统计 1、研究对象的一般特征 2、均衡性检验
现实:病例的定义可确定其源人群,对照应为病例源人群 的随机样本)
(1)同一或多个医院其他病人:那些与暴露没联系者 吸烟与肺癌:排除呼吸道疾病入院者做对照 (2)人群对照(社区、社团非病例或健康人):随机抽样;随 机数字拨号 (3)朋友、同事、亲属及死亡对照
(四)确定样本量(size of sample) 1、影响样本量的因素 (1)对照组的暴露率(P0) (2)估计的RR或OR (3)希望的显著性水平(a=0.05 or =0.01)
类型:
(1)前瞻性(prospective nested case-control study):研究开始时据一定条件选择某一人群 作为队列,前瞻性地随访一定时间确定病例组 和对照组。
(2)回顾性(retrospective nested casecontrol study):据研究之前一段特定时间的 情况选择某一人群作为队列,据现在的情况确 定病例组和对照组。
m = Ua / 2 Ub p(1 p) /( p 1 / 2) 2 = 1.96 / 2 1.28 0.67(1 0.67) /(0.67 1 / 2) 2 = 9091.9
2
2
q1=1-p1=1-0.46=0.54 q0=1-p0=1-0.3=0.7 总对子数:M≈m/(p0q1+p1q0) =90/(0.3×0.45+0.46×0.7)=186(人)
(五)获取研究因素的信息
1、变量的选定:与目的有关的变量不能少,且要细致(吸烟: 量、时间、种类、方式、戒烟时间等);无关的项目不能有。 2、变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少 一支,持续一年以上者) 3、变量的测量:定性(是、否);半定量(经常、偶尔、不); 定量(平均每周几次?平均每次多少?) 4、使变量符合规定:以客观手段与证据为准绳(病情用医疗档 案核准;职业史以工厂档案核准;空气、水污染用检测结果核准; 吸烟量由亲属核准等)
2、估计方法
(1)非匹配设计:病例数=对照数
n = 2 pq (Ua Ub ) 2 /( p1 p 0) 2 p1 = p 0 RR /[1 p 0( RR 1)] p = 0.5( p1 p 0) q = 1 p
例:吸烟与肺癌,预期RR=2.0,人群吸烟率(p0)=20%, 定:a=0.05(双侧)b=0.1 查表得: Ua=1.96 Ub=1.28 p1=(0.2×2)/(1+0.2×1)=0.333 =1-0.267=0.733 p =(0.2+0.333)/2=0.267 q n=2×0.267×0.733(1.96+1.282)2/0.333-0.2)2 =232 (查表得:n=229)
第一节 基本原理
过去
比较 人数 暴露
+ 病 例
-
现在
a
a/(a+c)
c
b/(b+d) b d
+
-
对 照
病例对照研究(case control study):以一组患有 某病者(病例)和一组或几组未患该病但在某些已知 因素方面与病例组相似者(对照)为研究对象,调查 他们过去是否暴露于某个或某些可疑致病因素或暴露 剂量,比较两组暴露比值,推断研究因子作为病因的 可能性。 暴露(exposure):指研究对象接触某些因素,或具 备某些特征,或处于某种状态。 暴露因素(exposure factor):可以是机体固有的、 先天的,也可以是体外的、后天的,暴露因素也叫研 究变量(variable)。 混杂与混杂因素(confounding and confounding factor):研究某因素与某疾病关联时,由于某个既与 疾病有制约关系,又与所研究的因素有联系的外来因 素的影响,掩盖或扩大了所研究的因素与疾病的联系, 这种现象或影响叫混杂,其所带来的偏倚叫混杂偏倚, 该外来因素叫混杂因素。
假阳性错误(false positive error)或称第一类错误(type I error) 即由于判断失误,从而拒绝了原本正确的无效假设。在统计推断
上指允许犯假阳性的概率。1- a 称为精确度。
(4)希望的把握度(power)或称功效,(1- b)
b为假阴性错误(false negative error or type II error),指由于 统 计量(t)没有超过显著水平,从而接受了原本不正确的无效假设。
2、病例队列研究(case-cohort study)(病例参 比式研究,case-base reference study):队 列研究开始时,在队列中按一定比例随机抽取 一个一定量的有代表性的样本作为对照组,观 察结束时,队列中出现的全部所研究的病例为 病例组,与上述对照组比较。
特点: 1)对照是随机选取的,不与病例进行匹配 2)事先抽中的对照组成员如发生所研究的疾病,既 可作为病例组,也可作为对照组 3)可以研究几种疾病,但对照组是同一样本