病例对照研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
56
混杂因素的识别
混杂因素的识别:年龄 是所研究疾病(MI)的独立影响因素:在非暴露组考 察混杂因素与疾病的关联
46
OR值的意义
与RR一样,反映暴露者患某种疾病的危险性较无 暴露者高的程度 OR=1,认为暴露和疾病无关 OR>1,认为暴露是疾病发生的危险因素 OR<1,认为暴露是疾病发生的保护因素
48
OR值的估计 当研究为抽样研究时,所计算的OR为根据样 本信息计算的样本统计量,由于抽样误差的 存在,外推到总体时,需对总体OR进行估 计。 区间估计 Miettinen法 Woolf法
12
阴道腺癌患者及配对对照者母亲的部分资料
13
吸烟与肺癌关系的研究
14
主要内容
1
病例对照研究概述 病例对照研究设计实施 病例对照研究偏倚及控制 病例对照研究的优缺点
2
3
4
15
病例对照研究
设计与实施
研究目的和研究假设 研究设计方案 研究类型 研究对象 样本含量 研究指标 资料收集 资料整理 资料分析 常见偏倚及其控制
39
资料分析
组间可比 两组暴露情 况的比较及 统计学检验 多个因 素水平 组间不 可比 单个因 素水平 分 层 分 析 各层OR 值相同 各层OR 不同(齐 性检验) 总体 同质 总体不 同质 多因素 分析 计算关 联强度 OR值 回归分析 估计总 体OR
计 算 总 的 OR 交互 作用
40
41
α值及单双侧:一般取0.05双侧 检验效能(把握度)1-β:一般要求不低于75%,常 取80%或90%
29
样本含量的估计
不匹配(含频数匹配) 两组例数相等
两组例数不等
30
样本含量的估计
1:1匹配:两组间暴露的不一致率进行估计
31
研究内容/指标
调查目的转化成具体可测量的指标或项目 原则 相关性:少而精 客观性:客观指标优先 可行性:具体、可测量 可接受性:测量方法简单、可靠、易被接受
8
病例对照研究(Case-control study)
目的:探讨疾病和所研究因素(暴露)之间的因果关 联 基本思想:病例组的暴露情况一定高于对照组 比较的内涵: 比较的对象:病例组和对照组 比较的前提:可比性 比较的变量:既往暴露情况
9
病例对照研究
设计模式
10
病例对照研究
特点
34
资料的整理
资料的核查清理:保证数据的完整、准确 人工抽查→逻辑错误→修正→验收→归档 资料编码,形成数据库 资料的归纳、分组
35
资料分析
基本分析方法:比较病例与对照组中研究因素暴 露的比例,估计研究因素与疾病发生的关联强度 分类 不匹配、频数匹配资料 匹配(配对)资料 基本步骤 一般特征描述 均衡性检验 两组暴露情况比较 关联强度的度量 分层分析
36
对象一般特征的描述
对两组人群特征进行描述,从而了解资料的一般 情况 两组的入组人数 调查对象的一般特征分组描述
年龄、性别、民族、地区等
37
38
均衡性分析
对除研究因素、匹配因素以外的其他特征、因素 在两组间的构成情况的可比性进行统计学检验 若假设检验P>α,认为两组在该特征上可比 若假设检验P≤α,认为两组在该特征上不可比 ,应结合实际意义,考虑该因素为混杂因素 在暴露率比较及OR的计算时进行控制 分层分析 多因素分析
LOGO
病
例
对
照
研
究
Case-control study
流行病与卫生统计学教研室 孔翔瑜
1
流行病学的研究任务
描述疾病或健康 相关事件的三间分 布 提出假设
探索分布内在规 律——影响因素分 析 检验假设
提出策略和措施 评价有效性 进一步验证假设
揭示现象
找出原因
提供措施
2
病因的流行病学定义
21
匹配法注意事项 (二)
匹配的因素不宜过多
比例一般为1:1,最多不超过1:4
增加工作的难度 匹配过度(overmatching)
匹配过度
在病例对照研究匹配设计中,造成的研究因素被 间接匹配,则研究因素的效应被低估。 eg:吸烟、血脂、心血管疾病
22
(二) 研究设计方案 研究对象
确定目标人群——研究现场 研究目的 代表性 可行性 确定研究对象:从目标人群中抽出的具有代表性 人群 病例人群 对照人群
49
OR95%可信区间的解释 在一次抽样研究中,总体OR落在所计算的 区间可能性大小为95% 若可信区间包含1,则尚不能排除总体 OR=1 若可信区间不包含1,则可以认为总体 OR≠1
50
资料分析
组间可比 两组暴露情 况的比较及 统计学检验 多个因 素水平 组间不 可比 单个因 素水平 分 层 分 析 各层OR 值相同 各层OR 不同(齐 性检验) 总体 同质 总体不 同质 多因素 分析 计算关 联强度 OR值 回归分析 估计总 体OR
属于观察研究:未施加干预措施 分析性研究:设立对照组 回顾性研究:由果及因 可用于分析暴露与疾病的联系
11
病例对照研究
用途和分类
病因学研究:探讨致病因素或危险因素与疾病的 关系 探索性病例对照研究:广泛探索疾病的可能危 险因素 验证性病例对照研究:深入检验某个或几个病 因假设
计 算 总 的 OR 交互 作用
51
分层分析
把研究人群根据某非研究因素的类别进行分层后 分析暴露与疾病关联的方法 发现分层因素与暴露间的交互作用(Interaction) 识别并控制可能的混杂因素(Confounder)
52
分层分析
来自百度文库
53
分层分析
分层分析
①各层OR接近 或一致 ②假设检验各层 总体OR一致 ③计算总OR及 其可信区间
44
两组暴露情况的比较
确定P值,作出统计推断 X2=19.13 , 查卡方界值表, P<0.001 , 故按α =0.05水准,可以认为病例和对照的暴露率不同, 病例组暴露率较高
45
疾病与暴露关联强度的度量
RR与OR
相对危险度,RR 暴露组的暴露率与非暴露组的暴露率之比 在病例对照研究中不能得到 比值比OR:病例对照研究中关联强度度量指标 比值(Odds):是指事件发生的概率与不发生的 概率之比,也叫暴露优势 事件发生率小于5%时,OR是RR的极好近似值
16
(一) 研究目的与假设
研究目的 广泛探索疾病的可能危险因素 检验病因假设,即暴露与疾病间的因果关联 研究假设 查阅文献 既往描述性研究基础 eg:探讨原发性肝癌与乙肝病毒感染的关系
17
(二) 研究设计方案 研究类型
匹配,或称配比(matching):使组间某些已知的、 对研究结果有影响的非研究因素(匹配因素)在病例 组和对照组尽量相同的措施。 目的 提高研究效率 控制混杂因素 分类 不匹配或频数匹配(frequency matching) 个体匹配(individual matching)
32
研究内容/指标
指标内容: 研究因素 可能的混杂因素:一般人口学特征等 调查表的内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,混杂因素 结尾部分:调查员签名、调查日期等
33
资料的收集方法 问卷调查:对对象或知情人询问调查获得 直接观察 查阅记录或档案 体格检查或实验室检查 环境调查与检测
病例对照研究:比较分 析结果差异的原因
分析:同果同因,异果异因
现况研究:发现 问题
描述分布、找出规律:偶然性
6
主要内容
1
病例对照研究概述 病例对照研究设计实施 病例对照研究偏倚及控制 病例对照研究的优缺点
2
3
4
7
病例对照研究(Case-control study)
以确诊患有某特定疾病的病人为病例组,以不 患有该病但具有可比性的个体作为对照组,回 顾调查研究对象既往(发病前)某个或某些因素的 暴露情况,测量并比较两组中暴露比例和/或暴 露水平的差异,研究该疾病与这个(这些) 因素 的关系 基本原理:相似的果,有相似的因;不同的果,有 不同的因
18
(二) 研究设计方案 研究类型
病例与对照不匹配 对照无特殊的要求 随机选择一定数量非病例作为对照 对照的数量一般等于或多于病例 频数匹配 匹配因素的构成比例在病例组与对照组一致 对照的数量一般等于或多于病例 狭义的匹配不含此形式
19
(二) 研究设计方案 研究类型
25
研究对象 对照的选择
条件: 未患此病的人(可以是其它疾病); 不能为有共同危险因素的疾病病人; 除研究因素外其它条件一致; 来自同一人群; 来源: 从医院病人中选对照; 从全人口中选对照; 从亲属、同事、邻居中选对照。
26
样本含量的估计
样本量过大 人力、物力和时间上的浪费 样本量过小:抽样误差大 代表性差 假设检验时检验效能过低 随机分配均衡性差 估计的基本原则 足够代表性和检验效能前提下的最小样本量
那些能使人群发病概率升高的因素,就可认为是 病因(也叫危险因素),其中某个或多个因素不存在 时,人群疾病频率就会下降。 特点 适用对象:人群,而非个体 预防医学角度—降低人群发病率 因果联系:病因与疾病间概率性联系
3
群体观点和概率论的观点
• 偶然中孕育“必然” 一定条件下,在个体(或一次观察)中表现 的结果各不相同(或事前不能确定)——偶 然性 在大量、重复观察中(人群),结果的 出现具有一定的规律性——必然性
23
研究对象 病例的选择
来源 医院病例资料 社区人群资料 类型 新发病例 新近发生,回忆准确,首选 现患病例 回忆易受到影响,但数量多 死亡病例 误差大,极少利用 病例的确定 诊断明确,尽量使用金标准 ,统一诊断标准
24
研究对象 对照的选择
对照的选择:目标人群中未患研究疾病的人 原则 范围明确:非病例=健康人+患其他疾病病例 代表性:最好与病例的人群来源一致 可比性:非研究因素与病例组相同或相近 注意事项 排除已知与所研究危险因素有关的病种 排除患有多种疾病的病例 病种不要局限于一种
a)各层OR值相差 较大 b)总体OR齐性检 验差异有统计学 意义 c)分析交互作用
54
混杂因素的识别
必须是所研究疾病的独立影响因素 必须与所研究暴露存在统计学关联 不应是暴露与疾病因果链中的一个环节或中间变 量——专业上判定 eg: 性别:口服避孕药与心梗
55
混杂因素的识别
混杂因素的识别:性别 在未服用OC组考察年龄与MI的关联 X2=7.27,P=0.007,OR=0.48
27
样本含量的估计
需考虑的问题 抽样方法:完全随机抽样 无应答率:不超过10%或20% 比较指标总体参数的估计及统计学要求 设计方法 不匹配(频数匹配) 两组例数相等 两组例数不等 个体匹配(1:R)
28
样本含量的估计
已知条件 对照组暴露率π0 病例组的暴露率π1,或相对危险度RR或OR
两组暴露情况的比较
资料分组整理,形成统计表:根据暴露情况(是否 暴露或暴露分级)和疾病状态(病例、对照)进行交 叉分组统计频数,形成列联表
42
两组暴露情况的比较
43
两组暴露情况的比较
建立检验假设,确立检验水准 H0:病例组与对照组暴露率相同,即π1= π0 H1:病例组与对照组暴露率不同,即π1≠ π0 α=0.05 计算检验统计量:Tmin=40,n=1418
4
概率论/统计因果观
• 因果联系具有不确定性,本质上是概率性 的: 原因是使结果发生概率升高的事件或特 征 原因不是决定性的,结果也不是必然性 的
5
病因研究的过程
因果推断
验证假设 检验假设 提出假设
实验性研究:排除干 扰、明确因果联系
实践检验
队列研究:观察不 同原因结果的差异
分析:同因同果,异因异果
个体匹配,也叫配对或配伍:给每一个病例按照 匹配因素(如年龄、性别等)相同或相近选择一个或 几个对照,进行1:1或1:R匹配。 对照数目R:按Pitman效率递增公式
20
(二) 研究设计方案 研究类型
匹配法注意事项 (一)
慎重选择匹配因素 不应作为匹配因素的特征 可疑病因决不能作为匹配因素 研究因素与病因链上的中间环节 与研究因素有关但与疾病无关的特征