第八章研究的真实性与因果推断
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
病例对照研究 病例与对照 是否患病 回顾性(由果推因) 一果多因 无 暴露比值 前瞻性队列研究 无病个体 是否暴露 前瞻性(由因推果) 一因多果 无 发病率、死亡率 RR、AR、PAR、 AR%、PAR% 现场实验研究 易感者 随机 前瞻性 一因一果 有 发病率、死亡率 RR、AR、PAR、 AR%、PAR%、 保护率、效果指 数 确证 研究过程及结果 分析可标准化;偏 倚少;结论肯定
偶然关联 提出 假设 验证 假设 关 联 统计学关联 间接因果关联 因果关联
病因推断
非因果关联
选择偏倚 观察偏倚 混杂等
直接因果关联
(二)因果关联(causal association)
黄色瘤(E) 1、继发 关联 高血清胆 胆固醇(C) ? 冠心病(D) 2、直接 关联 歪曲 性乱(F) 静脉吸毒(E) ? HIV感染(D)
4、剩余法(排除法 method of residues; exclusion):在研究的几种因素中,排除 了某些已知与疾病无关的因素,则剩余的 因素可能是病因。(鼻咽癌与遗传,排除 鼻腔结构、语言、生活习惯等) 5、类推法((method of analogy):当一 种原因未明的疾病与另一种已知原因的疾 病分布相同时,两者病因可能相同。非洲 儿童恶性淋巴瘤 Burkitt lymphoma 与疟 疾分布相同(热带非洲; >1542m; >16℃), 推断与虫媒(按蚊)有关。
第八章 研究的真实性与因果推断
1、研究结果的变异性 2、研究的真实性 3、研究的偏倚 4、病因定义及模型 5、因果关系的逻辑方法 6、统计关联到因果关联 7、因果关联的推断标准
第一节 研究结果的变异性
一、概述 变异性(variability):研究结果的变动或波动叫 研究结果的变异性 1、生物学变异和测量变异:主要来自个体(个体 生物学变异;测量误差)、群体(个体遗传学变 异、环境变异测量误差)和样本(抽样方式、样 本大小和测量误差) 2、随机变异和系统变异:前者成正态分布;后者 的绝对值和方向保持恒定。 测量误差包括随机误差和系统误差
三、因果实验中的对照法则
(一)设立对照的必要性 求出净效应 (二)保证对照组的有效性 各组除了处理因素不同,其它因素尽 量相同 1、各组干扰因素的可比性:随机分组 2、各组效应测量的的可比性:主、客观 因素(主观因素消除办法:盲法)
第六节 统计关联到因果关联
(一)统计学关联(association)
第四节 病因的定义及模型
一、定义: Lilienfeld:那些能使人群发病概率升高的 因素,就可以认为是病因。 MacMahon:因果关系是事件或特征之间 的一种关联,改变某一事件(X)的频率 或特征,就会引起另一事件频率或特征 的改变。此时,前一事件(X)是后一事 件(Y)的原因。
(二)防治效应的病因定义
无差异分类错误
研究真实数据 错误分类数据
高脂肪 膳食 心肌梗死 对照
OR=2.3
低脂肪 膳食
高脂肪 膳食 心肌梗死
低Байду номын сангаас肪 膳食
60 40
40 60
对照
OR=2.0
48 32
52 68
差异分类错误
研究真实数据 错误分类数据
高脂肪 膳食 心肌梗死 对照
OR=2.3
低脂肪 膳食
高脂肪 膳食 心肌梗死 对照
是否患病或暴露 现况 多因多果 无 现患率、暴露率
RR、AR、PAR、 OR、AR%、 PAR% AR%、PAR%
提出病因线索 可迅速获得结果; 可了解基线率
提出、初步验证 样本小,获结果快; 费用低;适于少见 病
进一步验证 资料准确,结果可 靠;结论说服力强; 可直接计算RR;
缺点
不易确定因果关 选择及回忆偏倚大, 系;不适于病程短、 样本代表性差,仅 死亡快的病和少 能计算OR,难判断 见病 时间前后关系
二、个体水平差异
变异来源 特 点 个体状态 日间变异,年龄、膳食或运动改变,环境因素 测量误差 仪器标度差,精密度差,读数或记录错误
三、群体水平的变异性
• 是各个体变异的累积,群体变异常大于个体 • 可根据群体变异来确定正常值的范围 • 也受到测量误差的影响
四、样本水平的变异性
1、描述性结果样本变异:图8-1 2、分析性结果样本变异:图8-2
时间顺序、强度、特异性、重复性、合理性
三、病因判断的标准
1、时间顺序:前因后果。幽门螺杆菌感染与十
二指肠溃疡:324例感染者,10年,11%发病; 133例对照0.8%发病;海豹状肢体短畸发生在 反应停销售后8-9个月; 2、强度:强度越大,成为病因可能性越大(吸 烟肺癌与OR=4-20;与心肌梗死为2) 3、重复性:至少有30次病例对照研究,7次队列 研究,不同地点、时间、人群研究证明肺癌与 吸烟的关系。
样本大,时间长,费 用高,失访多,设计 严,实施难,不适于 少见病
样本大,时间长, 费用高,失访多, 设计严,实施难, 涉及医德问题
三、应用举例
病因推断标准应用 幽门螺杆菌与十二指肠溃疡 防治效应推断标准应用 老年人高血压降压治疗以降低心血管疾病 危险和死亡率
表
方法特点 研究对象 分组标准 时间顺序 因果性质 干预措施 比较内容 疾病与暴 露关联强 度指标 病因研究 优点 现况研究 自然人群
几种主要流行病学研究方法的比较
无差异性错误分类(nondifferential misclassification):暴露或疾病的错误分类与研究分组 无关;大多数情况下,模糊了组间差异,低估了研究效 应 差异性错误分类(differential misclassification):暴 露或疾病的错误分类与研究分组有关,由于其差异偏向 不同,可高估或低估研究效应
OR=3.2
低脂肪 膳食
60 40
40 60
60 32
40 68
三、 混杂偏倚
定义:在研究某因素与某疾病关联时,由于某个既与疾病有 制约关系,又与所研究的因素有联系的外来因素的影响, 掩盖或扩大了所研究的因素与疾病的联系,这种现象或影 响叫混杂(confounding),其所带来的偏倚叫混杂偏倚 (confounding bias),该外来因素叫混杂因素 (confounding factor) 。 特点:(1)必须是所研究疾病的独立危险因子 (2)必须与研究因素(暴露因素)有关 (3)必须不是研究因素与研究疾病因果链上中间变量
实验 EPI
病因推断
2、定义:对描述和分析流行病学研究起衔接作用的逻辑 方法即假设演绎法 3、推理形式:
HBV持续感染
PHC
PHC组HBV感染率高于对照 HBV感染组肝癌发病率高 证据(E)有 HBV感染率↓PHC发病率↓
假设(H)
条件 C
因素
HBV感染率≠PHC发病率 →证据(E)无
(二)Mill准则: 1、求同法(methodofagreement):在不同的事件 中寻找共同点。不同的事件或情况与一种疾病存在关 联,而这多种事件或情况均有一个共同点(因素), 则该点(因素)可能是该病病因。(1958年川西平原 不明原因发热,农民和国家职工均有下水劳动史—— 钩体病) 2、求异法(method of difference):在不同的事件中 寻找差异点。(吸烟者肺癌发病率显著高于不吸烟者, 吸烟可能是原因) 3、共变法(method of concomitant variation):当 某因素的频率或强度发生变化某病发病率也随之变化 时,该因素可能是该病病因(吸烟量增加,肺癌发病 OR值增加)
第三节 研究的偏倚
一、选择偏倚
• 定义:选入研究样本的研究对象与未被选 入者之间特征差异造成的系统误差。
描述性研究的选择偏倚:体现在样本对总体的 代表性上 分析性研究的选择偏倚:体现在研究对象进入、 排除、不参与、失访等
二、信息偏倚
定义:在从研究对象收取所需信息时产生的偏倚。其 表现是使研究对象的某种特征被错误分类 (misclassification)。 同样存在描述性研究和分析性研究的中
研究因果关系的实验:在受控的条件下, 研究这有意改变一个或多个处理因素,并 前瞻性地确定其效应 防治试验中的处理(treatment or maneuver)可看作是防治特定效应(结局) 的可能原因
鬼神、上帝、天意 二、病因模型: 金木水火土→人 病原微生物→人
病原物
迷信阶段
朴素唯物主义
生物学病因萌芽
第七节 因果关联的推断标准
一、标准的发展 (一)病因推断标准: 1、Henle-koch原理(1882):
该微生物在每个病例中均存在; 该微生物必须能够在体外分离和培养; 将培养出的微生物接种于易感宿主时,应可引起此种 特异疾病; 由被接种的动物也能分离出此微生物并加以鉴定
2、美国“吸烟与健康报告”委员会(1964):5条
第二节 研究的真实性
一、概述 真实性(效度;validity):研究收集的 数据、分析结果和所得结论与客观实际的 符合程度。用真实性指数(index of validity, IV)或灵敏度等表示。
研究误差:研究结果与客观实际不符合的地方。分为系统 误差(偏异;bias)和随机误差
可靠性(信度;reliability;精密度; precision):指研究中随机误差的大小程 度
二、由统计学关联到因果关联
(一)统计学关联(association)
偶然关联 提出 假设 验证 假设 关 联 统计学关联 因果关联 直接因果关联 非因果关联 选择偏倚 观察偏倚 混杂等
病因推断
间接因果关联
(二)因果关联(causal association)
黄色瘤(E) 1、继发 关联 高血清胆 胆固醇(C) ? 冠心病(D) 2、直接 关联 歪曲 性乱(F) 静脉吸毒(E) ? HIV感染(D)
二、内部真实性(internal validity)
• 指研究结果与实际研究对象真实情况的符 合程度,指研究本身是否真实 • 真实性高,则系统误差和随机误差小 • 研究结果真实性差,不能应用于其他人群
三、外部真实性(external validity)
• 研究结果与推论对象真实情况的符合程度 • 增加研究对象的同质性,能改善内部真实 性; • 增加研究对象的异质性,能改善外部真实 性; • 应综合考虑研究对象的异质性和同质性
三角模型
环境 生物的 机体 宿主(人) 物质的
轮状模型
社会的
G
社会经济因素 生物学因素 环境因素 心理行为因素 卫生保健因素
疾病因素模型
医学生物学因素 (致病机制)
疾病
第五节
因果推断的逻辑方法
一、推理方法 (一)假设演绎法(hypothesis-deduction method) 1、证明某因子是某病病因的过程: 横断面研究 纵向研究 描述EPI 临床资料 疾病监测 形成假设 病理资料 分析EPI 病例对照研究 队列研究
4、合理性:吸烟与肺癌,吸烟与支气管上 皮鳞状化有关,与支气管鳞状上皮细胞 癌有关,与腺癌无关,患病率男>女, 狗吸烟动物实验证明,有癌基因;但 Snow提出霍乱由微生物引起,由粪口途 径经水传播,经30年后才发现霍乱弧菌 5、论证强度:实验性研究>队列研究>病 例对照研究>现况研究
6、剂量-反应关系:吸烟量越大,RR值越大; 7、暴露与疾病分布一致性:各国吸烟销售量与肺癌 死亡率正相关。脂肪摄入量与大肠癌;疟疾与按 蚊;钉螺与血吸虫病 8、终止效应:戒烟者肺癌死亡率下降;停用某品牌 阴道月经棉条后中毒性休克症(toxic shook syndrome)发病率下降,消逝。 9、特异性:指唯一的病因和疾病。传染病与病原体 有明显的特异性;从多因多果的观点,此条应取 消。
偶然关联 提出 假设 验证 假设 关 联 统计学关联 间接因果关联 因果关联
病因推断
非因果关联
选择偏倚 观察偏倚 混杂等
直接因果关联
(二)因果关联(causal association)
黄色瘤(E) 1、继发 关联 高血清胆 胆固醇(C) ? 冠心病(D) 2、直接 关联 歪曲 性乱(F) 静脉吸毒(E) ? HIV感染(D)
4、剩余法(排除法 method of residues; exclusion):在研究的几种因素中,排除 了某些已知与疾病无关的因素,则剩余的 因素可能是病因。(鼻咽癌与遗传,排除 鼻腔结构、语言、生活习惯等) 5、类推法((method of analogy):当一 种原因未明的疾病与另一种已知原因的疾 病分布相同时,两者病因可能相同。非洲 儿童恶性淋巴瘤 Burkitt lymphoma 与疟 疾分布相同(热带非洲; >1542m; >16℃), 推断与虫媒(按蚊)有关。
第八章 研究的真实性与因果推断
1、研究结果的变异性 2、研究的真实性 3、研究的偏倚 4、病因定义及模型 5、因果关系的逻辑方法 6、统计关联到因果关联 7、因果关联的推断标准
第一节 研究结果的变异性
一、概述 变异性(variability):研究结果的变动或波动叫 研究结果的变异性 1、生物学变异和测量变异:主要来自个体(个体 生物学变异;测量误差)、群体(个体遗传学变 异、环境变异测量误差)和样本(抽样方式、样 本大小和测量误差) 2、随机变异和系统变异:前者成正态分布;后者 的绝对值和方向保持恒定。 测量误差包括随机误差和系统误差
三、因果实验中的对照法则
(一)设立对照的必要性 求出净效应 (二)保证对照组的有效性 各组除了处理因素不同,其它因素尽 量相同 1、各组干扰因素的可比性:随机分组 2、各组效应测量的的可比性:主、客观 因素(主观因素消除办法:盲法)
第六节 统计关联到因果关联
(一)统计学关联(association)
第四节 病因的定义及模型
一、定义: Lilienfeld:那些能使人群发病概率升高的 因素,就可以认为是病因。 MacMahon:因果关系是事件或特征之间 的一种关联,改变某一事件(X)的频率 或特征,就会引起另一事件频率或特征 的改变。此时,前一事件(X)是后一事 件(Y)的原因。
(二)防治效应的病因定义
无差异分类错误
研究真实数据 错误分类数据
高脂肪 膳食 心肌梗死 对照
OR=2.3
低脂肪 膳食
高脂肪 膳食 心肌梗死
低Байду номын сангаас肪 膳食
60 40
40 60
对照
OR=2.0
48 32
52 68
差异分类错误
研究真实数据 错误分类数据
高脂肪 膳食 心肌梗死 对照
OR=2.3
低脂肪 膳食
高脂肪 膳食 心肌梗死 对照
是否患病或暴露 现况 多因多果 无 现患率、暴露率
RR、AR、PAR、 OR、AR%、 PAR% AR%、PAR%
提出病因线索 可迅速获得结果; 可了解基线率
提出、初步验证 样本小,获结果快; 费用低;适于少见 病
进一步验证 资料准确,结果可 靠;结论说服力强; 可直接计算RR;
缺点
不易确定因果关 选择及回忆偏倚大, 系;不适于病程短、 样本代表性差,仅 死亡快的病和少 能计算OR,难判断 见病 时间前后关系
二、个体水平差异
变异来源 特 点 个体状态 日间变异,年龄、膳食或运动改变,环境因素 测量误差 仪器标度差,精密度差,读数或记录错误
三、群体水平的变异性
• 是各个体变异的累积,群体变异常大于个体 • 可根据群体变异来确定正常值的范围 • 也受到测量误差的影响
四、样本水平的变异性
1、描述性结果样本变异:图8-1 2、分析性结果样本变异:图8-2
时间顺序、强度、特异性、重复性、合理性
三、病因判断的标准
1、时间顺序:前因后果。幽门螺杆菌感染与十
二指肠溃疡:324例感染者,10年,11%发病; 133例对照0.8%发病;海豹状肢体短畸发生在 反应停销售后8-9个月; 2、强度:强度越大,成为病因可能性越大(吸 烟肺癌与OR=4-20;与心肌梗死为2) 3、重复性:至少有30次病例对照研究,7次队列 研究,不同地点、时间、人群研究证明肺癌与 吸烟的关系。
样本大,时间长,费 用高,失访多,设计 严,实施难,不适于 少见病
样本大,时间长, 费用高,失访多, 设计严,实施难, 涉及医德问题
三、应用举例
病因推断标准应用 幽门螺杆菌与十二指肠溃疡 防治效应推断标准应用 老年人高血压降压治疗以降低心血管疾病 危险和死亡率
表
方法特点 研究对象 分组标准 时间顺序 因果性质 干预措施 比较内容 疾病与暴 露关联强 度指标 病因研究 优点 现况研究 自然人群
几种主要流行病学研究方法的比较
无差异性错误分类(nondifferential misclassification):暴露或疾病的错误分类与研究分组 无关;大多数情况下,模糊了组间差异,低估了研究效 应 差异性错误分类(differential misclassification):暴 露或疾病的错误分类与研究分组有关,由于其差异偏向 不同,可高估或低估研究效应
OR=3.2
低脂肪 膳食
60 40
40 60
60 32
40 68
三、 混杂偏倚
定义:在研究某因素与某疾病关联时,由于某个既与疾病有 制约关系,又与所研究的因素有联系的外来因素的影响, 掩盖或扩大了所研究的因素与疾病的联系,这种现象或影 响叫混杂(confounding),其所带来的偏倚叫混杂偏倚 (confounding bias),该外来因素叫混杂因素 (confounding factor) 。 特点:(1)必须是所研究疾病的独立危险因子 (2)必须与研究因素(暴露因素)有关 (3)必须不是研究因素与研究疾病因果链上中间变量
实验 EPI
病因推断
2、定义:对描述和分析流行病学研究起衔接作用的逻辑 方法即假设演绎法 3、推理形式:
HBV持续感染
PHC
PHC组HBV感染率高于对照 HBV感染组肝癌发病率高 证据(E)有 HBV感染率↓PHC发病率↓
假设(H)
条件 C
因素
HBV感染率≠PHC发病率 →证据(E)无
(二)Mill准则: 1、求同法(methodofagreement):在不同的事件 中寻找共同点。不同的事件或情况与一种疾病存在关 联,而这多种事件或情况均有一个共同点(因素), 则该点(因素)可能是该病病因。(1958年川西平原 不明原因发热,农民和国家职工均有下水劳动史—— 钩体病) 2、求异法(method of difference):在不同的事件中 寻找差异点。(吸烟者肺癌发病率显著高于不吸烟者, 吸烟可能是原因) 3、共变法(method of concomitant variation):当 某因素的频率或强度发生变化某病发病率也随之变化 时,该因素可能是该病病因(吸烟量增加,肺癌发病 OR值增加)
第三节 研究的偏倚
一、选择偏倚
• 定义:选入研究样本的研究对象与未被选 入者之间特征差异造成的系统误差。
描述性研究的选择偏倚:体现在样本对总体的 代表性上 分析性研究的选择偏倚:体现在研究对象进入、 排除、不参与、失访等
二、信息偏倚
定义:在从研究对象收取所需信息时产生的偏倚。其 表现是使研究对象的某种特征被错误分类 (misclassification)。 同样存在描述性研究和分析性研究的中
研究因果关系的实验:在受控的条件下, 研究这有意改变一个或多个处理因素,并 前瞻性地确定其效应 防治试验中的处理(treatment or maneuver)可看作是防治特定效应(结局) 的可能原因
鬼神、上帝、天意 二、病因模型: 金木水火土→人 病原微生物→人
病原物
迷信阶段
朴素唯物主义
生物学病因萌芽
第七节 因果关联的推断标准
一、标准的发展 (一)病因推断标准: 1、Henle-koch原理(1882):
该微生物在每个病例中均存在; 该微生物必须能够在体外分离和培养; 将培养出的微生物接种于易感宿主时,应可引起此种 特异疾病; 由被接种的动物也能分离出此微生物并加以鉴定
2、美国“吸烟与健康报告”委员会(1964):5条
第二节 研究的真实性
一、概述 真实性(效度;validity):研究收集的 数据、分析结果和所得结论与客观实际的 符合程度。用真实性指数(index of validity, IV)或灵敏度等表示。
研究误差:研究结果与客观实际不符合的地方。分为系统 误差(偏异;bias)和随机误差
可靠性(信度;reliability;精密度; precision):指研究中随机误差的大小程 度
二、由统计学关联到因果关联
(一)统计学关联(association)
偶然关联 提出 假设 验证 假设 关 联 统计学关联 因果关联 直接因果关联 非因果关联 选择偏倚 观察偏倚 混杂等
病因推断
间接因果关联
(二)因果关联(causal association)
黄色瘤(E) 1、继发 关联 高血清胆 胆固醇(C) ? 冠心病(D) 2、直接 关联 歪曲 性乱(F) 静脉吸毒(E) ? HIV感染(D)
二、内部真实性(internal validity)
• 指研究结果与实际研究对象真实情况的符 合程度,指研究本身是否真实 • 真实性高,则系统误差和随机误差小 • 研究结果真实性差,不能应用于其他人群
三、外部真实性(external validity)
• 研究结果与推论对象真实情况的符合程度 • 增加研究对象的同质性,能改善内部真实 性; • 增加研究对象的异质性,能改善外部真实 性; • 应综合考虑研究对象的异质性和同质性
三角模型
环境 生物的 机体 宿主(人) 物质的
轮状模型
社会的
G
社会经济因素 生物学因素 环境因素 心理行为因素 卫生保健因素
疾病因素模型
医学生物学因素 (致病机制)
疾病
第五节
因果推断的逻辑方法
一、推理方法 (一)假设演绎法(hypothesis-deduction method) 1、证明某因子是某病病因的过程: 横断面研究 纵向研究 描述EPI 临床资料 疾病监测 形成假设 病理资料 分析EPI 病例对照研究 队列研究
4、合理性:吸烟与肺癌,吸烟与支气管上 皮鳞状化有关,与支气管鳞状上皮细胞 癌有关,与腺癌无关,患病率男>女, 狗吸烟动物实验证明,有癌基因;但 Snow提出霍乱由微生物引起,由粪口途 径经水传播,经30年后才发现霍乱弧菌 5、论证强度:实验性研究>队列研究>病 例对照研究>现况研究
6、剂量-反应关系:吸烟量越大,RR值越大; 7、暴露与疾病分布一致性:各国吸烟销售量与肺癌 死亡率正相关。脂肪摄入量与大肠癌;疟疾与按 蚊;钉螺与血吸虫病 8、终止效应:戒烟者肺癌死亡率下降;停用某品牌 阴道月经棉条后中毒性休克症(toxic shook syndrome)发病率下降,消逝。 9、特异性:指唯一的病因和疾病。传染病与病原体 有明显的特异性;从多因多果的观点,此条应取 消。