回顾性临床研究的设计和分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 多因素分析:
– Y=α+β1X1+β2X2+β3X3+…βnXn – 生存状态=α+ β1*治疗方案+β2*年龄+β3*并发疾病 – 校正后估计,考虑其他因素对Y的影响
49
多变量分析中变量的选择
• 统计学方法
– Backward, Forward, Stepwise – AIC, BIC, Adjusted-R2
病例与对照的选择
• 病例
– 2002年6月-2008年12月 – 广州地区6所医院 – 706名组织病理学确诊CRC患者
• 对照
– 相同时间段 – 广州地区健康体检人群 – 随机选择723名无CRC研究对象 – 年龄、性别配对
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
• 随访终点(已知)
• 一个队列研究可观察多个研究结局
16
专业资料,仅供医药卫生专业人士参考
结局和暴露状态的测量
• 基本原则:独立与客观
盲法 (Blinding)
– 研究结局不应影响暴露状态的判断
– 暴露状态不应影响研究结局的判断
• 观察性研究中不存在完全的独立与客观
• 测量的误差会影响研究结果,无法校正
42
专业资料,仅供医药卫生专业人士参考
• 研究人群:
– 2010/7-2012/7 – 就诊乳腺癌患者
• 数据收集:
– 病理科档案
43
专业资料,仅供医药卫生专业人士参考
常用的分析方法
• 描述性分析(Descriptive analysis)
– 描述研究人群的基本特征
• 组间比较(Subgroup comparison)
• 外部对照
– 不同地点,不同时间 – 需要更强的相似性假设
12
专业资料,仅供医药卫生专业人士参考
暴露组与对照组的可比性
• 观察性研究的特性决定了暴露组与对照组 是不可比的
– 基线的背景风险不同(选择性入组)
– 脱落者与在访者的背景风险不同(选择性脱落)
• 忽略这种不同会影响我们对结果的解读
随机
(Randomization) “选择性偏倚”
目标受众:专业资料,仅供医药卫生专业人士参考
回顾性临床研究的设计 与数据分析
文毅 临床流行病学研究员 上海罗氏制药医学部
NP-OBC-2015.11-002 Valid Until 2017.11
1
声明
• 本资料为仅用于学术会议或活动的专业资 料,旨在促进医药信息的沟通和交流,仅 供医药卫生专业人士参考。内容可能含有 未在中国批准的临床适应症。处方请参考 国家食品药品监督管理总局批准的药品说 明书
• 研究实施上
• 减少因失访导致的信息缺失
• 数据分析上 • 结果解读上
• 分层分析 • 多变量分析 • 谨慎,避免结论性的论断
15
专业资料,仅供医药卫生专业人士参考
队列研究的终点/结局
• 事件的发生(已知)
– Time-to-event (OS, PFS) – Disease incidence
“信息偏倚”
17
专业资料,仅供医药卫生专业人士参考
回顾性队列研究中的 选择性偏移与信息偏移
• 选择性偏移
– 选择性入组和脱落 – 回顾性数据的完整性
• 信息偏移
– 回顾性数据的准确性 – 回忆的准确性 – 暴露状态对结局的影响相对较小
18
专业资料,仅供医药卫生专业人士参考
关于失访
• 观察性研究的失访无法避免 • 对临床研究的影响
专业资料,仅供医药卫生专业人士参考
数据收集
• 同时收集暴露与结局信息(一次性收集) • 收集方式:
– 面对面访谈 – 邮寄调查问卷 – 电话访谈 – 自我填写的调查问卷 – 医学检查(实验室检查) – 已有档案回顾
41
专业资料,仅供医药卫生专业人士参考
横断面研究的偏倚与混杂
• 选择性偏倚:研究对象不具代表性 • 信息偏倚:基于回忆或自我报告 • 混杂:风险因素缺失或未收集
• 根据研究对象在研究起点(过去)的暴露 状态而确定的
– 暴露组 – 对照组
• 根据研究问题清晰定义
– 有/无(治疗方案) – 按暴露程度(剂量) – 按暴露的Pattern(顺序)
11
专业资料,仅供医药卫生专业人士参考
对照组的选择
• 除了暴露因素外,应与暴露组相似
• 内部对照
– 从同一地点,同一时间内选择。如从同一家医 院,在同一个时间段内选择
病例对照研究中的 偏倚与混杂
• 选择性偏倚
– 不恰当的选择对照(受暴露状态的影响) – 病例与对照来自不同人群
• 信息偏倚(暴露信息不准确)
– 回顾性的数据收集方式
• 回忆偏倚 • 研究者引入的偏倚
• 混杂
– 风险因素数据不完整或缺失
31
专业资料,仅供医药卫生专业人士参考
病例对照研究中的 偏倚与混杂的控制
13
专业资料,仅供医药卫生专业人士参考
举例:死亡率指标
“二、三级综合医院医疗服务能力标准”征求意见稿
住院患者死亡率 住院手术死亡率
三级医院
≤0.8%
≤1.4‰
二级医院
≤0.4%
≤0.28‰
14
专业资料,仅供医药卫生专业人士参考
“差异”的校正和控制
• 研究设计上
• 选择内部对照 • 尽可能收集风险因素
• 疾病(事件、状态)发生、流行和分布的 影响因素:比(Hazard Ratio, Rate Ratio)
7
专业资料,仅供医药卫生专业人士参考
队列研究的设计要素
一组人 确定研究人群
确定研究问题
从暴露
确定暴露因素
时间轴 前进
随访起止点
8
专业资料,仅供医药卫生专业人士参考
到结局
确定研究终点
随访
• 起点:
• 计数、百分比
45
组间比较
• 比较组间基线特征差异
– t检验(连续变量) – 卡方检验(分类变量)
• “我该使用哪种检验方法?”
http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm
46
①
① Dependent Variable: 因变量(年龄)
20
专业资料,仅供医药卫生专业人士参考
病例对照研究
21
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例
22
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例 对照
23
专业资料,仅供医药卫生专业人士参考
结局
病例: 对照:
暴露
24
专业资料,仅供医药卫生专业人士参考
Odds Ratio (OR)
52
专业资料,仅供医药卫生专业人士参考
– 如果发生了研究结局,那么对照符合病例的入 选标准
• 对照的选择不受暴露因素的影响 • 除了暴露因素外,对照应与病例类似 • 病例对照比例:1:1~1:4
29
专业资料,仅供医药卫生专业人士参考
判断暴露状态
• 往往是回顾性的
– 基于已有病例档案(完整性?) – 基于回忆(准确性?)
30
专业资料,仅供医药卫生专业人士参考
• 判断暴露状态
27
专业资料,仅供医药卫生专业人士参考
病例的选择
• 理论上,人群中所有病例均应作为case
• 实际中,选择部分病例作为case
• 一般选择新发病例而非既往病例
– 不同时期的诊断水平存在差异
28
专业资料,仅供医药卫生专业人士参考
对照的选择
• 在选择时没有发生研究结局 • 与病例来自同一人群
横断面研究
• 了解某种疾病或状态 在特定时间、某个人 群中的分布状态(流 行率)
流行率=
+
37
专业资料,仅供医药卫生专业人士参考
横断面研究
• 特殊的病例对照研究
– 所有的non-case均选为control – 相关因素分析(OR)
38
专业资料,仅供医药卫生专业人士参考
横断面研究的设计要素
人群的切面
34
专业资料,仅供医药卫生专业人士参考
暴露因素测量
• 问卷:吸烟、饮酒、家族史…… • 采集血样进行基因分析
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
35
专业资料,仅供医药卫生专业人士参考
36
专业资料,仅供医药卫生专业人士参考
– 了解可能存在的组间差异
• 回归分析(Regression analysis)
– 偏倚与混杂的校正,分析影响因素
44
描述性分析
• 根据变量类型选择分析方法
变量类型 连续变量
分类变量
描述性分析
• 按连续变量报告 • 平均数(SD, 95% CI) • 中位数(Range, IQR)
• 转换成分类变量,如年龄段 • 计数,百分比
4Fra Baidu bibliotek
专业资料,仅供医药卫生专业人士参考
队列研究
一组人
前进
时间轴
暴露
结局
5
专业资料,仅供医药卫生专业人士参考
前瞻性 现在
队列研究
一组人
前进
回顾性 现在
暴露
6
时间轴
因→果
专业资料,仅供医药卫生专业人士参考
结局
队列研究 可以回答哪些问题?
• 疾病(事件)的发生情况:发生率
• 疾病(状态)的流行或分布:百分数
• 较队列研究更难控制 • 可用的方法
– 配对 – 尽可能收集风险因素 – 使用客观测量结果 – 分析:分层、多因素分析
• 承认其存在以及研究的局限性
32
专业资料,仅供医药卫生专业人士参考
• 研究问题:
– MKK4基因多态性与结直肠癌的相关性
• 研究设计:
– 病例对照
33
专业资料,仅供医药卫生专业人士参考
2
专业资料,仅供医药卫生专业人士参考
前瞻性 vs.回顾性
• 时间顺序性
– 研究问题 vs. 数据收集 – 暴露因素 vs. 研究结局
• 数据的分析永远是回顾性的 • 数据的产生永远是前瞻性的
3
专业资料,仅供医药卫生专业人士参考
常见的回顾性研究设计
• 一般为观察性研究 • 回顾性队列研究(因 → 果) • 病例对照研究( 果 → 因) • 横断面研究
• 确定研究人群
– 在哪个人群切?
• 确定数据收集/产生时间
– 在什么时候切?
• 结局与暴露的测量
– 数据收集
39
专业资料,仅供医药卫生专业人士参考
数据收集/产生时间
• 日历时间(calendar time)
– X年X月-X年X月
• 事件时间(event time)
– 就诊、诊断、治疗、死亡…
40
② Independent Variable: 自变量(治疗方案)
②③
使用的检 验方法
③ Nature of Depend Variable
– Interval – Normal – Ordinal – Categorical
47
四种统计 软件的操
作方法
回归分析
• 根据研究设计和因变量(结果变量)种类 选择回归分析方法
– 生存分析(Cox回归):time-to-event变量 – Logistic回归:0,1结果变量 – 线性回归:连续性结果变量 – Poisson回归:非负的计数性结果变量
• 单变量 vs. 多变量
48
单因素与多因素分析
• 单因素分析:
– Y=α+βX1 – 生存状态=α+β*治疗方案 – 粗估,未考虑其他因素对Y的影响
病例 对照
暴露
4
病例
2
对照
非暴露
2
4
OR=
25
专业资料,仅供医药卫生专业人士参考
病例对照研究 可以回答哪些问题?
• 疾病或状态的影响因素(比较性问题)
– 保护因素 – 风险因素 – 唯一的产出:OR
26
专业资料,仅供医药卫生专业人士参考
病例对照研究的设计要素
• 确定研究问题 • 确定研究人群
– 病例的选择 – 对照的选择
– 暴露或者风险发生的起点
– 过去的某个时间点
• 终点:
– 事件发生 – 失访或脱落
过去的某个时间点
– 研究结束
现在 or 过去的某 个时间点
9
专业资料,仅供医药卫生专业人士参考
确定研究人群
• 目标人群 • 源人群 • 研究人群
从研究起点(过去)进行选择
10
专业资料,仅供医药卫生专业人士参考
确定暴露状态
– 减少了样本量,降低研究的效力 – 造成选择性偏倚
• 应对措施
– 补充数据,减少失访造成的信息缺失 – 接受现实、评估可能的影响、谨慎解读结果
19
专业资料,仅供医药卫生专业人士参考
病例对照研究
• 研究结局(果) → 暴露状态(因)
– Step 1: 根据结局确定“病例”与“对照” – Step 2: 确定各自的暴露状态 – Step 3: 计算
• 临床意义
– 风险因素
“All models are wrong, but some are useful”
50
总结
• 根据研究问题选择研究设计 • 是否需要前瞻性的收集数据(数据积累) • 省时高效 • 正确认识回顾性研究的局限性
51
专业资料,仅供医药卫生专业人士参考
Doing now what patients need next
– Y=α+β1X1+β2X2+β3X3+…βnXn – 生存状态=α+ β1*治疗方案+β2*年龄+β3*并发疾病 – 校正后估计,考虑其他因素对Y的影响
49
多变量分析中变量的选择
• 统计学方法
– Backward, Forward, Stepwise – AIC, BIC, Adjusted-R2
病例与对照的选择
• 病例
– 2002年6月-2008年12月 – 广州地区6所医院 – 706名组织病理学确诊CRC患者
• 对照
– 相同时间段 – 广州地区健康体检人群 – 随机选择723名无CRC研究对象 – 年龄、性别配对
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
• 随访终点(已知)
• 一个队列研究可观察多个研究结局
16
专业资料,仅供医药卫生专业人士参考
结局和暴露状态的测量
• 基本原则:独立与客观
盲法 (Blinding)
– 研究结局不应影响暴露状态的判断
– 暴露状态不应影响研究结局的判断
• 观察性研究中不存在完全的独立与客观
• 测量的误差会影响研究结果,无法校正
42
专业资料,仅供医药卫生专业人士参考
• 研究人群:
– 2010/7-2012/7 – 就诊乳腺癌患者
• 数据收集:
– 病理科档案
43
专业资料,仅供医药卫生专业人士参考
常用的分析方法
• 描述性分析(Descriptive analysis)
– 描述研究人群的基本特征
• 组间比较(Subgroup comparison)
• 外部对照
– 不同地点,不同时间 – 需要更强的相似性假设
12
专业资料,仅供医药卫生专业人士参考
暴露组与对照组的可比性
• 观察性研究的特性决定了暴露组与对照组 是不可比的
– 基线的背景风险不同(选择性入组)
– 脱落者与在访者的背景风险不同(选择性脱落)
• 忽略这种不同会影响我们对结果的解读
随机
(Randomization) “选择性偏倚”
目标受众:专业资料,仅供医药卫生专业人士参考
回顾性临床研究的设计 与数据分析
文毅 临床流行病学研究员 上海罗氏制药医学部
NP-OBC-2015.11-002 Valid Until 2017.11
1
声明
• 本资料为仅用于学术会议或活动的专业资 料,旨在促进医药信息的沟通和交流,仅 供医药卫生专业人士参考。内容可能含有 未在中国批准的临床适应症。处方请参考 国家食品药品监督管理总局批准的药品说 明书
• 研究实施上
• 减少因失访导致的信息缺失
• 数据分析上 • 结果解读上
• 分层分析 • 多变量分析 • 谨慎,避免结论性的论断
15
专业资料,仅供医药卫生专业人士参考
队列研究的终点/结局
• 事件的发生(已知)
– Time-to-event (OS, PFS) – Disease incidence
“信息偏倚”
17
专业资料,仅供医药卫生专业人士参考
回顾性队列研究中的 选择性偏移与信息偏移
• 选择性偏移
– 选择性入组和脱落 – 回顾性数据的完整性
• 信息偏移
– 回顾性数据的准确性 – 回忆的准确性 – 暴露状态对结局的影响相对较小
18
专业资料,仅供医药卫生专业人士参考
关于失访
• 观察性研究的失访无法避免 • 对临床研究的影响
专业资料,仅供医药卫生专业人士参考
数据收集
• 同时收集暴露与结局信息(一次性收集) • 收集方式:
– 面对面访谈 – 邮寄调查问卷 – 电话访谈 – 自我填写的调查问卷 – 医学检查(实验室检查) – 已有档案回顾
41
专业资料,仅供医药卫生专业人士参考
横断面研究的偏倚与混杂
• 选择性偏倚:研究对象不具代表性 • 信息偏倚:基于回忆或自我报告 • 混杂:风险因素缺失或未收集
• 根据研究对象在研究起点(过去)的暴露 状态而确定的
– 暴露组 – 对照组
• 根据研究问题清晰定义
– 有/无(治疗方案) – 按暴露程度(剂量) – 按暴露的Pattern(顺序)
11
专业资料,仅供医药卫生专业人士参考
对照组的选择
• 除了暴露因素外,应与暴露组相似
• 内部对照
– 从同一地点,同一时间内选择。如从同一家医 院,在同一个时间段内选择
病例对照研究中的 偏倚与混杂
• 选择性偏倚
– 不恰当的选择对照(受暴露状态的影响) – 病例与对照来自不同人群
• 信息偏倚(暴露信息不准确)
– 回顾性的数据收集方式
• 回忆偏倚 • 研究者引入的偏倚
• 混杂
– 风险因素数据不完整或缺失
31
专业资料,仅供医药卫生专业人士参考
病例对照研究中的 偏倚与混杂的控制
13
专业资料,仅供医药卫生专业人士参考
举例:死亡率指标
“二、三级综合医院医疗服务能力标准”征求意见稿
住院患者死亡率 住院手术死亡率
三级医院
≤0.8%
≤1.4‰
二级医院
≤0.4%
≤0.28‰
14
专业资料,仅供医药卫生专业人士参考
“差异”的校正和控制
• 研究设计上
• 选择内部对照 • 尽可能收集风险因素
• 疾病(事件、状态)发生、流行和分布的 影响因素:比(Hazard Ratio, Rate Ratio)
7
专业资料,仅供医药卫生专业人士参考
队列研究的设计要素
一组人 确定研究人群
确定研究问题
从暴露
确定暴露因素
时间轴 前进
随访起止点
8
专业资料,仅供医药卫生专业人士参考
到结局
确定研究终点
随访
• 起点:
• 计数、百分比
45
组间比较
• 比较组间基线特征差异
– t检验(连续变量) – 卡方检验(分类变量)
• “我该使用哪种检验方法?”
http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm
46
①
① Dependent Variable: 因变量(年龄)
20
专业资料,仅供医药卫生专业人士参考
病例对照研究
21
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例
22
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例 对照
23
专业资料,仅供医药卫生专业人士参考
结局
病例: 对照:
暴露
24
专业资料,仅供医药卫生专业人士参考
Odds Ratio (OR)
52
专业资料,仅供医药卫生专业人士参考
– 如果发生了研究结局,那么对照符合病例的入 选标准
• 对照的选择不受暴露因素的影响 • 除了暴露因素外,对照应与病例类似 • 病例对照比例:1:1~1:4
29
专业资料,仅供医药卫生专业人士参考
判断暴露状态
• 往往是回顾性的
– 基于已有病例档案(完整性?) – 基于回忆(准确性?)
30
专业资料,仅供医药卫生专业人士参考
• 判断暴露状态
27
专业资料,仅供医药卫生专业人士参考
病例的选择
• 理论上,人群中所有病例均应作为case
• 实际中,选择部分病例作为case
• 一般选择新发病例而非既往病例
– 不同时期的诊断水平存在差异
28
专业资料,仅供医药卫生专业人士参考
对照的选择
• 在选择时没有发生研究结局 • 与病例来自同一人群
横断面研究
• 了解某种疾病或状态 在特定时间、某个人 群中的分布状态(流 行率)
流行率=
+
37
专业资料,仅供医药卫生专业人士参考
横断面研究
• 特殊的病例对照研究
– 所有的non-case均选为control – 相关因素分析(OR)
38
专业资料,仅供医药卫生专业人士参考
横断面研究的设计要素
人群的切面
34
专业资料,仅供医药卫生专业人士参考
暴露因素测量
• 问卷:吸烟、饮酒、家族史…… • 采集血样进行基因分析
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
35
专业资料,仅供医药卫生专业人士参考
36
专业资料,仅供医药卫生专业人士参考
– 了解可能存在的组间差异
• 回归分析(Regression analysis)
– 偏倚与混杂的校正,分析影响因素
44
描述性分析
• 根据变量类型选择分析方法
变量类型 连续变量
分类变量
描述性分析
• 按连续变量报告 • 平均数(SD, 95% CI) • 中位数(Range, IQR)
• 转换成分类变量,如年龄段 • 计数,百分比
4Fra Baidu bibliotek
专业资料,仅供医药卫生专业人士参考
队列研究
一组人
前进
时间轴
暴露
结局
5
专业资料,仅供医药卫生专业人士参考
前瞻性 现在
队列研究
一组人
前进
回顾性 现在
暴露
6
时间轴
因→果
专业资料,仅供医药卫生专业人士参考
结局
队列研究 可以回答哪些问题?
• 疾病(事件)的发生情况:发生率
• 疾病(状态)的流行或分布:百分数
• 较队列研究更难控制 • 可用的方法
– 配对 – 尽可能收集风险因素 – 使用客观测量结果 – 分析:分层、多因素分析
• 承认其存在以及研究的局限性
32
专业资料,仅供医药卫生专业人士参考
• 研究问题:
– MKK4基因多态性与结直肠癌的相关性
• 研究设计:
– 病例对照
33
专业资料,仅供医药卫生专业人士参考
2
专业资料,仅供医药卫生专业人士参考
前瞻性 vs.回顾性
• 时间顺序性
– 研究问题 vs. 数据收集 – 暴露因素 vs. 研究结局
• 数据的分析永远是回顾性的 • 数据的产生永远是前瞻性的
3
专业资料,仅供医药卫生专业人士参考
常见的回顾性研究设计
• 一般为观察性研究 • 回顾性队列研究(因 → 果) • 病例对照研究( 果 → 因) • 横断面研究
• 确定研究人群
– 在哪个人群切?
• 确定数据收集/产生时间
– 在什么时候切?
• 结局与暴露的测量
– 数据收集
39
专业资料,仅供医药卫生专业人士参考
数据收集/产生时间
• 日历时间(calendar time)
– X年X月-X年X月
• 事件时间(event time)
– 就诊、诊断、治疗、死亡…
40
② Independent Variable: 自变量(治疗方案)
②③
使用的检 验方法
③ Nature of Depend Variable
– Interval – Normal – Ordinal – Categorical
47
四种统计 软件的操
作方法
回归分析
• 根据研究设计和因变量(结果变量)种类 选择回归分析方法
– 生存分析(Cox回归):time-to-event变量 – Logistic回归:0,1结果变量 – 线性回归:连续性结果变量 – Poisson回归:非负的计数性结果变量
• 单变量 vs. 多变量
48
单因素与多因素分析
• 单因素分析:
– Y=α+βX1 – 生存状态=α+β*治疗方案 – 粗估,未考虑其他因素对Y的影响
病例 对照
暴露
4
病例
2
对照
非暴露
2
4
OR=
25
专业资料,仅供医药卫生专业人士参考
病例对照研究 可以回答哪些问题?
• 疾病或状态的影响因素(比较性问题)
– 保护因素 – 风险因素 – 唯一的产出:OR
26
专业资料,仅供医药卫生专业人士参考
病例对照研究的设计要素
• 确定研究问题 • 确定研究人群
– 病例的选择 – 对照的选择
– 暴露或者风险发生的起点
– 过去的某个时间点
• 终点:
– 事件发生 – 失访或脱落
过去的某个时间点
– 研究结束
现在 or 过去的某 个时间点
9
专业资料,仅供医药卫生专业人士参考
确定研究人群
• 目标人群 • 源人群 • 研究人群
从研究起点(过去)进行选择
10
专业资料,仅供医药卫生专业人士参考
确定暴露状态
– 减少了样本量,降低研究的效力 – 造成选择性偏倚
• 应对措施
– 补充数据,减少失访造成的信息缺失 – 接受现实、评估可能的影响、谨慎解读结果
19
专业资料,仅供医药卫生专业人士参考
病例对照研究
• 研究结局(果) → 暴露状态(因)
– Step 1: 根据结局确定“病例”与“对照” – Step 2: 确定各自的暴露状态 – Step 3: 计算
• 临床意义
– 风险因素
“All models are wrong, but some are useful”
50
总结
• 根据研究问题选择研究设计 • 是否需要前瞻性的收集数据(数据积累) • 省时高效 • 正确认识回顾性研究的局限性
51
专业资料,仅供医药卫生专业人士参考
Doing now what patients need next