Meta分析中效应尺度指标的选择_文进
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 1 暴露与疾病关系的四格表 Fourfold table for data analysis between exposure and disease E E (暴露/ exposure) (非暴露/ un-exposure) D (疾病/ disease) D (非疾病/ nondisease) a c a+c b d b+d a+b c+d
Table 1
Chin J Evid-based Med, 2007, Vol.7( 8 ) www.cjebm.org.cn
a/(a+b) a 病例中暴露的比值 病例组暴 = = = 露的比值 病例中非暴露的比值 b/(a+b) b c/(c+d) c 对照中暴露的比值 对照组暴 = = = 露的比值 对照中非暴露的比值 d/(c+d) d 暴露比值比 = 病例暴露的比值 对照暴露的比值 = ORE = a/b c/d = ad bc
606
非暴露 (非干预) 组发病的比值 = 发病比值比 = OR1 = p1 / p2
b/(b+d) b p2 = = 1-p2 d/(b+d) d = ad bc
1-p1 1-p2
1.1.2 暴露比值比 (exposure odds ratio) 病例对照 研究不能得到发病比值比, 只能得到暴露比值比。
6Leabharlann Baidu7
需要注意的是, 只有队列研究和随机对照试验 结果可以直接获得相对危险度。 1.3 RD RD(risk difference)即危险差, 也被称为归因 危险度 (attributable risk, AR) 、 绝对风险差 (absolute risk difference)和 绝 对 风 险 降 低 率 (absolute risk reduction, ARR) , 是指干预 (暴露) 组和对照组结局 事件发生概率的绝对差值。例如, 感染某种疾病的 风险在干预组为 10%, 对照组是 15%, 则研究的 RD 为 -5%。 RD 反映了暴露 (干预) 组中净由暴露 (干预) 因素所致的发病水平 (从暴露组角度考虑) 。RD=0 表示比较组间没有差异。 当研究结局为不利事件时, RD<0 表示干预可降低结局风险。 通常只有队列研究和随机对照试验结果可以计 算 RD。 1.4 WMD WMD(weighted mean difference)即加权均数 差, 用于 Meta 分析中所有研究具有相同连续性结 局变量 (如体重) 和测量单位时。计算 WMD 时, 需 要知道每个原始研究的均数、 标准差和样本量。每 个原始研究均数差的权重 (例如每个研究对 Meta 分析合并统计量的影响大小) 由其效应估计的精确
性决定。Cochrane 协作网的 RevMan 统计软件设定 计算 WMD 的权重为方差的倒数。 1.5 SMD SMD(standardized mean difference)即标准化 均数差, 为两组估计均数差值除以平均标准差而得。 由于消除了量纲的影响, 因而结果可以被合并。 风险 (risk) 是观察对象中发生研究事件的人数 与总的观察人数之比, 而比值 (odds) 是观察对象中 发生研究事件人数与未发生研究事件人数之比。例 如, 24 人去滑雪, 其中 6 人跌倒, 那么跌倒的风险为 6/24=0.25=25%, 跌倒的比值为 6/18=1/3=0.33。
中国循证医学杂志 2007 年第 7 卷第 8 期 www.cjebm.org.cn
实 践 与 交 流
为二分类或连续性变量进行 Meta 分析。 2.1.3 效应尺度指标的特性 [2] 2.1.3.1 一致性 (consistency) 一致性主要是指合 并统计量值与所有纳入原始研究或亚组人群效应值 的相似性。关注一致性主要是因为各个原始研究纳 入人群的基线风险常常存在差异, 选择一致性较好 的合并统计量有利于 Meta 分析结果的推广性。 通常相对效应指标比绝对效应指标的一致性 好。 因 此, 可 以 认 为 SMD 的 一 致 性 比 WMD 好, OR 和 RR 的一致性比 RD 好。而且, OR 和 RR 在 一致性方面差别不大。一般不推荐使用基于特定情 况下才最具一致性的效应尺度指标。 例如, 某研究试验组和对照组的 A 事件率分别 是 20%和 10%, 另一相同研究试验组和对照组 A 事 件率分别是 10%和 5%。选择相对效应指标 RR, 则 两个原始研究的 RR 值均为 2; 若选择绝对效应指 标 RD, 则一个研究 RD 为 10%, 另一个为 5%。 如此, 当进行 Meta 分析时, 选择合并统计量为 RR 时可 能异质性检验提示同质性好, 而选择合并统计量为 RD 时则很可能提示原始研究间统计异质性较大。 2.1.3.2 数学特性 (mathematical properties) 最重 要的数学特性就是可靠方差估计值的可得性。研究 表明, 常用的分类变量效应尺度指标中, OR 的数学 特性最好。连续性变量一般都能对方差进行较好的 估计, 故 WMD 与 SMD 的数学特性相近。 数学特性是进行 Meta 分析时需要考虑的因素 之一。例如需治疗人数 (NNT) 虽然非常容易被理 解, 受到临床医生的欢迎, 但由于其没有一个简单的
暴露 (干预) 组发病的比值 = p1 1-p1 = a/(a+c) c/(a+c) = a c
1 基本概念 Practice and Communication
研究中常用的效应尺度指标包括结局为分类 变 量 时 的 odds ratio(OR) 、 relative risk(RR)和 risk difference(RD) , 以及结局为连续性变量时的 weighted mean difference(WMD) 和 standardized mean difference(SMD) 。下面对这些基本概念进行 简要介绍。 1.1 OR OR 即比值比或优势比, 是测量疾病与暴露联 系强度的一个重要指标。是某组中某事件的比值与 另一组内该事件的比值之比。OR=1 表示比较组间 没有差异。当研究结局为不利事件时, OR<1 表示 暴露可能会降低结局风险。 比值 (Odds) : 是某事件发生可能性的一种表示 方式, 为一个样本中发生某事件的人数与没有发生 某事件的人数之比。例如, 在一个 100 人的样本中,
20 人死亡, 80 人存活, 则这个样本中发生死亡的比 值为 20/80=1/4 或 0.25。比值也可以定义为某事件 发生的概率与不发生的概率之比, 即 P/(1-P), 这里 P 表示某事件发生的概率。 表 1 为常见的研究暴露 (干预)与疾病关系时 候的资料总结表。 根据流行病学不同的研究设计类型, 可以获得 以下三种比值比。 1.1.1 发病比值比 (incidence odds ratio) 对于队 列研究或随机对照试验而言, 可以获得发病比值比, 其计算如下:
Meta分析中效应尺度指标的选择
文 进 李幼平*
摘 要
Meta 分析中效应尺度指标的选择对其结果的解释和应用非常重要。本文 首先简要介绍了常见的几种 Meta 分析合并统计量的基本概念。Meta 分析中选 择合并统计量常需要考虑以下因素: 流行病学设计类型, 资料 (数据) 类型, 效应 一致性, 数学特性和可解释性。对连续性变量, 当对同一干预措施效应的测量方 法或单位完全相同时, 宜选择 WMD; 当对同一干预措施效应采用不同的测量方 法或单位, 或不同研究间均数差异过大时, 宜选择 SMD 作为合并统计量。对二 分类变量, 随机对照试验的 Meta 分析推荐首选 RR 为合并统计量。当干预 (暴 露) 组和对照组的事件发生率均非常低时, 可以采用 OR 估计 RR。Meta 分析中 无一个可应用于所有情形的最佳合并统计量。 中国循证医学杂志 , 2007, 7(8): 606-613.
1.1.3
患病比值比 (prevalence odds ratio) 对横断
面研究而言, 既不能获得发病比值比, 也不能得到暴 露比值比。横断面研究可以获得患病比值比。
患病比值比 = ORP = a/c b/d = ad bc
由于横断面研究的因果论证强度非常低, 因此 在使用和解释患病比值比时务必谨慎。 1.2 RR RR 是 rate ratio 或 risk ratio 或 relative risk 的缩 写, 国内翻译为 “ 相对危险度 ”, 其意义为两组的事 件率之比。RR 是反映暴露 (干预) 与事件关联强度 的最有用的指标。RR=1 表示比较组间没有差异。 当研究结局为不利事件时, RR<1 表示干预可降低 结局风险。
从专业上对其结果进行解释。对二分类变量而言, OR 是最不容易被理解和使用的合并统计量。许多 Meta 分析采用 OR 为合并统计量, 但被错误解释为 RR。因此从可解释性出发, RR 和 RD 比 OR 好。 表 2 列出了二分类变量效应尺度指标的重要特 性。 2.1.4 专业相关因素 主要是从专业角度分析临床 异质性大小、 基线风险差异大小和数据表述在不同 研究间有无差异等, 这些因素也可能影响合并统计 量的选择。 2.2 Meta分析中各种效应尺度指标的选择 从上述效应尺度指标选择时需要考虑的因素分 析中可以知道, Meta 分析中没有一个可以应用于所 有情形的最佳合并统计量。每个合并统计量的不同 特质有时是矛盾的, 例如绝对效应指标很容易被解 释, 但可推广性受限。选择合并统计量时, 常常需要 综合考虑各种因素。 2.2.1 连续性变量合并统计量的选择 当对同一干
RR = a a+c / b b+d = p1 p2
2 Meta分析中效应尺度指标的选择
2.1 Meta分析中效应尺度指标选择需要考虑的因素 2.1.1 流行病学研究设计类型 前瞻性研究 (队列 研究和随机对照试验) 可以计算相对危险度和发病 比值比; 病例对照研究不能直接获取相对危险度, 只能计算暴露比值比; 横断面研究可以计算患病比 值比。 2.1.2 数据类型与效应尺度指标 [1] Meta 分析中 的数据类型有以下几类: ① 二分类变量: 可计算相对危险度、 风险差或 比值比。 ② 连续性变量: 可以计算加权均数差或标准化 均数差。 ③ 等级变量: 由于方法学上某些局限性, 该类 资料在等级较少时一般转化为二分类变量, 在等级 较多时可以视为连续性变量处理。 ④ 计算个体事件 (重复)发生的次数而获得 的计数和率: 当获得的频数为小概率事件时, 类似 Poisson 数据, 此时如果有详细的人时记录, 可以获 得发病密度 (率) , 可计算 RR 或 RD; 当频数为非小 概率事件时, 可将计数当作连续性变量处理。 ⑤ 时间事件 (生存) 数据 (time-to-event/survival data) : 某些时候 (如某个时点上所有患者的情况都 清楚) 当作二分类变量处理, 此时可以采用 RR、 RD 或 OR 等效应指标。但最适合时间事件数据分析的 方法是通过危险比 (hazard ratio, HR)来表示干预 效应的生存分析。Hazard 和 Risk 在概念上相似, 细微的差别在于 Hazard 表述的是瞬时风险而且可 能随时间不断变化。HR 的解释也与 RR 类似。时 间事件数据的 Meta 分析通常需要有单个患者数据 (individual patient data, IPD) 才可以进行。 总之, 多数情况下, 不同类型的数据最终都转化
证据是循证医学的核心, 系统评价或 Meta 分 析是公认的最高级别证据。来自 Meta 分析的证据 总是通过一定的效应尺度 (effect size, ES; 或 effect magnitude, EM)指标来表示。但国内外杂志上发 表的 Meta 分析在选择效应尺度指标时常存在误用 指标或错误解释指标结果的情况。因此, 深刻理解 Meta 分析中各种常用效应尺度指标的意义, 对正 确选择效应指标、 理解和应用统计结果至关重要。 Meta 分析中使用的定量合成效应尺度指标, 也被称 为合并统计量 (summary statistic) 。
关键词 Meta 分析 合并统计量 效应尺度 作者单位 1. 四川大学华西医院 中国循证医学中心 ( 成都 610041) 第一作者简介 文进, 男 (1974 年~) , 流行病与卫生统 计学硕士, 循证医学在读博士, 以循证 决策和管理为主要研究方向。 Email: huaxiwenjin@163.com *通讯作者, Email: yzmylab@hotmail.com
Table 1
Chin J Evid-based Med, 2007, Vol.7( 8 ) www.cjebm.org.cn
a/(a+b) a 病例中暴露的比值 病例组暴 = = = 露的比值 病例中非暴露的比值 b/(a+b) b c/(c+d) c 对照中暴露的比值 对照组暴 = = = 露的比值 对照中非暴露的比值 d/(c+d) d 暴露比值比 = 病例暴露的比值 对照暴露的比值 = ORE = a/b c/d = ad bc
606
非暴露 (非干预) 组发病的比值 = 发病比值比 = OR1 = p1 / p2
b/(b+d) b p2 = = 1-p2 d/(b+d) d = ad bc
1-p1 1-p2
1.1.2 暴露比值比 (exposure odds ratio) 病例对照 研究不能得到发病比值比, 只能得到暴露比值比。
6Leabharlann Baidu7
需要注意的是, 只有队列研究和随机对照试验 结果可以直接获得相对危险度。 1.3 RD RD(risk difference)即危险差, 也被称为归因 危险度 (attributable risk, AR) 、 绝对风险差 (absolute risk difference)和 绝 对 风 险 降 低 率 (absolute risk reduction, ARR) , 是指干预 (暴露) 组和对照组结局 事件发生概率的绝对差值。例如, 感染某种疾病的 风险在干预组为 10%, 对照组是 15%, 则研究的 RD 为 -5%。 RD 反映了暴露 (干预) 组中净由暴露 (干预) 因素所致的发病水平 (从暴露组角度考虑) 。RD=0 表示比较组间没有差异。 当研究结局为不利事件时, RD<0 表示干预可降低结局风险。 通常只有队列研究和随机对照试验结果可以计 算 RD。 1.4 WMD WMD(weighted mean difference)即加权均数 差, 用于 Meta 分析中所有研究具有相同连续性结 局变量 (如体重) 和测量单位时。计算 WMD 时, 需 要知道每个原始研究的均数、 标准差和样本量。每 个原始研究均数差的权重 (例如每个研究对 Meta 分析合并统计量的影响大小) 由其效应估计的精确
性决定。Cochrane 协作网的 RevMan 统计软件设定 计算 WMD 的权重为方差的倒数。 1.5 SMD SMD(standardized mean difference)即标准化 均数差, 为两组估计均数差值除以平均标准差而得。 由于消除了量纲的影响, 因而结果可以被合并。 风险 (risk) 是观察对象中发生研究事件的人数 与总的观察人数之比, 而比值 (odds) 是观察对象中 发生研究事件人数与未发生研究事件人数之比。例 如, 24 人去滑雪, 其中 6 人跌倒, 那么跌倒的风险为 6/24=0.25=25%, 跌倒的比值为 6/18=1/3=0.33。
中国循证医学杂志 2007 年第 7 卷第 8 期 www.cjebm.org.cn
实 践 与 交 流
为二分类或连续性变量进行 Meta 分析。 2.1.3 效应尺度指标的特性 [2] 2.1.3.1 一致性 (consistency) 一致性主要是指合 并统计量值与所有纳入原始研究或亚组人群效应值 的相似性。关注一致性主要是因为各个原始研究纳 入人群的基线风险常常存在差异, 选择一致性较好 的合并统计量有利于 Meta 分析结果的推广性。 通常相对效应指标比绝对效应指标的一致性 好。 因 此, 可 以 认 为 SMD 的 一 致 性 比 WMD 好, OR 和 RR 的一致性比 RD 好。而且, OR 和 RR 在 一致性方面差别不大。一般不推荐使用基于特定情 况下才最具一致性的效应尺度指标。 例如, 某研究试验组和对照组的 A 事件率分别 是 20%和 10%, 另一相同研究试验组和对照组 A 事 件率分别是 10%和 5%。选择相对效应指标 RR, 则 两个原始研究的 RR 值均为 2; 若选择绝对效应指 标 RD, 则一个研究 RD 为 10%, 另一个为 5%。 如此, 当进行 Meta 分析时, 选择合并统计量为 RR 时可 能异质性检验提示同质性好, 而选择合并统计量为 RD 时则很可能提示原始研究间统计异质性较大。 2.1.3.2 数学特性 (mathematical properties) 最重 要的数学特性就是可靠方差估计值的可得性。研究 表明, 常用的分类变量效应尺度指标中, OR 的数学 特性最好。连续性变量一般都能对方差进行较好的 估计, 故 WMD 与 SMD 的数学特性相近。 数学特性是进行 Meta 分析时需要考虑的因素 之一。例如需治疗人数 (NNT) 虽然非常容易被理 解, 受到临床医生的欢迎, 但由于其没有一个简单的
暴露 (干预) 组发病的比值 = p1 1-p1 = a/(a+c) c/(a+c) = a c
1 基本概念 Practice and Communication
研究中常用的效应尺度指标包括结局为分类 变 量 时 的 odds ratio(OR) 、 relative risk(RR)和 risk difference(RD) , 以及结局为连续性变量时的 weighted mean difference(WMD) 和 standardized mean difference(SMD) 。下面对这些基本概念进行 简要介绍。 1.1 OR OR 即比值比或优势比, 是测量疾病与暴露联 系强度的一个重要指标。是某组中某事件的比值与 另一组内该事件的比值之比。OR=1 表示比较组间 没有差异。当研究结局为不利事件时, OR<1 表示 暴露可能会降低结局风险。 比值 (Odds) : 是某事件发生可能性的一种表示 方式, 为一个样本中发生某事件的人数与没有发生 某事件的人数之比。例如, 在一个 100 人的样本中,
20 人死亡, 80 人存活, 则这个样本中发生死亡的比 值为 20/80=1/4 或 0.25。比值也可以定义为某事件 发生的概率与不发生的概率之比, 即 P/(1-P), 这里 P 表示某事件发生的概率。 表 1 为常见的研究暴露 (干预)与疾病关系时 候的资料总结表。 根据流行病学不同的研究设计类型, 可以获得 以下三种比值比。 1.1.1 发病比值比 (incidence odds ratio) 对于队 列研究或随机对照试验而言, 可以获得发病比值比, 其计算如下:
Meta分析中效应尺度指标的选择
文 进 李幼平*
摘 要
Meta 分析中效应尺度指标的选择对其结果的解释和应用非常重要。本文 首先简要介绍了常见的几种 Meta 分析合并统计量的基本概念。Meta 分析中选 择合并统计量常需要考虑以下因素: 流行病学设计类型, 资料 (数据) 类型, 效应 一致性, 数学特性和可解释性。对连续性变量, 当对同一干预措施效应的测量方 法或单位完全相同时, 宜选择 WMD; 当对同一干预措施效应采用不同的测量方 法或单位, 或不同研究间均数差异过大时, 宜选择 SMD 作为合并统计量。对二 分类变量, 随机对照试验的 Meta 分析推荐首选 RR 为合并统计量。当干预 (暴 露) 组和对照组的事件发生率均非常低时, 可以采用 OR 估计 RR。Meta 分析中 无一个可应用于所有情形的最佳合并统计量。 中国循证医学杂志 , 2007, 7(8): 606-613.
1.1.3
患病比值比 (prevalence odds ratio) 对横断
面研究而言, 既不能获得发病比值比, 也不能得到暴 露比值比。横断面研究可以获得患病比值比。
患病比值比 = ORP = a/c b/d = ad bc
由于横断面研究的因果论证强度非常低, 因此 在使用和解释患病比值比时务必谨慎。 1.2 RR RR 是 rate ratio 或 risk ratio 或 relative risk 的缩 写, 国内翻译为 “ 相对危险度 ”, 其意义为两组的事 件率之比。RR 是反映暴露 (干预) 与事件关联强度 的最有用的指标。RR=1 表示比较组间没有差异。 当研究结局为不利事件时, RR<1 表示干预可降低 结局风险。
从专业上对其结果进行解释。对二分类变量而言, OR 是最不容易被理解和使用的合并统计量。许多 Meta 分析采用 OR 为合并统计量, 但被错误解释为 RR。因此从可解释性出发, RR 和 RD 比 OR 好。 表 2 列出了二分类变量效应尺度指标的重要特 性。 2.1.4 专业相关因素 主要是从专业角度分析临床 异质性大小、 基线风险差异大小和数据表述在不同 研究间有无差异等, 这些因素也可能影响合并统计 量的选择。 2.2 Meta分析中各种效应尺度指标的选择 从上述效应尺度指标选择时需要考虑的因素分 析中可以知道, Meta 分析中没有一个可以应用于所 有情形的最佳合并统计量。每个合并统计量的不同 特质有时是矛盾的, 例如绝对效应指标很容易被解 释, 但可推广性受限。选择合并统计量时, 常常需要 综合考虑各种因素。 2.2.1 连续性变量合并统计量的选择 当对同一干
RR = a a+c / b b+d = p1 p2
2 Meta分析中效应尺度指标的选择
2.1 Meta分析中效应尺度指标选择需要考虑的因素 2.1.1 流行病学研究设计类型 前瞻性研究 (队列 研究和随机对照试验) 可以计算相对危险度和发病 比值比; 病例对照研究不能直接获取相对危险度, 只能计算暴露比值比; 横断面研究可以计算患病比 值比。 2.1.2 数据类型与效应尺度指标 [1] Meta 分析中 的数据类型有以下几类: ① 二分类变量: 可计算相对危险度、 风险差或 比值比。 ② 连续性变量: 可以计算加权均数差或标准化 均数差。 ③ 等级变量: 由于方法学上某些局限性, 该类 资料在等级较少时一般转化为二分类变量, 在等级 较多时可以视为连续性变量处理。 ④ 计算个体事件 (重复)发生的次数而获得 的计数和率: 当获得的频数为小概率事件时, 类似 Poisson 数据, 此时如果有详细的人时记录, 可以获 得发病密度 (率) , 可计算 RR 或 RD; 当频数为非小 概率事件时, 可将计数当作连续性变量处理。 ⑤ 时间事件 (生存) 数据 (time-to-event/survival data) : 某些时候 (如某个时点上所有患者的情况都 清楚) 当作二分类变量处理, 此时可以采用 RR、 RD 或 OR 等效应指标。但最适合时间事件数据分析的 方法是通过危险比 (hazard ratio, HR)来表示干预 效应的生存分析。Hazard 和 Risk 在概念上相似, 细微的差别在于 Hazard 表述的是瞬时风险而且可 能随时间不断变化。HR 的解释也与 RR 类似。时 间事件数据的 Meta 分析通常需要有单个患者数据 (individual patient data, IPD) 才可以进行。 总之, 多数情况下, 不同类型的数据最终都转化
证据是循证医学的核心, 系统评价或 Meta 分 析是公认的最高级别证据。来自 Meta 分析的证据 总是通过一定的效应尺度 (effect size, ES; 或 effect magnitude, EM)指标来表示。但国内外杂志上发 表的 Meta 分析在选择效应尺度指标时常存在误用 指标或错误解释指标结果的情况。因此, 深刻理解 Meta 分析中各种常用效应尺度指标的意义, 对正 确选择效应指标、 理解和应用统计结果至关重要。 Meta 分析中使用的定量合成效应尺度指标, 也被称 为合并统计量 (summary statistic) 。
关键词 Meta 分析 合并统计量 效应尺度 作者单位 1. 四川大学华西医院 中国循证医学中心 ( 成都 610041) 第一作者简介 文进, 男 (1974 年~) , 流行病与卫生统 计学硕士, 循证医学在读博士, 以循证 决策和管理为主要研究方向。 Email: huaxiwenjin@163.com *通讯作者, Email: yzmylab@hotmail.com