Meta分析及其应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Meta分析及其应⽤
概述
1976年英国教育⼼理学家G. V. Glass在教育学⽂献综述中⾸次命名Meta分析,并将其定义为:“The statistical analysis of large collection of analysis results from individual studies for the purpose of integrating the findings”。

Meta分析并⾮⼀种单纯的统计学⽅法,⽽是⼀个汇总多个同类研究结果,并对研究效应进⾏定量合并的分析研究过程,包括提出研究问题,收集相关⽂献、制定⽂献纳⼊和排除标准、提取⽂献信息、统计学处理和报告结果等,是⼀种定量的系统综述(systematic review)。

Meta分析最先在教育学和⼼理学领域应⽤,从80年代后期起,Meta分析⽂献⼤量涌现,并逐步引⼊中国。

近年来,随着循证医学的兴起和发展,在医学领域尤其是临床医学和公共卫⽣领域的应⽤⽇益⼴泛。

例如,1988年临床上对短暂性脑缺⾎发作患者是否能应⽤抗凝药预防中风存在很⼤争议,研究结果互相⽭盾,Meta分析分析结果表明,抗凝药能使脑⾎管病患者死于中风、⼼肌梗死的风险减少22%,这⼀结果使临床上对短暂性脑缺⾎发作患者使⽤抗凝药问题取得了公识。

在流⾏病学研究中,⼈们常发现⼀些关联强度较弱但⼜具有潜在重要公共卫⽣意义的危险因素,如被动吸烟与肺癌、⼝服避孕药与乳腺癌、饮咖啡与冠⼼病等。

例如,美国环保局根据19个病例对照研究结果,对⼥性被动吸烟与肺癌的关系进⾏Meta分析,结果表明,被动吸烟使⼥性患肺癌的风险增加42%,并据此结果将被动吸烟列为致癌物。

M e t a分析基本原理
假定从⼀个均数为1.5、标准差为0.7的正态总体中作随机抽样,样本含量分别为20、50、100、200、300、500、1000,不同样本含量均作20次抽样,共得140个样本。

现以样本均数为横坐标,样本含量为纵坐标作散点图,可见散点以样本含量较⼤的均数为轴,左右基本对称。

⽤⽅差分析对各样本所对应的总体均数是否相等作假设检验,结果表明140个样本所对应的总体均数相同。

因此,可⽤140个样本的信息来估计总体均数和标准差,结果µ=1.501,σ=0.699。

显然,这样做提⾼了估计的精度。

如各次抽样都是随机的,在这种理想状态下,⽤标准正态离差SND与精度P作散点图,则SND与精度P呈直线关系,且回归直线通过原点。

把不同研究者对同⼀问题所作的研究看作是从同⼀总体中随机抽取的样本。

如果都是按照相同的设计⽅案得到的研究结果,并且我们可以获得每⼀项研究的结果,则可根据上⾯的原理得到⼀个更为可靠的综合的结果。

因此,Meta分析⽅法可以定量估计研究效应的平均⽔平和提⾼统计学检验效能。

但问题通常并⾮如此简单,实际能够得到的资料可能存在各种偏性,例如发表偏性(publication bias)问题。

此时,再以样本均数为横坐标,样本含量为纵坐标作散点图,则图形不对称。

⽤SND与精度P作散点图,则回归直线不通过原点。

此时合并的结果存在较⼤偏性,甚⾄是没有意义的。

M e t a分析基本步骤
⼀、提出研究的问题
⼆、确定⽂献收集的⼊选标准和排除标准:⽬的是保证进⼊Meta分析的各个独⽴研究具有较好的同质性,应考虑设计类型、研究对象、暴露或⼲预措施、效应指标以及统计⽅法等
三、收集⽂献:包括检索途径、出版年限、⽂献类型、⽂献语种、使⽤的关键词等,应综合考虑检索结果的敏感性(查全率)和
五、对⼊选⽂献有关信息进⾏摘录和录⼊
六、根据资料类型计算各项研究的效应尺度(effect magnitude)及其⽅差。

所谓效应尺度,是指反映各个研究暴露或⼲预措施的效应⼤⼩的⽆量纲的统计量。

七、同质性检验
根据同质性检验结果选择相应的统计模型计算合并统计量。

⼀般原则是:同质采⽤固定效应模型,存在异质性则采⽤随机效应模型。

若存在异质性,还需进⼀步分析造成异质性的原因,并对异质性进⾏处理。

敏感性分析是评价Meta 分析结果可靠性和稳定性的常⽤⽅法,即在排除可能是异常结果的研究后,重新作Meta分析,与未排除异常结果研究的Meta分析结果进⾏⽐较,探讨被去除的研究对合并效应的影响。

Meta回归或其它混合模型是控制混杂因素和消除异质性的重要⽅法。

造成异质性的原因很多,各个研究在研究设计、研究实施和资料收集与分析等⽅⾯存在差异可导致异质性。

例如纳⼊和排除标准不⼀致,或各个研究的⼲预措施存在差异,或测量⽅式不同,或失访和缺失资料处理不同等。

⼋、偏性评价
Meta 分析本质上是⼀种观察性研究。

所谓偏性是指在资料收集、分析、解释、发表和综述时任何可能导致结论系统地偏离真实结果的情况。

如发表偏性、查找偏性、语⾔偏性、引⽤偏性、重复发表偏性等。

常⽤的评价⽅法是漏⽃图和直线回归⽅法。

漏⽃图是评价是否存在发表偏性的⽅法,其基本思想是:每个纳⼊研究的效应值的精度随该研究样本含量的增加⽽增加。

因此,以每个研究的效应尺度为横坐标,每个研究的样本含量为纵坐标作成散点图。

通过对漏⽃图对称性的观察,对偏性进⾏估计。

资料存在偏性,漏⽃图不对称,不对称越明显,偏性越⼤。

直线回归⽅法也可⽤来检验漏⽃图的对称性。

⽅法是先计算纳⼊Meta 分析的每个研究的标准正态离差(SND)和精度(Precision)。

设有k 个研究纳⼊Meta 分析,t i 和νi 为第i 个研究的效应尺度和⽅差,则
t SND =

1
P =
SND a b P
=+?
⼩样本研究精度低,在x轴上接近0,标准误⼤,则SND也较⼩,在y轴上也接近0,因⽽⼩样本研究所代表的散点在回归直线上应接近原点。

⼤样本研究精度⾼,SND较⼤。

理论上,如果不存在发表偏性,则回归直线的截距a等于0,这对应于对称的漏⽃图。

如果回归直线不经过原点,则a的⼤⼩代表了漏⽃图不对称的程度,a越⼤,不对称程度越⼤。

实际⼯作中,可计算a 及其95%可信区间或对a是否为0作假设检验,推断漏⽃图是否对称。

九、根据专业知识做出结论,绘制森林图(Forest Plot)
⼗、Meta分析的质量评价
研究设计是否合理、是否使⽤了恰当的统计学⽅法进⾏合并分析、是否进⾏了同质性检验、是否进⾏了敏感性分析、是否进⾏了偏性评价等。

实例分析
为研究Aspirin预防⼼肌梗塞(MI)的作⽤,美国不同机构在1976年-1988年间进⾏了7个关于Aspirin 预防⼼肌梗塞的研究。

以发⽣⼼肌梗塞后患者是否死亡为观察结局。

其中6次研究结果表明Aspirin组与安慰剂组的⼼肌梗塞后死亡率差别⽆统计意义,
研究编号
Aspirin组安慰剂组
RR 2P 观察
⼈数
死亡
⼈数
存活
⼈数
观察
⼈数
死亡
⼈数
存活
⼈数
1 615 49 566 624 67 557 0.74
2 2.800 0.094
2 758 44 714 771 64 707 0.699 3.628 0.057
3 832 102 730 850 126 72
4 0.827 2.359 0.125
4 317 32 28
5 309 38 271 0.821 0.765 0.382
5 810 85 725 40
6 52 354 0.819 1.449 0.229
6 226
7 246 2021 2257 219 203
8 1.118 1.617 0.204
7 8587 1570 7017 8600 1720 6880 0.914 8.180 0.004
1.计算各研究的效应尺度、⽅差及权重服⽤Aspirin 预防⼼肌梗塞后死亡的研究结果死亡未死亡合计 Aspirin 组 a b n 1 安慰剂组 c d n 2 合计 a+c
b+d
N
效应尺度lnRR 为:
1
2
效应尺度lnRR 的⽅差为:
ln 2
1
21111
R R S a
n c
n =
-
+
-
权重为:
ln 2
1
RR W S =
第1项研究的效应尺度:
12/49/615
ln ln ln(
)ln 0.74200.2983/67/624a n RR c n ??====- 第1项研究的效应尺度⽅差:
ln 2
1
2
111111110.0321
49
615
67
624
R R S a
n c
n =
-
+
+
-
=
第1项研究的权重:
ln 2
1131.1478
0.0321
RR
W S =
=
=
7项研究结果的效应尺度、⽅差和权重研究编号
效应尺度d ln RR ⽅差
ln 2
RR S
权重W 1 / ln 2
RR
S
1 -0.2983 0.0321 31.1478
2 -0.3577 0.0357 27.9830
3 -0.1899 0.015
4 65.095
5 4 -0.1974 0.0512 19.5408 5 -0.1993 0.0273 36.6329
6 0.1118 0.007
7 129.0810 7 -0.0897
0.0010
1014.6064
2.同质性检验
H 0:各研究的效应尺度相等 H 1:各研究的效应尺度不相等α = 0.10
计算统计量Q
()2
i i i i i
i
W d Q W d d W d
W
=
-=
-
∑∑∑∑ 1K ν=-
Q 服从⾃由度为K -1的χ2分布,其中,d i 为第i 项研究的效应尺度,d 为效应尺度的均数,i W 为第i 项研究的权重。

2
()i Q W d d =
-∑= 9.9285,ν = 6,P = 0.1277。

可以认为7个研究结果的效应尺度是同质的,因此选⽤固定效应模型计算合并效应量。

3.计算合并的效应尺度及其⽅差计算固定效应模型的合并效应尺度:
i i
i
W d d W
=
∑∑= - 0.09
计算固定效应模型合并效应尺度的⽅差:
2
1
d
i
S
W
=
∑= 1
0.00081324.0875 =
计算合并效应尺度d 的可信区间:
d S t d 6,2/05.0± = - 0.0902 ± 2.4469 ? 0.0275 d 可信区间为(- 0.1574,- 0.0229)。

对d 及d 的可信区间进⾏反对数运算,合并的RR 及其可信区间为:
RR = 0.9137,可信区间为(0.8543, 0.9773)。

计算标准化正态离差SND与精度P,结果见下表。

7项研究结果的SND和Precision
研究编号SND Precision
1 -1.6651 5.5810
2 -1.8921 5.2899
3 -1.5322 8.0682
4 -0.8727 4.4205
5 -1.2061 6.0525
6 1.2706 11.3614
7 -2.8583 31.8529
以SND为应变量,精确度P为⾃变量作线性回归分析,回归⽅程为:
SND = - 0.731-0.0501P
常数项a的标准误为0.743,t = - 0.984,P = 0.370,尚不能认为资料存在偏性。

5.绘制森林图
以效应尺度为横坐标,绘制各研究的效应尺度及其可信区间。

竖线为⽆效线,横线为某研究95%可信区间上下线的连线,线条长短表⽰可信区间范围⼤⼩,线条中央点为效应尺度点估计。

若某研究95%可信区间线条横跨⽆效竖线,该研究结果⽆统计学意义,反之,该横线在⽆效竖线的左侧或右侧,该研究结果有统计学意义。

Grand Mean为7项研究按固定效应模型的汇总结果。

固定效应模型:
研究间变异由抽样误差所致,纳⼊Meta分析的各个独⽴研究来⾃相同的总体,各个独⽴研究的效应是效应合并值这⼀总体参数的估计值。

随机效应模型:
研究间变异不是由抽样误差所致,纳⼊Meta分析的各个独⽴研究来⾃不同的总体,即各个独⽴研究有其⾃⾝相应的总体参数。

换⾔之,“真实效应”在不同研究间确实存在差异,各个独⽴研究的效应是该“真实效应”的估计值,⽽Meta分析的效应合并值是多个不同总体参数的加权平均。

相关文档
最新文档