率的Meta分析及软件实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
率的Meta分析及软件实现
周 波1,2 陈 欣1,2 时景璞1,2* 付凌雨1,2 王海龙1,2 吴晓梅1,2
1. 中国医科大学附属第一医院临床流行病学与循证医学教研室(沈阳 110001);
2. 辽宁省循证医学中心(沈阳 110001)
摘要 目前对于效应量为率的同类研究进行Meta 分析的研究很多,但相关方法的研究较少。
因此,本文概括性介绍了率的Meta 分析的适用条件、分析步骤及常用软件的实现过程,并通过应用实例中的数据比较常用的R 软件、Comprehensive Meta-Analysis 、Stata 和MetaAnalyst 的不同操作过程。
率的Meta 分析难点在于判断能否进行率的合并,对如何处理不同研究结果间异质性的问题尚需进一步探讨。
关键词 率;Meta 分析;异质性
Meta-Analysis of Rates and Software Implementation
ZHOU Bo 1,2, CHEN Xin 1,2, SHI Jing-pu 1,2*, FU Ling-yu 1,2, WANG Hai-long 1,2, WU Xiao-mei 1,2
1. Department of Clinical Epidemiology and Evidence-based Medicine, First Affiliated Hospital, China Medical University, Shenyang 110001, China;
2. Evidence-based Medicine Center of Liaoning Province, Shenyang 110001, China
Abstract Many meta-analysis studies evaluate rates as parameter to assess the overall estimate of effects. However, none of these studies address systematic approaches for the meta-analysis of rates. This paper outlines the conditions, analysis and software operation procedures for the meta-analysis of rates. It also compares different operation procedures of three types of commonly-used R software (Comprehensive Meta-Analysis, Stata and MetaAnalyst) through real appli-cation examples. The biggest challenge for the meta-analysis of rates is to determine whether rates can be pooled, and how to evaluate heterogeneity between studies’ outcomes needs further discussion.
Key words Rate; Meta-analysis; Heterogeneity
DOI : 10.7507/1672-2531.20140166作者简介:周波,女(1978年~),博士,讲师,以心血管流行病学与循证医学为主要研究方向。
Email: ripple_zhou@ * 通讯作者,Email: sjp56@
目前,应用Meta 分析的方法将以往的研究结果进行定量合并在临床医学研究领域越来越受重视,如2013年PubMed 收录的关于Meta 分析的文章就达5 200余篇。
通过Meta 分析,可达到为同类研究增大样本量,提高检验效能的目的 [1]。
所以其结果作为高质量证据,也正在被广大临床医生接受并应用于临床实践。
随着方法学的不断发展,临床研究中Meta 分析的种类也逐渐多样化,由原来的局限于治疗性研究的随机对照试验的Meta 分析,扩展到诊断性试验的Meta 分析、队列研究的Meta 分析和病例-对照研究的Meta 分析等。
近几年,国内外期刊有关率的Meta 分析论文开始出现 [2-5]。
率或比值,在临床医学中应用非常广泛,可用于描述疾病的分布频率,干预措施的治疗效果及不良反应的程度,诊断试验的准确性,疾病的预后等。
率具有直观、便于比较的优势,但由于不同研究间质量
参差不齐,样本来源、样本量大小不一,使很多同类率的结果差别很大。
因此,可考虑通过率的Meta 分析方法,对于多个研究的同类率指标进行定量合并,以期得到更为可靠的结论。
本文旨在阐述率的Meta 分析过程及常用率的Meta 分析软件实现过程。
1 适用条件
率的Meta 分析可用于各种率或比的综合分析。
例如:在描述疾病分布的研究中,可进行特定人群中高血压、心脑血管事件、恶性肿瘤、急性传染病等的发病率、患病率、死亡率、病死率、知晓率和控制率等的Meta 分析,还可对描述疾病本身不同临床亚型、病理分型、症状和体征等的比例进行Meta 分析,也可对用于反映某项干预措施的效果或不良反应的治愈率、缓解率、复发率和发生率等进行Meta 分析,或对反映诊断试验准确性的灵敏度、特异度、预测值和似然比等进行Meta 分析。
2 分析步骤
2.1提出问题,明确研究目的
提出问题是Meta分析的首要环节,需临床专业等相关知识基础。
在进行率的Meta分析时,构建问题同样需要遵循PICOS原则 [6]。
P:指代患者及参与者,还指代疾病;
I:指代干预,还指代暴露;
C:指代对照或者比较;
O:指代结局或者结果;
S:一般指代研究设计类型。
值得注意的是,在进行率的Meta分析时,这5个要素中,常常有1个或2个要素是缺如的。
如:在反映干预措施效果时,对于设立对照的研究,仅能选择其中1组的率进行汇总;在进行疾病分布等描述时,相关原始研究多数为观察性研究,无干预措施,且横断面研究、病例系列等研究类型,也未设立对照组。
问题提出后,应全面了解其背景知识,掌握国内外研究现状,同时为避免重复,应检索是否有类似系统评价或Meta分析发表。
2.2 制定检索策略,收集相关研究
确定研究问题后,需系统、全面地收集相关文献。
为提高文献的查全率、查准率,保证Meta分析质量,则需制定合理的检索策略,通过多种途径、多种语言收集文献。
目前,很多数据库和网站均有自己特定的检索策略,以帮助研究者最大程度上检索到所需文献。
如BMJ集团的《Clinical Evidence》,其采用的检索策略由BMJ证据中心的信息专家制定,经评价验证可用于检索到那些符合方法学要求的研究。
此外,EMbase数据库还根据不同研究内容制订了相应的检索策略,也是优秀的检索策略代表。
2.2.1电子检索①首先选择和确定数据库。
可获得率的原始研究的英文数据库主要包括MED-LINE、EMbase、Web of Science和Ovid等;中文数据库主要包括WanFang Data、CBM、CNKI和VIP 等。
②其次制定检索式和检索词。
检索式可由关注疾病、目标人群、暴露因素、某个(些)率的指标和研究类型(病例系列、横断面研究、队列研究、随机对照试验和诊断性试验等)组成。
检索词应采用MeSH词与自由词相结合的方式,且需注意,不同部分检索词间用逻辑符“AND”连接,各部分多个同义词间,应以逻辑符“OR”连接。
此外,还有一些其他运算符,如“WITH”、“NEAR”和“NOT”等,可帮助提高查准率。
2.2.2 手工检索手工检索是电子检索的补充。
尤其是中文期刊中有很多杂志尚未被电子数据库收
录,则需通过手工检索进行补充。
还有一些在研研究、会议论文等尚未公开发表,也需进行手工检索获得。
2.2.3追溯参考文献在进行文献检索时要特别重视参考文献的追溯。
某些情况下,由于检索词或检索策略设置不完善,可通过参考文献进行补充,以获得更全的文献信息。
2.3 文献筛选
根据事先拟定的纳入和排除标准,在收集的文献中,检出能够回答研究问题的文献资料。
由2位研究者通过阅读文题、摘要和全文独立进行文献筛选,如遇分歧则与第三人协商解决,并记录排除的研究及其排除原因。
常用的选择标准如:①原始研究设计类型(横断面研究、队列研究等);②同一人群相关频率指标时效性的规定;③研究人群范围局部与整体的关系;④重复报道的数据的定义;⑤可根据研究目的确定是否排除特定群体的研究(如老年人、青少年等)。
此外,关于研究疾病的诊断标准、暴露因素的暴露水平等均应有严格统一的标准,并在文中标明。
2.4 纳入研究的质量评价
Meta分析质量受纳入的原始研究质量、评价的方法、评价者的知识水平及观点的影响。
若Meta 分析纳入的原始研究质量低,且未对原始研究的质量进行正确评价,就会直接影响系统评价或Meta 分析的结论准确性和临床应用 [7]。
因此,可以说,对Meta分析纳入的原始研究质量进行严格评价是系统评价或Meta分析最重要的组成部分。
质量评价包括评价纳入研究的方法学质量及报告质量。
原始研究质量评价工具主要根据研究设计、实施、结果分析整个过程中可能出现偏倚的各个因素确定。
目前已有多个评价工具,包括单个评价条目、清单和量表三种类型。
对于随机对照试验的方法学质量评价,可采用的评价工具包括Jadad量表 [8]、PEDro (物理治疗证据数据库)量表 [9]、Dephi清单 [10]、英国牛津循证医学中心文献严格评价项目CASP清单(critical appraisal skill program,CASP,2004) [11]及Cochrane手册推荐的“偏倚风险评估”工具 [7]等,而随机对照试验的报告质量可采用CONSORT声明来评价和解释 [12]。
非试验性研究(如队列研究和病例-对照研究)的方法学质量评价主要采用纽卡斯尔-渥太华量表(Newcastle-Ottawa Scale,NOS) [13]、CASP清单。
横断面研究质量评价目前尚无统一标准,其中有代表性的是美国卫生保健质量和研
究机构(Agency for Healthcare Research and Qual-ity,AHRQ)推荐的11条评价标准 [14]。
STROBE (strengthening the reporting of observational studies in epidemiology) [15]则用于规范流行病学观察性研究的报告格式,包括队列研究、病例-对照研究及横断面研究;诊断性试验中的相关率的指标较为特殊,可采用QUADAS(quality assessment for diag-nostic accuracy studies)质量评价标准 [16]。
具体这些评价工具内容可参考曾宪涛等 [17,18]的文章。
2.5 Meta分析
可用于率的Meta分析的常见软件包括R软件、Comprehensive Meta-Analysis、Stata、Meta-Analyst 等。
以下对其分别进行介绍。
2.5.1 R软件
(1)首先建立Excel表,录入原始研究名称(study)、事件发生数(event)及样本量(n),然后另存为CSV(逗号分隔)文件,放在R软件的起始文件夹中。
在R Console输入命令,利用read函数读入之前建立好的Excel数据集:
rate <-read.csv("rate.csv")
(2)然后加载“meta”程序包:点击“Packages”选项,下拉菜单点击“load package”,选择“meta”。
(3)利用metaprop函数计算各个独立研究的率及95%CI,并按照率的分布选择合适的估计方法,得到合并的率及其95%CI。
命令如下:
metarate <- metaprop(event,n, study,data=rate,sm="PRA W",incr=0.5,allincr=FALSE, addincr=FALSE,title="")
sm=“PRAW”,表示没有转换的原始率;
sm=“PLN”
,表示对数转换;sm=“PLOGIT”,表
示logit转换;sm=“PAS”,表示反正弦转换;sm=“PFT”,表示Freeman-Tukey双重反正弦转换。
incr=0.5表示当事件发生数为0时用0.5来替代。
allincr=TRUE表示至少有1个研究的事件发生数为0时,所有事件发生数都加上incr数值;为FALSE 时,只对事件发生数为0的研究加上incr数值。
addincr=TRUE表示无论是否有事件发生数为0的研究,所有研究都加上incr数值;为FALSE时,表示无论是否有事件发生数为0的研究,所有研究都不加上incr数值。
title=“”表示这次Meta分析的标题。
(4)绘制森林图,命令如下:
forest(metarate)
(5)查看数据合并后的率等相关数据,命令如下:
summary(metarate)
(6)查看漏斗图,命令如下:
funnel(metarate)
以《胆管癌肝移植有效性与安全性的Meta分析》一文 [19]的数据为例,应用R软件进行胆管癌原位肝移植1年有效生存率的Meta分析,数据录入见图1,命令输入见图2,结果分析森林图见图3。
结果与原文中结果一致。
2.5.2 Comprehensive Meta-Analysis Comprehen-sive Meta-Analysis软件可直接录入数据或者从其他软件中导入数据。
此外,该软件还可实现多种数据格式的录入,用于多种指标的Meta分析:①两个组、时间点或暴露(含相关),可以是二分类变量dichotomous(number of events)、连续性变量continuous(means)、相关系数correlation、以人年计算的率rates(events by person years)和生存时间survival(time to event);②一个时间点、一组数的均数、比例或者率的估计,可以是一组的二分类变量dichotomous(number of events)、连续性变量continuous(means)和以人年计算的率rates(events by person years);③普通的点估计,以原始尺度分析的数据;④对数尺度的普通点估计,以对数尺度分析的数据。
利用该软件进行率的合并选择第②种
图 1 数据录入Excel
就可以。
录入数据后,直接点击Run analyses进行分析即可。
仍以《胆管癌肝移植有效性与安全性的Meta 分析》一文 [19]的数据为例,应用Comprehensive Meta-Analysis软件进行胆管癌原位肝移植1年有效生存率的Meta分析。
数据录入见图4,结果分析森林图见图5。
结果与原文中结果一致。
2.5.3 Stata
图 2 R软件率的Meta分析命令
图 3 R软件率的Meta分析森林图
图 4 Comprehensive Meta-Analysis软件数据录入
(1)首先,在数据编辑窗口输入数据,设置变量名称,分别为研究的名称(study )、事件发生率(r )及样本量(n )。
(2)计算各样本率的标准误,在command 窗口输入命令:
generate ser=sqrt(r *(1-r)/n)
(3)进行Meta 分析,得到结果森林图,命令如下:
metan r ser, random label(namevar=study) 随机效应模型metan r ser, fixed label(namevar=study) 固定效应模型
(4)得到漏斗图,命令如下:
metafunnel r ser
仍以《胆管癌肝移植有效性与安全性的Meta 分析》一文 [19]的数据为例,应用Stata 软件进行胆管癌原位肝移植1年有效生存率的Meta 分析,数据录入见图6,结果分析森林图及漏斗图见图7、8。
结果与原文中结果一致。
2.5.4 MetaAnalyst 该软件与Comprehensive Meta-Analysis 软件类似,无须输入命令,操作简单。
以《胆管癌肝移植有效性与安全性的Meta 分析》一
文 [19]的数据为例,应用MetaAnalyst 软件进行胆管癌原位肝移植1年有效生存率的Meta 分析。
数据录入见图9,仅需录入研究的名称、年份、发生数和总数,其构成比及其下限和上限(图中黄色显示)会自动算出。
接下来即可进行率的Meta 分析,点击“Analysis ”-“New Analysis ”,出现的菜单见图10,先选择随机效应模型进行分析,结果森林图和漏斗图见图11、12。
结果与原文中结果一致。
2.6 异质性来源
率的指标来自众多不同的研究。
这些研究由于受研究者、研究对象、设计方案和研究实施等各种因素影响,其结果间通常存在很大异质性,尤其是非试验性研究,这种异质性就更为明显。
按异质性来源,一般可将异质性分为临床异质性和统计学异质性。
在率的Meta 分析中,临床异质性显得尤为突出,其中研究对象的来源,包括样本量的问题等均是导致异质性产生的主要原因。
关于率的Meta
分
图 5 Comprehensive Meta-Analysis
软件结果森林图
图 6 Stata 软件数据编辑
析异质性来源的探索和处理方法,尚无最新、一致的专家意见提出,目前均采用与其他类型的Meta 分析一致的方法。
3讨论
Meta分析作为一种统计学方法,从其产生至今一直备受关注,尤其在临床医学领域,更起到了关键作用。
很多原始研究由于样本量的问题、方法学的限制等原因,使针对同一个研究问题得到不同甚至相反的结果,而Meta分析要求最广泛、全面地收集原始研究并进行严格的质量评价,使纳入的原始研究在方法学质量和结果报告上均达到一定要求后进行定量合并,一定程度上弥补了原始研究的不足,增加了把握度,汇总后的总体效应估计值更具可信性。
采用Meta分析方法进行率的合并,在国内外发展时间很短,目前可实现率的合并的软件很多,如本文介绍的Stata、R、CMA、MetaAnalyst等。
不同软件的操作难易程度有所差异,其结果呈现形式亦不尽相同 [20-22],各有特色:R软件和Stata软件功能较全面,除可实现率的Meta分析外,还可行Meta 回归、累积Meta分析、敏感性分析、发表偏倚的统计检验、可信区间的合并等,但需进行编程;CMA 软件优势是无需编程,通过模块的运用即可完成相关功能,更灵活且易操作。
从本文实例分析结果可见,采用不同软件得出的合并后率的总体效应估计值及可信区间与原文均一致,因此,我们认为进行不同研究率的Meta分析合并,操作上可行。
需要特别注意的是,由于率的产生来源不同,不同研究结果间是否可进行率的合并是关键问题。
这需结合专业知识且充分探讨异质性来源后才能
图 7 Stata软件结果森林图图 8 Stata软件漏斗图
图 9 MetaAnalyst软件数据录入
图 10 MetaAnalyst软件Meta分析菜单
图 11 MetaAnalyst软件结果森林图
图 12 MetaAnalyst软件漏斗图
决定是否能够进行合并 [23]。
不同研究率的异质性往往很大,尤其是一些常见慢性病的患病率。
由于只考虑单组数据,大样本数据所得可信区间小,而小样本数据所得可信区间相对较大,这种差异直接导致I2和P值差异显著。
一定时期内符合纳入标准的文献越多,合并估计得到率的结果越准确。
时间范围越窄,研究地区范围越小,结果所代表的意义越大。
而对于有显著异质性的研究,可采用亚组分析、敏感性分析或Meta回归的方法对其异质性进行探讨,分析后如仍存在显著异质性,则不应继续进行合并,仅能进行定性分析。
参 考 文 献
1 Glass GV. Primary, secondary, and meta-analysis of research. Educ
Res, 1976, 5: 3.
2 Hussain N, Chien T, Hussain F, et al. Simultaneous versus staged bi-
lateral total knee arthroplasty: a meta-analysis evaluating mortality, peri-operative complications and infection rates. HSS J, 2013, 9(1): 50-59.
3 Jin YL, Ding LL, Yao YS, et al. Obesity detection rate among pri-
mary school students in the People's Republic of China: a meta-analysis. Ther Clin Risk Manag, 2013, 9: 383-390.
4 周煜, 李秀央, 陈坤, 等. 大气颗粒物与居民脑卒中发作或死亡之
间关系的Meta分析. 中华流行病学杂志, 2010, 31(11): 1300-1305. 5 邵晓丹, 张铁军, 何纳. 单纯疱疹病毒2型新发感染率及其危险因
素的Meta分析. 中华流行病学杂志, 2011, 32(2): 170-176.
6 曾宪涛, 孙竹, 汤红明. Meta分析系列之十: 合格标准的制定. 中国
循证心血管医学杂志, 2013, 2(5): 6-9.
7 Higgins JPT, Green S. Cochrane Handbook for Systematic Reviews
of Interventions Version 5.1.0. The Cochrane Collaboration. 2011 [2012-03-30]. Available at: .
8 Jadad AR1, Moore RA, Carroll D, et al. Assessing the quality of
reports of randomized clinical trials: is blinding necessary? Control Clin Trials, 1996, 17(1):1-12.
9 Centre for Evidence-Based Physiotherapy at The George Institute
for Global Health. Physiotherapy Evidence Database(PEDro). (1999-06-21) [2012-03-30]. Available at: .au/english/ downloads/pedro-scale.
10 Verhagen AP, de Vet HC, de Bie RA, et al. The Delphi list: a criteria
list for quality assessment of randomized clinical trials for conduct-ing systematic reviews developed by Delphi consensus. J Clin Epide-miol, 1998, 51(12): 1235-1241.
11 Ibbotson T, Grimshaw J, Grant A. Evaluation of a programme of
workshops for promoting the teaching of critical appraisal skills.
Med Educ, 1998, 32(5): 486-491.
12 Schulz KF, Altman DG, Moher D, CONSORT Group. CONSORT
2010 statement: updated guidelines for reporting parallel group ran-domised trials. Int J Surg, 2011, 9(8): 672-677.
13 Stang A. Critical evaluation of the Newcastle-Ottawa scale for the as-
sessment of the quality of nonrandomized studies in meta-analysis.
Eur J Epidemiol, 2010, 25(9): 603-605.
14 Rockville. Celiac Disease: Agency for Healthcare Research and
Quality(US); 2004. (Evidence Reports/Technology Assessments, No.104) Appendix D. Quality Assessment Forms. Available at: /books/NBK35156.
15 Vandenbroucke JP, von Elm E, Altman DG, et al. Strengthening the
Reporting of Observational Studies in Epidemiology(STROBE): ex-planation and elaboration. PLOS Med, 2007, 4(10): e297.
16 Whiting P, Rutjes AWS, Reitsma JB, 等. QUADAS的制定: 用于系
统评价中评价诊断性研究质量的工具. 中国循证医学杂志, 2007, 7(4): 296-306.
17 曾宪涛, 包翠萍, 曹世义, 等. Meta分析系列之三: 随机对照试验的
质量评价工具. 中国循证心血管医学杂志, 2012, 4(3): 183-185.
18 曾宪涛, 刘慧, 陈曦, 等. Meta分析系列之四: 观察性研究的质量评
价工具. 中国循证心血管医学杂志, 2012, 4(4): 297-299.
19 顾劲扬, 柏建岭, 施晓雷, 等. 胆管癌肝移植有效性与安全性的
Meta分析. 中华外科杂志, 2011, 49(4): 351-356.
20 Gao X, Cui Q, Shi X, et al. Prevalence and trend of hepatitis C virus
infection among blood donors in Chinese mainland: a systematic review and meta-analysis. BMC Infect Dis, 2011, 11: 88.
21 胡军, 刘锋, 吕征, 等. 同期与分期双膝关节置换术后死亡率的
Meta分析. 中华骨科杂志, 2011, 31(8): 852-858.
22 何倩, 王静, 朱玉, 等. 中国内地居民2000-2009年被动吸烟率Meta
分析. 中华流行病学杂志, 2011, 32(2): 159-163.
23 王丹, 翟俊霞, 牟振云, 等. Meta分析中的异质性及其处理方法. 中
国循证医学杂志, 2009, 9(10): 1115-1118.
收稿日期:2014–04–12 修回日期:2014–05–14
本文编辑:蒋茜、杜亮。