关于倾向评分配比法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于倾向评分配比法
【关键词】倾向评分配比法
配比(matching),或称匹配,是指选择某些特征上与处理组一致的对照,排除这些因素的混杂作用,从而凸显出研究因素的效应。
配比是控制混杂偏倚的常用方法。
配比又分为频数配比和个体配比。
频数配比(frequency matching)又称为成组配比,是指在选择对照时要求对照组某些重要混杂因素的分布与处理组总体一致。
比如研究某处理在人群中的效应时,如果处理组男性占30 %,则选择对照组时,男性也要占30 %。
个体配比(inpidual matching)是以个体为单位进行的匹配,即处理组的每一个个体与对照组1个或几个个体在某些特征(配比变量)相同。
如果1个处理组个体对应1个对照,则为1∶1配比,又称配对,这是个体配比研究最常见的形式。
如果1个处理对象配2个或2个以上对照,这为1∶m配比,如1∶2,1∶3。
一、倾向评分配比的概念
倾向评分配比(propensity score matching)就是利用倾向评分值从对照组中为处理组每个个体寻找1个或多个背景特征相同或相似的个体作为对照,最终两组的混杂变量也趋于均衡可比,属于一种个体配比的方法。
与传统的个体配比方法相比,倾向评分配比的优势是同时匹配许多混杂因素时不增加匹配的难度和效果。
传统的分层匹配的方法要根据每个变量取值分层后进行匹配,如果需要平衡的变量个数或水平较多,则分层数成倍增加,往往难以实现。
马氏配比是通过计算两个观察对象的马氏距离进行配比,随着配比维数的增加,不但运算量大大增加,而且马氏距离均值也增加,使配比效果下降[1]。
而倾向评分配比将所有的协变量综合为一个尺度变量,因此协变量个数增加并不增加配比的难度[2,3]。
尽管倾向评分配比能够同时平衡较多的变量,但其永远只局限于已知的混杂变量,而许多未知的混杂变量可能仍然会对最终的结果产生影响。
因此,其组间均衡性不可能完全达到随机对照研究的均衡性。
二、倾向评分配比的原理
目前利用倾向评分进行配比的具体方法较多,如:最邻配比法(nearest neighborhood matching)、与马氏矩阵配比法(Mahalanobis metric matching)、Radius配比法(Radius Matching)、Kernel配比法(Kernel Matching)和局部线性回归配比法(local linear regression matching)等[4]。
一些配比方法(如最邻配比法、与马氏配比结合法、Radius配比法)需要规定匹配精度以增加配比准确性。
本文主要介绍文献应用较多的最邻配比法和马氏矩阵配比法。
最邻配比法是从对照组中寻找出1个与处理组个体倾向评分值最相近的个体作为配比对象,是倾向评分配比最基本,也是最简单的一种形式[2,3]。
其具体
方法是:首先根据协变量计算倾向评分值,将处理组观察对象与对照组分开。
然后,将两组观察对象按照倾向评分值大小排序,从处理组中依次选出1个研究对象,从对照组中寻找倾向评分值与处理组对象最相近的1个对象作为配比个体。
如果对照组中同时有2个或2个以上倾向评分差值相同的个体,则按随机的原则进行选择。
配比成功的对象从源人群中移去,然后进入下一个处理对象的配比过程,直到处理组中的全部对象完成匹配。
配比时一般应规定配比精度,如倾向评分值相差<0.01或<0.001。
如果研究者希望某个重要变量精确匹配,则可以先根据该变量(如性别)分层后,分别对每层人群进行单纯倾向评分配比。
然后将配比人群合并,这样最终的两组研究人群中该变量分布完全相同。
这一方法确保这一变量精确匹配,但要求精确匹配因素及其因素水平很少,而且样本量足够大。
马氏矩阵配比是通过矩阵计算两个观察对象的马氏距离的一种匹配办法[1]。
马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示m维空间中2个点之间的协方差距离。
它不受量纲的影响,还可以排除变量之间的相关性的干扰。
处理组研究对象i与对照组研究对象j之间的马氏距离d(i, j)可用下面公式计算:
d(i, j)=(u-v)TC-1(u-v)
这里u和v分别表示处理组和对照组中配比变量的值,C是对照组全部对象配比变量的协方差阵。
倾向评分配比与马氏配比结合后可以增加个别重点变量平衡的能力。
具体结合方法有两种:一种是把倾向评分值作为一个变量同其它重点平衡的变量一起估计马氏距离,然后进行马氏配比;另外一种是首先在一定精度的倾向评分差值范围内选择对照组中全部可以匹配的对象,然后根据少数重点变量计算马氏距离,选择马氏距离最小的对象作为最终的对照。
这一方法要求计算马氏距离的变量不能太多,实现过程比较复杂。
三、倾向评分配比对资料的要求
要想合理应用倾向评分配比,研究者必需首先明确所获取的资料是否适合进行倾向评分配比。
一般来说,倾向评分配比适合于下列几种情况:(1) 处理因素(或病例)在人群中的比例远低于非处理因素(或对照),这样保证有足够的对照人群可供选择和配比,对照人群越大,配比效果越好。
(2)需要平衡的因素较多。
如March of Dimes基金会一项关于过期分娩儿童的研究中,平衡因素加上交互项目多达20个,而且许多变量差异非常显著[2]。
(3)研究的结局变量的调查难度较大或费用较高,选择部分可比的观察对象无疑会保证研究的可行性和结果的准确性。
四、应用实例
某医院欲利用一项“妇女孕期妊娠高血压疾病调查研究”资料进一步随访研究妇女孕期先兆子痫(preeclampsia,PE)对儿童发育状况的影响。
该项研究包括187名先兆子痫妇女和4 722名正常妇女[3]。
如果全部随访,随访任务大。
因此,需要从中选取部分可比的个体进行随访。
两组人群在一些主要特征分布方面存
在显著差异,可能会影响效应的估计,这些因素包括妇女年龄、怀孕前后体质指数(body mass index,BMI)、文化程度、产次(初产/非初产)、胎数(单胎/多胎)。
现采用较为常用的最邻配比法选取可比的个体作为随访对象。
首先以PE变量(1=PE,0=正常)为因变量,以需要调整的上述变量为自变量构建Logistci回归模型,求出每个研究对象的倾向评分值。
将研究对象按PE变量分为两组,然后进行匹配,配比精度为倾向评分<0.01。
为了保证较好的配比效果,采用精度由高到低(倾向评分<0.0001→<0.001→<0.01)进行配比,配比后的结果见表1。
共有181对妇女配比
成功,配比后各变量分布明显趋于一致。
利用Baser推荐的方法对配比效果进行评价[6]:首先求出每个协变量在配比前后的均数,无序分类变量需要转换为哑变量进行计算;然后计算各变量在配比前后均数的偏差;最后根据偏差计算偏差下降的百分率。
从表2可以看到,每个变量偏差下降均在50 %以上,其中年龄变量均衡效
果最好,偏差下降达92.4 %。
表1 倾向评分最邻配比前后人群主要特征的分布
五、倾向评分配比应用中需要注意的问题
与其它倾向评分分析方法相比,倾向评分配比的平衡能力较强,平衡后偏倚的下降幅度较大。
另外,其最大的优势是不但能用于数据分析阶段,而且还可以用于研究设计阶段。
随访研究是一种重要的流行病学病因研究方法,研究者在基线调查的基础上利用倾向评分配比选择随访对象,既可以节省随访费用,又可有效降低混杂偏倚。
倾向评分配比还可用于病例对照研究,如在巢式病例对照研究中用倾向评分配比从随访人群中选取可比的对照,然后测量病例和对照在某些暴露(如基因型、生化指标等)上的差别。
这种情况下,分组变量为疾病有或无,协变量是需要平衡的混杂变量。
倾向评分配比资料的效应分析可以用单因素的分析方法直接比较,也可以用多因素回归的方法,但分析方法应当适合配比资料。
比如,效应变量如果是计量资料,用配对t检验比较均数;如果是两分类计数资料,可以用McNemar法或条件Logistic回归进行分析。
两组倾向评分重叠区范围常称为共同支持域(common support region)。
共同支持域的大小是影响具体匹配方法估计效果的一个重要因素。
如果两组没有共同支持域,表明两组完全没有可比性,也无法进行倾向评分分析。
Monte Carlo模拟试验表明,当共同支持域较大时,倾向得分匹配方法对具体匹配方法的选择是不敏感的。
但是当共同支持域较小时,倾向得分匹配方法对具体匹配方法的选择是敏感的。
当共同支持域很小时,局部线性回归匹配结果较好[6]。
倾向评分配比过程中,部分处理组个体可能配比不成功,主要原因是:(1)用于计算倾向评分的主要协变量有缺失。
一个观察单位只要任何一个协变量数据缺失,则无法估计其倾向评分值,因而也就无法进行配比。
(2)处理组中部分研究对象倾向评分太大或太小(极端值),较远地落在了共同支持域之外,因此没有可以与之匹配的对照可供选择。
(3)配比精度过高。
在样本量固定的情况下,如果想提高匹配的精确性,必然会减少匹配成功的例数;反之,如果想尽量多保留能够匹配的
对象,则匹配精度自然会降低。
这需要研究者结合资料的具体情况、专业知识来决定匹配的精度和样本量。
倾向评分配比前后处理组与对照组协变量分布的平衡性的评价不能仅仅依靠各个变量在配比前后分布差异的显著性来评价。
这是因为,倾向评分配比后对照组只选择了与处理组可以匹配的部分个体作为研究对象,因此样本量较原来的人群要小。
由于样本量的改变,将会导致配比后两组比较的显著性检验统计量减小,P 值增大。
因此,需要使用与样本量改变无关的评价指标,如本例中使用的是偏差下降百分比,这一方法只与两组协变量均数差值变化大小有关,而与标准差无关。
参考文献
1 Rubin DB. Bias reduction using Mahalanobis metric matching[J]. Biometrics, 1980, 36:293��298.
2 D’Agostino RB. Propensity score methods for bias reduction in the comparison of a treatment to a non��randomized control group[J]. Statistics in Medicine, 1998,17(19):2265��2281.
3 李智文,刘建蒙,张乐,等. 倾向评分配比在流行病学设计中的应用[J]. 中华流行病学杂志,2009,30(5):514��517.
4 Caliendo M, Kopeinig S. Some practical guidance for the implementation of propensity score matching[J]. Journal of Economic Surveys, 2008, 22(1): 31��72.
5 Baser O. Too much ado about propensity score models? Comparing methods of propensity score matching[J]. Value Health, 2006,9(6):
377��85.
6 刘凤芹,马慧.倾向得分匹配方法的敏感性分析[J].统计与信息论坛,2009, 24(10): 7��13.。