propensity score matching例子

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

propensity score matching例子
Propensity score matching是一种用于处理实验和非实验数据
纠偏的统计方法,主要应用在基于观察数据的因果推断。

本文将介绍
这种方法的基本原理和实际应用。

一、什么是propensity score matching?
Propensity score matching是一种常见的匹配算法。

其基本原
理是通过建立预测模型,将实验组和对照组之间的特征数据进行匹配,以达到类似随机分组的效果。

在匹配时使用的是特定指标-倾向得分(propensity score),倾向得分指的是建立预测模型所得到的每个个
体在特定条件下发生某一行为的概率。

通过建立这样的模型,我们就
能够找具有相同倾向得分的实验组和对照组,并将它们合并起来进行
统计分析。

二、例子-使用propensity score matching研究某种疗法的疗

以研究一种新的抗生素疗法应对感染疾病的例子为例。

我们将选
取一组300名患有感染疾病的患者进行研究。

我们随机选取100人组
成实验组进行新抗生素治疗,其余200人组成的对照组进行标准抗生
素治疗。

我们收集了这些患者的基本信息和既往病史等数据,如性别、年龄、BMI等。

1. 进行倾向得分的建模
首先,我们需要建立针对病人群的倾向得分模型,我们可以利用
混合效应模型建立最合适的模型,如:
Treatment ~ Age + Gender + BMI
Treatment是因变量,取值为1表示被分配到实验组,0表示对
照组;Age,Gender和BMI都是自变量。

建立得到模型公式如下:logit(p)= β0+ β1*Age+ β2*Gender+ β3*BMI
其中,p被定义为实验组治疗的概率,β0、β1、β2和β3是
我们需要估计的参数。

2. 倾向得分的估计与匹配
我们用取值为1或0的Treatment指标来求得每个患者治疗的概率值,表示该患者加入实验组的倾向得分。

我们以实验组的患者为目标,建立一个多元逻辑回归模型,使倾向得分达到最佳化。

比如我们将在实验组中随机选取10名患者,其实验治疗概率如下:
Patient 1: 0.6
Patient 2: 0.8
Patient 3: 0.4
Patient 4: 0.2
Patient 5: 0.9
Patient 6: 0.6
Patient 7: 0.7
Patient 8: 0.3
Patient 9: 0.5
Patient 10: 0.4
接着,我们需要从对照组中找出与实验组患者倾向得分相似的患者。

通过倾向得分,我们可以找到在对照组中的10名匹配患者如下:Patient 1: 0.59
Patient 2: 0.82
Patient 3: 0.38
Patient 4: 0.21
Patient 5: 0.91
Patient 6: 0.63
Patient 7: 0.68
Patient 8: 0.31
Patient 9: 0.49
Patient 10: 0.45
如果患者的倾向得分非常相似,我们就会得到更好的匹配结果。

3. 结果的分析
我们可以通过对配对结果进行比较,以确定新治疗方案的疗效是
否明显。

例如,我们可以利用因变量Treated当中的0或1标志是否进行了实验方案的治疗。

最终,我们得到的分析结果显示出新的抗生素方案治疗组与标准方案治疗组相比存在显著的治疗效果(p=0.019)。

这说明propensity score matching方法可以帮助我们排除干扰因素,更好的评估新治疗方案的效果。

总结:
Propensity score matching方法可以为我们提供更有力的证据以评估特定治疗方案的效果,它能够帮助我们更好的做到研究结果的复现和验证,消弭欠匹配等干扰因素,使研究具有更好的可行性与可信度。

相关文档
最新文档