PSM原理及软件操作
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对混杂因素变量的匹配效果通常采用标准差异(standardized difference)指标 进行测量,比较组间混杂变量的标准差异在匹配前后的改变,匹配后的标准差异越接近 0,匹配结果越令人满意,当标准差异小于10%时,认为组间变量的均衡性较好。
连续性变量计算公式
分类变量计算公式
倾向性评分匹配应用的注意事项
2.软件准备
采用的软件是易侕统计软件,该软件由美国X&Ysolutions公司研究的一套全新 设计的数据分析软件。该软件后台程序以R软件为平台,受国际认可。于2013年底面 向中国科研人员开发了中文版本。
该软件以科研分析思路设计的全新设计理念,融合现代计算机软件技术,采用可 视化数据挖掘与分析操作界面。自动选择统计方法,自动编程,自动摘录统计结果、 制作图表,用户只需集中精力思考统计分析思路,使临床研究数据统计分析变得更深 入和全面。
3.实例操作 数据读取成功
百度文库
3.实例操作
②进行PSM操作 点击软件上方“数据操作”菜单, 选择“病例对照配对”。
3.实例操作
②进行PSM操作
进入“病例对照配对”界面后,病例对照分组变量处选择研究的分组变量NLR,研究对象编号处选择原始研 究编号变量id,用于配对的变量选择需要调整的混杂因素(下图右方蓝色部分)变量,再在“计算倾向性评分再 按评分配对”处打勾,1:n配对处选择n=1,最后点击下方的“查看结果”。
RCT研究被称为是临床防治性研究的“金标准”,是因为在RCT研究中试验组和 对照组可以通过“随机分配”的方式平衡混杂因素,比如研究一种药物治疗哮喘的疗效, 研究者在招募一些哮喘患者后,将其随机分为试验组和对照组,试验组接受药物治疗, 对照组接受安慰剂治疗,治疗一段时间后,如果两组患者的有效率不同,则我们可以认 为两组有效率的差异完全是由该药物引起的。因为从理论上说试验组和对照组相比除了 该药物外,其他的临床特征都是相同的,或者说是具有可比性。
01 倾向性评分匹配的原理介绍
02 倾向性评分匹配的软件操作
03 倾向性评分匹配应用的注意事项
01 倾向性评分匹配的原理介绍
临床研究常见的类型
X是否人为分配?Assigned
exposure X?
No
Yes
观察性 Observational
实验性 Experimental
Analytic • Cross sectional 横断面 • Case-control 病例对照 • Cohort studies 队列
中第一个xls表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。
3.实例操作
④匹配后数据展示 打开EXCEL后PP.score变量展示的是所有记录的倾向性评分。
3.实例操作
④匹配后数据展示 再回到软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选
2.观察性研究简介
2.观察性研究
但相对于RCT研究,观察性的研究就比较“尴尬”了,因为没有随机分组,所以 实验组和对照组除了要研究的暴露因素X外,两组基线特征还存在很多差异(也就是 混杂因素),因此,两组结局事件的发生就不一定完全由暴露因素X所引起的。
2.观察性研究
某项研究探讨基线胆固醇增高的个体是否更容易发生急性心肌梗死。在这个课题中, 研究者根据受试者的胆固醇水平,将队列人群分为胆固醇增高组和胆固醇正常组,并对 两组人群进行随访观察,20年后,观察结果发现:基线胆固醇增高组人群发生急性心肌 梗死的比例高于基线胆固醇正常组,是否能认为胆固醇增高就是急性心肌梗死的危险因 素?
常德一医 临床科研青年骨干小组培训班课件
The First People’s Hospital of Changde City
倾向性评分匹配的原理及软件操作
周权 常德市第一人民医院 科教科
二O一七年五月
The First People’s Hospital of Changde City
目录
CONTENTE
2.软件准备 下面介绍软件的下载、安装和登陆方法。
①百度“易侕统计”进入第一条网页
2.软件准备 ②下载 “易侕统计”到电脑上并安装
2.软件准备
③进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免 费使用本软件一个月
2.软件准备
该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是 采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下 输入用户名和密码才能访问。
Randomized controlled trials (RCT)
1.RCT研究简介
RCT研究的基本流程
Study Population
Randomize
Treatment Group
Blindness ?
Control Group
Outcomes Comparison
Outcomes
1.RCT研究简介
答案是:不能,有可能这种表象是因为在基线胆固醇增高组中其他可能引起急性心 肌梗死的相关因素与胆固醇正常组分布不一致,有可能在观察人群中,基线胆固醇增高 组甘油三酯和高血压水平也高于基线胆固醇正常组,到底是胆固醇增高引起的急性心肌 梗死还是混杂因素甘油三酯、高血压引起的急性心肌梗死还说不清楚?
3.倾向性评分匹配的原理介绍
3.倾向性评分匹配的原理介绍
倾向性评分匹配的研究步骤:
①根据临床经验和实际要求,以处理因素为应变量(Y),混杂因素为自变量(X)来构建 回归模型; ②由大量观察性数据拟合回归模型的参数; ③根据拟合的回归模型计算每个个体的倾向指数,指数范围为0-1之间,反映个体被分到 实验组的概率; ④以倾向指数为依据,通过倾向评分匹配方法来均衡组间协变量的分布;
从生成的结果可以看出, 原始研究中有4个混杂因 素在两个组间的分布还是 有差别的。
3.实例操作 ⑤匹配效果展示 第三步:利用易侕软件读取匹配后的数据表格NLRpsm
3.实例操作
⑤匹配效果展示 第四步:在易侕软件“研究人群描述”模块中设置相应的参数。
3.实例操作 ⑤匹配效果展示
从生成的结果可以看出, 匹配后所有的基线特征变 量都配平了。
1.RCT研究简介 药物临床试验(GCP)采用的就是严格按照RCT研究标准进行的
1.RCT研究简介
RCT研究也有其不可避免的缺陷: ①有些研究无法解决伦理问题。如吸烟和肺癌,就不能做RCT研究
②RCT研究是在理想条件下对特定人群的干预结局,并不能很好的外推到真实的临 床环境中,如:药物的RCT一般都会限制研究人群,年龄有限制,小孩不要,老人 不要,有基础疾病的不要,但在真实的临床环境中,如果遇到了这些人群,究竟用 不用这个药,用多少,有什么风险…,这些都不清楚。
混杂偏倚可能改变着研究结果的真实性,从而使观察性临床研究结果的实际运用价 值受到相应的限制。观察性临床研究中,是否有效控制偏倚成为其成功与否的关键,在 这种情况下,倾向性评分匹配就横空出世了。
20世纪80年代Rosenbaum和Rubin首次提出了了倾向性评分法这一概念。倾向性 评分法是运用倾向性评分值来综合所有的观察变量信息从而达到均衡变量、减少偏倚的 目的。
我们先利用易侕软件统计一下匹配 前的原始数据基线情况。
第一步:在软件的“数据分析”菜 单下选择“研究人群描述”模块。
3.实例操作
⑤匹配效果展示 第二步:在“研究人群描述”模块中,列分层变量选NLR,分析变量选下图所蓝色的 混杂变量。 小数点处选择0.01,再点击下面的“查看结果”。
3.实例操作 ⑤匹配效果展示
倾向性评分匹配SCI论文的写作套路 各年发表的倾向性评分相关论文分布情况如下图所示:
3.倾向性评分匹配的原理介绍
倾向性评分匹配是倾向性评分法应用的一个方面,英文名为“Propensity score matching, PSM”,就是指通过一定的统计学方法对实验组与对照组进行筛选,使筛选出 来的研究对象在临床特征(潜在的混杂因素)上具有可比性,此时,实验组与对照组的 结局存在差异,就可以完全归结果实验因素也就是暴露因素了。
③RCT研究对试验条件要求高,投入也大,一般的小医院很难开展高质量、大样本 的RCT。
1.RCT研究
上市后药物扩大适应症的研究 属于药品补充注册的一种,需要研 究者进行药物临床研究, 再上报国家 食品药品监督管理局,审批通过后 才允许在说明书上面增加新适应症。
2.观察性研究简介
上面的时髦名词“真实世界研究”,其实也就是观察性的临床研究,相对于RCT研 究,观察性临床研究的研究对象所具有的各种特征是客观存在的,研究者不能对其进 行干预,其研究结果更接近实际情况,同时因其较宽的纳入排除标准,使其研究结果 更具外推性,实用性更好。
03 倾向性评分匹配应用的注意事项
倾向性评分匹配应用的注意事项
倾向性评分匹配相关论文的有其基本的报道要求,下面以一篇2015年 发表在《中华内科杂志》上的论文为例进行讲解:
倾向性评分匹配应用的注意事项
1.需要对匹配前后研究对象基本特征进行描述(代表性)
倾向性评分匹配应用的注意事项
2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。
3.倾向性评分匹配的原理介绍
02 倾向性评分匹配的软件操作
1.实例介绍
下面我们以我院杨浩洁医生撰写的一篇SCI论文数据为例,来演示如何利用统 计软件来实现倾向性评分匹配。
1.实例介绍
示例为该论文的部分数据:共483个病人样本,采集的变量分别为:患者的ID 号、性别、HBsAg、Child评分、Album等指标。
2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。
2.软件准备 登陆后的软件界面如上所示
3.实例操作
下面开始利用“易侕软件”来实现PSM:
①导入数据
打开EXCEL表格文件,将 其另存为“文本文件(制 表符分隔)”并命名。
3.实例操作
①导入数据 打开“易侕软件”,点击菜单“分析项目”>“创建新项目”,读入刚刚 保存的文本文件(制表符分隔)NLR2,再点击下方“读取数据文件”。
择PROJ1_1_tbl_NLR_pps_match_ddxls表格再单击,在弹出的对话框中选择“是”, 软件将会自动打开EXCEL表格。
3.实例操作
④匹配后数据展示
打开的EXCEL表格中有五个变量, group.id表示病例对照配对组号, group.n表示每组有多少人,如只 有1个人表示没有找到对照,如有2 个人表示找到1个对照。 ID为原始数据的编号 NLR为原始数据中的分组变量 pp.Score为倾向性评分值
③结果解读
3.实例操作
③结果解读
3.实例操作
软件同时还生成了一张图,形象的展 示了原始数据中118个病例和365个对照的 倾向性评分分布情况。
可以看出,软件算出的倾向性评分值在 0到0.8之间。两组在各评分值区间重合越 多,越容易匹配成功。
3.实例操作
④匹配后数据展示 在软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选择图
倾向性评分匹配SCI论文的写作套路
近年来,倾向性评分的应用越来越火爆,pubmed数据库在2010年专门为使用这
一类方法的论文指定了一个主题词。本人2017年5月16日在PUBMED数据库中共检索
发现应用倾向评分法的论文为11469篇。
"propensity score"[MeSH Terms] OR (propensity score matching[Title/Abstract]) OR (propensitymatched analysis[Title/Abstract]) OR (propensitymatched study[Title/Abstract]) OR (propensity score based analysis[Title/Abstract]) OR propensity score[Title/Abstract]
3.实例操作
④匹配后数据展示 将软件生成的匹配数据与原始研究数据,利用vlookup函数进行比对,去掉没有
配对成功的3个病例数据和对照组数据,生成一个新的表格。
3.实例操作
④匹配后数据展示 下面是匹配后的数据展示,将其另存为NLRpsm
3.实例操作
⑤匹配效果展示
既然匹配是为了使两组的基线特征相似,那么有必要检验一下匹配后的数据 是否达到了预期的效果。
连续性变量计算公式
分类变量计算公式
倾向性评分匹配应用的注意事项
2.软件准备
采用的软件是易侕统计软件,该软件由美国X&Ysolutions公司研究的一套全新 设计的数据分析软件。该软件后台程序以R软件为平台,受国际认可。于2013年底面 向中国科研人员开发了中文版本。
该软件以科研分析思路设计的全新设计理念,融合现代计算机软件技术,采用可 视化数据挖掘与分析操作界面。自动选择统计方法,自动编程,自动摘录统计结果、 制作图表,用户只需集中精力思考统计分析思路,使临床研究数据统计分析变得更深 入和全面。
3.实例操作 数据读取成功
百度文库
3.实例操作
②进行PSM操作 点击软件上方“数据操作”菜单, 选择“病例对照配对”。
3.实例操作
②进行PSM操作
进入“病例对照配对”界面后,病例对照分组变量处选择研究的分组变量NLR,研究对象编号处选择原始研 究编号变量id,用于配对的变量选择需要调整的混杂因素(下图右方蓝色部分)变量,再在“计算倾向性评分再 按评分配对”处打勾,1:n配对处选择n=1,最后点击下方的“查看结果”。
RCT研究被称为是临床防治性研究的“金标准”,是因为在RCT研究中试验组和 对照组可以通过“随机分配”的方式平衡混杂因素,比如研究一种药物治疗哮喘的疗效, 研究者在招募一些哮喘患者后,将其随机分为试验组和对照组,试验组接受药物治疗, 对照组接受安慰剂治疗,治疗一段时间后,如果两组患者的有效率不同,则我们可以认 为两组有效率的差异完全是由该药物引起的。因为从理论上说试验组和对照组相比除了 该药物外,其他的临床特征都是相同的,或者说是具有可比性。
01 倾向性评分匹配的原理介绍
02 倾向性评分匹配的软件操作
03 倾向性评分匹配应用的注意事项
01 倾向性评分匹配的原理介绍
临床研究常见的类型
X是否人为分配?Assigned
exposure X?
No
Yes
观察性 Observational
实验性 Experimental
Analytic • Cross sectional 横断面 • Case-control 病例对照 • Cohort studies 队列
中第一个xls表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。
3.实例操作
④匹配后数据展示 打开EXCEL后PP.score变量展示的是所有记录的倾向性评分。
3.实例操作
④匹配后数据展示 再回到软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选
2.观察性研究简介
2.观察性研究
但相对于RCT研究,观察性的研究就比较“尴尬”了,因为没有随机分组,所以 实验组和对照组除了要研究的暴露因素X外,两组基线特征还存在很多差异(也就是 混杂因素),因此,两组结局事件的发生就不一定完全由暴露因素X所引起的。
2.观察性研究
某项研究探讨基线胆固醇增高的个体是否更容易发生急性心肌梗死。在这个课题中, 研究者根据受试者的胆固醇水平,将队列人群分为胆固醇增高组和胆固醇正常组,并对 两组人群进行随访观察,20年后,观察结果发现:基线胆固醇增高组人群发生急性心肌 梗死的比例高于基线胆固醇正常组,是否能认为胆固醇增高就是急性心肌梗死的危险因 素?
常德一医 临床科研青年骨干小组培训班课件
The First People’s Hospital of Changde City
倾向性评分匹配的原理及软件操作
周权 常德市第一人民医院 科教科
二O一七年五月
The First People’s Hospital of Changde City
目录
CONTENTE
2.软件准备 下面介绍软件的下载、安装和登陆方法。
①百度“易侕统计”进入第一条网页
2.软件准备 ②下载 “易侕统计”到电脑上并安装
2.软件准备
③进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免 费使用本软件一个月
2.软件准备
该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是 采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下 输入用户名和密码才能访问。
Randomized controlled trials (RCT)
1.RCT研究简介
RCT研究的基本流程
Study Population
Randomize
Treatment Group
Blindness ?
Control Group
Outcomes Comparison
Outcomes
1.RCT研究简介
答案是:不能,有可能这种表象是因为在基线胆固醇增高组中其他可能引起急性心 肌梗死的相关因素与胆固醇正常组分布不一致,有可能在观察人群中,基线胆固醇增高 组甘油三酯和高血压水平也高于基线胆固醇正常组,到底是胆固醇增高引起的急性心肌 梗死还是混杂因素甘油三酯、高血压引起的急性心肌梗死还说不清楚?
3.倾向性评分匹配的原理介绍
3.倾向性评分匹配的原理介绍
倾向性评分匹配的研究步骤:
①根据临床经验和实际要求,以处理因素为应变量(Y),混杂因素为自变量(X)来构建 回归模型; ②由大量观察性数据拟合回归模型的参数; ③根据拟合的回归模型计算每个个体的倾向指数,指数范围为0-1之间,反映个体被分到 实验组的概率; ④以倾向指数为依据,通过倾向评分匹配方法来均衡组间协变量的分布;
从生成的结果可以看出, 原始研究中有4个混杂因 素在两个组间的分布还是 有差别的。
3.实例操作 ⑤匹配效果展示 第三步:利用易侕软件读取匹配后的数据表格NLRpsm
3.实例操作
⑤匹配效果展示 第四步:在易侕软件“研究人群描述”模块中设置相应的参数。
3.实例操作 ⑤匹配效果展示
从生成的结果可以看出, 匹配后所有的基线特征变 量都配平了。
1.RCT研究简介 药物临床试验(GCP)采用的就是严格按照RCT研究标准进行的
1.RCT研究简介
RCT研究也有其不可避免的缺陷: ①有些研究无法解决伦理问题。如吸烟和肺癌,就不能做RCT研究
②RCT研究是在理想条件下对特定人群的干预结局,并不能很好的外推到真实的临 床环境中,如:药物的RCT一般都会限制研究人群,年龄有限制,小孩不要,老人 不要,有基础疾病的不要,但在真实的临床环境中,如果遇到了这些人群,究竟用 不用这个药,用多少,有什么风险…,这些都不清楚。
混杂偏倚可能改变着研究结果的真实性,从而使观察性临床研究结果的实际运用价 值受到相应的限制。观察性临床研究中,是否有效控制偏倚成为其成功与否的关键,在 这种情况下,倾向性评分匹配就横空出世了。
20世纪80年代Rosenbaum和Rubin首次提出了了倾向性评分法这一概念。倾向性 评分法是运用倾向性评分值来综合所有的观察变量信息从而达到均衡变量、减少偏倚的 目的。
我们先利用易侕软件统计一下匹配 前的原始数据基线情况。
第一步:在软件的“数据分析”菜 单下选择“研究人群描述”模块。
3.实例操作
⑤匹配效果展示 第二步:在“研究人群描述”模块中,列分层变量选NLR,分析变量选下图所蓝色的 混杂变量。 小数点处选择0.01,再点击下面的“查看结果”。
3.实例操作 ⑤匹配效果展示
倾向性评分匹配SCI论文的写作套路 各年发表的倾向性评分相关论文分布情况如下图所示:
3.倾向性评分匹配的原理介绍
倾向性评分匹配是倾向性评分法应用的一个方面,英文名为“Propensity score matching, PSM”,就是指通过一定的统计学方法对实验组与对照组进行筛选,使筛选出 来的研究对象在临床特征(潜在的混杂因素)上具有可比性,此时,实验组与对照组的 结局存在差异,就可以完全归结果实验因素也就是暴露因素了。
③RCT研究对试验条件要求高,投入也大,一般的小医院很难开展高质量、大样本 的RCT。
1.RCT研究
上市后药物扩大适应症的研究 属于药品补充注册的一种,需要研 究者进行药物临床研究, 再上报国家 食品药品监督管理局,审批通过后 才允许在说明书上面增加新适应症。
2.观察性研究简介
上面的时髦名词“真实世界研究”,其实也就是观察性的临床研究,相对于RCT研 究,观察性临床研究的研究对象所具有的各种特征是客观存在的,研究者不能对其进 行干预,其研究结果更接近实际情况,同时因其较宽的纳入排除标准,使其研究结果 更具外推性,实用性更好。
03 倾向性评分匹配应用的注意事项
倾向性评分匹配应用的注意事项
倾向性评分匹配相关论文的有其基本的报道要求,下面以一篇2015年 发表在《中华内科杂志》上的论文为例进行讲解:
倾向性评分匹配应用的注意事项
1.需要对匹配前后研究对象基本特征进行描述(代表性)
倾向性评分匹配应用的注意事项
2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。
3.倾向性评分匹配的原理介绍
02 倾向性评分匹配的软件操作
1.实例介绍
下面我们以我院杨浩洁医生撰写的一篇SCI论文数据为例,来演示如何利用统 计软件来实现倾向性评分匹配。
1.实例介绍
示例为该论文的部分数据:共483个病人样本,采集的变量分别为:患者的ID 号、性别、HBsAg、Child评分、Album等指标。
2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。
2.软件准备 登陆后的软件界面如上所示
3.实例操作
下面开始利用“易侕软件”来实现PSM:
①导入数据
打开EXCEL表格文件,将 其另存为“文本文件(制 表符分隔)”并命名。
3.实例操作
①导入数据 打开“易侕软件”,点击菜单“分析项目”>“创建新项目”,读入刚刚 保存的文本文件(制表符分隔)NLR2,再点击下方“读取数据文件”。
择PROJ1_1_tbl_NLR_pps_match_ddxls表格再单击,在弹出的对话框中选择“是”, 软件将会自动打开EXCEL表格。
3.实例操作
④匹配后数据展示
打开的EXCEL表格中有五个变量, group.id表示病例对照配对组号, group.n表示每组有多少人,如只 有1个人表示没有找到对照,如有2 个人表示找到1个对照。 ID为原始数据的编号 NLR为原始数据中的分组变量 pp.Score为倾向性评分值
③结果解读
3.实例操作
③结果解读
3.实例操作
软件同时还生成了一张图,形象的展 示了原始数据中118个病例和365个对照的 倾向性评分分布情况。
可以看出,软件算出的倾向性评分值在 0到0.8之间。两组在各评分值区间重合越 多,越容易匹配成功。
3.实例操作
④匹配后数据展示 在软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选择图
倾向性评分匹配SCI论文的写作套路
近年来,倾向性评分的应用越来越火爆,pubmed数据库在2010年专门为使用这
一类方法的论文指定了一个主题词。本人2017年5月16日在PUBMED数据库中共检索
发现应用倾向评分法的论文为11469篇。
"propensity score"[MeSH Terms] OR (propensity score matching[Title/Abstract]) OR (propensitymatched analysis[Title/Abstract]) OR (propensitymatched study[Title/Abstract]) OR (propensity score based analysis[Title/Abstract]) OR propensity score[Title/Abstract]
3.实例操作
④匹配后数据展示 将软件生成的匹配数据与原始研究数据,利用vlookup函数进行比对,去掉没有
配对成功的3个病例数据和对照组数据,生成一个新的表格。
3.实例操作
④匹配后数据展示 下面是匹配后的数据展示,将其另存为NLRpsm
3.实例操作
⑤匹配效果展示
既然匹配是为了使两组的基线特征相似,那么有必要检验一下匹配后的数据 是否达到了预期的效果。