交互作用分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
交互作用分析
一、交互作用的概念
简单地说,交互作用指当两个因素都存在时,它们的作用大于(协同)或小于(拮抗)各自作用的和。
要理解交互作用首先要区别于混杂作用。
混杂作用
以吸烟(SMK)和饮酒(ALH)对收缩压(SBP)的影响为例,可以建立以下二个模型:
模型1:SBP = β0+β2’SMK
模型2:SBP = β0+β1ALH+β2SMK
假设从模型1估计的SMK的作用为β2’,从模型2估计的SMK的作用为β2。如吸烟与饮酒有关(假设吸烟者也多饮酒),而且饮酒与血压有关,这时可以假想两种可能:
1.吸烟与血压无关,但因为饮酒的原因,模型1中的β2’会显著,而模型2控制了ALH 的作用后,SMK的作用β2将不显著。
2.吸烟与血压有关,模型1中估计的SMK的作用β2’一部分归功于饮酒,模型2估计的β2是控制了ALH的作用后SMK的作用,因此β2’不等于β2。
是不是β2不等于β2’就意味着有交互作用呢?不是的,这只是意味着β2’中有饮酒的混杂作用。
那么什么是交互作用呢?
根据吸烟与饮酒将研究对象分成四组,各组SBP的均数可用下表表示:
吸烟与饮酒对SBP的影响,有无交互作用反映在β12上,检验β12是否等于零就是检验吸烟与饮酒对SBP的影响有无交互作用。而上面的模型2是假设β12等于零所做的回归方程。
交互作用的理解看上去很简单,但需要意识到的是交互作用的评价与作用的测量方法有关。以高血压发病率为例,看吸烟与饮酒对高血压发病率的影响就有两种情况。
I、相加模型:
II、相乘模型:
相加模型检验Isa是否等于零,相乘模型检验B是否等于1,可以想象Isa等于零时B 不一定等于1,因此会出现按不同的模型检验得出的结论不同。在报告交互作用检验结果时,要清楚所用的是什么模型。一般的线性回归的回归系数直接反映应变量的变化,是相加模型,而Logistic回归的回归系数反映比值比的变化,属相乘模型。
二、交互作用的检验
交互作用检验有两种方法,一是对交互作用项回归系数的检验(Wald test),二是比较两个回归模型,一个有交互作用项,另一个没有交互作用项,用似然比检验。本系统采用方法。
如以吸烟与饮酒两个两分类变量为例,可以形成回归方程:
方程1:F(Y)= β0+β1ALH+β2SMK+β12SMK*ALH
计算该方程似然数(likelihood),似然数表示按得出的模型抽样,获得所观察的样本的概率。它是一个很小的数,因此一般取对数表示,即Log likelihood,似然数可以简单地理解为拟合度。
如果我们假定吸烟与饮酒无交互作用,β12等于零,则方程为:
方程2:F(Y)= β0+β1ALH+β2SMK
如果方程1和方程2得到的似然数没有显著差别,表明β12是多余的,或者说β12与零无显著性差异,吸烟与饮酒对f(Y)无交互作用。反之,吸烟与饮酒对f(Y)有交互作用。
三、交互作用分析
交互作用分析也可以理解为,在分层分析基础上对分层变量的不同层级水平上,危险因素对结果变量的作用的回归系数差异进行统计学检验。如上表中可以看出,在不吸烟组,饮酒的作用是β1,在吸烟组中饮酒的作用是β1+β12,如β12=0则表示饮酒的作用在吸烟组与不吸烟组都一样。分析交互作用主要回答的问题是:有哪些因素影响危险因素
(X)与结果变量(Y)的关系”?有没有效应修饰因子?参看。
发现效应修饰因子对助于我们进一步理解危险因素对结果变量的作用通路。
危险因素可以是连续性变量,也可以是分类型变量。本系统多要分析的可能的效应修饰因子限于分类型变量。
系统将自动检测结局变量的类型(如两分类变量、连续变量),再自动默认选择合适的回归模型(如Logistic回归或线性回归模型)。用户可以对分布类型和联系函数自行定义。
用户可以定义表格输出格式,包括要报告的结果、行列编排、小数点位置等。
如果危险因素是分类型变量,系统将:
1.列出危险因素与效应修饰因子的每种层级组合(联合亚组),如危险因素分3
组,效应修饰因子分2组,联合亚组就有6组。
2.如果结果是一个连续性的变量,统计每个联合亚组内结果变量的均数与标准
差;如果结果是一个二分类的变量,统计频数(百分数)。
3.运行两种回归模型: A 和 B
•模型A 按联合亚组生成指示变量,放入模型中(如有6个联合亚组,把一组作为参照组,放入5个指示变量于模型中);
•模型B不考虑危险因素与效应修饰因子的联合,分别产生指示变量放入模型中,如危险因素分3组,把一组作为参照,放入2个指示变量于模型中,效应修饰
因子分2组,一组为参照,放入一个指示变量于模型中,共3个指示变量。
然后进行似然比检验比较模型A与模型B,报告P值,即交互作用的P值。如果危险因素是连续性变量,系统将:
1.运行两种回归模型: A 和 B。
•模型A 按效应修饰因子的每个层级产生危险因素参数。如效应修饰因子为SMK 分2组(吸烟与不吸烟),危险因素为BMI(体重指数),产生2个BMI(BMI1
与BMI2),当SMK=0(不吸烟)时,BMI1=BMI, BMI2=0;当SMK=1(吸烟)时,BMI2=BMI, BMI1=0。把BMI1与BMI2同时放入模型中。
•模型B只有一个危险因素参数。
然后进行似然比检验比较模A与模型B,报告P值,即交互作用的P值。
系统将自动检测结局变量的类型(如两分类变量、连续变量),再自动默认选择合适的回归模型(如Logistic回归或线性回归模型)。用户可以对分布类型和联系函数自行定义。
用户可以定义表格输出格式,包括要报告的结果、行列编排、小数点位置等。
例1: