logistic回归哑变量结果解读

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

logistic回归哑变量结果解读
在进行logistic回归时,若自变量包含非连续变量,常常使用哑变量
处理方法转换为数值型变量进行回归分析。

哑变量在结果解释中常常
是一个重要的部分,以下是对哑变量结果的解读。

1. 哑变量及其一个水平的基准值。

哑变量是指将分类变量拆分成两个
或多个虚拟变量。

例如,在分析某地区居住状态是否对健康的影响时,人们会将居住状态分为有房无贷、有房有贷、租房三类。

此时,需要
将该分类变量转换成虚拟变量。

分别用两个虚拟变量来表示“有房有贷”和“租房”的情况,而“有房无贷”则成为基准值。

2. coefficients系数。

这是指logistic回归模型中哑变量所对应的系数值。

例如,在上例中,如果哑变量为“有房有贷”,一旦计算出回归
系数后,可以得到如下方程:β0 + β1x1,其中x1是有没有房贷(0
代表无房贷,1代表有房贷),β0是常数项,β1为有房贷的系数。

3. 每个水平与基准水平之间的比较。

利用上述方程,可以通过系数来
判断每个水平与基准水平之间的比较。

在此例中,如果水平1是“有
房有贷”,水平2是“租房”,那么如果得到的回归系数为β0 +
β1x1,那么系数1 - 系数2 = β1,这表示“有房有贷”相对于“租房”有更高的健康风险,且差异很显著。

4. 对哑变量结果的显著性检验。

为了知道哑变量效果是否显著,可以
使用检验,常常使用卡方检验。

如果显著性检验得到的p值小于0.05,则说明样本之间存在较大差异,在输出结果时需要特别关注。

在哑变量的结果解释中,需要注意的是哑变量是假设变量,所以哑变
量的系数的解释需要谨慎。

而且,与其它因素相比,哑变量本身可能
是一个较小的影响因素,因此在结果解释中需要用组合变量,即哑变
量与其它变量的组合来进行解释。

相关文档
最新文档