SPSS实验8-二项Logistic回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS作业8:二项Logistic回归分析

为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用Logistic回归的方法,是否购买作为被解释变量(0/1二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用Enter方法,性别以男为参照类,收入以低收入为参照类。

(一)基本操作:

(1)选择菜单Analyz e-Regression-Binary Logistic;

(2)选择是否购买作为被解释变量到Dependent框中,选其余各变量为解释变量到Covariates框中,采用Enter方法,结果如下:

消费的二项Logistic分析结果(一)(强制进入策略)

Categorical Variables Codings

Frequency Parameter coding (1) (2)

收入低收入132 .000 .000

中收入144 1.000 .000

高收入155 .000 1.000

性别男191 .000

女240 1.000

分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。可以看到,对收入生成了两个虚拟变量名为Income(1)和Income(2),分别表示是否中收入和是否高收入,两变量均为0时表示低收入;对性别生成了一个虚拟变量名为Gedder(1),表示是否女,取值为0

时表示为男。

消费的二项Logistic 分析结果(二)(强制进入策略)

Block 0: Beginning Block

Classification Table a,b

Observed Predicted

是否购买 Percentage Correct

不购买

购买

Step 0

是否购买

不购买 269 0

100.0

购买

162

.0 Overall Percentage

62.4

a. Constant is included in the model.

b. The cut value is .500

分析:上表显示了Logistic 分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269人中实际没购买且模型预测正确,正确率为100%;162人中实际购买了但模型均预测错误,正确率为0%。模型总的预测正确率为62.4%。

消费的二项Logistic 分析结果(三)(强制进入策略)

Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 0 Constant -.507 .099 26.002 1 .000 .602

分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald检验统计量的观测值,自由度,Wald检验统计量的概率p值,发生比。由于此时模型中未包含任何解释变量,因此该表没有实际意义。

消费的二项Logistic分析结果(四)(强制进入策略)

Variables not in the Equation

Score df Sig.

Step 0 Variables age 1.268 1 .260

gender(1) 4.667 1 .031

income 10.640 2 .005

income(1) 2.935 1 .087

income(2) 10.640 1 .001

Overall Statistics 18.273 4 .001

分析:上表显示了待进入方程的各个变量的情况,各数据项的含义依次为Score检验统计量的观测值,自由度和概率p值。可以看到,如果下一步Age 进入方程,则Score检验统计量的观测值为1.268,概率p值为0.26。如果显著性水平a为0.05,由于Age的概率p值大于显著性水平a,所以是不能进入方程的。但在这里,由于解释变量的筛选策略为Enter,所以这些变量也被强行进入方程。

消费的二项Logistic分析结果(五)(强制进入策略)

Block 1: Method = Enter

Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1 Step 18.441 4 .001

Block 18.441 4 .001

Model 18.441 4 .001

分析:上表显示了Logistic分析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率p值。可以看到,在本步所选变量均进入方程(Method=Enter)。与前一步相比,似然比卡方检验的观测值18.441,概率p值为0.001。如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,认为所有回归系数不同时为0,解释变量的全体与Logit P之间的线性关系显著,采用该模型是合理的。

在这里分别输出了三行似然比卡方值。其中,Step行是本步与前一步相比的似然卡方比;Block行是本块(Block)与前一块相比的似然卡方比;Model 行是本模型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。

消费的二项Logistic分析结果(六)(强制进入策略)

Model Summary

Step -2 Log likelihood Cox & Snell R

Square

Nagelkerke R

Square

1 552.208a.04

2 .057

a. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.

相关文档
最新文档