SPSS实验8-二项Logistic回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS作业8:二项Logistic回归分析
为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用Logistic回归的方法,是否购买作为被解释变量(0/1二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用Enter方法,性别以男为参照类,收入以低收入为参照类。
(一)基本操作:
(1)选择菜单Analyz e-Regression-Binary Logistic;
(2)选择是否购买作为被解释变量到Dependent框中,选其余各变量为解释变量到Covariates框中,采用Enter方法,结果如下:
消费的二项Logistic分析结果(一)(强制进入策略)
Categorical Variables Codings
Frequency Parameter coding (1) (2)
收入低收入132 .000 .000
中收入144 1.000 .000
高收入155 .000 1.000
性别男191 .000
女240 1.000
分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。可以看到,对收入生成了两个虚拟变量名为Income(1)和Income(2),分别表示是否中收入和是否高收入,两变量均为0时表示低收入;对性别生成了一个虚拟变量名为Gedder(1),表示是否女,取值为0
时表示为男。
消费的二项Logistic 分析结果(二)(强制进入策略)
Block 0: Beginning Block
Classification Table a,b
Observed Predicted
是否购买 Percentage Correct
不购买
购买
Step 0
是否购买
不购买 269 0
100.0
购买
162
.0 Overall Percentage
62.4
a. Constant is included in the model.
b. The cut value is .500
分析:上表显示了Logistic 分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269人中实际没购买且模型预测正确,正确率为100%;162人中实际购买了但模型均预测错误,正确率为0%。模型总的预测正确率为62.4%。
消费的二项Logistic 分析结果(三)(强制进入策略)
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constant -.507 .099 26.002 1 .000 .602
分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald检验统计量的观测值,自由度,Wald检验统计量的概率p值,发生比。由于此时模型中未包含任何解释变量,因此该表没有实际意义。
消费的二项Logistic分析结果(四)(强制进入策略)
Variables not in the Equation
Score df Sig.
Step 0 Variables age 1.268 1 .260
gender(1) 4.667 1 .031
income 10.640 2 .005
income(1) 2.935 1 .087
income(2) 10.640 1 .001
Overall Statistics 18.273 4 .001
分析:上表显示了待进入方程的各个变量的情况,各数据项的含义依次为Score检验统计量的观测值,自由度和概率p值。可以看到,如果下一步Age 进入方程,则Score检验统计量的观测值为1.268,概率p值为0.26。如果显著性水平a为0.05,由于Age的概率p值大于显著性水平a,所以是不能进入方程的。但在这里,由于解释变量的筛选策略为Enter,所以这些变量也被强行进入方程。
消费的二项Logistic分析结果(五)(强制进入策略)
Block 1: Method = Enter
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 18.441 4 .001
Block 18.441 4 .001
Model 18.441 4 .001
分析:上表显示了Logistic分析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率p值。可以看到,在本步所选变量均进入方程(Method=Enter)。与前一步相比,似然比卡方检验的观测值18.441,概率p值为0.001。如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,认为所有回归系数不同时为0,解释变量的全体与Logit P之间的线性关系显著,采用该模型是合理的。
在这里分别输出了三行似然比卡方值。其中,Step行是本步与前一步相比的似然卡方比;Block行是本块(Block)与前一块相比的似然卡方比;Model 行是本模型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。
消费的二项Logistic分析结果(六)(强制进入策略)
Model Summary
Step -2 Log likelihood Cox & Snell R
Square
Nagelkerke R
Square
1 552.208a.04
2 .057
a. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.