多项分类Logistic回归研究分析的功能与意义-()
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多项分类Logistic回归分析的功能与意义-()
————————————————————————————————作者:————————————————————————————————日期:
多项分类Logistic回归分析的功能与意义
我们经常会遇到因变量有多个取值而且无大小顺序的情况,比如职业、婚姻情况等等,这时一般的线性回归分析无法准确地刻画变量之间的因果关系,需要用其它回归分析方法来进行拟合模型。SPSS的多项分类Logistic回归便是一种简便的处理该类因变量问题的分析方法。
例子:下表给出了对山东省某中学20名视力低下学生视力监测的结果数据。试用多项分类Logistic回归分析方法分析视力低下程度(由轻到重共3级)与年龄、性别(1代表男性,2代表女性)之间的关系。
山东省某中学20名学生视力监测结果数据
编号视力低下程度性别年龄
11115
21115
32114
42216
53216
63217
72217
82118
91114
103218
111117
121217
131115
142118
151215
161215
173217
181115
191115
202216
分析步骤:
1、进入SPSS,打开“分析”|“回归”|“多项Logistic” 命令。
2、选择进行Logistic 回归的变量。如下图所示对话框左侧的列表中,选中“视力低下程度”
并单击向右的箭头按钮使之进入“因变量”列表框,选择“性别”使之进入“因子”列表框,选择“
年龄”使之进入“协变量”列表框。
6.jpg(38.14 KB, 下载次数: 47)
下载附件
2012-8-13 23:20 上传
3、其它设置使用系统默认设置即可。
4、设置完毕,单击“确定”按钮,等待输出结果。
模型拟合信息
模型
模型拟合
标准
似然比检验
-2 倍对数
似然值
卡方df显著水平
仅截距32.633
最终18.80413.8284.008
伪R 方
Cox 和
Snell
.499
Nagelkerke.572
McFadden.336
似然比检验
效应
模型拟合
标准
似然比检验
简化后的
模型的 -2
倍对数似
然值
卡方df显著水平
截距18.804.0000.年龄25.442 6.6382.036性别25.306 6.5022.039
参数估计
听力低下程度a B标准误Wald df 显著水
平
Exp(B)
Exp(B) 的置信区间 95%
下限上限
1截距34.33819.553 3.0841.079
年龄-2.112 1.181 3.1971.074.121.012 1.225
[性别
=1]
21.272 1.183323.0951.000 1.731E+09 1.702E+08 1.761E+10 [性别
=2]
0..0....
2截距20.97419.066 1.2101.271
年龄-1.277 1.141 1.2511.263.279.030 2.613
[性别
=1]
20.540.000.1.8.321E+088.321E+088.321E+08 [性别
=2]
0..0....
还是以教程“blankloan.sav"数据为例,研究银行客户贷款是否违约(拖欠)的问题,数据如下所示:
上面的数据是大约700个申请贷款的客户,我们需要进行随机抽样,来进行二元Logistic 回归分析,上图中的“0”表示没有拖欠贷款,“1”表示拖欠贷款,接下来,步骤如下:
1:设置随机抽样的随机种子,如下图所示:
选择“设置起点”选择“固定值”即可,本人感觉200万的容量已经足够了,就采用的默认值,点击确定,返回原界面、
2:进行“转换”—计算变量“生成一个变量(validate),进入如下界面:
在数字表达式中,输入公式:rv.bernoulli(0.7),这个表达式的意思为:返回概率为0.7的bernoulli分布随机值
如果在0.7的概率下能够成功,那么就为1,失败的话,就为"0"
为了保持数据分析的有效性,对于样本中“违约”变量取缺失值的部分,validate变量也取缺失值,所以,需要设置一个“选择条件”
点击“如果”按钮,进入如下界面:
如果“违约”变量中,确实存在缺失值,那么当使用"missing”函数的时候,它的返回值应该为“1”或者为“true",为了剔除”缺失值“所以,结果必须等于“0“也就是不存在缺失值的现象点击”继续“按钮,返回原界面,如下所示:
将是“是否曾经违约”作为“因变量”拖入因变量选框,分别将其他8个变量拖入“协变量”选框内,在方法中,选择:forward.LR方法
将生成的新变量“validate" 拖入"选择变量“框内,并点击”规则“设置相应的规则内容,如下所示:
设置validate 值为1,此处我们只将取值为1的记录纳入模型建立过程,其它值(例如:0)将用来做结论的验证或者预测分析,当然你可以反推,采用0作为取值记录
点击继续,返回,再点击“分类”按钮,进入如下页面