二元logistic逻辑回归分析1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS与社会统计学课程作业二
[1]陈昱,陈银蓉,马文博. 基于Logistic模型的水库移民安置区居民土地流转意愿分析——四川、湖南、湖北移民安置区的调查[J]. 资源科学,2011,06:1178-1185.
一、变量赋值
1.被解释变量用0表示不愿意流转,1表示愿意流转,有意愿上的状态表示效果。
2.性别分别用1和2表示男女,男女不存在有没有状态的表征,所以用1、2赋值非常合适;它的预计影响方向为负,是基于学者张林秀、刘承芳等认为:由于农村男性外出打工的几率高于女性,女性更愿意在家耕种土地,这就可能导致女性不愿意转出土地的基础上设定的。
3.教育程度越高赋值越高,且预测影响为正,这个也是在文章前面定量分析的时候引用学者李实的观点说明赋值的理由。
4.职业类型中,兼业化程度越高赋值越高,且为正向。从家庭收入对农业收入的依赖性原理角度来看这个不难理解。
5.其它变量的赋值依据实际情况初步判断也不能理解其赋值的缘由。然而对于“是否为村干部”这一变量来看,预测的趋向是:是村干部则不愿意流转,前面的分析并没有说明为什么会是这样。虽然这知识一种预判,但是若能够给出预判的一丁点理由就更好了。
二、系数解读
1.标准化系数中,x1,x3,x7,x9,x11,x12系数为付,意味着性别是男、与市中心距离
越近、家庭人口和劳动力人数越少、农业收入占比越少、认为土地经营权权属则土地流转的意愿越强;
2.其中X3(与市中心距离),x9(劳动力人数)影响系数绝对值较大,分别为0.815,0.322。
在显著性检验方面,x3、x9、x11分别通过了15%、1%、5%的显著性检验。也就是说,土地不愿意流转与劳动力人数多有显著相关性,与农业收入占比高有较显著的相关,与市中心距离近相关性不显著。
3.系数为正的变量中,影响系数均不高,但能通过显著性检验的有:x2、x5(15%);x10、
x13(5%);x4(1%)。说明文化程度高对愿意流转的影响是非常显著的,而且在系数为正的变量中,x4的系数为最大,说明x4与y(1)显著相关。
三、模型检验
这篇文章主要是对模型的拟合优度进行检验。检验方法选取Hosmerand Lemeshow 检验和Omnibus 检验。H-L 检验和Omnibus检验结果如上表4和表5所示:由表4可知,模型的卡方值为4.302,显著性水平为0.829,不能拒绝原假设,认为模型拟合程度较好。而表5显示,模型以0.01的显著性水平通过检验,说明模型中至少有一个自变量与因变量显著相关。结合H-L检验和Omnibus检验可知,选择的模型以及回归结果可以较好的反映水库移民安置区农户土地转出的意愿。
[2]叶男. 农民的土地流转意愿及其影响因素研究[J]. 统计与决策,2013,09:99-101.
一、变量赋值
1.对性别的赋值这里是赋为女(0),男(1),作为定类变量,虽然这样赋值没多大错误,
但是按我们的习惯似乎赋予1,2这样的值更令我们可以接受。
2.文化程度同样是越高数值越大,而健康状况则越好赋值越少。职业类型中,非农就业全
部赋值为0,务农全部赋值为1,没有依赖度上的区分。兼业化程度从农户的视角来分析,变量选取上似乎比较粗糙,难以定量;比如说,如何界定农业兼业户与非农兼业户。
而且很有可能与变量“职业类型”存在共线性的问题。土地依赖性越高赋值越小,离县城越远赋值越大,所在村越穷赋值越大。在地形地貌上,平原赋值为1,山区丘陵赋值为0.有新农保赋值1,没有则为0.
二、系数解读(以转出意愿模型为例)
在这篇文章中,我们主要来解读Exp(B)。对于系数为负的变量,我们以年龄作为一个解读例子。年龄越高,可能受恋土情结等因素的影响,土地流出意愿越弱,且在0.01的显著性水平上通过了检验,说明年龄对土地流出意愿有显著影响。发生比为0.953,即在其它条件不变的情况下,年龄每增加1,土地流出意愿比将是原来的0.953倍,土地流出的概率比原来减少了0.047。对于系数为正的变量,我们以土地依赖性为例。土地依赖性越低,土地流出的意愿越高。且在0.01的显著性水平上通过了检验,说明土地依赖性对土地流出意愿有显著影响。发生比为2.548,即在其它条件不变的情况下,依赖程度每降一级(变量值增加1),土地流出意愿比将是原来的2.548倍,土地流出的概率比原来扩大了1.548倍。三、模型检验(以转出意愿模型为例)
-2 Loglikelihood=365.95;Cox & Snell RSquare=0.269;Nagelkerke R Square=0.363;Sig. =0.000来看,模型拟合较好,因为-2 Loglikelihood足够大,而且非常显著,具有较好的解释力。后两个R2是伪决定值,所以不能用作判断。
感想:发现很难找到把所有的模型检验的指标都在文章中体现的文献,选择性的把指标给出,能体现作者的无奈之举。
参考文献:
[1]陈昱,陈银蓉,马文博. 基于Logistic模型的水库移民安置区居民土地流转意愿分析——四川、湖南、湖北移民安置区的调查[J]. 资源科学,2011,06:1178-1185.
[2]叶男. 农民的土地流转意愿及其影响因素研究[J]. 统计与决策,2013,09:99-101.