基于SPSS的国家人类发展指数判别分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于SPSS的国家人类发展指数判别分析

多元统计分析课程作业

一、数据说明

根据2010年联合国发布的《人类发展报告》,从2010年世界各国人类发展指数的排序中,选取极高发展水平、高发展水平、中等发展水平的国家各5个作为3组样本,另选4个国家作为待判样本做判别分析。用SPSS软件找出判别函数,并用该函数来判断中国等4个国家的类型归属。原始数据见表1。

表1 2010年15国人类发展指数构成

二、判别分析

1、判别过程

把所有变量加入建立判别函数所需的变量中,设置已知的变量值为3类,采用逐步判别法,按照所指定的纳入或排除标准,依次引入和剔除变量,直到方程稳定为止。

SPSS给出判别过程汇总分析表,表格显示有15个样本参加判别分析,有4个样本(待判断)因没有组标而被排除在外。表2显示各组样本的有关统计量,包括各个类以及各个类总和的均值、标准差、未加权和加权的有效值。

随后的是逐步判别分析的运行结论及Wilks’ Lambda检验的具体结果,如表3,仅有两个变量(人均国民收入、预期受教育年限)通过了统计检验,入选成为判别标准。由表可以看到,F统计值较高,其伴随概率远小于0.05,该函数具有统计学意义。

2、Fisher判别法结果

表4是Fisher 判别函数的特征值表。Eigenvalues 为相应Fisher 判别函数的特征值,等于判别函数值组间平方和与组内平方和之比,该值越大表明判别函数效果越好。特征值的个数与Fisher 判别函数的个数相等,本案例总体有三类,所以至多有两个Fisher 判别函数。

根据Fisher 判别函数有效性检验结果,因为p 值小于0.05,说明在 0.05 的显著性水平下有理由拒绝原假设,即应认为不同组的平均Fisher 判别函数值存在显著差异,这意味着判别函数是有效的。

表5 标准化的Fisher 判别函数

Function

1

2 预期受教育年限(年) .839 .734 人均国民收入(GNI)

1.030 -.427

对比标准化与为标准化的Fisher 判别函数,发现为标准化的判别函数中“人均国民收入”的系数始终接近0,究其原因,可能是数据绝对值差异较大所致。所以在此选用标准化的判别函数较为合理。表5给出标准化的Fisher 判别函数,据此可得到标准化的Fisher 判别函数为:

12

U X 0.839 1.030 U X 0.734 -0.427 X X X X ⎧⎪⎨=+=⎪⎩(预期受教育年限)(人均国民收入)

(预期受教育年限)(人均国民收入)()() 3、Bayes 判别法结果

表6给出了各类总体的先验概率。由于之前在判别类先验概率选项栏中选择了默认的All groups equal 选项,所以系统自动给每类分配了1/3的先验概率。

表6 各类的先验概率

表7给出了Bayes 线性判别函数的系数。表中的每一列表示样品判入相应类别的Bayes 判别函数系数。

由此得到各类的Bayes 判别函数如下:

23 -152.86911.939 0.002-73.6798.7300.001 -47.9027.119 0.001 1Y X X Y X X Y X X =++=++=++(预期受教育年限)(人均国民收入)(预期受教育年限)(人均国民收入)(预期受教育年限)(人均国民收入)

第一类:第二类:第三类:

将各样品的自变量值代入上述3个Bayes 判别函数,得到3个函数值。比较3个值,哪个函数值比较大就可以判断该样品判入哪一类。 4、模型判别功效

表8给出了模型的错判矩阵。从表中可以看到,样品没有存在错判现象,模型总的预测正确率为100%,结果相当理想。

表8 模型错判矩阵

5、判别结论

经过上述操作,SPSS 的数据编辑窗中会生成一列新的数据,用于显示各个样本的判别类别结果,如图1。

图1 SPSS 数据窗结果

由图可以看出,待判别的四个国家分别被分到3类中,新西兰为第一类(极

高发展水平国家),阿根廷为第二类(高发展水平国家),中国和苏里南都属于第三类(中等发展水平国家)。对照联合国2010年的《人类发展报告》,判别结果与实际相符合。

相关文档
最新文档