spss论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS在判别分析中的应用
刘亭
(学号:200900703021)
摘要:判别分析是一种经典的多元统计分析方法,用于对分类型变量取值的分析和预测。判别分析能够在已有样本数据的基础上,分析类别变量与判别变量之间的数量关系,建立判别函数,最终实现对新数据分类变量取值类别的预测。根据判别准则,可将判别分析分为距离判别法、Fisher判别法和贝叶斯判别法。
关键词:公司文化;判别分析,距离判别、Fisher判别、贝叶斯判别
一、问题重述
调查了15个公司的组织文化、领导角色和员工发展3个方面内容作为预测变量,因变量为公司对员工的吸引力.为符合研究问题,将公司对员工的吸引力根据被测的实际填答情形,划分为高吸引力组(group=1)、中吸引力组(group=2)和低吸引力组(group=3)。数据如表1所示.(数据见:不同类的不同公司特点)
表1 不同类的不同公司特点
公司组织文
化
领导角
色
员工发
展
Microsoft 80 75 90 IBM 85 90 90 Dell 85 85 60 Apple 90 75 90 联想99 78 80 NPP 88 89 90 北京电子79 95 97 清华紫光89 81 82 北大方正75 95 96 TCLE 60 85 88 世纪成79 50 51 Angel 75 88 89 Hussar1 60 89 90
世纪飞扬100 85 84
Vinda 61 89 60
二、问题分析
(1):要使判别分析的效果较为理想,多个类别总体下的歌判别变量的均值应存在显著差异,否则给出错误判别结果的概率会较高.通常,应首先进行总体的均值检验,也就是判断各类别总体下判别变量的组间差异是否显著.
(2):在距离判别中,各类别总体的协差阵相等和不相等将采用不同的判别函数,因此,应观察判断协方差阵是否存在显著差异.
三、问题求解
(1):均值检验
Spss采用方差分析的方法,利用F统计量对每个判别变量逐个进行检验.按Statistics按钮指定输出相应统计量.
(2):协差阵齐性检验
Spss采用Box’sM法进行检验.
四、操作步骤
判别分析的基本操作步骤是:
(1)选择菜单:
【Analyze】→【Classify】→【Discriminant】
(2) 选择类别变量到【Grouping Variable】框中,按Define Range按钮给出类别变量的类别值范围.
(3) 选择判别变量到【Independents】框中.
(4) 指定判别变量进入策略。【Enter independents together】选项表示所有判别变量同时进入,为默认策略;【Use stepwise method】为逐步筛选策略.
(5) 如果只对符合一定条件的样本进行分析,则可选择一个条件判断变量到【Selection Variable】框中,并按Value按钮,给出判断值.
五、结果分析
(1) 判别分析的准备工作:均值检验和协差阵齐性检验
1.均值检验的结果如下:
表2 案例分析结果(一)
表2给出了高吸引力、中吸引力以及低吸引力三组中组织文化、领导角色以及员工发展评分的均值和标准差.可见,高吸引力组的组织文化、领导角色和员工发展的评分平均值最高,低吸引力组次之,中吸引力组的最低.
表3 案例分析结果(二)
表3给出了三个判别变量的Wilk’λ值、方差分析的F统计量的观测值、自由度和概率P值.如果显著性水平α为0.05,由于概率P值小于显著性水平α,应拒绝原假设,说明各类别总体下判别变量的均值存在显著差异.这里,三组的组织文化、领导角色和员工发展的均值存在显著差异.
2.协差阵齐性检验结果如下:
表四案例分析结果(三)
表4给出了高吸引力、中吸引力以及低吸引力三组中组织文化、领导角色以及员工发展评分的协差阵和总协差阵.可以看到,各组的协差阵有比较大的差异.
表五案例分析结果(四)
表五案例分析结果(五)
表5给出了各类别组的协差阵的对数行列式值.
表六案例分析结果(六)
表6 给出了M,B统计量的观测值,以及对应的概率P-值,为0.032.如果显著性水平α为0.005,由于概率P-值小于显著性水平α,因此应拒绝原假设,认为各类别总体下的判别变量协差阵存在显著差异.
表7 案例分析结果(七)
进一步,为探究原始变量对新空间中样本点位置确定的贡献程度,通常采用标准化判别系数.标准化判别系数克服了由原始变量量纲差异造成的影响.
新空间中,第一坐标位置主要取决于领导角色,第二坐标位置主要由组织文化决定.
表8 案例分析结果(八)
利用结构系数探讨输入变量与判别函数之间的相关性.
表8给出了判别变量和两个标准化Fisher判别函数,即原始判别变量和在新空间中变量之间的合并的组内相关系数.表中的星号表示相应系数的绝对值最大,可见,第一判别函数与领导角色的相关程度最高,第二判别函数与组织文化的相关程度最高.
表9 案例分析结果(九)
Fisher判别函数的投影是否很好地实现了将各类样本分开的效果,哪个判别函数更重要.表9显示了两个特征值、所解释方差的百分比、所解释方差的累计百分比以及典型相关系数.可以看到,第一判别函数的特征值为0.555,第一判别函数很重要,结合前表则知,判别的主要依据是领导角色.
六、判别结果的评价
表10 案例分析结果(十)
表10列出了混淆矩阵的频数和百分比.对于高吸引力的判别正确率为96.8%:同理,对于中吸引力和低吸引力的判别正确率分别为96.4%和92.3%,模型判别的总正确率为95.3%,比较理想.
七、判别结果的图形表示