spss19.0软件介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析软件spss19.0的分析操作过程。
1.打开spss,出现一个对话框,左下角有数据视图和变量视图,可以相互切换。在数据视图中,相当于是一个表格,第一行全是“变量”的字样,可以直接输入所观测的数据,也可以通过打开已经设计好的excel表格。
2.点击菜单栏第一项“文件”里的“打开”,打开已经获得的数据,在数据视图情形下,点击主菜单的“分析”,选择“分类”,在里面选择“判别分析”,出现下面的判别分析主对话框。
3.导入分组变量和自变量,指定分析变量。
1)指定分类变量及其范围:在主对话框中左边的矩形框中选择已知的观测量所属类别的变量(一定是离散变量),点击“分组变量”框左边的右拉箭头按钮,将所选变量名移到该矩形框中,此时矩形框下的“定义范围”按钮加亮,点击该按钮,显示一个小对话框,提供指定该分类变量的数值范围。设定后,按“继续”按钮,回到主对话框。
1)指定判别分析的自变量:在主对话框中左边的变量框中选择表明观测量特征的变量,点击“自变量”框左边的右拉箭头按钮,使该变量名移到该矩形框中,作为参与判别分析的自变量。
3)选择变量:一般均使用数据文件中的所有合法观测量,此步骤可省略。
4.选择分析方法
在主对话框中自变量矩形框下面有两个选择项选择判别分析方法:
1)一起输入自变量选项,当认为所有自变量都能对观测量特性提供丰富的信息时使用该选择项。
2)点击下面的“使用步进式方法”即逐步判别法,进入判别模型的自变量根据对判别贡献的大小进行逐步选择。选中该项后,“方法”按钮加亮,可以进一步选择判别分析方法。
4)设置逐步判别分析
点击“方法”按钮,打开设置逐步判别分析方法对话框,方法默认为Milks Lambra。
方法栏:
① Wilks’lambda选项,每步都是Wilk的统计量 最小的进入判别函数。
②未解释方差复选项,每步都是使各类不可解释的方差和最小的变量进入判别函数。
③ Mahalanobis距离选项,每步都使靠的最近的两类间的Mahalanobis距离最大的变量进入判别函数。
④最小F值选项,每步都使任何两类间的最小的F值最大的变量进入判别函数。
⑤ Rao’s V选项,每步都是使Rao’s V统计量产生最大增量的变量进入判别函数。可以对一个要加入到模型中的变量的V值指定一个最小增量。选择此种方法后,应该在该项下面的V至输入后的矩形框中输入这个增量的指定值。当某变量导致的V值增量大于指定值的变量进入判别函数。
本例选入“Mahalanobis距离”选项。
标准栏:选择逐步判别停止的判据,可供选择的判据有:
①使用F值:是系统默认的判据,默认值是:进入:3.84;移出:2.71。即当被加入的变量F值>=3.84时才把该变量加入到模型中,否则变量不能进入模型;或者,当要从模型中移出的变量F值<=2.71时,该变量才被移出模型,否则模型中的变量不会被移出。
②使用F值的概率:加入变量的F值概率的默认值是0.05(5%);移出变量的q 值概率是0.10(10%)。removal值(移出变量的正值概率)>Entry值(加入变量的F值概率)。
本例选中“使用F值”选项,进入栏输入3.0,删除栏输入2.0.
输出栏:对于逐步选择变量的过程和最后结果的显示,可以通过“输出”栏的两项进行选择。
步进摘要:要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。两两组间距离的F值:要求显示两类之间的F值矩阵。
本例两项都不选择。
7)统计量输出设置
回到判别分析页面,点击统计量按钮,选择描述性中的均值选项,矩阵中不选,判别函数系数中Fisher选项。点击“继续”。
①“描述性”栏选择输出描述统计量:
均值复选项:可以输出各类中各自变量的均值,标准差和各自变量总样本的均值和标准差。
单变量ANOVA复选项:对各个自变量进行均值假设检验,输出单变量的方差分析结果。
Box’s M复选项:对各类的协防差矩阵相等的假设进行检验。
本例选“均值”选项。
②“函数系数”栏选择输出判别函数系数。
Fisher’s复选项:给出Bayes判别函数的系数,名字Fisher’s是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。
未标准化复选项:未经标准化处理的判别系数。
本例选Fisher’s选项
③“矩阵”栏选择输出自变量的系数矩阵
组内相关复选项:它是根据在计算相关矩阵之前将各组协方差矩阵平均后计算组内相关矩阵。
组内协方差复选项:即计算并显示合并组内协方差矩阵,是将各组协方差矩阵平均后计算的,区别于总协方差阵。
分组协方差复选项:对每类输出显示一个协方差矩阵。
总体协方差复选项:计算并显示总样本的协方差矩阵。
8)分类栏指定分类参数和判别结果
回到主页面,点选分类按钮,将输出和图中的选项全部选取,先验概率选择“所有组相等”,使用协方差矩阵选择“在组内”。
①“先验概率”栏
所有组相等:各组先验概率相等,若分为n组,则各组先验概率均为1/n.
根据组大小计算:由各组的样本量计算决定,即各类的先验概率与其样本量成正比。
②“使用协方差矩阵”栏
在组内:指定使用合并组内协方差矩阵进行分类。
分组:指定使用各组协方差矩阵进行分类,由于分类是根据判别函数而不是根据原始变量,因此该选择项不是总等价于二次判别。
本例选在组内选项。
③“输出”栏
个案结果:输出每个观测量包括判别分数、实际类、预测类和后验概率等。其附属选项:将个案限制在前,在矩形框中输入观测量数n,选择此项则仅输出前n 个观测量,观测数量大时可以选择此项。
摘要表:要求输出分类的小结,给出正确分类观测量数和错分类观测量数和错分率。
不考虑该个案时的分类:输出对每个观测量进行分类的结果,所依据的判别函数是由除该观测量以外的其他观测量导出的。也称为交互校验结果。
④图
合并图:生成一张包括各组的散点图。该散点图是根据前两个判别函数值作的散点图。如果只有一个判别函数,就输出直方图。
分组:根据前两个判别函数值对每一组生成一张散点图,共分为几组就生成几张散点图。如果只有一个判别函数,就输出直方图。
区域图:生成用于根据函数值把观测量分到各组中去的边界图。此种统计图把一张图的平面划分出与类数相同的区域。每一类占据一个区,各类的均值在各区中用星号标出。如果仅有一个判别函数,则不作此图。