判别分析的SPSS操作
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图1.3 "Discriminant Analysis:Set Value" :
Step5:执行操作. :执行操作. 选择完毕后,单击" 按钮, 选择完毕后,单击"OK"按钮,执行判别分析操作. 按钮 执行判别分析操作.
§3. 选项设置
§3.1 Method选项 选项 选择" 方法进行判别分析时, 选择"Use stepwise method"方法进行判别分析时, 方法进行判别分析时 按钮, "Method"(方法)按钮将被激活,单击"Method"按钮,打开 (方法)按钮将被激活,单击" 按钮 "Discriminant Analysis:Stepwise Method"(判别分析:逐 : (判别分析: 步分析方法)对话框,如图1.4所示 步分析方法)对话框,如图 所示
判别分析的SPSS操作 操作 判别分析的
§1. 基本原理 §2. 基本操作 §3. 选项设置 §4. 实例分析
§1. 基本原理
判别分析的目的是得到体现分类的函数关系式, 判别分析的目的是得到体现分类的函数关系式,即判别 函数. 函数.基本思想是在已知观测对象的分类和特征变量值的前 提下,从中筛选出能提供较多信息的变量,并建立判别函数; 提下,从中筛选出能提供较多信息的变量,并建立判别函数; 目标是使得到的判别函数在对观测量进行判别其所属类别时 的错判率最小. 的错判率最小. 判别函数的一般形式是: 判别函数的一般形式是:Y = a1 x1 + a 2 x2 + + a n x n 其中, 为判别函数判别值; 其中,Y 为判别函数判别值;x1 , x 2 ,, x n 为反映研究对象 特征的变量; 特征的变量;1 , a 2 ,, a n 为各变量的系数,即判别系数. a 为各变量的系数,即判别系数. 常用的判别法有距离判别法, 判别法和Bayes判别法. 判别法. 常用的判别法有距离判别法,Fisher判别法和 判别法和 判别法
Step4:选择变量值标识. :选择变量值标识. 如果需要使用一部分个案参与判别函数的推导, 如果需要使用一部分个案参与判别函数的推导,而且有一个变 量的某个值可以作为这些观测量的标识,则用Select Variable功 量的某个值可以作为这些观测量的标识,则用 功 能进行选择.方法为在变量列表中选择变量,单击右向箭头按钮, 能进行选择.方法为在变量列表中选择变量,单击右向箭头按钮, 将其移动至" 将其移动至"Selection"(选择变量)文本框;然后单击 (选择变量)文本框; 文本框右侧的" 按钮, "Selection"文本框右侧的"Value"按钮,显示"Discriminant 文本框右侧的 按钮 显示" Analysis:Set Value"(判别分析:设定值)子对话框,如图 : (判别分析:设定值)子对话框, 1.3所示,输入选择变量的标识.单击"Continue"按钮,返回主 所示, 按钮, 所示 输入选择变量的标识.单击" 按钮 对话框. 对话框.
代人判别函数: 代人判别函数:
得两组的判别函数分别为: 得两组的判别函数分别为:
将原各组样品进行回判结果如下一灯片表: 将原各组样品进行回判结果如下一灯片表: 待判样品判别结果如下: 待判样品判别结果如下:
3,利用距离判别法中例l的人文发展指数的数据作 ,利用距离判别法中例 的人文发展指数的数据作 Fisher判别分析: 判别分析: 判别分析 (1)建立判别函数 建立判别函数 利用前例计算的结果,可得 利用前例计算的结果,可得Fisher判别函数的系数 判别函数的系数
(2)计算样本协差阵,从而求出 计算样本协差阵, 计算样本协差阵
类似地
经计算
(3)求线性判别函数 求线性判别函数W(X) 求线性判别函数 解线性方程组 得
(4)对已知类别的样品判别分类 对已知类别的样品判别分类 对已知类别的样品(通常称为训练样品 通常称为训练样品)用线性判别函数进行判 对已知类别的样品 通常称为训练样品 用线性判别函数进行判 别归类,结果如下表,全部判对. 别归类,结果如下表,全部判对.
5.Rao's V Rao V统计量.选择该项,表示每步都使 统计量. 统计量 选择该项,表示每步都使Rao V统计量产生最大增量的变量进入判别函数,可以对一个要加 统计量产生最大增量的变量进入判别函数, 统计量产生最大增量的变量进入判别函数 入到模型中的变量的V值指定一个最小增量.选择该方法时需 入到模型中的变量的 值指定一个最小增量. 值指定一个最小增量 要在该项下面的" 要在该项下面的"V-to-enter"(输入 值)文本框中输入这个 (输入V值 增量的指定值,当某变量导致的V值增量大于指定值的变量进 增量的指定值,当某变量导致的 值增量大于指定值的变量进 入判别函数. 入判别函数. "Criteria"(准则 选项组用于选择逐步判别停止的判据,可 准则)选项组用于选择逐步判别停止的判据 准则 选项组用于选择逐步判别停止的判据, 供选择的判据包括以下几项: 供选择的判据包括以下几项:
(5)对判别效果作检验 对判别效果作检验 判别分析是假设两组样品取自不同总体, 判别分析是假设两组样品取自不同总体,如果两个总体的均值 向量在统计上差异不显著,作判别分析意义就不大: 向量在统计上差异不显著,作判别分析意义就不大:所谓判别效果 的检验就是检验两个正态总体的均值向量是否相等, 的检验就是检验两个正态总体的均值向量是否相等,取检验的统计 量为: 量为:
§2. 基本操作
SPSS利用"Discriminate"过程进行判别分析操作,下面 利用" 过程进行判别分析操作, 利用 过程进行判别分析操作 给出基本操作步骤. 给出基本操作步骤. Step1:打开主对话框. :打开主对话框. 选择" 命令, 选择"Analyze" →"Classify" →"Discriminate"命令, 命令 打开" 对话框, 打开"Discriminate Analysis"对话框,如图 所示 对话框 如图1.1所示
来自百度文库
本例中变量个数p= ,两类总体各有5个样品 个样品, 本例中变量个数 =3,两类总体各有 个样品,即n1=n2=5 , 个待判样品, 有4个待判样品,假定两总体协差阵相等. 个待判样品 假定两总体协差阵相等. 两组线性判别的计算过程如下: 两组线性判别的计算过程如下: (1)计算两类样本均值 计算两类样本均值
对话框, 图1.1 "Discriminate Analysis"对话框, 对话框
Step2:选择分组变量和自变量 : 在变量列表中选择指定分组变量,单击右向箭头按钮, 在变量列表中选择指定分组变量,单击右向箭头按钮, 将其移动至右侧的" 将其移动至右侧的"Grouping Variable"(分组)文本框中, (分组)文本框中, 并单击" 并单击"Define Range"(定义范围)按钮,出现图 所示 (定义范围)按钮,出现图1.2所示 的"Discriminant Analysis:Define Range"(判别分析定 : ( 义范围)对话框,在"Minimum"文本框中输入该分组变量 义范围)对话框, 文本框中输入该分组变量 的最小值, 的最小值,在"Maximum"文本框中输入该分组变量的最大 文本框中输入该分组变量的最大 单击" 按钮, 值,单击"Continue"按钮,返回主对话框. 按钮 返回主对话框.
其中
将上边计算结果代人统计量后可得: 将上边计算结果代人统计量后可得:
故在 函数有效. 函数有效.
检验水平下,两总体间差异显著, 检验水平下,两总体间差异显著,即判别
(6)对待判样品判别归类结果如下表: 对待判样品判别归类结果如下表: 对待判样品判别归类结果如下表
2,继续用前面距离判别法例1的人文发展指数的数据作 ,继续用前面距离判别法例 的人文发展指数的数据作 的人文发展指数的数据作Bayes 判别分析. 判别分析. 这里组数k= ,指标数p= , 这里组数 =2,指标数 =3,n1=n2=5
人文发展指数是联合国开发计划署于1990年5月发表 例1 人文发展指数是联合国开发计划署于 年 月发表 的第一份《人类发展报告》中公布的.该报告建议, 的第一份《人类发展报告》中公布的.该报告建议,目前对人 文发展的衡量应当以人生的三大要素为重点, 文发展的衡量应当以人生的三大要素为重点,衡量人生三大要 素的指示分别采用出生时的预期寿命, 素的指示分别采用出生时的预期寿命,成人识字率和实际人均 GDP,将以上三个指示指标的数值合成为一个复合指数,即为 ,将以上三个指示指标的数值合成为一个复合指数, 人文发展指数.资料来源UNDP《人类发展报告》1995年. 人文发展指数.资料来源 《人类发展报告》 年 今从1995年世界各国人文发展指数的排序中,选取高发展 年世界各国人文发展指数的排序中, 今从 年世界各国人文发展指数的排序中 水平,中等发展水平的国家各五个作为两组样品, 水平,中等发展水平的国家各五个作为两组样品,另选四个国 家作为待判样品作判别分析. 家作为待判样品作判别分析. 使用三种判别方法进行判别,并进行研究三者之间的关系. 使用三种判别方法进行判别,并进行研究三者之间的关系.
所以判别函数为
(2)计算判别临界值 0. 计算判别临界值y 计算判别临界值 由于
所以
(3)判别准则 判别准则
(4)对已知类别的样品判别归类 对已知类别的样品判别归类
上述回判结果表明:总的回代判对率为 %,这与统计资料 上述回判结果表明:总的回代判对率为100%,这与统计资料 %, 的结果相符,而且与前面用距离判别法的结果也一致. 的结果相符,而且与前面用距离判别法的结果也一致. (5)对判别效果作检验 对判别效果作检验 由于 检验水平下判别有效. 所以在 检验水平下判别有效. (6)待判样品判别结果如下:判别结果与实际情况吻合. 待判样品判别结果如下: 待判样品判别结果如下 判别结果与实际情况吻合.
选项组中选择进行逐步判别分析的方法, 在"Method"选项组中选择进行逐步判别分析的方法,可供 选项组中选择进行逐步判别分析的方法 选择的判别分析方法有5种 选择的判别分析方法有 种: 1.Wilks'lambda Wilks'lambda方法.默认选项,每步都是 方法. 方法 默认选项, Wilk的概计量最小的进入判别函数. 的概计量最小的进入判别函数. 的概计量最小的进入判别函数 2.Unexplained variance 不可解释方差方法.选择该项, 不可解释方差方法.选择该项, 表示每步都是使各类不可解释的方差和最小变量进入判别函数. 表示每步都是使各类不可解释的方差和最小变量进入判别函数. 3.Mahalanobis'distance Mahalanobis距离方法.选择该 距离方法. 距离方法 表示每步都使靠的最近的两类间Mahalanobis距离最大的变 项,表示每步都使靠的最近的两类间 距离最大的变 量进入判别函数. 量进入判别函数. 4.Smallest F ratio最小 值方法.选择该项,表示每步都使 最小F值方法 最小 值方法.选择该项, 任何两类间的最小的F值最大变量进入判别函数 值最大变量进入判别函数. 任何两类间的最小的 值最大变量进入判别函数.
图1.2 "Discriminate Analysis:Define Range"对 : 对 话框
在变量列表中选择判别分析的变量,单击右向箭头按钮, 在变量列表中选择判别分析的变量,单击右向箭头按钮, 将其移动至" 将其移动至"Independents"(自变量)列表框中. (自变量)列表框中. Step3:选择判别分析方法. :选择判别分析方法. 在主对话框中,自变量列表框下侧显示两个单选框, 在主对话框中,自变量列表框下侧显示两个单选框,用 于指定选择判别分析的方法. 于指定选择判别分析的方法. Enter independents together 默认选项.当认为所有自变 默认选项. 量都能对观测特性提供丰富的信息时,使用该选项, 量都能对观测特性提供丰富的信息时,使用该选项,选择该项 将不加uanz地使用所有自变量进行判别分析,建立全模型,且 地使用所有自变量进行判别分析, 将不加 地使用所有自变量进行判别分析 建立全模型, 不需要进一步选择. 不需要进一步选择. Use stepwise method 逐步分析方法.当认为不是所有自 逐步分析方法. 变量都能对观测量特性提供丰的信息时,选择该项, 变量都能对观测量特性提供丰的信息时,选择该项,因此需要 判别贡献的大小再进行选择.选中该单选按钮时, 判别贡献的大小再进行选择.选中该单选按钮时,"Method" 按钮被激活,可以进一步选择判别分析方法. 按钮被激活,可以进一步选择判别分析方法.