判别分析 SPSS应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Statistics 对话框-指定输出统计量
Descriptives:描述统计量 Function Coefficients:判别函数系数 Matrices:观测量的统计矩阵。
观测量均值; 单变量方差分析检验。原假设各类同一自变量均值相等。 各类协方差矩阵相等的检验。原假设各类协方差矩阵相等。
花瓣宽
4.340 3.145 4.287 4.188 .387 .452 .486 1.000
花萼宽 花瓣长 花瓣宽 Correlation 花萼长 花萼宽 花瓣长 花瓣宽
29.960 8.767 16.129 4.340 1.000 .471 .683 .387
进一步分析 必要性,挑 选变量?
a. The covariance matrix has 147 degrees of freedom.
Valid N (listwise) Unweighted Weighted 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 150 150.000 150 150.000 150 150.000 150 150.000
花萼长 花萼宽 花瓣长 花瓣宽
单变量方差分析结果:进行假设检验,原假设不同类中 的同变量均值相等。 Wilk的 统计量。 F检验。
判别分析结果输出(4a)
a Covariance Matrices
分类 ห้องสมุดไป่ตู้毛鸢尾花
花萼长 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽
对话框上部左侧的变量列表中选分析变量,点击钮使 之进入Independents框 对话框上部左侧的变量列表中选分组(类)变量,点击 钮使之进入Group Variable框 Enter independents togther 或 Use Stepwise method:所 选全部参与判别分析 还是 逐步方法挑选变量判别分析 5个功能按钮: 1) Select : 根据标识变量,选择部分数据参与分析 2) Statistics : 指定输出统计量 3) Method : 判别分析方法 4) Classify : 分类参数、图表输出、交叉验证 5) Save : 在数据文件之建立新变量显示输出结果
花瓣长
1.636 1.170 3.016 .607 18.290 8.127 22.082 7.310 28.461 5.804 30.694 4.943 130.036 -33.056 312.670 129.803
花瓣宽
1.033 .930 .607 1.111 5.578 4.049 7.310 3.911 6.409 4.456 4.943 7.543 53.507 -12.083 129.803 58.101
费歇尔判别系数; 未标准化的判别方程系数。
合并类内相关矩阵; 合并类内协方差矩阵(各类协方差矩阵取平均计算)。 各类的协方差矩阵 总的协方差矩阵。
Classify对话框-分类参数和判别结果
Prior Probabilities:先验概率。 输出窗口中的有关分类结果 缺测值处理办法
分类统计结果:均值、方差、未加权的 权重和加权的权重。
判别分析结果输出(3)
Tests of Equality of Group Means Wilks' Lambda .397 .598 .059 .071 F 111.847 49.371 1179.052 960.007 df1 2 2 2 2 df2 147 147 147 147 Sig. .000 .000 .000 .000
0 0 150
.0 .0 100.0
参与判别分析的观测量数据总结
判别分析结果输出(2)
Group Statistics
分类 刚毛鸢尾花
变色鸢尾花
佛吉尼亚鸢尾花
Total
花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽
Method对话框- 选择变量的判别分析方法
Wilk’ lambda:每步使得Wilk的统计量最小的变量进入 判别函数( 统计量-判别函数组内离差平方和与组间 离差平方和的比值)。 Unexplained variance:每步使得各类不可解释的方差之 和最小的变量进入判别函数; Mahalanobis’ distance:每步使得两类间最近的马氏距离 最大的变量进入函数; Smallest F ratio:每步使得两类间最小的F值最大的变量 进入函数; Rao’s V:每步使得Rao V统计量产生最大增量的变量进 入判别函数。
指定使用合并类内协方差矩阵进行分析。 指定使用各类协方差矩阵进行分析。
生成一个包括各类的散点图,根据前两个判别函数作图;如果只有一 个判别函数,则输出直方图。 对每类生成一个散点图,根据前两个判别函数作图。但如果只有一个 判别函数,则输出直方图。 生成区域图。即根据函数值把观测量分到各类中去的区域图,把一个 平面划分成与类数相同的区域,每类占据一个区,各类均值在各区中 用星号标注。
判别分析结果输出(4b)
a Pooled Within-Groups Matrices
花萼长
Covariance 花萼长
花萼宽
8.767 11.542 5.033 3.145 .471 1.000 .344 .452
花瓣长
16.129 5.033 18.597 4.287 .683 .344 1.000 .486
12.425 9.922 1.636 1.033 26.643 8.288 18.290 5.578 50.812 8.090 28.461 6.409 74.537 -4.683 130.036 53.507
花萼宽
9.922 14.369 1.170 .930 8.288 9.902 8.127 4.049 8.090 10.355 5.804 4.456 -4.683 19.036 -33.056 -12.083
a. First 2 canonical discriminant functions were used in the analysis.
典则判别函数的特征值(即矩阵W-1B的特征 根 )以及方差贡献。 典则相关系数(Canonical Correlation)。
判别分析结果输出(7)
Wilks' Lambda Test of Function(s) 1 through 2 2 Wilks' Lambda .025 .774 Chi-square 538.950 37.351 df 8 3 Sig. .000 .000
合并类内协方差矩阵和相关矩阵:阵中各元素是各类 协方差阵或相关阵中对应元素的均值。 花瓣长和花萼长的协方差值和相关系数值较大。
判别分析结果输出(5)
Test Results Box's M F Approx. df1 df2 Sig. 162.596 7.811 20 77566.75 .000
Wilk的Lambda 统计量:组内离差交叉乘积矩阵行列式与 总离差交叉乘积矩阵行列式比值。对判别函数的有效性 进行检验假设。 两判别函数自由度: (4-1+1)(3-1)=8;(4-2+1)(3- 2)=3
该统计量服从自由度为(m-r+1)(G-r)的 χ2-分布. r 为第几个判别函数,m 为变量数,G 为类数。
定义 Group Variable(分组或类)数目
Minmum:分组变量中的最小值; Maxmum:分组变量中的最大值;
仅选择 Use Stepwise method,才能进入此界面; Method:可供选择的判别分析指标; Criteria:选入或剔除变量的临界值-判据。要求Entry F value>Removal F value(对于probability of F 相反); Display:Summary of steps,逐步选择变量过程中,显示每步 分析结果; F for pairwise distance-显示两类类之间的F值 矩阵;
变色鸢尾花
佛吉尼亚鸢尾花
,
进一步分析 必要性,挑 选变量?
Total
a. The total covariance matrix has 149 degrees of freedom.
各类协方差矩阵和总协方差矩阵。 除刚毛鸢尾花外,另两种花的花瓣长和花萼长的协方差数 值较大。 总协方差阵中,花瓣长和花萼长的协方差数值较大。
Mean 50.06 34.28 14.62 2.46 59.36 27.66 42.60 13.26 66.38 29.82 55.60 20.26 58.60 30.59 37.61 11.99
Std. Deviation 3.52 3.79 1.74 1.05 5.16 3.15 4.70 1.98 7.13 3.22 5.54 2.75 8.63 4.36 17.68 7.62
SPSS 判别分析和应用
观测量描述统计量 判别函数系数 标准化以及未标准化典则判别函数系数 类内相关矩阵和协方差矩阵 判别函数得分和据此划分的类别 判别函数的判别效果 交叉验证
点击菜单 Analysis→classify→discriminant
Discriminant功能界面-主对话框
Tests null hypothesis of equal population covariance matrices.
各类协方差矩阵相等的假设检验:假设各类协方差矩 阵相等。 结果:置信水平为0.000,各类协方差矩阵不相等。
判别分析结果输出(6)
Eigenvalues Function 1 2 Eigenvalue % of Variance 30.419a 99.0 .293a 1.0 Cumulative % 99.0 100.0 Canonical Correlation .984 .476
判别分析应用实例1—— 全变量分析
数据集:鸢(yuan)尾花的花瓣和花萼 的长宽数据。 一共收集3种鸢(yuan)尾花,每种50个 样本,共150个样本。
判别分析结果输出(1)
Analysis Case Processing Summary Unweighted Cases Valid Excluded Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total N 150 0 0 Percent 100.0 .0 .0
分类使用的协方差阵 输出的统计图
各类先验概率相等; 根据各类样本量计算先验概率,各类先验概率与其样 本量成正比。
对每个观测量输出判别分数、实际类、预测类和后验概率等。 Limit cases to first:指定输出前n个观测量的分类结果。 输出分类小结,给出正确分类的观测量数,错分观测量数和 错分率。 交叉验证的判别分类结果,即所依据的判别函数是由除该观 测量以外的其它观测量导出的。
Save对话框—— 数据文件中创建新变量输出判别分析结果
预测分类(判别分类结果-类成员)。 建立表明判别分数的变量,有几个判别函数就有几个判别分数变量:未 标准化的典则判别系数乘以变量数值求和再加上常数项。 建立新变量表明观测量属于某一类的概率。有多少类就有多数个新变量 对应属于该类的概率。