判别分析的一般步骤及SPSS实现

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

.322 -7.163 -.685
13
3
3 1.000
5.365 -8.655 -1.823
14
3
3 .879
3.384 -4.766 -.608
15
3
3 .995
.998 -5.727 -.270
16
ungrouped
3 1.000
361.567 -20.714 -13.498
17
ungrouped
49 . 97 2 10 . 52 0 18 1. 7 14 - 49 82. 8 80
判别分析的SPSS实现
5. Casewise Statistics（给出个案观察结果）在Casewise Statistics输出表针对每个样品给出了了大部分的判
别结果，其中包括：实际类（Actual Group）、预测类（Predicted Group）、Bayes判别法的后验概率、与组重心的马氏距离（Squared Mahalanobis Distance to Centroid）以及Fisher 判别法的每个典型判别函数的判别得分（Discriminant Scores）。出于排版要求，这里给出结果表的是经过加工的，隐藏了其中的一些项目，如表7.4所示。从表中可以看出四个待判样本依次被判别为第三组、第一组、第二组和第三组。
实际上两个函数式计算的是各观测值在各个维度上的坐标，这样就可以通过这两个函数式计算出各样品观测值的具体空间位置。
判别分析的SPSS实现
表7.2（a）未标准化的典型判别函数系数
3. Functions at Group Centroids（给出组重心处的Fisher判别函数值）如表7.2 (b) 所示，实际上为各类别重心在空间中的坐标位置。这样，只要在前面计算出各观测值的具体坐标位置后，再计算出它们分别离各重心的距离，就可以得知它们的分类了。
图7.2 判别分析主界面
判别分析的SPSS实现
2. 点击Define Range按钮，定义分组变量的取值范围。本例中分类变量的范围为1到3，所以在最小值和最大值中分别输入1和3。单击Continue按钮，返回主界面。
判别分析的SPSS实现
3. 单击Statistics…按钮，指定输出的描述统计量和判别函数系数。选中Function Coefficients栏中的Fisher’s和Unstandardized。这两个选项的含义如下：
2. 0 0 - 16 4. 69 1
17 1. 1 85 - 99 .9 76
62 . 52 5 12 . 09 4 20 7. 0 03 - 62 02. 1 58
Fisher's linear discriminant functions
3. 0 0 - 13 4. 86 2
14 4. 4 62 - 85 .9 45
Centroid
.297
Func tion 1
-2.177
Func tion 2
1.364
2
1
1 1.000
.236 -2.270 1.375
3
1
1 1.000
.117 -2.741 1.323
4
1
1 .998
.507 -3.199
.638
5
1
1 1.000
.418 -2.582
.366
6
2
2 1.000
表7.2（b）组重心处的Fisher判别函数值
Functions at Group Centroids
Func tion
GROUP 1. 0 0
1 - 2. 59 4
2 1. 0 13
2. 0 0
9. 1 94
- .2 57
3. 0 0
- 6. 60 0
- .7 56
Unstandardized c anonic al disc riminant functions evaluated at group m eans
Fisher’s：给出Bayes判别函数的系数。（注意：这个选项不是要给出 Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s，是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆，请注意辨别。）
Unstandardized：给出未标准化的Fisher判别函数（即典型判别函数）
的系数（SPSS默认给出标准化的Fisher判别函数系数）。
判别分析的SPSS实现
注：由于SPSS中的判别分析没有距离判别这一方法，因此距离判别法无法在SPSS中直接实现(但可以通过Excel等软件来进行手工计算)。
判别分析的SPSS实现
单击Continue按钮，返回主界面。
图7.3 Statistics子对话框
将各样品的自变量值代入上述三个Bayes判别函数，得到三个函数值。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。例如，将第一个待判样品的自变量值分别代入函数，得到： F1=3793.77， F2=3528.32， F3=3882.48
比较三个值，可以看出第一个待判样品应该属于第三组。
X 4 ： 55岁组死亡概率 X5 ： 80岁组死亡概率 X6 ：平均预期寿命
表7.1 各地区死亡概率表
X1
X2
X3
X4
X5
X6
类别
1
34.16 7.44 1.12 7.87 95.19 69.3
1
2
33.06 6.34 1.08 6.77 94.08 69.7
1
3
36.26 9.24 1.04 8.97 97.3 68.8
2
9
53.04 25.74 4.06 34.87 152.03 63.5
2
10 38.03 11.2 6.07 27.84 146.32 66.8
2
11 34.03 5.41 0.07 5.2 90.1 69.5
3
12 32.11 3.02 0.09 3.14 85.15 70.8
3
13 44.12 15.02 1.08 15.15 103.12 64.8
5. 单击Save按钮，指定在数据文件中生成代表判别分组结果和判别得分的新变量，生成的新变量的含义分别为：
Predicted group membership：存放判别样品所属组别的值； Discriminant scores：存放Fisher判别得分的值，有几个典型判别函数就
有几个判别得分变量； Probabilities of group membership：存放样品属于各组的Bayes后验概率值。
表7.4 个案观察结果表
Case wise Statistics
Highest Group
Discriminant Scores
Case Number
1
Ac tual Group
Predicted Group
1
1
P(G=g | D=d)
1.000
Squared Mahalanobis Distanc e to
4. 单击Classify…按钮，定义判别分组参数和选择输出结果。选择 Display栏中的Casewise results，输出一个判别结果表，包括每个样品的判别分数、后验概率、实际组和预测组编号等。其余的均保留系统默认选项。单击Continue按钮。
图7.4 Classify…子对话框
判别分析的SPSS实现
将对话框中的三个复选框均选中，单击Continue按钮返回。
判别分析的SPSS实现
图7.5 Save子对话框 6. 返回判别分析主界面，单击OK按钮，运行判别分析过程。
判别分析的SPSS实现
（二）主要运行结果解释 1. Standardized Canonical Discriminant Function Coefficients（给出标准化的典型判别函数系数）
3
14 54.17 25.03 2.11 25.15 110.14 63.7
3
15 28.07 2.01 0.07 3.02 81.22 68.3
3
待判 50.22 6.66 1.08 22.54 170.6 65.2
.
待判 34.64 7.33 1.11 7.78 95.16 69.3
.
待判 33.42 6.22 1.12 22.95 160.31 68.3
第二组：
F2 6202.2 164.7X1 171.2X2 100.0 X3 62.5X4 12.1X5 207.0X6
第三组：
F3 4982.9 134.9X1 144.5X2 85.9X3 50.0X4 10.5X5 181.7X6
判别分析的SPSS实现
判别分析的SPSS实现
表7.3 Bayes判别法的输出结果
Classification Function Coefficie nts
GROUP
X1 X2 X3 X4 X5 X6 ( Con st ant )
1. 0 0 - 14 3. 85 1
15 3. 1 37 - 90 .0 88
53 . 00 9 11 . 00 8 18 9. 2 61 - 53 17. 2 34
.469 9.674
.231
7
2
2 1.000
.868 8.332
-.613
8
2
2 1.000
5.985 10.128 -2.518
9
2
2 1.000
4.793 8.342 1.760
10
2
2 1.000
.101 9.491
-.145
11
3
3 1.000
.139 -6.687 -.394
12
3
3 1.000
.
待判 44.02 15.36 1.07 16.45 105.3 64.2
.
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate，调出判别分析主界面，将左边的变量列表中的“group”变量选入分组变量中，将 X1 — X6 选入自变量中，并选择Enter independents together单选按钮，即使用所有自变量进行判别分析。
判别分析的SPSS实现
由此表可知，两个Fisher判别函数分别为： y1 74.99 1.861X1 1.656X2 0.877 X3 0.798X4 0.098X5 1.579X6 y2 29.482 0.867X1 1.155X2 0.356X3 0.089X 4 0.054X5 0.69X6
判别分析的一般步骤及SPSS实现
判别分析的逻辑框图
判别分析的SPSS实现
例1:为研究某地区人口死亡状况，已按某种方法将15个已知地区样品分为3类，指标含义及原始数据如下。试建立判别函数，并判定另外4个待判地区属于哪类？
X1 ： 0岁组死亡概率 X 2 ：1岁组死亡概率 X 3 ： 10岁组死亡概率
ห้องสมุดไป่ตู้
1 .998
.558 -3.319
.831
18
ungrouped
2 1.000
28.668 14.008 2.086
19
ungrouped
3 1.000
1.982 -7.595 -1.752
判别分析的SPSS实现
6. 由于我们在Save子对话框中选择了生成表示判别结果的新变量，所以在数据编辑窗口中，可以观察到产生的新变量。其中，变量 dis-1存放判别样品所属组别的值，变量dis1-1和dis2-1分别代表将样品各变量值代入第一个和第二个判别函数所得的判别分数，变量dis1-2、dis2-2和dis3-2分别代表样品分别属于第1组、第2组和第3组的Bayes后验概率值。
标准化的典型判别函数是由标准化的自变量通过Fisher判别法得到的，所以要得到标准化的典型判别得分，代入该函数的自变量必须是经过标准化的。
2. Canonical Discriminant Function Coefficients（给出未标准化的典型判别函数系数）
未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分，所以该系数使用起来比标准化的系数要方便一些。见表7.2（a）。
1
4
40.17 13.45 1.43 13.88 101.2 66.2
1
5
50.06 23.03 2.83 23.74 112.52 63.3
1
6
33.24 6.24 1.18 22.9 160.01 65.4
2
7
32.22 4.22 1.06 20.7 124.7 68.7
2
8
41.15 10.08 2.32 32.84 172.06 65.85
判别分析的SPSS实现
4. Classification Function Coefficients（给出Bayes判别函数系数）如表7.3所示，Group栏中的每一列表示样品判入相应列的Bayes
判别函数系数。在本例中，各类的Bayes判别函数如下：第一组：
F1 5317.2 143.9X1 153.1X2 90.1X3 53.0 X4 11.0X5 189.3X6