上机部分-多元统计分析的SPSS实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是
要给出Fisher判别函数的系数。这个复选框的名字之所以为 Fisher’s,是因为按判别函数值最大的一组进行归类这种思想 是由Fisher提出来的。这里极易混淆,请读者注意辨别。) Unstandardized:给出未标准化的Fisher判别函数(即典型判 别函数)的系数(SPSS默认给出标准化的Fisher判别函数系 数)。
Function 1 -2.177 -2.270 -2.741 -3.199 -2.582 9.674 8.332 10.128 8.342 9.491 -6.687 -7.163 -8.655 -4.766 -5.727 -20.714 -3.319 14.008 -7.595
Function 2 1.364 1.375 1.323 .638 .366 .231 -.613 -2.518 1.760 -.145 -.394 -.685 -1.823 -.608 -.270 -13.498 .831 2.086 -1.752
图4.4 Classify…子对话框
5. 单击Save按钮,指定在数据文件中生成代表判别分组结果 和判别得分的新变量,生成的新变量的含义分别为:
Predicted group membership:存放判别样品所属组别的值; Discriminant scores:存放Fisher判别得分的值,有几个典型
表4.4 个案观察结果表
Case wise Statistic s Highe st Group Squared Mahalanobis Dista nce to Centroid .297 .236 .117 .507 .418 .469 .868 5.985 4.793 .101 .139 .322 5.365 3.384 .998 361.567 .558 28.668 1.982 Disc riminant Sc ores
X 2 :1岁组死亡概率
X 3 : 10岁组死亡概率
X5 : 80岁组死亡概率
X6 : 平均预期寿命
表4.1 各地区死亡概率表
X1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 待判 待判 待判 待判 34.16 33.06 36.26 40.17 50.06 33.24 32.22 41.15 53.04 38.03 34.03 32.11 44.12 54.17 28.07 50.22 34.64 33.42 44.02
图4.2 判别分析主界面
2. 点击Define Range按钮,定义分组变量的取值范围。本例 中分类变量的范围为1到3,所以在最小值和最大值中分别输 入1和3。单击Continue按钮,返回主界面。 3. 单击Statistics…按钮,指定输出的描述统计量和判别函数 系数。选中Function Coefficients栏中的Fisher’s和 Unstandardized。这两个选项的含义如下:
于第三组。
Classific ation Func tion Coefficie nts GROUP X1 X2 X3 X4 X5 X6 (Constant) 1.00 -143.851 153.137 -90.088 53.009 11.008 189.261 -5317.234 2.00 -164.691 171.185 -99.976 62.525 12.094 207.003 -6202.158 3.00 -134.862 144.462 -85.945 49.972 10.520 181.714 -4982.880
如表4.3所示,GROUP栏中的每一列表示样品判入相应列的
Bayes判别函数系数。在本例中,各类的Bayes判别函数如下: 第一组:
F 1 5317.2 143.9 X 1 153.1X 2 90.1 X3 53.0 X 4 11.0 X 5 189.3 X 6
第二组:
这样,只要在前面计算出各观测值的具体坐标位置后,再计算 出它们分别离各重心的距离,就可以得知它们的分类了。
Func tions at G roup Centr oids Function GROUP 1.00 2.00 3.00 1 -2.594 9.194 -6.600 2 1.013 -.257 -.756
X2
7.44 6.34 9.24 13.45 23.03 6.24 4.22 10.08 25.74 11.2 5.41 3.02 15.02 25.03 2.01 6.66 7.33 6.22 15.36
X3
1.12 1.08 1.04 1.43 2.83 1.18 1.06 2.32 4.06 6.07 0.07 0.09 1.08 2.11 0.07 1.08 1.11 1.12 1.07
多元SPSS实现内容提要
1.判别分析SPSS实现 2.聚类分析SPSS实现 3.主成分分析SPSS实现 4.因子分析SPSS实现
判别分析SPSS实现
这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计
算机实现。 为研究某地区人口死亡状况,已按某种方法将15个已知地区 样品分为3类,指标含义及原始数据如下。试建立判别函数, 并判定另外4个待判地区属于哪类? X1 : 0岁组死亡概率 X 4 : 55岁组死亡概率
判别函数就有几个判别得分变量; Probabilities of group membership:存放样品属于各组的 Bayes后验概率值。
将对话框中的三个复选框均选中,单击Continue按钮返回。
图4.5 Save子对话框
6. 返回判别分析主界面,单击OK按钮,运行判别分析过程。
(二) 主要运行结果解释 1. Standardized Canonical Discriminant Function Coefficients(给出标准化的典型判别函数系数)
Case Number 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Ac tua l Group
Predic ted P(G=g Group | D=d) 1 1 1.000 1 1 1 1 2 2 2 2 2 3 3 3 3 3 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 1 2 3 1.000 1.000 .998 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .879 .995 1.000 .998 1.000 1.000
X6
69.3 69.7 68.8 66.2 63.3 65.4 68.7 65.85 63.5 66.8 69.5 70.8 64.8 63.7 68.3 65.2 69.3 68.3 64.2
类别 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 . . . .
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调 出判别分析主界面,将左边的变量列表中的“group”变量选 入分组变量中,将—变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判 别分析。
标准化的典型判别函数是由标准化的自变量通过Fisher判别法
得到的,所以要得到标准化的典型判别得分,代入该函数的自 变量必须是经过标准化的。
2. Canonical Discriminant Function Coefficients(给出未标 准化的典型判别函数系数)
未标准化的典型判别函数系数由于可以将实测的样品观测值直
F2 6202.2 164.7 X1 171.2 X 2 100.0 X3 62.5 X 4 12.1X 5 207.0 X 6
第三组:
F3 4982.9 134.9 X1 144.5 X 2 85.9 X 3 50.0 X 4 10.5 X 5 181.7 X 6
将各样品的自变量值代入上述三个Bayes判别函数,得到三个
函数值。比较这三个函数值,哪个函数值比较大就可以判断该 样品判入哪一类。例如,将第一个待判样品的自变量值分别代 入函数,得到:
F1=3793.77, F2=3528.32,
F3=3882.48
比较三个值,可以看出最大,据此得出第一个待判样品应该属
接代入求出判别得分,所以该系数使用起来比标准化的系数要 方便一些。见表4.2(a)。
由此表可知,两个Fisher判别函数分别为:
y1 74.99 1.861X1 1.656 X 2 0.877 X3 0.798 X 4 0.098 X 5 1.579 X 6 y2 29.482 0.867 X1 1.155 X 2 0.356 X 3 0.089 X 4 0.054 X 5 0.69 X 6
X4
7.87 6.77 8.97 13.88 23.74 22.9 20.7 32.84 34.87 27.84 5.2 3.14 15.15 25.15 3.02 22.54 7.78 22.95 16.45
X5
95.19 94.08 97.3 101.2 112.52 160.01 124.7 172.06 152.03 146.32 90.1 85.15 103.12 110.14 81.22 170.6 95.16 160.31 105.3
Unstanda rdized c anonica l discrim inant func tions e valuated at group m e ans
表4.2(b) 组重心处的Fisher判别函数值
4. Classification Function Coefficients(给出Bayes判别函数 系数)
单击Continue按钮,返回主界面。
图4.3 Statistics子对话框
4. 单击Classify…按钮,定义判别分组参数和选择输出结果。 选择Display栏中的Casewise results,输出一个判别结果表, 包括每个样品的判别分数、后验概率、实际组和预测组编号 等。其余的均保留系统默认选项。单击Continue按钮。
Fisher's line ar discriminant functions
表4.3 Bayes判别法的输出结果
5. Casewise Statistics(给出个案观察结果)
在Casewise Statistics输出表针对每个样品给出了了大部分的判
别结果,其中包括:实际类(Actual Group)、预测类 (Predicted Group)、Bayes判别法的后验概率、与组重心的 马氏距离(Squared Mahalanobis Distance to Centroid)以及 Fisher判别法的每个典型判别函数的判别得分(Discriminant Scores)。出于排版要求,这里给出结果表的是经过加工的, 隐藏了其中的一些项目,如表4.4所示。从表中可以看出四个 待判样本依次被判别为第三组、第一组、第二组和第三组。
ungrouped ungrouped ungrouped ungrouped
6. 由于我们在Save子对话框中选择了生成表示判别结果的新 变量,所以在数据编辑窗口中,可以观察到产生的新变量。 其中,变量dis-1存放判别样品所属组别的值,变量dis1-1和 dis2-1分别代表将样品各变量值代入第一个和第二个判别函 数所得的判别分数,变量dis1-2、dis2-2和dis3-2分别代表样 品分别属于第1组、第2组和第3组的Bayes后验概率值。
实际Байду номын сангаас两个函数式计算的是各观测值在各个维度上的坐标,这
样就可以通过这两个函数式计算出各样品观测值的具体空间位 置。
表4.2(a) 未标准化的典型判别函数系数
3. Functions at Group Centroids(给出组重心处的Fisher判 别函数值)
如表4.2 (b) 所示,实际上为各类别重心在空间中的坐标位置。
要给出Fisher判别函数的系数。这个复选框的名字之所以为 Fisher’s,是因为按判别函数值最大的一组进行归类这种思想 是由Fisher提出来的。这里极易混淆,请读者注意辨别。) Unstandardized:给出未标准化的Fisher判别函数(即典型判 别函数)的系数(SPSS默认给出标准化的Fisher判别函数系 数)。
Function 1 -2.177 -2.270 -2.741 -3.199 -2.582 9.674 8.332 10.128 8.342 9.491 -6.687 -7.163 -8.655 -4.766 -5.727 -20.714 -3.319 14.008 -7.595
Function 2 1.364 1.375 1.323 .638 .366 .231 -.613 -2.518 1.760 -.145 -.394 -.685 -1.823 -.608 -.270 -13.498 .831 2.086 -1.752
图4.4 Classify…子对话框
5. 单击Save按钮,指定在数据文件中生成代表判别分组结果 和判别得分的新变量,生成的新变量的含义分别为:
Predicted group membership:存放判别样品所属组别的值; Discriminant scores:存放Fisher判别得分的值,有几个典型
表4.4 个案观察结果表
Case wise Statistic s Highe st Group Squared Mahalanobis Dista nce to Centroid .297 .236 .117 .507 .418 .469 .868 5.985 4.793 .101 .139 .322 5.365 3.384 .998 361.567 .558 28.668 1.982 Disc riminant Sc ores
X 2 :1岁组死亡概率
X 3 : 10岁组死亡概率
X5 : 80岁组死亡概率
X6 : 平均预期寿命
表4.1 各地区死亡概率表
X1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 待判 待判 待判 待判 34.16 33.06 36.26 40.17 50.06 33.24 32.22 41.15 53.04 38.03 34.03 32.11 44.12 54.17 28.07 50.22 34.64 33.42 44.02
图4.2 判别分析主界面
2. 点击Define Range按钮,定义分组变量的取值范围。本例 中分类变量的范围为1到3,所以在最小值和最大值中分别输 入1和3。单击Continue按钮,返回主界面。 3. 单击Statistics…按钮,指定输出的描述统计量和判别函数 系数。选中Function Coefficients栏中的Fisher’s和 Unstandardized。这两个选项的含义如下:
于第三组。
Classific ation Func tion Coefficie nts GROUP X1 X2 X3 X4 X5 X6 (Constant) 1.00 -143.851 153.137 -90.088 53.009 11.008 189.261 -5317.234 2.00 -164.691 171.185 -99.976 62.525 12.094 207.003 -6202.158 3.00 -134.862 144.462 -85.945 49.972 10.520 181.714 -4982.880
如表4.3所示,GROUP栏中的每一列表示样品判入相应列的
Bayes判别函数系数。在本例中,各类的Bayes判别函数如下: 第一组:
F 1 5317.2 143.9 X 1 153.1X 2 90.1 X3 53.0 X 4 11.0 X 5 189.3 X 6
第二组:
这样,只要在前面计算出各观测值的具体坐标位置后,再计算 出它们分别离各重心的距离,就可以得知它们的分类了。
Func tions at G roup Centr oids Function GROUP 1.00 2.00 3.00 1 -2.594 9.194 -6.600 2 1.013 -.257 -.756
X2
7.44 6.34 9.24 13.45 23.03 6.24 4.22 10.08 25.74 11.2 5.41 3.02 15.02 25.03 2.01 6.66 7.33 6.22 15.36
X3
1.12 1.08 1.04 1.43 2.83 1.18 1.06 2.32 4.06 6.07 0.07 0.09 1.08 2.11 0.07 1.08 1.11 1.12 1.07
多元SPSS实现内容提要
1.判别分析SPSS实现 2.聚类分析SPSS实现 3.主成分分析SPSS实现 4.因子分析SPSS实现
判别分析SPSS实现
这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计
算机实现。 为研究某地区人口死亡状况,已按某种方法将15个已知地区 样品分为3类,指标含义及原始数据如下。试建立判别函数, 并判定另外4个待判地区属于哪类? X1 : 0岁组死亡概率 X 4 : 55岁组死亡概率
判别函数就有几个判别得分变量; Probabilities of group membership:存放样品属于各组的 Bayes后验概率值。
将对话框中的三个复选框均选中,单击Continue按钮返回。
图4.5 Save子对话框
6. 返回判别分析主界面,单击OK按钮,运行判别分析过程。
(二) 主要运行结果解释 1. Standardized Canonical Discriminant Function Coefficients(给出标准化的典型判别函数系数)
Case Number 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Ac tua l Group
Predic ted P(G=g Group | D=d) 1 1 1.000 1 1 1 1 2 2 2 2 2 3 3 3 3 3 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 1 2 3 1.000 1.000 .998 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .879 .995 1.000 .998 1.000 1.000
X6
69.3 69.7 68.8 66.2 63.3 65.4 68.7 65.85 63.5 66.8 69.5 70.8 64.8 63.7 68.3 65.2 69.3 68.3 64.2
类别 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 . . . .
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调 出判别分析主界面,将左边的变量列表中的“group”变量选 入分组变量中,将—变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判 别分析。
标准化的典型判别函数是由标准化的自变量通过Fisher判别法
得到的,所以要得到标准化的典型判别得分,代入该函数的自 变量必须是经过标准化的。
2. Canonical Discriminant Function Coefficients(给出未标 准化的典型判别函数系数)
未标准化的典型判别函数系数由于可以将实测的样品观测值直
F2 6202.2 164.7 X1 171.2 X 2 100.0 X3 62.5 X 4 12.1X 5 207.0 X 6
第三组:
F3 4982.9 134.9 X1 144.5 X 2 85.9 X 3 50.0 X 4 10.5 X 5 181.7 X 6
将各样品的自变量值代入上述三个Bayes判别函数,得到三个
函数值。比较这三个函数值,哪个函数值比较大就可以判断该 样品判入哪一类。例如,将第一个待判样品的自变量值分别代 入函数,得到:
F1=3793.77, F2=3528.32,
F3=3882.48
比较三个值,可以看出最大,据此得出第一个待判样品应该属
接代入求出判别得分,所以该系数使用起来比标准化的系数要 方便一些。见表4.2(a)。
由此表可知,两个Fisher判别函数分别为:
y1 74.99 1.861X1 1.656 X 2 0.877 X3 0.798 X 4 0.098 X 5 1.579 X 6 y2 29.482 0.867 X1 1.155 X 2 0.356 X 3 0.089 X 4 0.054 X 5 0.69 X 6
X4
7.87 6.77 8.97 13.88 23.74 22.9 20.7 32.84 34.87 27.84 5.2 3.14 15.15 25.15 3.02 22.54 7.78 22.95 16.45
X5
95.19 94.08 97.3 101.2 112.52 160.01 124.7 172.06 152.03 146.32 90.1 85.15 103.12 110.14 81.22 170.6 95.16 160.31 105.3
Unstanda rdized c anonica l discrim inant func tions e valuated at group m e ans
表4.2(b) 组重心处的Fisher判别函数值
4. Classification Function Coefficients(给出Bayes判别函数 系数)
单击Continue按钮,返回主界面。
图4.3 Statistics子对话框
4. 单击Classify…按钮,定义判别分组参数和选择输出结果。 选择Display栏中的Casewise results,输出一个判别结果表, 包括每个样品的判别分数、后验概率、实际组和预测组编号 等。其余的均保留系统默认选项。单击Continue按钮。
Fisher's line ar discriminant functions
表4.3 Bayes判别法的输出结果
5. Casewise Statistics(给出个案观察结果)
在Casewise Statistics输出表针对每个样品给出了了大部分的判
别结果,其中包括:实际类(Actual Group)、预测类 (Predicted Group)、Bayes判别法的后验概率、与组重心的 马氏距离(Squared Mahalanobis Distance to Centroid)以及 Fisher判别法的每个典型判别函数的判别得分(Discriminant Scores)。出于排版要求,这里给出结果表的是经过加工的, 隐藏了其中的一些项目,如表4.4所示。从表中可以看出四个 待判样本依次被判别为第三组、第一组、第二组和第三组。
ungrouped ungrouped ungrouped ungrouped
6. 由于我们在Save子对话框中选择了生成表示判别结果的新 变量,所以在数据编辑窗口中,可以观察到产生的新变量。 其中,变量dis-1存放判别样品所属组别的值,变量dis1-1和 dis2-1分别代表将样品各变量值代入第一个和第二个判别函 数所得的判别分数,变量dis1-2、dis2-2和dis3-2分别代表样 品分别属于第1组、第2组和第3组的Bayes后验概率值。
实际Байду номын сангаас两个函数式计算的是各观测值在各个维度上的坐标,这
样就可以通过这两个函数式计算出各样品观测值的具体空间位 置。
表4.2(a) 未标准化的典型判别函数系数
3. Functions at Group Centroids(给出组重心处的Fisher判 别函数值)
如表4.2 (b) 所示,实际上为各类别重心在空间中的坐标位置。