多元统计分析——判别分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学生实验报告
学院:
课程名称:多元统计分析
专业班级:
姓名:
学号:
学生实验报告
一、实验目的及要求:
1、目的
熟悉SPSS统计软件,学会在统计软件SPSS中进行判别分析,并通过判别分析输出结果图,再进行判别分析。根据输出结果,把未分组的判给距离相近那组。
2、内容及要求
⑴熟悉spss软件有关判别分析的操作;
⑵利用spss软件分析判别分析课后练习第六题,判定待判组的类别归属;
⑶输出并解释分析结果并完成实验报告。
二、仪器用具:
三、实验方法与步骤:
步骤一:将数据复制到SPSS中,经过编辑后形成某地区人口死亡状况的数据集,如图1所示。
图1 某地区人口死亡状况的观测数据
步骤二:根据要求,采用系统聚类方法,在SPSS中选择分析-分类-判别分析如图2。
图2 判别分析
步骤三:进行判别分析,将X1到X6全部选入自变量中,分组变量为组别,如图
图3 判别分析选项框
步骤四:在统计量选项框中选择均值,单变量,Box’s M 等,如图4;分类选项中勾选个案、摘要等,如图5。
图4 统计量选项框
图5 分类选项框
四、实验结果与数据处理:
1.检验各组的描述统计量和对各组均值是否相等:
表1 Analysis Case Processing Summary
Unweighted Cases N
Percent
Valid 15 78.9 Excluded
Missing or out-of-range group codes
4
21.1
At least one missing discriminating variable 0
.0
Both missing or
out-of-range group codes and at least one missing discriminating variable 0
.0
Total
4 21.1 Total
19
100.0
表1
表2平上拒绝X4与X5在三组的均值相等的假设,即认为变量X4、X5在三组的均值是有显著差异的。
2. 典型判别函数:
表4 Wilks' Lambda
Test of Function(s) Wilks' Lambda
Chi-square
df
Sig. 1 through 2
.010 43.948 12 .000 2
.591
4.999
5
.416
由表3可以得出:第一判别函数解释了98.8%的方差,第二判别函数解释了1.2%的方差,两个判别函数解释了全部的方差。表4是对两个判别函数的显著性检验,由Wilkins’ Lambda检验,在0.05的显著性水平上,根据P值可以得到,第一个判别函数是显著的,第二个判别函数是不显著的。
3. 判别函数、判别载荷和各组的重心:
表5 Standardized Canonical Discriminant Function Coefficients
Function
1 2
X1 -17.046 -7.677
X2 14.757 9.870
X3 -1.306 -.513
X4 6.381 -.666
X5 1.332 .710
X6 4.315 1.833
表6 Structure Matrix
Function
1 2
X1 .007*-.002
X5 .280 -.394*
X4 .145 -.201*
X3 .096 .104*
X2 .007 .103*
X6 -.035 .092*
表7 Canonical Discriminant Function Coefficients
Function
1 2
X1 -1.950 -.878
X2 1.748 1.169
X3 -.930 -.365
X4 .825 -.086
X5 .102 .054
X6 1.662 .706
(Constant) -78.896 -30.330
表8 Functions at Group Centroids
组别Function
1 2
1 -2.647 1.013
2 9.444 -.259
3 -6.797 -.754
表5是标准化的判别函数,表示为:
Y1=-17.046X1+14.757X2-1.306X3+6.381X4+1.332X5+4.315X6
Y2=-7.677X1+9.870X2-0.531X3-0.666X4+0.710X5+1.833X6
表6为结构矩阵,即判别载荷,表四是反映判别函数在各组的重心
表7是非标准化的判别函数,表示为:
Y1=-78.896-1.950X1+1.748X2-0.930X3+0.825X4+0.102X5+1.662X6
Y2=-30.330-0.878X1+1.169X2-0.365X3-0.086X4+0.054X5+0.706X6
4.分类的统计结果:
表8 Classification Function Coefficients
组别
1 2 3
X1 -159.015 -181.479 -149.370
X2 168.068 187.715 158.749
X3 -98.413 -109.195 -93.908
X4 58.217 68.296 54.948
X5 11.702 12.862 11.185
X6 202.770 221.972 194.625
(Constant) -5628.382 -6584.377 -5266.780
Fisher's linear discriminant functions
表8是每组的分类函数,也称费歇线性判别函数,三组的分类函数表示为:
Y1=-5628.382-159.015X1+168.068X2-98.413X3+58.217X4+11.702X5+202.770X6 Y2=-6584.377-181.479X1+187.715X2-109.195X3-68.296X4+12.862X5+221.972X6 Y3=-5266.780-149.370X1+158.749X2-93.908X3+54.948X4+11.185X5+194.625X6 可以根据计算每个观测在各组的分类函数值,将观测分类到较大的分类函数值中。