第四讲判别分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四讲:判别分析
温州大学《现代统计分析方法》课程组
在主对话框中单击“Save...”可得以下对话框:
选“Predicted group membership”可保存各样品的判 别分类; 选“Discriminant scores”可保存各样品的典型判别函 数值; 选“Probabilities of group membership”可保存各样品 的后验概率。
Std. Deviation 3.525 3.791 1.737 1.054 5.162 3.138 4.699 1.978 6.359 3.225 5.519 2.747 8.281 4.359 17.653 7.622
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表6:相应的特征值、方差百分比、方差累计百分比及正则相关系数
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表7:判别式的组均值
Functions at Group Centroids Function
组别
1 2 3
1 -7.608 1.825 5.783
2 .215 -.728 .513
Unstandardized canonical discriminant functions evaluated at group means
第四讲:判别分析
温州大学《现代统计分析方法》课程组
2、在“Function Coefficients”对话框中的设置: 选“Fisher’s”可得费歇的线性判别函数的系数; 选“Unstandardized”得非标准化的典型判别函数系数; 3、在“Matrices”对话框中的设置: 选“Within-groups correlation”可得合并组内的相关系 数矩阵。 选“Within-groups covariance”可得合并组内的协方差 矩阵。 选“Separate-groups covariance”可得分组组内协方差 矩阵; 选“Total covariances”可得总协方差矩阵。 选定后单击“Continue”可返回主对话框(下同)。
第四讲:判别分析
温州大学《现代统计分析方法》课程组
点“Define Range”按钮,给出分类变量取值范围的上下 限,在“Minimum”和“Maximum”窗口分别输入下限和上限。 “Independents”对话框,从左侧的变量列表中选入要分 析的变量,单击向右的三角形按钮使之进入该框。 “Enter independent together”按钮表示选择所有变量参 与判别分析。 “Use Stepwise method”按钮表示使用逐步判别方法。激 活 “Select Variable”按钮,在该按钮下选择进入变量。
组别 1
2
3
Total
x1 x2 x3 x4 x1 x2 x3 x4 x1 x2 x3 x4 x1 x2 x3 x4
Mean 50.06 34.28 14.62 2.46 59.36 27.70 42.60 13.26 65.88 29.74 55.52 20.26 58.43 30.57 37.58 11.99
第四讲:判别分析
温州大学《现代统计分析方法》课程组
在主对话框中单击“Classify...”可打开以下对话框:
1、在“Prior Probabilities”对话框中的设置: 选“All groups equal”则设定各类先验概率相同; 选“Compute from group size”则设定以样本中各类样 品出现的频率为各类的先验概率。
第四讲:判别分析
温州大学《现代统计分析方法》课程组
例5.2.3 对破产的企业收集它们在破产前两年的年度 财务数据,同时对财务良好的企业也收集同一时期的数据。 数据涉及四个变量: x1=现金流量/总债务, x2=净收入/总资 产,x3=流动资产/流动债务,以及x4=流动资产/净销售额。 数据见表5.2.1,1组为破产企业,2组为非破产企业。 试建立判别函数,估计误判概率,并对某个待判企业数据:
第四讲:判别分析
温州大学《现代统计分析方法》课程组
在主对话框中单击“Statistics”按钮可以打开选择输出 统计量的对话框。
1、在“Descriptives”对话框中的设置: 选“Means”得到各类的均数、标准差等统计量; 选“Univariate ANOVAs”得到各单变量的方差分析; 选“Box’s M”可得到各类协差阵相等性的Box检验。
y1 = 4.035x1 −18.387x2 +1.616x3 +12.194x4 − 4.382
y2 = 5.295x1 −10.020 x2 + 3.306 x3 + 9.949 x4 − 6.754 待判企业数据是: x = ( −0.16, −0.10,1.45, 0.51)′
把待判企业数据代入得: y1 = 4.035 x1 − 18.387 x 2 + 1.616 x3 + 12.194 x 4 − 4.382 = 5.373
a
组别
1 x1 x2 x3 x4 x1 x2 x3 x4 x1 x2 x3 x4
x1 .044 .028 .034 .004 .047 .009 .075 -.007 .068 .028 .150 -.003
x2 .028 .021 .026 .003 .009 .002 .009 .000 .028 .015 .059 .001
x3 .034 .026 .164 .033 .075 .009 1.047 .033 .150 .059 1.013 .029
x4 .004 .003 .033 .045 -.007 .000 .033 .026 -.003 .001 .029 .034
2
Total
a. The total covariance matrix has 45 degrees of freedom.
第四讲:判别分析
温州大学《现代统计分析方法》课程组
∑的联合估计
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表3:非标准化判别函数的系数
Classification Function Coefficients
组别
x1 x2 x3 x4 (Constant) 1 4.035 -18.387 1.616 12.194 -5.075 2 5.295 -10.020 3.306 9.949 -7.447
第四讲
判别分析
第四讲:判别分析
温州大学《现代统计分析方法》课程组
例5.2.3 对破产的企业收集它们在破产前两年的年度 财务数据,同时对财务良好的企业也收集同一时期的数据。 数据涉及四个变量: x1=现金流量/总债务, x2=净收入/总资 产,x3=流动资产/流动债务,以及x4=流动资产/净销售额。 数据见表5.2.1,1组为破产企业,2组为非破产企业。 试建立判别函数,估计误判概率,并对某个待判企业数据:
Eigenvalues Canonical Function Eigenvalue % of Variance Cumulative % Correlation 1 32.192a 99.1 99.1 .985 2 .285a .9 100.0 .471 a. First 2 canonical discriminant functions were used in the analysis.
Cross-validated
a
Count %
组别 1 2 1 2 1 2 1 2
Predicted Group Membership 1 2 18 1 85.7 4.0 18 2 85.7 8.0
Total 3 24 14.3 96.0 3 23 14.3 92.0 21 25 100.0 100.0 21 25 100.0 100.0
x = ( −0.16, −0.10,1.45, 0.51)′
判别其应属于何类企业。 实验步骤: 根据上述步骤得以下结果:
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表1:独立变量的全部和各组的均值和标准离差。
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表2:协方差矩阵
Covariance Matrices
Fisher's linear discriminant functions
第四讲:判别分析
温州大学《现代统计分析方法》课程组
据此得判别方程:
y2 = 5.295x1 −10.020 x2 + 3.306 x3 + 9.949 x4 − 7.447
经修正后的判别方程:
y1 = 4.035x1 −18.387x2 +1.616x3 +12.194x4 − 5.075
Hale Waihona Puke Baidu
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表5:各组的均值和标准离差.
Group Statistics Valid N (listwise) Unweighted Weighted 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 150 150.000 150 150.000 150 150.000 150 150.000
x = ( −0.16, −0.10,1.45, 0.51)′
判别其应属于何类企业。
判别分析操作步骤 在数据窗口建立或打开一个待进行判别分析的数据文件, 判别分析的步骤如下:点Analyze→Classify→Discriminant
第四讲:判别分析
温州大学《现代统计分析方法》课程组
第四讲:判别分析
温州大学《现代统计分析方法》课程组
打开Discriminant Analysis 对话框如下图所示:
该对话框中各选项意义如下: 在“Grouping Variable”对话框,从左侧选入分组变量, 例如选择分组变量为“type”, 单击向右的三角形按钮使之进 入“Grouping Variable”框内,这时“Define Range”被激活;
y2 = 5.295 x1 − 10.020 x 2 + 3.306 x3 + 9.949 x 4 − 6.754 = 3.268 由判别准则知该企业属于破产企业。
第四讲:判别分析
温州大学《现代统计分析方法》课程组
表4:分类结果表
Classification Results
b,c
Original
Count %
a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case. b. 91.3% of original grouped cases correctly classified. c. 89.1% of cross-validated grouped cases correctly classified.
第四讲:判别分析
温州大学《现代统计分析方法》课程组
例5.4.2 费歇于1936年发表的鸯尾花数据被广泛地作 为判别分析的例子。数据是对3种鸯尾花:刚毛鸯尾花(第 1组),变色鸯尾花(第2组)和弗吉尼亚鸯尾花(第3 组)各抽取一个容量喂50的样本,测量其花萼长x1,花萼 宽x2,花瓣长x3,花瓣宽x4,单位为mm,数据见表5.4.1 试建立判别函数,估计误判概率。 实验步骤: 根据以上步骤可得以下结果:
第四讲:判别分析
温州大学《现代统计分析方法》课程组
2、在“Display”对话框中的设置: 选“Casewise results”可得样品的判别结果; 选“Summary table”可得验证结果的总表; 选“Leave-one-out classification”可得交叉验证结果。 3、在“Display”对话框中的设置: 选“Within-groups”则用合并组内协差阵计算,通常 使用该选项; 选“Separate-groups”则用各类独立的协差阵计算后验 概率,这将产生与分类函数不一致的分类结果。 选定“Plots”栏中的各项,可得各种有关图形。