判别分析的案例分
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Func 9.638 0.613x1 0.606x2
表1.7典型判别函数系数 Canonical Discriminant Function Coefficients
Function 1 舒张压 .613
胆固醇
(Constant)
.606
-9.638
Unstandardized coefficients
表1.6 标准化典型判别函数系数 Standardized Canonical Discriminant Function Coefficients
Function 1 舒张压 胆固醇 .873 .669
ZFunc 0.873x1 0.669x2
6、典型判别函数系数 表所示为典型判别函数的系数,其典型函数为:
.713(a)
100.0
100.0
.645
a First 1 canonical discriminate functions were used in the analysis.
4、Wilks检验结果 表1.5所示为典型判别分析的Wilks检验结果。其中Wilks值为 0.584,卡方检验统计量的观测值为15.071,概率P值为0.001, 小于0.05。
2、分组统计量 表1.3所示为分组统计量列表。表中给出分组变量和合计的 均数(means)、标准差(standard deviation)和有效个案的 例数。
表1.3 分组统计量 Group Statistics
Mean 组别 1.00 舒张压 胆固醇 2.00 舒张压 胆固醇 Total 舒张压 胆固醇 Unweighted 12.3794 4.6931 10.6267 3.7687 11.5313 4.2458 Std. Deviation Weighted 1.64999 1.29614 1.13528 .85021 1.65996 1.18231 Valid N (listwise) Unweighted 16 16 15 15 31 31.000 31 31.000 Weighted 16.000 16.000 15.000 15.000
Original
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
**. Misclassified case
9、分类结果 表1.10给出分类结果。最后系统对回代判别情况做出评价, 即病人组正确率为75.0%。正常人组为86.7%,总判别正确率为 80.65%,说明该判别函数的正确率还是较高的。
Step4:单击“Statistics”按钮,在“Descriptive”选项中选 择“Mean”;在“Function Coefficients”选择“Unstandardized”。 单击“Continue”按钮,返回主对话框。 Step5:单击“Classify”按钮,在“Plot”选项组中选择 “Combined-groups”选项,在“Display”选项组中选择“Cas ewise result”和“Summmary table”选项;单击“Continue”按 钮,返回主对话框。 Step6:单击“Save”按钮,在弹出的对话框中选择 “Pred icted group membership”选项,单击“Continue”按钮,返回 主对话框。 Step7:单击“OK”按钮,执行判别分析操作。
判别分析的案例分析
§4. 实例分析
例1、 为研究舒张期血压和血浆胆固醇对冠心病的作用, 某医师测定了50—59岁冠心病人15例和正常人16例的舒张压和 胆固醇指标,结果如下表所示。试做判别分析,建立判别函数 以便在临床中用于筛选在临床中用于筛选冠心病人(数据文件: discriminant.sav)
表1.5 Wilks 检验 Wilks' Lambda
Test of Function(s) 1 Wilks' Lambda .584 Chi-square 15.071 df 2 Sig. .001
5、标准化典型判别函数系数 表1.6给出典型判别函数的系数,其标准化函数为:
根据判别函数方程的标准化系数,确定各变量对结果的作用大 小,本例舒张压的标准化系数为0.873,大于胆固醇的标准化系 数0.669,因而舒张压对冠心病的影响作用大于胆固醇。
8、个案统计量表 表1.9所示为原始数据逐一回代的判别结果和预测分类的结 果显示,其中病人组有3人被错判(标注**者,编号为1,6,7) 正常人组有3人被错判(标注**者,16,17,18)
C a s e wi s e S t a ti s t i c s Highest Group Squared Mahalanobis Distance to Centroid .149 .000 .828 .167 .549 .046 .188 .004 1.824 1.423 .456 .966 .028 .150 1.824 1.020 .003 .167 .477 .188 .516 .719 .342 .101 .607 .001 .009 .402 .626 .020 .772 Second Highest Group Squared Mahalanobis Distance to Centroid 1.557 2.665 6.473 1.503 5.642 2.013 1.442 2.471 8.909 7.993 5.335 6.849 3.248 1.555 8.909 6.991 2.494 1.503 5.404 1.442 .838 6.162 4.926 3.813 .731 2.786 2.994 5.144 5.884 2.234 6.313 Discriminant Scores Case Number 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Actual Group 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Predicted Group 2** 1 1 1 1 2** 2** 1 1 1 1 1 1 1 1 2** 1** 1** 2 2 2 2 2 2 2 2 2 2 2 2 2 P(D>d | G=g) p df .699 .999 .363 .683 .459 .830 .665 .950 .177 .233 .499 .326 .867 .699 .177 .313 .956 .683 .490 .665 .472 .396 .558 .750 .436 .972 .923 .526 .429 .889 .380 P(G=g | D=d) .669 .791 .944 .661 .927 .728 .652 .774 .972 .964 .920 .950 .833 .669 .972 .952 .776 .661 .922 .652 .540 .938 .908 .865 .515 .801 .816 .915 .933 .752 .941 Group 1 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 P(G=g | D=d) .331 .209 .056 .339 .073 .272 .348 .226 .028 .036 .080 .050 .167 .331 .028 .048 .224 .339 .078 .348 .460 .062 .092 .135 .485 .199 .184 .085 .067 .248 .059 Function 1 -.457 .789 1.701 .383 1.532 -.628 -.410 .728 2.141 1.984 1.466 1.773 .959 .404 2.141 -1.853 .736 .383 -1.534 -.410 -.125 -1.692 -1.429 -1.162 -.064 -.878 -.940 -1.477 -1.635 -.704 -1.722
判别分析的结果 1、分析个案综合统计量 表1.2和表1.3所示为系统处理的数据简明表明中的数据,按变量 “组别”分组共有31个样本为判别基础数据进入分析,其中第 一组十五例,第二组十六例。
表1.2 分析个案综合统计量 Analysis Case Processing Summary
Unweighted Cases Valid Excluded Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total N 31 0 0 0 0 31 .0 .0 .0 .0 100.0 Percent 100.0
冠心病人组
编号 1 2 舒张压 9.86 13.33 胆固醇 5.18 3.73 编号 1 2
正常人组
舒张压 10.66 12.53 胆固醇 2.07 4.45
3
4 5 6
14.66
9.33 12.80 10.66
3.89
7.10 5.49 4.09
Biblioteka Baidu
3
4 5 6
13.33
9.33 10.66 10.66
3、典型判别函数的特征函数的特征值表 表1.4所示是典型判别函数的特征值表,其特征(Eigen value)为组间平方和与组内平方和之比,计算得0.713,典型 相关系数(Canonical Corr)为0.645。
表1.4 典型判别函数的特征值表 Eigenvalues
Function 1 Eigenvalue % of Variance Cumulative % Canonical Correlation
11
12 13 14
10.40
9.33 10.66 10.66
3.94
4.92 2.69 2.43
15
13.33
5.96
15
16
11.20
9.33
3.42
3.63
操作步骤: Step1:读取数据文件discriminant.sav。其中,变量名“舒 张压”、“胆固醇”代表两项指标值。病人资料和正常人资料 合并一同输入,定义变量名为“组别”的变量用于区分冠心病 人资料和正常人资料,即冠心病人资料的“组别”值均为1, 正常人资料的“组别”值均为2. Step2:选择“Analysis” →“Classify” →“Discriminant”命令,在 “Discriminant Analysis”对话框中,选择“组别”变量进入 “Grouping Variable”文本框;单击“Define Range”按钮,在 “Minimum”文本框中输入1,在“Maximum”文本框中输入2, 单击“Continue”按钮,返回主对话框。 Step3:选择变量“舒张压”和“胆固醇”移动到 “Independ ents”列表框中,本例选择“Enterindependents together”判别 方式作为判别分析的方法。
3.06
3.94 4.45 4.92
7
8 9 10
10.66
13.33 13.33 13.33
4.45
3.63 5.96 5.70
7
8 9 10
9.33
10.66 10.66 10.66
3.68
2.77 3.21 5.02
11
12 13 14
12.00
14.66 13.33 12.80
6.19
4.01 4.01 3.63
7、分类过程摘要 表1.8分类过程摘要,显示参与分类的个案例数和剔除例数
表1.8分类过程摘要
Classification Processing Summary
Processed Excluded Missing or out-of-range group codes At least one missing discriminating variable Used in Output 31 0 0 31