聚类判别分析SPSS练习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 现有22名白血病病人的九种基因表达的cDNA微阵列扫描数据(X1~X9),
根据X1~X9 的变量信息,对该22名白血病病人予以分类。(具体数据见下表1)采用SPSS软件进行操作并回答以下问题:(个体聚类。变量聚类)此题为个体
聚类
(1)采用什么分析方法?写出该方法在SPSS软件中的路径;
聚类分析classify——hierarchical
(2)该分析方法中采用什么统计指标进行度量的?
个体聚类用用欧式距离平方。距离越远就不可能聚类。
指标聚类用相关系数大小
(3)根据结果中的什么图从而将该22名白血病病人分成3类?同时写出归为同
一类的个体序号。第一类8、21、1、4.第二类6、11 第三类剩下的
《资料的表现形式是无序的、》聚类之后可以判别、、
表1 白血病人的九种基因表达
序号X1X2X3X4X5X6X7X8X9
1 2.57403 2.5378
2 2.5340
3 2.12710 2.00000 2.00000 2.00000 2.53656 2.44560
2 2.87448 2.80686 2.88366 2.74036 2.00000 2.00000 2.30320 3.2662
3 3.43281
3 2.55991 2.00000 2.56820 2.00000 2.56348 2.00000 2.45637 2.98543 3.38650
4 2.65031 2.27646 2.37291 2.01703 2.00000 2.10721 2.00000 2.45637 2.58659
5 3.12352 2.5365
6 2.65128 2.34830 2.26482 2.17026 2.43775 3.15746 3.80895
6 3.14551 2.72263 3.0285
7 2.00000 3.18724 2.00000 2.8524
8 3.11327 3.17898
7 2.77452 2.01703 2.52504 2.22011 2.77452 2.00000 2.00000 2.83442 3.78611
8 3.05231 2.60097 2.43297 2.16435 2.31597 2.22789 2.65992 2.95182 2.00000
9 2.97497 2.34044 2.77452 2.35025 2.00000 2.00000 2.00000 2.87448 3.31639
10 3.00817 2.81291 2.65992 2.00000 2.03743 2.00000 2.57519 3.02078 3.21958
11 2.95617 2.88138 2.61700 2.00000 2.71600 2.00000 2.51188 3.00689 3.34420
12 3.01578 2.41996 2.59879 2.22789 2.00000 2.29226 2.34439 2.80209 3.76686
13 2.72263 2.41664 2.16137 2.00000 2.60314 2.00000 2.44716 2.87622 3.07518
14 2.98046 2.99211 2.69810 2.00000 2.00000 2.16435 2.55751 2.96379 3.35468
15 2.95665 2.41996 2.48430 2.00000 2.13354 2.00000 2.00000 2.72916 3.17114
16 3.04297 2.37658 2.29885 2.36736 2.30750 2.00860 2.10380 2.78319 3.40261
17 2.62221 2.54033 2.54777 2.00000 2.70329 2.00000 2.00000 2.65896 3.13098
18 3.13481 2.00000 2.47129 2.08279 2.04139 2.46687 2.66087 2.79029 3.29535
19 2.98767 2.47129 2.78032 2.00000 2.09691 2.00000 2.68931 2.77232 2.85612
20 2.92993 2.30103 2.58659 2.03743 2.00000 2.02119 2.00000 2.79518 3.23729
21 3.05231 2.60097 2.43297 2.16435 2.31597 2.22789 2.65992 2.95182 2.00000
22 3.02325 2.83569 2.77525 2.61490 2.00000 2.00000 2.47857 3.46419 3.51322
2. 为明确诊断出小儿肺炎三种类型, 某研究单位测得30名结核性、12名化脓性
和18细菌性肺炎患儿共60名的6项生理、生化指标(具体数据见下表2), 试
进行判别分析。《判别有类别信息量。》
采用SPSS软件进行操作并回答以下问题:
(1)写出该方法在SPSS软件中的路径;Analyse-classify-discriminant
(2)简要说明所采用的具体判别分析方法是哪一种?它是如何判别的?
Bayes每一个都带到不同类别的函数值,,函数值可以算出概率大小。
Bayes含义
(3)写出相应的判别函数式;判别回代后的正确判断率为多少?
Z1=-4.456+0.020X1+1.758X2+0.766X3+2.750X4+2.091X5+0.054X6
Z2
Z3
81.7%
(4)现有两个未知类别的小儿肺炎患者,他们的6项指标分别为:4.0、1、0、
0、0、7.0、和18.0、1、0、0、0、60.0、,分别判断他们的类别。
表2 三种类型小儿肺炎6项生理、生化指标观测结果
X1 X2 X3 X4 X5 X6 肺炎
类型
X1 X2 X3 X4 X5 X6
肺炎
类型