应用多元统计分析SAS作业第六章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6-10 今有6个铅弹头,用“中子活化”方法测得7种微量元素的含量数据(见表1)。
(1) 试用多种系统聚类法对6个弹头进行分类;并比较分类结果; (2) 试用多种方法对7种微量元素进行分类。
元素 样品号
Ag(银) (X 1) Al(铝) Cu(铜) Ca(钙) Sb(锑) Bi(铋) Sn(锡)
(X 2) (X 3) (X 4) (X 5) (X 6) (X 7) 1 0.05798
5.5150 347.10 21.910 8586 1742 61.69 2 0.08441 3.9700 347.20 19.710 7947 2000 2440 3 0.07217 1.1530 54.85 3.052 3860 1445 9497 4 0.15010 1.7020 307.50 15.030 12290 1461 6380 5 5.74400 2.8540 229.60 9.657 8099 1266 12520 6
0.21300
0.7058
240.30
13.910
8980
2820
4135
问题求解
1对6个弹头进行分类
对数据进行标准化变换,样品间距离定义为欧式距离,系统聚类的方法分别使用类平均法(AVE )、中间距离法(MID )、可变类平均法(FLE )和离差平方合法(WARD )。使用SAS 软件CLUSTER 过程对数据进行聚类分析(程序见附录1)。 1.1类平均法
图1 类平均聚类法相关矩阵特征值图
图2 类平均聚类分析法聚类历史图 由图2可知,NCL=1时半偏R 2
最大且伪F 统计量在NCL=2,5时和伪t 方统计量在NCL=1,4时较大。因此,将6个弹头分为两类{}{}(2)
(2)
1
21,2,4,6,3,5G G ==。SAS 绘制的谱系聚类图如图3所示。
图3 类平均聚类分析法谱系聚类图
1.2中间距离法
图4 中间距离聚类法相关矩阵特征值图
图5 中间距离聚类法聚类历史图
由图5可知,中间距离法与类平均法结果一致。因此,也将6个弹头分为两类
{}{}(2)(2)
121,2,4,6,3,5G G ==。
SAS 绘制的谱系聚类图如图6所示。
图6 中间距离聚类法谱系聚类图
1.3可变类平均法
图7可变类平均聚类法分析结果图
图8 可变类平均聚类法聚类历史图
由图8可知,可变类平均法(=0.25
β-)输出结果与前两种方法稍有不同,NCL=1时半偏R2最大且伪F统计量在NCL=2时次大,NCL=5时最大;而伪t方统计量在NCL=1时最大。因此,分类结果
与之前相同,将6个弹头分为两类
{}{}(2)(2)
121,2,4,6,3,5G G ==。
SAS 绘制的谱系聚类图如图9所示。
图9 可变类平均聚类法谱系聚类图
1.4离差平方和法
图10 离差平方和聚类法相关矩阵特征值图
图11 离差平方和聚类法聚类历史
由图11可知,离差平方和法输出结果与可变类平均法结果一致。 SAS 绘制的NCL=2时离差平方和法谱系聚类图和分类结果如下所示。
图12 离差平方和聚类法谱系聚类图
图13 离差平方和聚类法聚类结果图
1.5 综合分析
综上所述,四种分类方法得到的结果一致,都是将6个弹头分为两类
{}{}(2)(2)
121,2,4,6,3,5G G ==。
四种方法中,类平均法和中间距离法结果相近;可变类平均法和离差平方和法得到结果相近且
更加准确(伪t 方统计量在NCL=1时最大)。
2对7种元素进行分类
同问题1,系统聚类的方法分别使用类平均法(AVE )、中间距离法(MID )、可变类平均法(FLE )和离差平方合法(WARD )。使用SAS 软件CLUSTER 过程对数据进行聚类分析(程序见附录2)。 2.1 类平均法
图14 7种元素类平均法聚类历史图
由图14可知,NCL=1,2时半偏R2较大;伪F统计量在NCL=4,5,6时较大;而伪t方统计量在NCL=3,4时较大。因此,较合适的分法是将7种元素分为四类和五类。
SAS绘制的谱系聚类图如下所示。
图15 7种元素类平均法谱系聚类图
2.2 中间距离法
图16 7种元素中间距离法聚类历史图
由图16可知,中间距离法聚类结果中NCL=1,2时半偏R2较大;伪F统计量在NCL=4,5,6时较大;而伪t方统计量在NCL=3,4时较大。因此,与类平均法相同,较合适的分法是将7种元素分为四类和五类。
SAS绘制的谱系聚类图如下所示。
图17 7种元素中间距离法谱系聚类图
2.3 可变类平均法
图18 7种元素可变类平均法聚类历史图
由图18可知,可变类平均法聚类结果与前两种方法结果相同,较合适的分法是将7种元素分为四类和五类。
SAS绘制的谱系聚类图如下所示。
图19 7种元素可变类平均法谱系聚类图
2.4 离差平方和法
图20 7种元素离差平方和法聚类历史图
由图20可知,离差平方和法聚类结果与前三种方法结果也相同,较合适的分法是将7种元素分为四类和五类。
SAS绘制的NCL=4,5时的谱系聚类图和分类结果图如下所示。
图21 7种元素离差平方和法谱系聚类图
图22 分为四类时7种元素聚类结果图
图23 分为五类时7种元素聚类结果图
2.4综合分析
综上所述,四种分类方法结果相同,合适的分法是将7种元素分为四类和五类。 分为四类时,分类结果如下
{}{}{}{}(4)(4)(4)(4)
1234,,,,,,G Ag Al Ca Cu G Bi G Sb G Sn ====;
分为五类时,分类结果如下
{}{}{}{}{}(5)(5)(5)(5)(5)
12345,,,,,G Ag Al Ca G Cu G Bi G Sb G Sn =====,。