主成分和聚类分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4实证过程与结果

4、1主成分与聚类分析

首先通过SPSS软件对环境污染的相应指标进行主成分分析,得到:

提取Y1、Y2、Y3与Y4四个主成分,其累积贡献率已经达到,超过80%,代表所有环境污染指标的绝大部分信息。Y1偏向于解释工业氢氧化物排放量,Y2偏向于解释生活烟尘排放量,Y3偏向于解释生活废水排放量,Y4偏向于解释工业二氧化硫排放量。

然后,根据主成分分析结果,用Z=0、43226*Y1+0、21911*Y2+0、10380*Y3+ 0、06519*Y4计算综合得分,见下表1。

表1 环境污染地区的主成分综合得分表

序号地区Z 排名序号地区Z 排名

1 北京0、863 5 17 武汉-0、116 13

2 天津1、088 4 18 长沙-0、841 28

3 石家庄0、455 6 19 广州-0、373 19

4 太原0、209 8 20 南宁-0、519 24

5 呼与浩特-0、052 12 21 海口-1、29 31

6 沈阳-0、273 1

7 22 重庆2、767 1

7 长春-0、257 16 23 成都-0、451 20

8 哈尔滨2、489 2 24 贵阳-0、331 18

9 上海1、979 3 25 昆明-0、552 26

10 南京-0、232 15 26 拉萨-1、275 30

11 杭州0、175 9 27 西安0、357 7

12 合肥-0、5 21 28 兰州-0、514 23

13 福州-0、525 25 29 西宁0、004 11

14 南昌-0、949 29 30 银川-0、702 27

15 济南0、022 10 31 乌鲁木齐-0、502 22

16 郑州-0、152 14

最后将环境污染的综合得分作为个案进行层次聚类分析,将31个地区分为5类,如表2。

表2 各地区污染分类

分类污染情况地区

1 轻度污染海口、拉萨

2 比较轻度污染合肥、乌鲁木齐、福州、南宁、兰州、,昆明、成都、银川、南昌、长沙、沈阳、长春、南京、广州、贵阳、郑州、武汉、济南、西宁、呼与浩特

3 污染情况一般太原、杭州、石家庄、西安

4 污染比较严重北京、天津

5 污染十分严重上海、哈尔滨、重庆

4、2主成分分析与聚类分析在SPSS中的操作过程

打开S PSS,“文件-打开-数据”,选中excel,如下图结果。

首先将变量标准化,“分析-描述统计-描述”,将变量全部选入对话框,点上“将标准化得分另存为变量(Z)”,结果如下。

在做主成分分析,“分析-降维-因子分析”,将为标准化的变量选入对话框。选择右侧“描述”,在弹出来对话框中点上“系数、显著性水平、KMO与Bartlett的球形度检验”,点“继续”。选择右侧“抽取”,在弹出来对话框中将方法改成“主成分”,“基于特征值”改成“0、6”,点“继续”。选择右侧“旋转”,在弹出来对话框中,将方法改成“最大方差法”,点“继续”。

首先输出的各自变量的相关矩阵,由下图可见,各自变量间存在显著性相关。说明有必要进行因子分析。

接着输出的就是KMO与Bartlett的检验,结果如下图,由表可见,KMO就是Kaiser-Meyer-Olkin的取样适当性度量,当KM0越大时,表示变量间的共同因素越多,越适合进行因子分析,此处KMO大于0、6,表示可进行因子分析。此外,Bartlett 球形检验的近似卡方分布为183、816(自由度为45)达到显著,代表有共同因素存在,适合进行因素分析。同时,Bartlett球度检验给出的相伴概率为0、000,小于显著性水平0、05,故适合进行因子分析。

随后输出的解释的总方差,由下图可见,主成分个数为4时,累积贡献率已经达到82、037%,超过80%。故本次因子分析中提取4个因子,我们分别称之为

F1,F2,F3,F4。

在下面的成分矩阵图中可以瞧出,F1主要就是与工业氢氧化物排放量有关,F2主要与生活烟尘排放量有关,F3主要与生活废水排放量有关,F4主要与工业二氧化硫排放量有关。

随后将成分矩阵表中的系数复制到数据窗口,并将变量名命名为a1,a2,

a3,a4。再在数据窗口点击“转换-计算变量”,将目标变量t1=a1/SQRT(4、323)。

(括号内为对应主成分的初始特征值),依次算出t2,t3,t4。则可知道Y1=0、382*Z 工业废水排放量+0、365*Z工业化学需氧量排放量+0、262*Z工业二氧化硫排放量+0、397*Z工业烟尘排放量+0、404*工业氢氧化物排放量+0、120*Z生活废水排放量+0、357*Z生活化学需氧量排放量+0、320*Z生活二氧化硫排放量+0、136*Z生活烟尘排放量+0、261*Z生活氢氧化物排放量,依次依据t2,t3,t4得到

Y2,Y3,Y4。再依据Z=0、43226*Y1+0、21911*Y2+0、10380*Y3+0、06519*Y4得到综合得分,见表1。

然后做层次聚类分析,“分析-分类-系统-系统聚类”,在弹出来对话框把综合得分选入变量栏,在右侧“绘制”中点上“树状图”,点确定。如下图。

依据下面的树状图,可将序号12,31,13,20,28,25,23,30,14,18,6,7,10,

19,24,16,17,15,29,5归结为一类,将21,26归结为一类,将4,11,3,27归结为一类,将1,2归结为一类,将8,22,9归结为一类。再依据综合得分的大小,绘制表2。

相关文档
最新文档