基于SPSS的主成分分析法在松花江哈尔滨段的水质评价
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013 年各断面平水期均值
氨氮 0. 668 7. 636 0. 73 0. 882 0. 67 0. 739 TP 0. 163 0. 43 0. 18 0. 156 0. 183 0. 173 氟化物 0. 273 0. 767 0. 267 0. 538 0. 272 0. 269 石油类 0. 03 0. 18 0. 04 0. 1 0. 04 0. 04 挥发酚 0. 00043 0. 00058 0. 00043 0. 00043 0. 00038 0. 00043 粪大肠杆菌 2900 24000 21666 13496 12433 6933
总方差解释
提取载荷平方和 方差百分比 77. 642 11. 311 累积 / % 77. 642 88. 953 总计 6. 986 1. 019 旋转载荷平方和 方差百分比 77. 626 11. 327 累积 / % 77. 626 88. 953
根据累积贡献率≥85% 原则, 提取前两个主 成分. 这两个主成分方差百分比为 77. 642% 和 11. 311% , 累积贡献率为 88. 953% . 计算主成分的表达式: F1 = 0 . 38 X1 + 0 . 37 X2 + 0 . 37 X3 + 0 . 38 X4 + 0 . 35 X5 + 0 . 38 X6 + 0 . 37 X7 + 0 . 11 X8 + 0 . 15 X9 F2 = 0 . 01 X1 + 0 . 05 X2 + 0 . 03 X3 + 0 . 01 X4 - 0 . 03 X5
Z 氨氮 - 0. 57268 - 0. 5568 1. 97153 - 0. 47198 0. 11815 - 0. 48822
根据上述的 SPSS 的操作步骤, 得出相关系数矩阵 R 见表 5 , 以及总方差解释见表 6.
ห้องสมุดไป่ตู้表5
COD COD BOD5 COD Mn 氨氮 总磷 氟化物 石油类 挥发酚 粪大肠杆菌 1. 000 0. 992 0. 964 0. 992 0. 938 0. 996 0. 989 0. 256 0. 363 BOD5 0. 992 1. 000 0. 988 0. 998 0. 888 0. 983 0. 999 0. 255 0. 295 COD Mn 0. 964 0. 988 1. 000 0. 988 0. 817 0. 957 0. 992 0. 207 0. 282
图1
因子分析
之后 将左侧的变量添加到右侧的变量栏中 , 依次选择描述、 抽取、 旋转、 得分和选项. 弹出“因 “因子分析: 抽 子分析: 描述统计” 对话框( 图 2) 、 “因子分析: 旋转 ” 取” 对话框( 图 3) 、 对话框 ( 图 4) 、 “因子分析因子得分 ” ( “因子 对话框 图 5) 、 分析: 选项” 对话框( 图 6 ) .
五日生化需氧量、 高锰酸 选取化学需氧量、 、 、 、 、 、 盐指数 氨氮 总磷 挥发酚 氟化物 石油类、 粪 大肠杆菌九项指标对松花江哈尔滨段枯水期 、 平 水期、 丰水期进行水质评价, 得出六个监测断面 的污染程度排名. 以 2013 年枯水期为例. 首先将数据进行标 — —描 — —描述统计— 准化. 打开 SPSS, 单击分析— 述, 打开描述对话框, 将变量选入右侧对话框中, 勾选底部的将标准化得分另存为变量( Z) . 如图 7. 标准化的数据见表 4.
表4
ZCOD 朱顺屯 阿什河口内 阿什河口下 呼兰河口内 呼兰河口下 大顶子山 - 0. 62775 - 0. 48694 1. 89791 - 0. 52214 0. 34907 - 0. 61015 ZBOD5 - 0. 49207 - 0. 48338 1. 9736 - 0. 52105 0. 11058 - 0. 58769 ZCOD Mn - 0. 48339 - 0. 43998 2. 0291 - 0. 42261 - 0. 19394 - 0. 48918
收稿日期: 2014 - 03 - 05 * 国家科技重大专项 , 松花江哈尔滨市市辖区控制单元水环境质量改善技术集成与综合示范 ( 2013ZX07201007 - 006 )
第3 期
基于 SPSS 的主成分分析法在松花江哈尔滨段的水质评价
133
图5 图2 因子分析: 描述统计
因子分析: 选项
图6
图7
数据标准化
标准化后的数据
Z 总磷 - 0. 85075 - 0. 55626 1. 53789 - 0. 65442 0. 98163 - 0. 45809 Z 氟化物 - 0. 76742 - 0. 52863 1. 88176 - 0. 46105 0. 36794 - 0. 49259 Z 石油类 - 0. 53119 - 0. 49184 1. 98705 - 0. 49184 0. 05902 - 0. 53119 Z 挥发酚 Z 粪大肠杆菌 0. 40825 0. 40825 0. 40825 - 2. 04124 0. 40825 0. 40825 - 2. 00458 0. 49525 0. 49525 0. 02358 0. 49525 0. 49525
氨氮 0. 992 0. 998 0. 988 1. 000 0. 895 0. 989 0. 999 0. 231 0. 331
第3 期
基于 SPSS 的主成分分析法在松花江哈尔滨段的水质评价
135
表6
组件 1 2 3 4 5 6 7 8 9 初始特征值 总计 6. 988 1. 018 0. 839 0. 153 0. 003 2. 763E - 16 1. 048E - 16 1. 477E - 17 - 3. 421E - 16 方差百分比 77. 642 11. 311 9. 317 1. 694 0. 036 3. 070E - 15 1. 165E - 15 1. 641E - 16 - 3. 801E - 15 累积 / % 77. 642 88. 953 98. 270 99. 964 100. 000 100. 000 100. 000 100. 000 100. 000 总计 6. 988 1. 018
2013 年各断面丰水期均值
氨氮 0. 394 3. 8 0. 426 0. 748 0. 364 0. 447 TP 0. 17 0. 215 0. 203 0. 22 0. 196 0. 16 氟化物 0. 269 0. 79 0. 216 0. 473 0. 272 0. 267 石油类 0. 04 0. 21 0. 04 0. 07 0. 05 0. 04 挥发酚 0. 00043 0. 00043 0. 00043 0. 00043 0. 00043 0. 00043 粪大肠杆菌 4000 24000 24000 12600 9800 5400
因子分析: 因子得分
最后返回 按照图中所显示的选项进行选择, 因子分析对话框, 选择确定, 等待 SPSS 给出相应
图3 因子分析: 抽取
的计算结果.
3 主成分分析在松花江哈尔滨段水 质评价
松花江哈尔滨流域的地表水系主要有一江 、 三沟. 全国七大江河之一的松花江是市区 一河、 的主干水系, 其次有一级支流阿什河, 较小的沟 谷有马家沟、 何家沟和信义沟 ( 简称市内三沟 ) . 市区江段长约 70 km, 将市区分为江南和江北两 部分. 该文选用了主成分分析法对松花江哈尔滨
张 莹, 刘 硕, 王 宏
( 哈尔滨师范大学)
并运用此法对松花 要】主要介绍了主成分分析方法在 SPSS 中的操作, 江哈尔滨段的水质进行评价, 以及在实际水质评价中的应用. 【摘 【关键词】主成分分析; SPSS; 水质评价
中图分类号: P641. 8 文献标识码: A 文章编号: 1000 - 5617 ( 2015 ) 03 - 0132 - 04
0
引言
2
主成分分析在 SPSS 中的操作
该文选用的是 SPSS22. 0 中文版本. 首先打开需要用到的数据, 特别需要注意的
主成分分析法 ( PCA ) 是一种将多维因子纳 入同一系统中进行定量化研究、 理论比较完善的 多元统计分析方法, 由霍特林在 1933 年首先提 [1 ] 出来的 . 主要利用的是降维的思想, 即用一种 数学变换的方法可以将多个指标转化为少量的 综合指标, 这些综合指标尽量多的保留原有指标 的信息.
第 31 卷 第3 期
哈尔滨师范大学自然科学学报 NATURAL SCIENCES JOURNAL OF HARBIN NORMAL UNIVERSITY
Vol. 31 ,No. 3 2015
基于 SPSS 的主成分分析法 * 在松花江哈尔滨段的水质评价
相关系数矩阵 R
总磷 0. 938 0. 888 0. 817 0. 895 1. 000 0. 946 0. 881 0. 321 0. 487 氟化物 0. 996 0. 983 0. 957 0. 989 0. 946 1. 000 0. 983 0. 226 0. 427 石油类 0. 989 0. 999 0. 992 0. 999 0. 881 0. 983 1. 000 0. 241 0. 312 挥发酚 0. 256 0. 255 0. 207 0. 231 0. 321 0. 226 0. 241 1. 000 - . 012 粪大肠杆菌 0. 363 0. 295 0. 282 0. 331 0. 487 0. 427 0. 312 - . 012 1. 000
134
哈尔滨师范大学自然科学学报
2015 年 第 31 卷
表2
断面名称 朱顺屯 阿什河口内 阿什河口下 呼兰河口内 呼兰河口下 大顶子山 COD 19. 7 40. 5 21. 6 22. 3 20. 8 16. 9 BOD5 2. 82 7. 58 2. 81 4. 82 2. 78 2. 73 COD Mn 5. 35 10. 82 5. 49 7. 03 5. 58 5. 4
表3
断面名称 朱顺屯 阿什河口内 阿什河口下 呼兰河口内 呼兰河口下 大顶子山 COD 18. 5 27. 3 21. 1 23. 3 21. 7 18 BOD5 2. 68 7. 15 2. 79 4. 68 2. 71 2. 62 COD Mn 5. 51 10. 5 5. 62 6. 88 5. 66 5. 3
图4 因子分析: 旋转
段的朱顺屯断面、 阿什河口内断面、 阿什河口下 断面、 呼兰河口内断面、 呼兰河口下断面和大顶 子山断面六个断面进行水质综合评价 ( 见表 1 、 表 2、 表 3) .
表1 2013 年各断面枯水期均值
氨氮 1. 171 8. 22 1. 215 3. 085 1. 45 1. 405 TP 0. 085 0. 45 0. 13 0. 365 0. 115 0. 145 氟化物 0. 241 0. 829 0. 294 0. 493 0. 309 0. 302 石油类 0. 02 0. 66 0. 03 0. 17 0. 03 0. 02 挥发酚 0. 00043 0. 00043 0. 00043 0. 00043 0. 00036 0. 00043 粪大肠杆菌 2800 24000 24000 24000 20000 24000
— — 是 SPSS 是可以直接打开 excel 的. 选择分析— — —因子分析, 如图 1 因子分析. 降维—
1
主成分分析的数学模型
[ 2]
设 p 维原始样本资料记为数据矩阵 X x12 , …, x1p x11 , x21 , x22 , …, x2p X= ……………… x n1 , x n2 , …, x np 首先对数据进行标准化( 以消除数据之间的 纲量影响) , 标准化数据之后计算相关矩阵 R , 根 据贡献率 ≥85 % 确定 m 值, 选取前 m 个特征值 对应的单位特征向量写出主成分表达式并命名 , 计算综合主成分值并进行评价与深入研究 .
断面名称 朱顺屯 阿什河口内 阿什河口下 呼兰河口内 呼兰河口下 大顶子山
COD 13 41. 7 14. 6 24. 1 14. 2 13. 2
BOD5 2. 57 11. 08 2. 6 4. 65 2. 47 2. 24
COD Mn 5. 17 13. 85 5. 32 6. 17 5. 38 5. 15