基于主成份分析法的饮用水特征性指标分类

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于主成份分析法的饮用水特征性指标分类

摘要:本文对商品饮用水进行调查统计的基础上,运用主成份分析的方法,对样本的特征性指标进行分类分析.分析结果表明:饮用水的特征性指标主要由钾离子,钠离子,镁离子,钙离子,偏硅酸和pH值组成;钾离子与钠离子为同一类指标、镁离子和钙离子为同一类、偏硅酸与pH值也是一类.此结论基本上是正确合理的,对商品水的质量控制及其质量检验部门的初步检测等都具有一定的指导作用,可以减少检测步骤、提高检测效率、节约检测成本,为选用步骤少效率高低成本的检测对象来反应饮用水质量提供了理论依据.

关键词:饮用水主成份分析特征性指标

Abstract:In this paper,the method of principal component analysis was applied in classification of drinking water characteristic indexes,which was from the statistics of commodity drinking water.The results showed that the contents of sodium ion、potassium ion、magnesium ion、calcium ion and silicic acid as well as the potential of hydrogen make up the drinking water characteristic indexes. The contents of sodium ion and potassium ion belong to one composition;the contents of magnesium ion and calcium ion belong to one composition;the content of silicic acid and the potential of hydrogen belong to another composition.This result is exact basically,and it can plays a guiding role in the quality control of commodity drinking water and in the preliminary

test of the quality inspection department.The process of inspection can be reduced,the efficiency of inspection can be improved,the cost of inspection can be saved.The theoretical basis was proved,of which the easy-going detection object would be chosen to show the quality of drinking water.Easy-going object is the characteristic index that can be inspected efficiently in a low cost.

Key words:Drinking Water;Principal Component Analysis;Characteristics Indexes

市场上的饮用水有多种,每种饮用水成分基本相同,如各种金属离子、水处理残留物、微量有机物和深层矿物产物等。但含量各异,且具有一定相关性。在参考了中国饮用水标准检验方法[1]和国外有关饮用水的理念[2][3]之后,本文应用主成份分析法针对饮用水各成分含量相关性进行研究,对市面上常见饮用水的特征性指标进行归纳总结,以期为水处理产业提供新的思路。在相关领域,主成份分析法被用于二滩水质监测[4]、湖泊营养类别的评判[5]等,都取得了较好的效果。将饮用水的特征性指标进行主成份分析,可以在初步检测中选取主成份中易于检测的指标来代表整个主成份的含量,进而可以通过三个主成份含量来代表样本整体的成分含量情况。

1 数据来源

本文所有的数据都收集自商品饮用水外包装。厂方自己标明的指

标无法完全代表其产品中成份的含量,但是就研究而言有一定价值。对于一些饮用水未标明的成份,为了使得分析更为精确,用此类指标的平均数值进行代替,同时也能使得其对整个分析造成的影响最小。饮用水特征性指标原始数据见表5。表中只列出了常规的特征性指标,而一些较少的指标,对于分析研究没有很大影响,便没有在表中列出。且当厂方标明的特征性指标处于某一范围时,为了数据分析的准确,取其范围中的平均值。

2 主成份分析法(Principal Component Analysis, PCA)

主成份分析法也称主分量分析或矩阵数据分析,通过变量变换的方法把相关的变量变为若干不相关的综合指标变量。[6] 若某研究对象有两项指标ζ1和ζ2,从总体ζ(ζ1,ζ2)中抽取了N个

样品,它们散布在椭圆平面内(见图1),指标ζ1与ζ2有相关性.η1和η2分别是椭圆的长轴和短轴,η1⊥η2,故η1与η2互不相关。其中η1是点ζ(ζ1,ζ2)在长轴上的投影坐标,η2是该点在短轴上的投影坐标。从图1可以看出点的N个观测值的波动大部分可以归结为η1轴上投影点的波动,而η2轴上投影点的波动较小。若η1作为一个综台指标,则η1可较好地反映出N个观测值的变化情况,η2的作用次要。综合指标η1称为主成份,找出主成份的工作称为主成份分析[7]。

可见,主成份分析即选择恰当的投影方向,将高维空间的点投影到低维空间上,且使低维空间上的投影尽可能多地保存原空间的信息,就是要使低维空间上投影的方差尽可能地大[8]。

3 主成份分析法的应用

3.1 原始数据的处理和标准化

由于原始数据矩阵庞大,如对全部指标进行分析,将而导致主次要

相关文档
最新文档