水质检测的数学模型

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

水质指标评价问题的数学模型

摘要

生活用水一直是关系到民生的根本问题，是国家和政府一直在重点保护和治理的项目之一。近年来，随着工业化、信息化步伐的加快，水质污染问题越来越突出。本文通过对商丘某县四口水井水质标准建模分析，希望为该村，为其他有类似问题的地方，提供水质量评价标准和预防污染的借鉴方法。

针对问题一，通过主成分分析和R型聚类分析两种方法，在减少指标的同时保留尽量多的原始信息。对主成分分析法，通过计算机模拟、软件求解，得出四口井的得分，据此得出结果；对聚类分析法，通过聚类减少指标量，然后根据密切值法得出四口井的排名。主成分分析模型的结果南井第一，北井第二，东井第三，西井第四；R型聚类分析模型结果为东井第一，南井第二，西井第三，北井最后。

针对问题二，首先提取水质检测数据和水质分级标准表中都有的指标，然后剔除水质分级标准中各水质类型均相同的指标，确定八个指标为本问题的原始指标。将水质分级标准表中的I类、II类、III类三类数据当作水井样本，和原来四口水井一起，组成一个样本容量为七、指标个数为八的新样本组合，利用问题一的主成分分析模型，通过软件求解，得出七个井的得分，对这七口井进行排名，然后根据排名确定水质分级。

针对问题三，结合问题一二的计算结果，从描述四口水井的概况开始，有针对性的分析污染原因，以及污染影响和对应的整治措施，为村民们提供较好的处理污染的方法，根据一些健康的饮水常识，为村民今后的饮水健康提出几点有意义的建议。

关键词：聚类分析法；主成分分析法；密切值法；水污染检测；指标；无量纲化；

1问题的重述

河南省商丘地区某村内有各相距500米以上的四口水井，分别位于村东、村西、村南和村北，由于农业和生活排放废物使地下浅表水遇到污染，水质监测资

料如表1所示.

表1：水质监测数据

2009 年10月15日商丘某村井水水质监测数据

报告编号：商水监/ SM089-2009 监测日期：2009.10.15

2009 年10月15日商丘某村井水水质监测数据

/ SM089-2009 监测日期：2009.10.15

报告编号：商水监

（1）请用2种以上的数学方法对该村的四个井水的水质进行排序，并比较是否由于方法的不同导致存在着异，以及差异产生的原因。

（2）请对该村的四个井的地表水分别进行水质等级判断。（水质分级标准

参考附录一，或自己查有关资料）

（3）请结合你们的计算结果给该村村民写一篇关于健康用水和保护水源方法的短文。

2 符号约定

i x 、j x ：为第i 项、第j 项指标的原始数据。

i ：为第i 主成分的特征值； i c ：为第i 水井密切值。

3 问题的分析

3.1问题一的分析

问题一要求用两种数学方法进行求解，为此我们选择使用R 型聚类分析法和主成分分析法。我们考虑到简化数据，故将“

（1）主成分分析法。本文使用主成分分析法，它是把各变量之间的复杂关系进行简化，研究指标体系的少数几个线性组合，并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。具体方法是化多个指标为少数综合指标，根据综合指标的方差贡献率，对四个水井进行分析、排序。由题建立模型，根据主成分分析的基本步骤来解决问题。首先确定分析标量，即四口水井对应的指标，列出原始样本资料阵，再对原始数据进行标准化（无量纲化），得到标准阵，再通过SPSS 软件求出方差贡献率、累积方差贡献率，最后确定主成分的得分，对水井进行排序。

（2）R 型聚类分析法，对井水水质的各项指标进行分类，其相似性程度通常用相关系数来描述。由题建立模型，根据聚类分析法的基本步骤来解决问题。首先确定样本分析指标，由数据直接计算原始数据的相关矩阵，然后将相关系数最大的一对指标聚为一类，合并相似指标，对相关矩阵进行降维，最终求得五个大的指标分类，然后运用密切值法对水井进行排序。

3.2 问题二的分析

根据水质分级标准表，首先剔除分级标准表中没有的指标和水质类型均相同的指标，确定8个指标为本问题的原始指标，将分级表中的I 类、II 类、III 类指标当作水井样本，和原来四口水井一起，组成一个样本容量为7、指标个数为8的新样本组合，利用问题一的主成分分析模型，通过计算方差贡献率，进行打分排名，根据排名确定水质分级。

4 模型的假设

根据题目，提出以下几个假设：

（1）假设相距500米以上的四口水井互相不存在影响。

（2）DL 是指“测量太小，无法统计”。在题目数据中，东西南北四个井水的铜、氰化物、汞、镉、六价铬、铅六项指标均“

妨忽略这样的指标，即我们只考虑其他18项指标。

5 问题一模型的建立

5.1问题的进一步分析 5.1.1主成分分析法

四口水井水样数据，共监测了18项指标进行分析。根据主成分分析法，先对原始数据进行无量纲化处理，再求相关系数矩阵，由相关系数矩阵计算特征值。

题中给出4个样本各24个指标，首先要确定分析标量，即四口水井对应的指标，列出原始样本资料阵，再对原始数据进行标准化（无量纲化），得到标准阵，再通过SPSS 软件求出方差贡献率、累积方差贡献率，最后确定主成分的保留，根据特征向量，求出主成分综合评价分数，得出排名结果。

5.1.2 R 型聚类分析法

R 型聚类分析是将指标相关系数最大的一对聚为一类，通过这种方法反复对相关矩阵进行降维处理，每一聚合降维，总是找到相关系数最大的一对，到最后只剩五大类指标。在每类指标中，列出本类中所有指标的相关系数矩阵，计算每个指标与其他指标的相关系数平方和的平均数，然后比较各指标所求的值，选择所求值最大的那个指标作为五大类的代表性指标。根据五个代表性指标，利用密切值法，对四口水井进行打分排序。

5.2模型的建立和求解 5.2.1主成分分析法：

首先我们根据原始数据表，列出原始样本资料阵：

8.1 5.1350183169

0.080.170.150.00623.851.40.78 1.350.02610.7 1.480.00269008.34 6.93271381600.110.190.150.00316.265.10.98 2.630.01213 1.720.01781805R 7.49 6.45242321620.070.20.270 1.900.1518.40.3210.050.530.002=56007.15

7.2

1020209312 1.080.650.190 1.700.030.320.0040 2.180.0211968⎛⎫

⎪

⎪ ⎪

⎪

⎝⎭

为了使四个水井样本指标有更直观的比较，现将四个井水的指标统一到一个标准上，即对水井的每个指标进行无量纲化处理，

),1,2,...,18ij x x x i j *

= （5.1）

其中j x ，j s 分别为第j 列元素的样本均值和样本方差

∑==411k kj j x n x ，()∑=--=4

211k j kj j x x n s （5.2）则采用矩阵形式写出的标准化后的的样本资料阵为