环境管理第四章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 环境规划与管理的数学基础

第一节 环境数据处理方法 一、数据的表示方法

1、列表法

例:研究电阻的阻值与温度的关系时,测试结果如下:

2、图示法

⏹ 图示法的第一步就是按列表法的要求列出因变量y 与自变量x 相对应的y i 与x i 数据表格。 ⏹ 作曲线图时必须依据一定的法则,只有遵守这些法则,才能得到与实验点位置偏差最小而光滑的曲线图形。

⏹ 坐标纸的选择--常用的坐标系为直角坐标系,包括笛卡尔坐标系(又称普通直角坐标系)、半对数坐标系和对数坐标系。

• 半对数坐标系

测量序号

温度t/℃ 电阻R/Ω 1 10.5 10.42 2 29.4 10.92 3 42.7 11.32 4 60.0 11.80 5 75.0 12.24 6

91.0

12.67

• 一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标轴。

• 右图中的横坐标轴(x 轴)是对数坐标。在此轴上,某点与原点的实际距离为该点对应数的

对数值,但是在该点标出的值是真数。为了说明作图的原理,作一条平行于横坐标轴的对数数值线。

3、插值法计算数值 (1)作图插值法

例:用分光光度计法测定溶液中铁的含量,测得标准曲线数据如下: Fe (μg/mL ) 2 4 6 8 10 12 吸光度(A ) 0.097 0.200 0.304 0.408 0.510 0.613 测得未知液的吸光度为0.413,试求未知液中铁的含量。

在图的纵坐标上0.413处找到直线上对应点,读出其对应的横坐标即为未知液中铁的含量 8.122

(2)比例法

半对数坐标的标度法

(3)牛顿内插公式

一般的非线性函数都可以展开为多项式

(二)数据特征

⏹ 数据特征是对环境总体状况进行估计判断的基础,是认识数据理论特性的基本出发点,通常可分为以下三类:

⏹ 位置特征数:表示数据集中趋势或刻画频数分布图中心位置的特征数; ⏹ 离散特征数:用来描述数据分散程度;

⏹ 分布形态特征数:刻划了根据所获数据绘制的分布曲线图的形态。

1. 位置特征数 (1)算术平均数:

式中:x1, x2, …, xn 为样本个体数据,n 为样本个数

(2)加权平均数

如果样本个体数据x 1, x 2, …, x n 取值因频 数不同或对总体重要性有所差别,则常

n

x

n

x x x x n

i i

n ∑==

+++=1

21 ∑∑===

++++++=n

i i

n

i i

i n

n

n w w

x

w w w w x w x w x w x 1

1212211

采取加权平均方法。

式中:wi 是个体数据出现频数,或是因该个体对样本贡献不同而取的不同的数值。

(5)中位数

⏹ 环境数据有时显得比较分散,甚至个别的数据离群偏远,难以判断去留,这时往往用到中位数。

⏹ 样本数据依次排列(从大到小或者从小到大)居中间位置的数即为中位数,若数据个数为偶数,则中位数为正中两个数的平均值。

⏹ 只有当数据的分布呈正态分布时,中位数才代表这组数据的中心趋向,近似于真值。 1. 位置特征数

⏹ 环境统计中常常用到几何平均数。

不同的平均值都有各自适用场合,选择的平均数指标应能反映数据典型水平,并非随意采用。几何平均直径:

2. 离散特征数

3. 分布形态特征数

3121/g 123p g

(...)ln exp(

)

==∑ 或 n n n N i

i

d d d d n d d N

二、异常数据的剔除

⏹ 在处理实验数据的时候,我们常常会遇到个别数据偏离预期或大量统计数据结果的情况,如果我们把这些数据和正常数据放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据简单地剔除,又可能忽略了重要的实验信息。这里重要的问题是如何判断异常数据,然后将其剔除。判断和剔除异常数据是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。

⏹ 目前人们对异常数据的判别与剔除主要采用物理判别法和统计判别法两种方法。

⏹ 物理判别法就是根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。

⏹ 统计判别法是给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。

⏹ 剔除异常数据实质上是区别异常数据由偶然误差还是系统误差造成的问题。

⏹ 若是人为因素的偶然误差就应剔除,如果没有足够的理由证实是偶然过失造成的时候,应对数据进行统计处理,采用一定的检验方法来决定取舍。 ⏹ 本节着重介绍统计判别法。 1.拉依达准则

若可疑数据xp 与样本数据之算术平均值的偏差的绝对值大于3倍(2倍)的标准偏差,即:

则应将xp 从该组数据中剔除,至于选择3s 还是2s 与显著性水平α有关,显著性水平α表示的是检验出错的几率为α,或检验的可置信度为1-α。3s 相当于显著水平=0.01,2s 相当于显著水平=0.05。

2. 格拉布斯准则

用格拉布斯准则检验可疑数据x p 时,选取一定的显著性水平α ,若:

s 23或s x x d p p >-=

则应将x p 从该组数据中剔除,

称为格拉布斯检验临界值,可查相关表格得到。 以上准则是以数据按正态分布为前提的,当偏离正态分布, 特别是测量次数很少时,则判断的可靠性就差。因此,对粗大误差除用剔除准则外,更重要的是要提高工作人员的技术水平和工作责任心。另外, 要保证测量条件稳定,防止因环境条件剧烈变化而产生的突变影响。 3.狄克逊(dixon )法

⏹ 狄克逊研究了n 次测量结果,按其数值大小排列成如下次序: ⏹ 当 x i 服从正态分布时

⏹ 用不同的公式求得 f 值,再经过查表,得到相应的临界值,进行比较,若计算值>f(n ,α)视为异常值,舍弃;再对剩余数值进行检验,直到没有异常值为止。狄克逊通过模拟实验认为:n ≤7,使用 f 10 ;8≤n ≤10,用 f 11 ;11≤n ≤13,用 f 21 ;n ≥14,用 f 22 效果好。

例题

⏹ 用狄克逊法判断下列测试数据(40.02,40.15, 40.20,40.13,40.16)中的40.02是否应舍弃?

⏹ 解:将数据排列,取 α =0.05

40.02 40.13 40.15 40.16 40.20

,0.611<0.642

⏹ 所以40.02应保留。

(1)(2)()n χχχ≤≤≤

相关文档
最新文档