第二章 误差及数据处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章误差及数据处理
§1 误差概述
一、误差的来源
1.测定值
分析过程是通过测定被测物的某些物理量,并依此计算欲测组分的含量来完成定量任务的,所有这些实际测定的数值及依此计算得到的数值均为测定值。

2.真实值 true value
真实值是被测物质中某一欲测组分含量客观存在的数值。

在实验中,由于应用的仪器,分析方法,样品处理,分析人员的观察能力以及测定程序都不十全十美,所以测定得到的数据均为测定值,而并非真实值。

真实值是客观存在的,但在实际中却难以测得。

真值一般分为:
<1>理论真值:三角形内角和等于1800。

<2>约定真值:统一单位(m.k g,.s)和导出单位、辅助单位。

1)时, <3>相对真值:高一级的标准器的误差为低一级标准器的误差的51(31~20
则认为前者为后者的相对真值。

思考:滴定管与量筒、天平与台称
3.误差的来源
真值是不可测的,测定值与真实值之差称为误差。

在定量分析中,误差主要来源于以下六个方面:
<1> 分析方法
由于任何一种分析方法都仅是在一定程度上反映欲测体系的真实性。

因此,对于一个样品来说,采用不同的分析方法常常得到不同的分析结果。

实验中,当我们采用不同手段对同一样品进行同一项目测定时,经常得到不同的结果,说明分析方法和操作均会引起误差。

例如:在酸碱滴定中,选用不同的指示剂会得到不同的结果,这是因为每一种指示剂都有着特定的pH变化范围,反应的变色点与酸、碱的化学计量点有或多或少的差距。

另外在样品处理过程中,由于浸取、消化、沉淀、萃取、交换等操作过程,不能全部回收欲测物质或引入其他杂质,对测定结果也会引入误差。

<2> 仪器设备
由于仪器设备的结构,所用的仪表及标准量器等引起的误差称为仪器设备误差。

如:天平两臂不等、仪表指示有误差、砝码锈蚀、容量瓶刻度不准等。

<3> 试剂误差
试剂中常含有一定的杂质或由贮存不当给定量分析引入不易发现的误差。

杂质还常常干扰测定。

所以试剂常常需要进行前处理和纯化,有些试剂在用前配制或标定。

<4> 操作环境
操作环境误差是由于操作的环境状态,如湿度、温度、气压、振动、电磁场、光线等条件与要求不一致而引起仪器设备的量值变化,仪器指示滞后或超前而产生误差。

此外,环境对分析对象本身也会引起改变。

<5> 操作人员
这是由分析人员固有的习惯(如读数时基准线偏上、偏下)以及生理特点(如最小分辨能力、辨色能力、敏感程度等)的差异引起的误差。

只有通过严格的训练克服错误的操作,减小自身的误差来克服这种误差。

〈6〉样品误差
由于取样方法不同,可能引起误差。

所取样品是否具有代表性还与时空观念有关。

如在分析环境样品时,当排污口向河水中排污时与不排污时,所取河水样品差距较大,由此引起的误差为样品误差。

以上只介绍了误差的来源,关于误差的克服及消减在后果的有关章节介绍。

二、误差的分类
误差分为系统误差(可测误差)、偶然误差(非确定误差)、粗差(过失误差)。

1.系统误差systematic error
系统误差是由于某种比较固定的原因引起的。

在同一条件下多次测定中,它会重复地出现,因此系统误差对分析结果的影响比较固定,即误差正负,大小一定,是单向性的。

正负和大小有着固定规律的误差称为系统误差。

误差的大小和正负是可测的,所以又叫可测误差。

定量分析化学中的系统误差主要产生于:
〈1〉分析方法、如:重量分析发中测定的溶解损失、滴定分析中终点与化学计量点不一致、定量分析中伴有副反应等。

〈2〉仪器误差、如:天平两臂不等、测量仪器不准、砝码锈蚀、标准器不准(滴定管、移液管)等。

〈3〉试剂不纯,如:试剂中有杂质、蒸馏水不合格等。

〈4〉操作环境:如:称吸水性试样时,浓度不同,误差大小不同。

〈5〉分析操作人员的固有习惯,如:对颜色不敏感,有主观偏见等。

以上是产生误差的可能原因,但在一个具体操作中,要做具体的分析,找出产生系统误差的主要原因,设法避免或减少。

2.偶然误差 random error
偶然误差是指由于偶然原因引起的误差。

它的大小、正负是可变,所以又称为非确定误差。

它是由一些偶然和意外原因引起的,事先无从知道产生误差的原因,因此偶然误差难以避免。

例如,某个分析人员对同一试样进行多次分析,得到的分析结果有高有低,不能完全
一致,这是偶然误差引起的,似乎没有规律性。

但实践证明,如果进行多次测定,便发现数据的分布符合一般的统计规律,即可以用正态分布曲线来表示偶然误差
偶然误差具有以下特点:
<1> 正误差和负误差出现的几率相等,即具有对称性和单峰性。

<2> 小误差出现的次数多,大误差出现的次数少,即在一定条件下的测量值中,其误差的绝对值不会超过一定界限,就是我们所说的有界性。

<3> 在一定条件下进行测定,偶然误差的算术平均值随测量次数的无限增加而趋于零。

误差的平均值趋于零。

即抵偿性。

根据误差理论,校正系统误差后,测定次数越多,则分析结果的平均值越接近真实值,也就是说采用多次测定取平均值的方法可以减小偶然误差。

由于偶然误差是由于不定因素引起的,不能通过实验减免,而且互相迭加、传递、干扰,且影响因素太多,所以只能通过数据处理来减少对测定结果的影响,故偶然误差是数据处理的主要对象。

3.粗差 mistake
粗度也称为过失误差,是一种明显与事实不符的误差。

粗差是由于操作不正确、偶然的外界变化或由于粗心造成的。

如样品的沾污、欲测组分的溅失及读数误差、记录错误等。

这种误差无规律可寻,属于责任事故,只有通过细心操作、准确记录和加强责任心才能加以避免。

一旦出现过失误差,可通过数据处理剔除。

三、误差与偏差的表示方法
1.绝对误差:测定值与真实值之差。

E=x i -μ
E ↓,表示x i →μ。

x i >μ,E>0,为正误差,表示测定结果偏高;x i <μ,E<0,为负误差,表示测定结果偏低。

2.相对误差:误差在真实结果中所占的百分率。

E 相对=μ
E ×100%=μμ-i x ×100% E 相对>0,为正误差;E 相对<0,为负误差。

相对误差较误差更能说明分析结果的准确性。

3.绝对偏差
在实际工作,由于真实值不知道,通常以平均值代替真实值,并以平均值作为最后的分析结果。

个别测定值与有限测定的平均值之差称为绝对偏差。

x x d i i -=
n x n x x x x i n ∑=++=.......21 其中:x 为算术平均值,i x 为某次测定值,n 为测定次数,d i 为某次测定值的偏差
4.相对偏差:绝对偏差与平均值之比。

d 相对 =x d i
×100%
相对偏差表示绝对偏差在平均值中所占的比例。

偏差也有正负。

在实际测定中,通常得到的是x ,而不是μ,所以偏差较误差更为常用。

5.算术平均偏差:各个单次测定产生偏差的算术平均值。

n x x n d n d d d d i i n ∑∑-==+++=
(21)
6.相对算术平均偏差 x
d d =相对×100% 7.标准偏差(均方根偏差):是测定中各单次测定的偏差平方和的平均值再开方。

当∞→n 时,n
x i ∑-=2
)(μσ 差总体标准偏差,标准误:σ。

当n 为有限次时,12--=∑n x X S i )
( S :标准偏差。

例:求以下两组偏差数据的平均偏差和标准偏差:
⑴ +0.3, -0.2,-0.4,+0.2,+0.1,+0.4,0.0,-0.3,+0.2,-0.3
⑵ 0.0, +0.1, -0.7, +0.2, -0.1, -0.2, +0.5, -0.2, +0.3, +0.1 解:通过计算可得:24.01==∑n d
d i ,24.02=d
1S =0.28,2S =0.33
由计算结果可知:算术平均偏差对于大偏差得不到如实的反映,因为在一系列测定中,小偏差出现的次数多,大偏差出现的次数少,前后求得的算术平均偏差总是偏低。

在标准偏差中,由于平方后,加大了较大偏差在计算中的影响, 这样就可以看出第一组的数据较第二组为好。

标准偏差和算术平均偏差一样,其大小是反映各测定值的互相间分散或密集的情况,其标准偏差比算术平均偏差更为“灵敏”一些。

8.相对标准偏差 relative standard deviation (RSD ),或变异系数coefficient of
variation (CV )
X
S S =相对×100% 9.平均值的误差:平均值与真实值之差。

μ-=X E X
在有限次测定中,我们把平均值看成是最佳值,但平均值与真实值之间存在着一定的差距,我们把平均值与真实值之差称为平均值的误差。

平均值的误差就等各次单一测定值误差的平均值。

n E E n i X ∑=1
10.平均值的标准偏差:单次测定的标准偏差除以测定次数的平方根。

n S S X ±=
x S 的大小与测定次数的平方根成反比,即:n ↑,↓x S ,增加测定次数可以提高测定
结果的精密度,使平均值的标准偏差下降。

但当n>5时,用增加测定次数来提高精密度的效果开始下降:
1 2 3 4 5…… ……10 11
1 1.414 1.73
2 2 2.236 3.162 3.317
可见,n ↑,n 变化梯度逐渐减小,所以对x 的影响减小。

一般工作中只取3~4个平行样。

如果再增加测定次数对X S 帮助较小,但却造成人力、物
力上的浪费。

11.极差:一组测定数据中最大值与最小值之差称为极差.也叫全距或全距范围,说明了数据的范围和伸展情况。

min max X X R -=
式中,R 为极差 为一组数据中的最大值max X 为一组数据中最小值min X
对于测定次数比较小的数据(n<15次),可通过下式简单地估算标准偏差:
n R
S ≈
例:经几次测定将水中含e F 量(以mg/L 计)为0.48, 0.37,0.47,0.40,0.43。

求X 、d 、相对d 、S 、相对S 、X S 、R 以及用R 估算S(95%置信度)。

解:43.05
43.040.047.037.048.0=++++=X 036.050
03.004.006.005.0=+-++-+=
d 100043
.0036.0⨯=相对d %=8.4% 046.01
5003.004.006.005.02222=-++++=S %11%10043.0046.0=⨯=
相对S 021.05046.0±=±=x S
11.037.048.0=-=R 049.0511
.0===n R
S
可见,估算出的标准偏差与前面准确计算出来的S 值接近,但计算要简便得对,在实际工作中有一定的意义。

四.准确度和精密度
1.准确度(accuracy):是测定值与真实值的符合程度。

准确度说明了测定结果的可靠性,可以用误差的大小来表示。

误差的绝对值↑E ,测定结果越不准确,即准确度越低。

测定结果的准确度常用相对误差来判断:
↑E ,不准确,即↑-μx ,准确度低;
↓E ,准确,表示↓-μx ,准确度高。

2.精密度(precision ):是n 次测定值之间相互接近的程度。

精密度说明了测定结果再现性程度,可以用偏差的大小来表示。

偏差↑,表示x 与x 相差多,数据分散,精密度低;
偏差↓,x 与x 相差少,数据集中,精密度高。

准确度与精密度是两个不同概念,必须严格区分,准确度高,精密度一定高,也就是
说准确度高是以精密度为前提的;而精密度高不一定准确度高,它可能存在着系统误差,使得数据虽然很接近,但从全部数据上偏离了真实值。

下面这个例子就说明了这个解释。

例:某人用三种不同方法测定含汞为10.00%的样品得到数据列表如下,并做图(见教材)
从图中可以看出,方法一的测定结果都集中在平均值附近,精密度较高,说明偶然误差小,但该方法的测定值远离真实值,说明该方法有较大的系统误差,只能消除系统误差或进行校准,这组数据才有实用价值。

方法二的测定结果都集中在平均值附近,且平均值接近真实值,说明精密度和准确度都高,该测定的系统误差和偶然误差都不大。

方法三的测定结果非常分散,精密度差,说明存在较大偶然误差,虽然它的平均值和方法二的平均值一样地接近真实值,即E 相等,但这也可能是某种巧合,实际应用中不能采用方法三。

从表中数据如何选择一种较好的分析方法呢?首先,比较精密度d ,弃去较大的方法三,法一,法二的精密度相同,就准确度来说,方法二更好。

所以,准确度高一定要精密度高,但精密度高不一定准确度高。

精密度是保证准确度的先决条件。

精密度低说明测定结果不可靠,在这种情况下,自然失去了衡量准确度的前提。

环境分析最终的目的是要准确,不精密的测定可靠性低,也难达到准确的目的。

但精密的测定结果一旦存在系统误差,也就难以准确了。

因此校正系统误差,提高准确度,再加上控制偶然误差,以提高精密度,这样就可得到准确、精密的测定结果。

五.灵敏度和检出限
1.灵敏度(sensitivity )
灵敏度是指一个分析方法或分析仪器在被测物质改变单位重量或单位浓度时所引起的响应量变化的程度。

灵敏度反映了一个方法或仪器的分辨能力,它可因实验条件的改变而变化,但在一定的实验条件下,灵敏度具有相对稳定性。

灵敏度的表示方法有:
a :根据定义,被测物的重量或浓度
响应量或其他指示量灵敏度= b :在实际工作中,可用校准曲线的斜率来度量灵敏度
c :在原子吸收分光光度法中,把1%吸收灵敏度叫做特征浓度或特征量。

特征浓度或特征量越小,方法灵敏度越高,即产生1%吸收的特征浓度或量越小,方法越灵敏。

2、检出限(limit of detection or minimum detectability )
检出限是指一个分析方法对被测物质在给定的可靠程度内能够被检出的最小重量或最低浓度。

在环境分析与监测中,检出限常用最小检出量的绝对值来表示,如0.1g μ;也常
用最低检出浓度来表示,如0.01㎎·L-1等。

应注意,如果实验操作条件改变(如取样体积变化),则最低检出限也会发生变化。

检出限与灵敏度是两个不同的概念,不可混淆。

§2 有效数字及其运算
在科学实验中,正确地记录和计算是一项不可忽视的工作。

如果处理不当,会导致错误的结果。

所谓正确地记录数据,是指正确地记下仪器测量的数字的位数。

对于任一物理量的测定,其准确度都一定限度,因此产生了有效数字的概念。

一、有效数字
数字的位数不仅表示数量的大小,而且也反映测量的准确度。

正确的数字位数就是在测量中所能得到的有实际意义的数字。

换句话说,有效数字就是实际上能测得的数字。

一个有效数字除最后一位不准确外,其它各数都是确定的,就是说有效数字是由两个部分组成的:
有效数字=可靠数字+可疑数字
可靠数字表示在反复测量一个量时,其结果总是有几位数字固定不变,所以为可靠数字。

在可靠数字后面出现的数字,在各次单一测定中常常是不同的、可变的,这些数字欠准确,往往是通过分析人员估计得到的,为可疑数字,实际工作中常保留一位可疑数字。

例如,用分析天平称取样品0.4010g或0.4011g,最末一位数字是可疑数字,前面的三位为可靠数字。

两者构成了0.4010这样一个四位数字。

如何确定有效数字的位数呢?
从可疑数字算起,到读数的左起第一非零数字的数字位数称为有效数字的位数。

在计算有效数字时,“0”的作用是不同的,“0”可以是有效数字,也可以是非有效数字,所谓非有效数字是指在一个数中可有可无的数字。

如:0.4010g
↙↘
非有效数字有效数字,不能省略
只起定位作用
没有其它意义
是可有可无的
也就是说,当“0”用来定位时,它就不是有效数字,若最后一位数字是“0”,则表示该数字的准确度,0.4010g表示准确到万分之一。

若改用于千分之一天平称量,得到结果为0.401g,其“1”是可疑数字,如果后面再加一个“0”,记录结果就是错误的。

所以一般只保留一位可疑数字。

课堂练习:判断以下数字是几位有效数字,注意“0”的作用。

2.0006(五) 0.1000(四)
0.401(三) 0.0401(三)
54(二) 0.04(一)
42261(五) 10.98%(四)
1.98×103
0.0010(二)
1×105 3600(不确定)
100(不确定) 10.0×101(三) 对于3600这样的数字应根据实际的有效数字写成:3.6×103,3.60×103,3.600×101。

另外,在环境分析与监测中常遇到一些数值,如:原子量、化合价、摩尔数、测量次数及一些常数,这些单一数字应视为准确的,一般将其有效数字视为足够的,如:6
18.2946)61(7272==的分子量o c k o c k m r r 。

这个“6”不意味只有一位有效数字,它是自然数,不是测量得到的,可以看成是无限多位有效数字。

对与pH 、pM 、㏒K 等对数数值,其有效数字的位数仅取决于小数部分的位数,因为整数部分只说明读数的方次。

如:pH=11.02 二位,而不是四位
[]6.9=+H
×10-12(mol/L )=0.96×10-11
(mol/L )
二、有效数字的保留与修约原则。

在数据记录和处理过程中,常常回遇到一些精密度不同或位数较多的数据。

另外,测量中的误差在计算中会传递到结果中去。

为了使计算简化,且不致引起错误,可以按下列原则对数据进行修约。

1.在记录测量数据时,一般仅保留一位可疑数字,个别情况下,保留二位可疑数字。

可疑数字表示末位上有1±或下一位上有5±个单位的误差。

如:滴定管读数V=24.36ml ,表示其准确度为:V=24.36±0.01;
某表头指针读数0.375,表示有0005.0±的误差。

2.表示分析方法的精密度和准确度时,多数情况下只取一位有效数字,个别情况下最多取二位,
如:d=0.03,d=0.15
3.在确定有效数字位数后,其余数字按修约原则进行取舍。

修约原则:四舍六入五成双。

即a 、舍去部分的数值大于五时,前一位加一、进一;
b 、舍去部分的数值小于五时,则舍去不计;
↗奇数+1→偶数
c 、舍去部分的数值等于五时,前一位为
↘偶数,则不变
可见,修约后,使这个数字变为偶数,即“保双”。

例:下列数字取三位有效数字时应为:
0.3246 → 0.325 六入
0.32349 → 0.323 四舍
0.3245 → 0.324 保双
0.324501→ 0.325 501>5,应入一位
0.324500→ 0.324 保双
0.3235 → 0.324 保双
保双的目的在于消除“舍、进”造成的系统误差。

如果按照旧的修约原则“四舍五入”,逢五进一,就会造成结果朝大或小的一个方向偏离。

另外,偶数也便于计算。

在取舍数字时,应对数字一次修约,不可连续对该数字进行修约。

如:27.455 →27一次修约 (正确)
27.455 →27.46 →27.5 →28 多次修约(不正确)
三.有效数字的运算
由于误差可以传递到计算结果中去,为了避免在计算中使误差改变其原来的意义,并且能在结果中正确地反映出来,计算就应按照一定的规则进行。

1.加减法
几个数据相加减时,它们的和或差只能保留一位不确定的数字,即有效数字的保留应以小数点后位数最少的数字为根据,换句话说,是以绝对误差最大的数据为根据。

例: 0.0121 + 25.64 + 1.05782
小数点后位数 四位 二位 五位 以最少为准
绝对误差 0001.0± 01.0± 00001.0± 以最大为准
进行计算时,应先修约后计算,这样就与误差的实际情况想等了。

在实际运算过程中,加减各数值时,应以小数点后位数最少者为准,其它各数可以比该数暂时多保留一位有效数字,这个多保留的数字称为安全数字,目的是为了防止连续舍或连续进而影响结果,当然最后计算结果仍以小数点后位数最少者为准。

2.乘除法
在乘除法运算中,所得到的积或商其有效数字的位数应与各测定值中有效数字位数最少(相对误差最大)者相同。

例: 0.0121 × 25.64 × 1.05782 = 0.328
有效数字位数 三 四 六 最少
E 相对 0121.00001.0±×100%64.2501.0±×100% 05782
.100001.0±×100% 最大 =08.0±% =04.0±% =00019.0±%
注意:
a.在乘除法运算中,当有效数字位数最少的数据,首位数为8或9时,有效数字位数可多算一位。

例:9.00,9.99这样大的数与10.01,12.01的相对误差接近。

9.99 99.901.0±=
相对E ×100%=0.10% 9.00 00.901.0±=相对
E ×100%=0.11% 10.01 01.1001.0±=相对
E ×100%=0.10% 12.01 01
.1201.0±=相对E ×100%=0.08% 所以可以把9.00,9.99当成多一位有效数字处理。

例:9.26×6.421=59.46 而不是59.5(将9.26看作四位有效数字,而不是三位) b.如果相乘数据首位为8或9,而积的首位也是8或9,则其有效数字位数不应增加。

例:9×0.99=9 而不是8.9
3.对数计算
所取对数位数应与真数的有效数字位数相等。

例:[]+H =5.3×410- PH=?
PH=-㏒[]+
H =-㏒5.3×410-=3.28 例:pH=11.02 求[]?=+H
[]5.9101002.11===--+PH H ×10-12 例:[]mol M 02.0=+·1-l
求㏒[]?=+M ㏒[]=+M ㏒0.02=-1.7
4.在计算平均值时,若为四个或四个以上的数相平均时,平均值有效数字可增加一位。

§3 分析结果数据处理
正确地记录和计算数据之后,可得到一组数据的平均值,但平均值与真实值之间有一定的差值。

这个平均值在什么范围内可靠?数据的测定结果用什么方法表示呢?
一、测定结果的表示方法。

1.置信界限
置信界限是指一个可以相信的数值范围。

由于误差的存在,平均值只能近似于真实值。

说明真实值就在平均值的两侧,所以用这样一个可信的数值范围来表示测定结果更为合。

置信要有一定的水准,这就是置信度。

现在再来看正态分布曲线(见教材)。

测定值x 落在任意区间(a ,b )的几率为P (a<x<b ),这就等于阴影部分的面积,也就是等于曲线及x=a 、x=b 、横坐标所夹的面积,用公式表示为: ⎰--=<<dx e b x a P x b
a 22
2)(21
)(σμπσ
式中:X —测定值 μ—真实值 σ—校准偏差
经计算可知:
测定值落在(σμσμ+-,)之间几率为68.27%
测定值落(σμσμ2,2+-)之间几率为94.45%
测定值落在(σμσμ3,3+-)之间几率为99.79%
测定值落在( ωμωμ96.1,9.1+-)之间几率为95%
当置信界限在σμ3±时,置信度为99.79%,也就是说测定值出现σμ3±范围内的几率为99.79%,在σμ3±外出现的几率仅为0.21%,所以在通常的有限次测定中,如果个别数据误差大于σ3±,则认为该数据已超出偶然误差范围。

在环境分析与监测质量控制中常以σ96.1±为置信界限,即采用95%的置信度。

2.t 分布曲线 有人在系统地研究了有限次测定的几率分布后,定义:x
s x t μ-=± t 值是平均值的误差以平均值的标准偏差为单位的数值,用t 值计算误差分布得到的t 分布曲线,其形状与正态分布曲线极相似。

但t 分布曲线,在测定次数n 少时,顶部稍平,底部稍宽,误差变动范围大;增加测定次数,↑↓↑t s n x 则,,,误差变动程度小。

当n>30时,t 分布曲线与正态分布曲线趋于一致。

测定次数不同,t 分布不同,每确定一个测定次数,就有一定t 分布曲线,即有不同的几率,通过计算,将t 值列表。

3.平均值的置信区间
在了解了有限次测定数据的分布几率后,就可以根据有限次的测定数据,在一定的置信度下,确切地表示分析结果:
x
s x t μ-=± t x ±=μ·n ts
x s x ±
= 此式说明了平均值与真实值之间的关系及平均值的可靠性。

平均值不是真实值,但可以使平均值落在一定的区间内。

平均值的置信界限取决于S 、n 及置信度。

一般采用95%的置信度,测定的精密度越高(↓s ),次数越多(↑n ),则置信界限n ts
±越小,即平均值越准确。

例:测定同一含铁样品得到一组数据Fe% :15.43 ,15.37 ,15.40 ,15.38 ,15.44。

用平均值的置信界限来表示分析结果的精密度。

解:经过计算得:40.15=x ,S=0.035,在95%置信度,查表得776.295.0=t
04.040.155035
.0776.240.15±=⨯±=±=n ts
x μ
说明该组分五次测定的平均值为15.40%,而且有95%的可能认为该组分真实值的置信界限在15.36到15.44之间。

4.平均值
<1>算术平均值:μ−−→−=++=∞→∑n i n n x n x x x x (21)
当无系统误差存在时,∞→n ,误差的大小和正负出现的几率相等。

将各测定值相加,并加以平均,可以获得接近真值的数值,所以真值是指无限多次测定值的平均值。

通常测定中,测定次数总是有限的,用有限次的测定值求得的平均值只能近似真实值,在消除系统误差的条件下,n>30次,认为x 为真值(实际应用中n>20次),在实验中,平行样一般不超过4个,因为当次数再多时,平均值趋进真值的效果并不明显,并对人力,物力造成浪费。

<2>几何平均值
算术平均值可以较好地反映正态分布下的数据,若一组数据呈偏态分布,用算术平均值就不能代表这组数据,此时数据可用几何平均值来表示。

()n
n n n g x x x x x x x x 132121⋅⋅⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅⋅⋅= 5.中位值
将一系列测定数据按大小顺序排列,找出中间值,即中位值。

若数据为偶次,中位值是中间两个数据的平均值。

中位值最大的优点是简便、直观,但只有在两端数据分布均匀时,中位值才能代表最佳值。

当测定次数较少时,平均值与中位值不完全符合。

例:求下列数据中的中位值和平均值。

10.06,10.20,10.08,10.10 解:计算得:平均值11.10=x ,几何平均值11.10=g x ,中位值=
09.10208.1010.10=+ 可见中位值与平均值不完全符合。

6.众数(从众值):一组数据中,出现次数最多的那个数叫众数。

二、可疑数据的舍弃与保留
在实际测定中,由于偶然误差的存在,有时会出现离散性很大的数据,也就是说有个别数据与其它数据相差较大,如果保留这一测定数据,会对平均值及偏差影响较大。

初学者为获得数据的一致性,常随便舍弃可疑数据,这是不正确的。

但偏离平均值较大的数据究竟是由于过失造成的,还是属于偶然误差范围,应进行数据的检验,数据的取舍应有一个衡量的尺度,这里介绍三种常用的检验方法:
1. Q 检验法
此法适用于检验测定次数为3-10次的可疑数字,具体步骤为:
⑴将测定数据从小到大顺序排列,,...,.........,,321n x x x x 其中n x x ,1可能为可疑数据 ⑵求出Q 值:
当1x 可疑时,Q=1
12x x x x n -- 当n x 可疑时,Q=
11x x x x n n n --- ⑶查表:根据测定次数n 和置信度查Q 值表
若表算Q Q >,则该可疑数据舍弃
若表算Q Q ≤,则该可疑数据保留
例:判断下列数据中15.46是否保留。

15.37,15.38,15.40,15.41,15.46,(90%置信度) 解: Q=11x x x x n n n ---=37
.1546.1541.1546.15--=0.56 查表:=)5(90.0Q 0.64
∴ 15.46属偶然误差,应保留
2.Grubbs 检验法——G 检法。

相关文档
最新文档