误差的统计概率
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
误差的统计概念
一.随机误差的正态分布
1. 正态分布
随机误差的规律服从正态分布规律,可用正态分布曲线(高斯分布的正态概率密度函数)表示:
(13)
式中:y—概率密度;μ—总体平均值;σ—总体标准偏差。
正态分布曲线依赖于μ和σ两个基本参数,曲线随μ和σ的不同而不同。为简便起见,使用一个新变数(u)来表达误差分布函数式:
(14)
u的涵义是:偏差值(x-μ)以标准偏差为单位来表示。
变换后的函数式为:
(15)
由此绘制的曲线称为“标准正态分布曲线”。因为标准正态分布曲线横坐标是以σ为单位,所以对于不同的测定值μ及σ,都是适用的。
图1:两组精密度不同的测定值图2:标准正态分布曲线
的正态分布曲线
“标准正态分布曲线”清楚地反映了随机误差的分布性质:
(1)集中趋势当x=μ时(u=0),,y此时最大,说明测定值x集中在μ附近,或者说,μ是最可信赖值。
(2)对称趋势曲线以x=μ这一直线为对称轴,表明:
正负误差出现的概率相等。大误差出现的概率小,小误差出现的概率大;很大误差出现的概率极小。在无限多次测定时,误差的算术平均值极限为0 。
(3)总概率曲线与横坐标从-∝到+∝在之间所包围的面积代表具有各种大小误差的测定值出现的概率的总和,其值为1(100%)
(16)
用数理统计方法可以证明并求出测定值x出现在不同u区间的概率(不同u值时所占的面积)即x落在μ±uσ区间的概率:
置信区
间置信概率
u= ± 1.00 x= μ± 1.00σ
68.3%
u= ± 1.96 x= μ± 1.96σ
95.0%
u= ± 3.00 x= μ± 3.00σ
99.7%
二. 有限数据随机误差的t分布
在实际测定中,测定次数是有限的,只有和S,此时则用能合理地处理少量实验数据的方法—t分布
1. t分布曲线(实际测定中,用、S代替μ、σ)
t分布曲线与标准正态分布曲线相似,纵坐标仍为概率密度,纵坐标则是新的统计量t
(17)
无限次测定,u一定→P 就一定;
有限次测定:t一定→P 随ν(自由度)不同而不同。
不同的ν值及概率所对应的t值,已有统计学家计算出来,可由有关表中查出。
2. 平均值的置信区间
应用t分布估计真值范围,考虑的符号时,则可得到如下关系式:
μ= x±t P,νS(18)
同样,对于样本平均值也存在类似的关系式:
(19)
此式表示的是在一定概率下,以样本平均值为中心的包括真值在内的取值范围,即平均值的置信区间。称为置信区间界限。
此式表明:平均值与真值的关系,即说明平均值的可靠性。
平均值的置信区间取决于测定的精密度、测定次数和置信水平(概率)。(分析工作中常规定为 95%)
测定精密度越高(S小),测定次数越多(n大),置信区间则越小,即平均值越准确。