2006.9.27第二章误差的基本性质与处理(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章
误差的基本性质与处理
按照测量误差的特点、性质和规律,以及对测量结果 的影响方式,可将其分为随机误差,系统误差和粗大误 差(异常值)三类。 第一节 概率、随机误差的分布
一、概率
对于某一随机试验,出现的事件A,B…为有限个,且 每个事件出现的可能性是相同的。若事件A出现的次数为L, 各类事件出现总数为N,则L/N称为事件A出现的频率。
1
当各类事件总数N逐渐增多时,频率逐渐稳定于某 个客观存在的实常数。它隶属于随机事件,处于0与1 之间,称为理论概率。常用P(A)表示给定条件下事件A 出现的概率。 例如:袋中5个球中只有1个红球,第1个球就取中红 球的概率是1/5。 这类概率问题是离散型随机变量的概率问题。 概率的特性:
1、非负性:概率值为零或小于等于1的正数。 2、规范性:P(Ω )=1, Ω ——样本空间 3、可数可加性:
x1 x2 xn x n
2、 算术平均值原理
x
i 1
n
i
n
(2 1)
由于随机误差的存在,对某一量值作多次重复测量 所得的测值,必然是互不相同。这时,应以所有测得值 的算术平均值作为测量结果,才是最合理的。
15
由上述随机误差的性质可从数学上推导出误差的分布 密度函数,(其中最重要的一个条件是:当测量值等于所 有测值的算术平均值时出现的概率最大。) 这个推导是高斯最早完成的,称正态分布。 其概率密度函数为: 2
y
1
2
e
2 2
10
随机误差的分布律 大量的测量实践表明,多数随机误差,特别是在多种各不 占优势的独立随机因素综合作用下的随机误差,是服从正态分 布律的,其概率密度函数为:
(3)以数据为横坐标, 20 频率密度为纵坐标,在横 坐标上划出等分的子区间,15 划出各子区间的直方柱, 10 即为所求统计直方图。
5
f ( x)
0 7
7.1
7.2
7.3
7.4
7.5
7.6
9
测量中的随机误差一般具有以下特点: 1)单峰性:小误差出现的概率比大误差出现的概率大 2)对称性:正误差出现的概率与负误差出现的概率相等。 3)抵偿性:随测量次数增加,随机误差的算术平均值趋 于零。
7
为了分析测量的随机误差的分布规律,可以对某一被测量 进行多次测量,例如:对某钢球工件直径重复测量150次, 得到下列测量点列图,可计算出数据集中在7.335mm附近:
xi
7.585
7.335
7.085
i
8
(1)分组数=11,组距 =0.05mm; (2)依次定各组的频数、 频率和频率密度;
25
y
1
2
e
2 2 2
正态分布曲线
称为“高斯曲线” (Gauss)或“随机误差正态分布曲线”。
12
测值算术平均值不为零的正态分布 这时概率密度函数将以算术平均值 μ 为曲线对称轴, 设连续型随机变量 X 的概率密度函数为
( x )2 f ( x) exp[ ], ( x ) 2 2 2 1
y
1
2
e
2 2 2
式中 —随机误差(真差); y—概率分布密度,可理解为随机误差在单位区间内 出现的概率;
—均方误差;
e—自然对数的底,e=2.71828…
误差符合正态分布的条件:影响的因素很多、彼此独立、各 影响因素又是均匀的小。
11
以为横坐标,y为纵坐标,此概率密度函数的图形如图。
P(T1 X T2 ) p
(且令 p 1 )
那么T1和T2之间的区间称为 X 双侧的概率为p的置信区间; p 1 称为置信水平 (level of confidence),
(也叫置信度、置信水准、置信概率等。)
而:α称为显著性水平或显著度。
6
二、随机误差的性质及其分布规律 对同一量值多次等精度测量,得到一系列不同 的测量值(称为测量列)。每个测量值含有误差, 前一个误差出现后,不能预定下一个测值误差的大小 和方向,但就误差总体而言,具有统计规律。这类误 差叫随机误差。 为了分析随机误差对测量结果的影响,需要对随 机误差的分布规律进行研究。也就是研究随机误差的 概率密度函数。
4
概率密度函数的性质:
(1)
f ( x) 0
(2)
f ( x)dx 1
概率密度函数图
随机变量x落在某一区间的概率:
P ( x X x dx ) f ( x )dx (概率微元)
b
P (a X b) f ( x )dx
a
5
置信区间:
被测量的估计值常用算术平均值 X 于T1和T2之间的概率为 表示,若 X 落
其中μ,σ为常数,且 σ>0,则称X服从参数为 μ,σ的正态分布,记 为: 2
X ~ N ( , )
13
σ值不同时,正态分布概率密度曲线的变化
( x )2 f ( x) exp[ ], ( x ) 2 2 2 1
来自百度文库
14
三、测值的算术平均值
1、算术平均值 设x1,x2,…xn为n次测量所得之值,该组测值的算术平均值为
3
因此:对于连续型随机变量,我们可以用概率密度函数来 刻画随机变量取值的概率分布。
概率密度函数(或分布密度函数)
对于随机变量X,如果存在非负可积函数 使对任意实数 a,b( a<b ),都有
f ( x ) (- x )
P (a X b) f ( x )dx
a
b
则称X为连续随机变量,并称f(x)为X的概率密度函数。 (简称概率密度或密度)
2
对于连续型随机变量:常用
P( x0 X x0 x )
区间的概率。
表示随机变量X落在 x0 X x0 x
P( x X x dx ) f ( x )dx (概率微元)
连续型随机变量与离散型随机变量的一个根本区别是: 连续型随机变量X取值任一定值a(x轴上某点)的概率为 零。只有研究随机变量X落在某一区间的概率才不为零。
误差的基本性质与处理
按照测量误差的特点、性质和规律,以及对测量结果 的影响方式,可将其分为随机误差,系统误差和粗大误 差(异常值)三类。 第一节 概率、随机误差的分布
一、概率
对于某一随机试验,出现的事件A,B…为有限个,且 每个事件出现的可能性是相同的。若事件A出现的次数为L, 各类事件出现总数为N,则L/N称为事件A出现的频率。
1
当各类事件总数N逐渐增多时,频率逐渐稳定于某 个客观存在的实常数。它隶属于随机事件,处于0与1 之间,称为理论概率。常用P(A)表示给定条件下事件A 出现的概率。 例如:袋中5个球中只有1个红球,第1个球就取中红 球的概率是1/5。 这类概率问题是离散型随机变量的概率问题。 概率的特性:
1、非负性:概率值为零或小于等于1的正数。 2、规范性:P(Ω )=1, Ω ——样本空间 3、可数可加性:
x1 x2 xn x n
2、 算术平均值原理
x
i 1
n
i
n
(2 1)
由于随机误差的存在,对某一量值作多次重复测量 所得的测值,必然是互不相同。这时,应以所有测得值 的算术平均值作为测量结果,才是最合理的。
15
由上述随机误差的性质可从数学上推导出误差的分布 密度函数,(其中最重要的一个条件是:当测量值等于所 有测值的算术平均值时出现的概率最大。) 这个推导是高斯最早完成的,称正态分布。 其概率密度函数为: 2
y
1
2
e
2 2
10
随机误差的分布律 大量的测量实践表明,多数随机误差,特别是在多种各不 占优势的独立随机因素综合作用下的随机误差,是服从正态分 布律的,其概率密度函数为:
(3)以数据为横坐标, 20 频率密度为纵坐标,在横 坐标上划出等分的子区间,15 划出各子区间的直方柱, 10 即为所求统计直方图。
5
f ( x)
0 7
7.1
7.2
7.3
7.4
7.5
7.6
9
测量中的随机误差一般具有以下特点: 1)单峰性:小误差出现的概率比大误差出现的概率大 2)对称性:正误差出现的概率与负误差出现的概率相等。 3)抵偿性:随测量次数增加,随机误差的算术平均值趋 于零。
7
为了分析测量的随机误差的分布规律,可以对某一被测量 进行多次测量,例如:对某钢球工件直径重复测量150次, 得到下列测量点列图,可计算出数据集中在7.335mm附近:
xi
7.585
7.335
7.085
i
8
(1)分组数=11,组距 =0.05mm; (2)依次定各组的频数、 频率和频率密度;
25
y
1
2
e
2 2 2
正态分布曲线
称为“高斯曲线” (Gauss)或“随机误差正态分布曲线”。
12
测值算术平均值不为零的正态分布 这时概率密度函数将以算术平均值 μ 为曲线对称轴, 设连续型随机变量 X 的概率密度函数为
( x )2 f ( x) exp[ ], ( x ) 2 2 2 1
y
1
2
e
2 2 2
式中 —随机误差(真差); y—概率分布密度,可理解为随机误差在单位区间内 出现的概率;
—均方误差;
e—自然对数的底,e=2.71828…
误差符合正态分布的条件:影响的因素很多、彼此独立、各 影响因素又是均匀的小。
11
以为横坐标,y为纵坐标,此概率密度函数的图形如图。
P(T1 X T2 ) p
(且令 p 1 )
那么T1和T2之间的区间称为 X 双侧的概率为p的置信区间; p 1 称为置信水平 (level of confidence),
(也叫置信度、置信水准、置信概率等。)
而:α称为显著性水平或显著度。
6
二、随机误差的性质及其分布规律 对同一量值多次等精度测量,得到一系列不同 的测量值(称为测量列)。每个测量值含有误差, 前一个误差出现后,不能预定下一个测值误差的大小 和方向,但就误差总体而言,具有统计规律。这类误 差叫随机误差。 为了分析随机误差对测量结果的影响,需要对随 机误差的分布规律进行研究。也就是研究随机误差的 概率密度函数。
4
概率密度函数的性质:
(1)
f ( x) 0
(2)
f ( x)dx 1
概率密度函数图
随机变量x落在某一区间的概率:
P ( x X x dx ) f ( x )dx (概率微元)
b
P (a X b) f ( x )dx
a
5
置信区间:
被测量的估计值常用算术平均值 X 于T1和T2之间的概率为 表示,若 X 落
其中μ,σ为常数,且 σ>0,则称X服从参数为 μ,σ的正态分布,记 为: 2
X ~ N ( , )
13
σ值不同时,正态分布概率密度曲线的变化
( x )2 f ( x) exp[ ], ( x ) 2 2 2 1
来自百度文库
14
三、测值的算术平均值
1、算术平均值 设x1,x2,…xn为n次测量所得之值,该组测值的算术平均值为
3
因此:对于连续型随机变量,我们可以用概率密度函数来 刻画随机变量取值的概率分布。
概率密度函数(或分布密度函数)
对于随机变量X,如果存在非负可积函数 使对任意实数 a,b( a<b ),都有
f ( x ) (- x )
P (a X b) f ( x )dx
a
b
则称X为连续随机变量,并称f(x)为X的概率密度函数。 (简称概率密度或密度)
2
对于连续型随机变量:常用
P( x0 X x0 x )
区间的概率。
表示随机变量X落在 x0 X x0 x
P( x X x dx ) f ( x )dx (概率微元)
连续型随机变量与离散型随机变量的一个根本区别是: 连续型随机变量X取值任一定值a(x轴上某点)的概率为 零。只有研究随机变量X落在某一区间的概率才不为零。