误差分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率的频率解释
若对某一个被测量重复测量,我们可以得 到一系列测量数据,这些数据称测量值或 观测值 测量值是随机变量,它们分散在某个区间 内,概率是测量值在区间内出现的相对频 率,即出现的可能性大小的度量

概率的可信程度的解释
由于测量的不完善或人们对被测量及其影 响量的认识不足,概率是测量值落在某个 区间内的可信度大小的度量 在这个定义中,对于那些我们不知道其大 小的系统误差,可以认为是以一定的概率 落在区间的某个位置,认为也属于随机变 量 或者说,某项未知的系统误差落在该区间 内的可信程度也可以用概率表征。
i i
20
si
15
10
5
0
x
概率分布(probability distribution)

一个随机变量取任何给定值或属于某一给 定值集的概率随取值而变化的函数
随机变量在整个集合中取值的概率等于1 2. 一个概率分布与单一(标量)随机变量有关时 称为单变量概率分布,与随机变量的向量有关 时称为多变量概率分布。多变量概率分布也称 联合分布 3. 一个概率分布可以采用分布函数或概率密度 函数的形式
第2章 测量误差分布
教学目标

通过本章内容的学习,可以让读者熟悉误 差分布的基本概念、常见误差分布特征与 处理方法。为学好本课程内容打下重要理 论基础。
随机变量



作一次试验,其结果有多种可能。每一种可能结 果都可用一个数来表示,可把这些数看作为某变 量X的取值范围,变量X称为“随机变量”,即实 验结果可用随机变量X来表示。 通俗地讲,表示随机现象结果的变量称为随机变 量。常用大写字母X,Y,Z等表示随机变量,它 们的取值用相应的小写字母x,y,z表示。 定义:如果某一量(例如测量结果)在一定条件下 ,取某一值或在某一范围内取值是一个随机事件 ,则这样的量称作随机变量。
4

f (x)
Ⅱ 4 3 Ⅰ 4 0
总体及其误差分布的峰 Ⅲ 1.2 凸程度。4 4 是将 4 无量 纲化,也称峰度,而 4 x 是按标准正态分布归零,0 较尖峭的分布有 4 0 ,较平 即对于正态分布超越系 坦的分布有 4 0 数 4 视为零
1

2 3
期望
期望与真值之差即 为系统误差,如果 系统误差可以忽略 ,则期望 就是被 测量的真值 期望代表了测量的 最佳估计值,或相 对真值的系统误差 三条测量值分布曲线的精密 度相同,但正确度不同。 大小

1
2
3
方差Variance
对于一个随机变量,仅用数学期望还不足 以充分描述其特性。 比如,两组测量数据: 28,29,30,31,32……数学期望30,各个数据 在28和32之间波动 10,20,30,40,50……数学期望30,各个数据 在10和50之间波动 两组数据具有相同的数学期望为30,但它 们具有重要的差别。
第二节 常见测量误差分布
本节介绍几种常见的误差分布,包括正态 分布、均匀分布、三角分布、瑞利分布、反 正弦分布、 分布。
一、正态分布
服从正态分布的条件
误差因素多而小,无一个占优,彼此相互 独立(中心极限定理)。 一般认为,当影响测量的因素在15个以上, 且相互独立,其影响程度相当,可以认为 测量值服从正态分布;若要求不高,影响 因素则应在5个(至少3个)以上,也可视 为正态分布。
分散性, 精密度 误差分布 不对称性
误差分布 尖峭程度 两误差关 联程度
偏态系数
峰态系数 协方差
3 ( x )3 f ( x)dx


不对称
尖峭
4
4 3 4 4




( x )4 f ( x)dx
Cov( x, y)




( x x )( y y ) f ( x, y)dxdy
i i
0 7
7.1
7.2
7.3
7.4
7.5
7.6
统计直方图的作用

矩形面积:
fi si x f i x
25



随机误差统计直方图中的 矩形面积,表示误差落在 误差区间 x x 2 , x x 2 中的频率 当测量次数充分多时,此 频率亦即随机误差落在该 区间内的概率 此图在一定程度上直观地 反映了测量随机误差的分 布情况
=1 = 0.5
负相关
线性不 相关
_ = 0.5
=0
统计分布常用的特征值
名称 数学期望 方差 定义
E( X )
2
几何意义

误差意义
实际值 正确度
xf ( x)dx
2
位置特征 弥散
D( X ) ( x ) f ( x)dx
3 3 3
1.
分布函数

对于每个x值给出了随机变量X小于或等于x 的概率的一个函数称分布函数,用F(x)表示 F (x)= P( X≤ x )
F (x) 是一个不减的函数 1
10
F(x)
0 F ( x) 1, 且 F () lim F ( x) 0;
x
20
F () lim F ( x) 1.
x
3.概率分布的特征参数

尽管概率分布反映了该随机变量的全貌, 但在实际使用中更关心代表该该概率分布 的若干数字特征量。
期望 方差
标准偏差
期望expectation


期望又称(概率分布或随机变量的)均值 (mean)或期望值(expected value),有时又称数 学期望。 常用符号 表示,也用E(X)表示。 测量值的期望

方差

(随机变量或概率分布的)方差用符号 表 示 (x )
n 2
lim
2
i 1
i
n
n

测量值与期望之差是随机误差,方差就 是随机误差平方的期望值
V ( X ) E X E ( X )
2

2




( x )2 p( x)dx

方差说明了随机误差的大小和测量值的 分散程度。但由于方差的量纲是单位的 平方,使用不方便,因此引出了标准偏 差这个术语
ຫໍສະໝຸດ Baidu


数学上,积分代表了面积。由此可见,概率p 是概率分布曲线下在区间(a,b)内包含的面积 当p=0.9,表明测量值有90%的可能性落在该 区间内,该区间包含了概率分布下总面积的 90% 当p=1,表明测量值以100%的可能性落在该 区间内,也就是测量值必定在此区间内。
P a x b p x dx
标准偏差

概率分布或随机变量的标准偏差是方差的 正平方根值,用符号表示
V (X )

标准偏差是无穷多次测量的随机误差平方 n 的算术平均值的正平方根值的极限, ( xi ) 2 lim i 1 n n
标准偏差
标准偏差是表明测 得值分散性的参数, 小表明测得值比较 集中,大表明测得 值比较分散。通常, 测量的重复性或复 现性是用标准偏差 来表示的。
随机变量根据其值的性质不同,可分为 离散型和连续型两种, 如果随机变量X的所有可能取值为有限个 或可列个,且以各种确定的概率取这些 不同的值,则称随机变量X为离散型随机 变量。 如果随机变量的所有可能取值充满为某 范围内的任何数值,且在其取值范围内 的任一区间中取值时,其概率是确定的 ,则称X为连续型随机变量。

概率(probability)

概率是一个0和1之间隶属于随机事件的实 数
概率与在一段较长时间内的事件发生的相对频
率有关 或与事件发生的可信程度(degree of belief)有关
-----------GBT 3358.1-2009 统计学词汇及符号 第1部分:一般统计术语与 用于概率的术语
1
1 2 2 3 3
标准偏差
由于期望、方差 和标准偏差都是 以无穷多次测量 的理想情况定义 的,因此都是概 念性的术语,无 法由测量得到 , 2和。
1
1 2 3
2 3
三条误差分布曲线的正确 度相同,但精密度不同
偏态系数
f (x)
定义
3 ( x ) f ( x)dx


在相同测量条件下,对某钢球工件的直径测量150 x1 , x2 ,, x150 次,得到一个测量样本( ) 测量点列图:以测量序数i为横坐标,以测得值 x i 或其误差 x x为纵坐标
i i 0
xi
7.585
单峰性
有界性
7.335
对称性
7.085
抵偿性
i
统计直方图

3

Ⅰ 3 0
Ⅱ 3 0
3 3 3

三阶中心矩, 3 将3 无量纲化,称为偏态 系数, 3 描述了测量 总体及其误差分布的 非对称程度
0
1
2
x
曲线Ⅱ具有正(右)偏态,曲 线Ⅰ具有负(左)偏态
峰态系数
定义
4 ( x ) f ( x)dx
1
1 2 3
2 3
三条误差分布曲线的正确 度相同,但精密度不同
标准偏差
由于标准偏差是无穷多 次测量时的极限值,所 以又称总体标准偏差。 可见:期望和方差(或标 准偏差)是表征概率分布 的两个特征参数。理想 情况下,应该以期望为 被测量的测量结果,以 标准偏差表示测得值的 三条误差分布曲线的正确 分散性 度相同,但精密度不同
离散随机变量 连续随机变量
E X pi xi
i 1
E( X )


xp( x)dx

通俗地说:期望值是无穷多次测量的平均值
期望
• 期望是概率分布曲线与横坐标轴构成面积 的重心所在的横坐标,因此它是决定随机 变量分布的位置的量


对于单峰、对称的概 率分布来说,期望值 在分布曲线峰顶对应 的横坐标 正因为实际上不可能 进行无穷多次测量, 因此,测量中期望值 是可望而不可得的。
yf ( x, y)dxdy
协方差 Cov( x, y) 表示了两变量间的相关程度
相关系数
定义

Cov ( x, y )
x y
线性 相关
正相关
1 1
表示了两个变量间线性相 关的程度 | | 越小,X,Y之间线性相 | 关程度越小, | 取值越大, X,Y之间线性相关程度越大 当 0 1 ,X与Y正相关, 当 1 0 ,X与Y负相关
b a
概率密度的性质
概率密度曲线 f ( x) 完好的描述了随机误差的统计 规律。 有两个性质
f (x ) p =1 _



f x dx 1
b a
P a x b f x dx 1
a x b 置信区间 a b p 1 置信概率(或置 概率密度函数的几何意义 信水平),简记为符号 p 显著性水平(又称显著度或危险率)

(1)测量样本按数据的大 小分组,分组数=11,组 25 距 x 0.05mm ; (2)依次定各组的频数 20 m i )、 (每组出现的数据个数 频率 f m n 和频率密 15 f i x ; 度 (3)以数据为横坐标,频 10 率密度为纵坐标,在横坐标 上划出等分的子区间,划出 5 各子区间的直方柱,即为所 求统计直方图。
x
0 3
1
2
x
离散型随机变量的概率分布
要了解离散型随机变量X的统计规律,就必 须知道它的一切可能值xi及取每种可能值的 概率pi 如果将离散型随机变量X的一切可能取值xi 及其对应的概率pi ,记作 P(X= xi)= pi ,i=1,2,…. 则称上式为离散型随机变量X的概率分布或 2 3 X -1 分布

pi
1 4
1 2
1 4
概率密度函数
分布函数的导数(当导数存在时)称(连 续随机变量的)概率密度函数,用p(x)表示 p(x)=dF (x)/dx p(x) dx称“概率元素” p(x) dx= P( x<X<x+ dx )

概率密度函数

若已知某个随机变量的概率密度函数p(x),则 测量值x落在(a,b)区间内的概率p可用下式计 算
4
4 3 4 4 , 4 4 , 4 表征了测量 4
协方差
定义
Cov( x, y)




( x x )( y y ) f ( x, y)dxdy
式中
x
y






xf ( x, y)dxdy




相关文档
最新文档