误差理论和测量平差 第二讲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

国土信息与测绘工程系教案(首页)
班级:课程:误差理论与测量平差授课日期:2005年月日第周A.提出问题,导入新课
观测必然有误差,没有误差的观测数据是不存在的。

咋样衡量和评定带有误差的观测数据-测量精度的概念。

本次课程的内容:衡量精度的指标。

B.授课章节名称: 2.1 正态分布,§2.2 偶然误差的概率特性,§2.3 衡量精度的指标
教学要点:
1、正态分布,偶然误差的概率特性
2、方差和中误差,平均误差、或然误差、极限误差、相对误差的基本概念重点:
1、随机变量方差和中误差的表述
2、其它精度指标与中误差的理论关系
难点:
1、观测数据的精度、准确度和精确度的概念、区别和联系
2、随机变量各种精度指标的理论值和估计值的关系
C.教学过程设计
一维正态分布的密度函数
度维正态分布的密度函数
偶然误差的概率特性
方差和中误差
平均误差
或然误差
极限误差 相对误差
一些需要注意的问题 课堂习题 作业题布置
第二讲
开场白:同学们我们上一节课学习了测量平差的基本概念,知道测量必然带来误差,没有误差的观测数据是不存在的。

并且学习了测量误差的分类及其各种误差的基本性质,我们本课程的学习内容是只带有偶然误差的数据处理,偶然误差服从正态分布,希望大家认真复习好所学过的概率和数理统计方面的知识。

本次课程我们将学习如何来衡量观测结果的精度。

第二章 误差理论基础
§1.1正态分布
无论在理论还是在实用上,正态分布都是一种重要的分别,这是因为: (1)设有相互独立的随机变量1X ,2X ,…n X ,其总和为∑=
i
X
X ,无论这些随
机变量原来服从什么分布,也无论他们是同分布或不同分布,只要它们具有有限的均值和方差,且其中每一个随机变量对其总和X 的影响都是均匀地小,也就是说,没有一个比其它的变量占有绝对优势,那么,其总和X 将是服从或近似服从正态分布的随机变量。

当我们对某个量进行观测时,总是不可避免地受到许许多多偶然因素的影响,其中每一个因素都引起基本误差项,而总的测量误差∆则是这一系列个别因素引起的基本误差项1δ,
2δ,…n δ之和,即∑=∆i δ,如果每一个δ对其总和∆的影响都是均匀的小,那么总和
测量误差∆就是服从正态分布的随机变量。

(2)有许多种分布,例如在后面章节要提到的二项式分布,t 分布,2
χ分布等等,当
∞→n 时,它们多趋于正态分布,或者说,许多种分布都是以正态分布为其极限分布的。

由此可见,正态分布时一种常见的概率分布,是处理观测数据的基础。

在观测值仅含偶然误差的情况下,精度与观测质量具有相同的含义,它与误差的分布状
况有着直接的关系,并取决于测量条件。

测量条件好,误差分布的离散度小,观测质量高,精度高;测量条件差,误差分布的离散度大,观测质量低,精度也低。

测量条件相同,误差分布的离散度相同,观测质量相同,也就是等质量或等精度观测。

一、一维正态分布
服从正态分布的一维随机变量x 的概率密度函数是:
⎪⎪⎭

⎝⎛--=222)(exp 21
)(σμπσx x f ,∞<<∞-x 其中μ和σ是分布密度的两个参数。

正态分布也称为高斯分布。

对一维随机变量x 服从参数为μ和σ的正态分布,一般记为x ~),(σμN 。

一维正态随机变量x 的数学期望和方差分别为
μ==⎰
+∞

-xdx x f x E )()(
[]{}
[]22
2
)()()()(σ=-=-=⎰
+∞

-dx x E x x f x E x E x D
在推导过程中需要注意到
02exp 2=⎪⎪⎭⎫ ⎝⎛-⨯⎰∞
+∞-dt t t ,π22exp 2=⎪⎪⎭⎫
⎝⎛-⎰∞+∞-dt t
一维正态随机变量x 出现在给定区间),(σμσμk k +-内的概率是:
dx x E x dx x f k x k P k k k k ⎰⎰
+-+-⎪⎪⎭

⎝⎛--==+<<-σ
μσμσ
μσ
μσπσσμσμ222))((exp 21
)()( 如果令
σ
μ
-=
x t
则上式变为
dt t dt t k x k P k
k
k ⎰
⎰++-⎪⎪⎭

⎝⎛-=⎪⎪⎭⎫
⎝⎛-=
+<<-0
222exp 222exp 21
)(π
πσμσμ
由概率论知道
683.0)(≈+<<-σμσμx p
955.0)22(≈+<<-σμσμx p 997.0)33(≈+<<-σμσμx p
二、N 维正态分布
服从N 维正态分布的随机向量T
n x x x X ),,,(21 =的概率密度函数是:
()
[][]⎪⎭
⎫ ⎝⎛---=
-X XX T X n XX
X D X D X f μμπ1
2
2
121exp 21
)(
N 维正态随机变量T
n x x x X ),,,(21 =的数学期望和方差分别为
X XdX X f X E μ==⎰
+∞

-)()(
[]{}
[]XX D dX X E X X f X E X E X D =-=-=⎰+∞

-2
2
)()()()(
其中
X n n x E x E x E X E μμμμ=⎪
⎪⎪⎪⎪⎭⎫ ⎝
⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=)()()()(2121 [][]{}
T
XX X E X X E X E D )()(--=
⎪⎪⎪⎪



⎝⎛=222
21
22
1212
11n n n n n x x
x x x x x x
x x x x x x x σσσσσσσσσ
这里2
i x σ是第i 个随机变量的方差,j i x x σ是第j 个随机变量的互协方差。


§2.2偶然误差的概率特性
一、偶然误差的分布和统计性质
前已指出,偶然误差是由无数偶然因素影响所致,因而每个偶然误差的数值大小和符号
正负都是偶然的(或随机的)。

然而,反映在个别事物上的偶然性,在大量同类事物的统计分析中却呈现出一定的统计规律性。

例如,一个具有一定技术水平的射手进行射击实验,假设仅考虑许多偶然因素的影响,每发射一弹命中靶心的上、下、左、右都有可能,但当射击次数足够多时,弹着点就会呈现出明显的规律性,即越靠近靶心越密;越远离靶心越稀;差不多以靶心为对称点。

偶然误差具有与之类似的规律性。

为寻求偶然误差的规律性,下面通过测量实例来说明。

某测区,在相同测量条件下,独立地观测了817个三角形的全部内角,由
0180-++=∆i i i i C B A 算得各三角形的闭合差。

由于作业中已尽量剔除了粗差和系统性
影响,这些三角形闭合差,就整体而言,都是偶然因素所至,故为偶然误差。

它们的数值分布情况列于下面的表内(等于分界数值的闭合差,统计在数值小的区间中)。

表2.2.1
考察这一统计表,不难发现如下的规律:(1)这些闭合差在数值上不会超出一定界限,或者说超出一定界限的闭合差出现的概率为零;(2)绝对值小的闭合差比绝对值大的闭合差出现的概率要大;(3)绝对值相等的正负闭合差个数大致相等。

上述情况,不仅表现于这个例子里,在大量的测量结果中,偶然误差都有与此完全一致的规律性。

为了对偶然误差的分布情况有个更直观的了解,并为进一步从理论上加以探讨,可按下述方法作出以上实例的解析图。

具体作法是先在横轴上截出表中的各误差区间并以之为底,再以误差出现于相应区间的频率除以区间间隔∆d (此处取5.0''=∆d )的商为高,即,作一系列长方形,则得如图2.2.1所示的直方图。

图中每一长方形面积即为误差出现于该相应区间的频率,长方形面积之和等于1,长方形的高则表示相应区间的误差分布密度。

这种图通常称为直方图,它形象地表示了误差的分布情况。

由此可知,在独立等精度条件下所得的一组观测误差,只要误差的总个数n 足够多,那么,误差出现在各区间的频率总是稳定在某一常数附近,而且当观测个数愈多时,稳定程度愈高。

如表2.2.1,如果在观测条件不变的情况下,再继续观测更多的三角形,则可以预见,随着观测个数的增加,误差出现在各区间的频率其变动的幅度也就愈来愈小,当∞→n 时,各频率将趋于一个完全确定的值,这个值即为误差出现在各区间的概率。

这就是说,一定的测量条件对应着一种确定的误差分布。

实际上误差的取值是连续的,当设想误差个数无限增多,所取区间间隔无限缩小时,则图2.2.1的直方图中各长方形上底的极限将形成一条连续曲线,设以)(∆f 表示,则得如图2.2.1所示的光滑曲线。

图中的曲线即为偶然误差的概率分布曲线,又称为偶然误差的分布密度曲线。

这一曲线与正态分布密度曲线极为接近,所以一般总是认为,当∞→n 时,偶然误差的频率分布是以正态分布为其极限的。

理论上,可由概率论中的中心极限定理给出证明。

中心极限定理指出:若随机变量y
是众多随机变
图2.2.1
5
.0ω

--图(121
量),,2,1(n i x i =之和,n x x x y +++= 21,如果i x 相互独立,且对y 的影响均匀的小,则当n 相当大时,随机变量y 趋于服从正态分布。

偶然误差正是这一类型的随机变量,即,
n ∆++∆+∆=∆ 21。

通过上面的分析讨论,可用概率的术语将偶然误差的规律性阐述如下:
(1)在一定的测量条件下,偶然误差的数值不超过一定限值,或者说超出一定限值的误差出现的概率为零。

(2)绝对值小的误差比绝对值大的误差出现的概率大。

(3)绝对值相等的正负误差出现的概率相同。

这就是偶然误差的三个概率特性,或简称偶然误差三特性。

这三特性可简要概括为:界限性、聚中性及对称性,它们充分揭示了表面上似乎并无规律性的偶然误差的内在规律。

掌握这一规律并加以运用,在本课程中是很重要的。

偶然误差的界限性表明,在一定测量条件下,偶然误差的数值是有一定范围的。

因此我们可以根据测量条件来确定偶然误差出现的界限。

显然测量条件愈好,可能出现的最大偶然误差愈小;反之,则愈大。

所以界限性是以后讨论极限误差的理论依据。

偶然误差的聚中性表明,偶然误差愈接近零,其分布愈密,而且易知,对于较好的测量条件这一特性也必相对明显和突出。

偶然误差的对称性表明,正负偶然误差的分布对称于零,故其密度函数必为偶函数,于是得偶然误差的数学期望
0)()(=∆∆∆=∆⎰+∞

-d f E (2.2.1)
这说明,偶然误差有相互抵消性,当误差个数足够多时,其算术平均值应趋于零,即
01lim 1
=∆∑=∞→n
i i n n (2.2.2) 此式与(2.2.1)式在含义上是一样的。

由此又知,偶然误差的分布即以其数学期望为对称中心,此中心常称作离散中心或扩散中心。

二、真值的统计学定义
误差是相对于绝对准确而言的。

反映一个量真正大小的绝对准确的数值,称为这一量的真值。

通过量测直接或间接得到的一个量的大小称为这个量的观测值。

与真值相对应的,凡以一定的精确程度反映这一量大小的数值,都统称之为此量的近似值或估计值,又简称估值。

一个量的观测值或平差值,都是此量的估值。

设以L ~
表示一个量的真值,L 表示它的某一观测值,∆表示观测误差,则有
∆+=L L ~
(2.2.3)
这里∆是相对于真值的误差,称为真误差。

真值通常是无法测知的,自然真误差也无法获得。

但是在一些情况下,有可能预知由观测值构成的某一函数的理论真值。

例如:以1L ,2L ,3L 表示平面三角形三内角的观测值,三内角和的理论真值为0
180 则是已知的。

若以w 表示三内角和的真误差,即三角形闭合差,则得
)(1803210L L L w ++-= (2.2.4)
因为三角形闭合差的真值为0,可得 w w w =-=∆0,故w 也可理解为三角形闭合差的真误差,
又如,当对同一个量观测两次,设观测值为1L 和2L ,该量真值为L ~
,且以d 表示两次观测的差数的真误差,可得
2121)()(L L X X L L d -=---= (2.2.5)
由此可见,两次观测值的差值d 就是差值的真误差。

差值d 又称较差。

一个量的真值即准确反映其真正大小的数值。

由于自然界中的一切事物都是在不停地发展变化着,作为测量对象的任何一量也不会例外,它的真正大小也是随时随地变化的。

所以一个量的真值,只能是指该量在观测瞬间或变化极微的一定时间段内的确切大小。

按照这一观点,一个量的客观真值是真实存在的,但是由于观测误差的不可避免,依靠观测所得到的只能是某些量一定意义下的估计值。

所以,真值一般是无法确知的理论值。

依照统计学的观点,对(2.2.3)式取数学期望并顾及(2.2.1)式得
)(~
L E L = (2.2.6)
此式表明,一个量仅含偶然误差的观测值的数学期望,就是这一量的真值。

此即真值的统计学定义。

将(2.2.6)式代入(2.2.3)式,即得真误差的表达式
L L E L L -=-=∆)(~
(2.2.7)
这里的真误差∆仅仅包含偶然误差。

由此可知,偶然误差间的相互差异与对应观测值之间的相互差异相同。

故观测值L 与它所带有的偶然误差∆具有类型一致的分布——正态分布。

且可看出,∆就是L 的中心化随机变量。

在图2.2.1中,若以横轴表示L ,0=∆处对应换作)(L E ,则图中曲线即观测值的分布密度曲线。

偶然误差真误差∆和观测值L 的密度函数分别是
()⎪⎪⎭

⎝⎛∆-=⎪⎪⎭⎫ ⎝
⎛∆-∆-=∆2
2222exp 21
2)(exp 21
)(σπσσπσE f (2.2.8) ()⎪⎪⎭


⎛--=222)(exp 21
)(σπσL E L L f (2.2.9) 易知,偶然误差∆服从正态分布),0(2
σN 。

当参数σ确定后,即可画出偶然误差所对应的误差分布曲线。

当σ不同时,曲线的位置不变,但分布曲线的形状将发生变化。

σ愈小曲线顶点愈高,形状愈陡峭,也就是分布愈密集于随机变量的数学期望附近,故参数σ代表的是随机变量分布的离散特征。

如图2.2.2所示,其中21σσ>。

误差分布的离散程度的数值←→精度,实际工作中,通过子样统计,得出在一定测量条件下观测精度的估计数值,因此精度评定也称为精度估计。

§2.3 衡量精度的指标

图2.2.2
在观测值仅含偶然误差的情况下,精度与观测质量具有相同的含义,它与误差的分布状况有着直接的关联,它们都取决于测量条件。

测量条件好,误差分布的离散度小,观测质量高。

测量条件差,则误差分布的离散度大,观测质量低。

同等测量条件下,误差分布的离散度相同,此时所获得的测量结果应视为有同等的质量。

给出确定的数值,用以表示一定测量条件下测量结果的质量,即为精度评定。

观测质量好即精度高;观测质量差即精度低。

反映误差分布离散程度的数值正可作为衡量精度的指标。

这也就是说,标志精度的数值应经统计得出。

显然,只有将一定测量条件下所有可能出现的误差都计算在内,即从误差的总体分布中,才能得出反映这一测量条件下观测精度的真实数据。

这在实际工作中是不可能做到的。

可行的只能是通过对有限个误差的统计,即通过子样统计,得出代表一定测量条件下观测精度的估计数值。

所以精度评定又称为精度估计。

常用的精度估计标准,有以下几种。

一、方差和中误差
仅含有偶然误差的观测值L 是随机变量,它服从正态分布,其概率密度函数是:
⎪⎪⎭

⎝⎛--=222)(exp 21
)(σμπσL L f (2.3.1) 其中
⎰+∞

-==LdL L f L E )()(μ (2.3.2)
[]{}
[]⎰+∞

--=-==dL L E L L f L E L E L D L 222
)()()()(σ (2.3.3)
分别是观测值L 的数学期望和方差。


[]{}
2)()(L E L E L D L -==σ (2.3.4)
称之为观测值L 的中误差。

由于观测值L 和其真值L ~的关系是:∆+=L L ~,μ==)(~
L E L ,所以观测值L 的真误差∆的概率密度函数是:
⎪⎪⎭
⎫ ⎝⎛∆-=⎪⎪⎭⎫ ⎝⎛∆-∆-=∆22222exp 21
2))((exp 21
)(σπσσπσE f (2.3.5) 其中
0)()(=∆∆∆=∆⎰+∞

-d f E (2.3.6)
[]{}
{}⎰+∞∞
-∆∆∆∆=∆=∆-∆=∆=d f E E E D 2222
)()()(σ (2.3.7)
真误差∆的中误差是:
[]{}
)()()(22∆∆-∆=∆=∆E E E D =σ (2.3.8)
可见观测值L 的方差、中误差和其真误差∆的方差、中误差相同。

在相同的测量条件下观测值L 和其真误差∆的方差计算公式是:
[]n
n
D L D n i
n ∆∆=∆
=∆==∞
→∞
→∑lim
lim
)()(22
σ
(2.3.9)
其估计值是
[]n
n
i
∆∆±
=∆
±=∑2
ˆσ
(2.3.10)
显然当∞→n 时,22ˆσσ
→。

二、平均误差
定义:在一定测量条件下,一组独立的偶然真误差绝对值的数学期望称为平均误差,并用θ表示,即
σσπ
σσπσσσπ
σπσθ5
4222exp 222exp 222exp 21
)(0
22220
2
222≈=⎪⎪⎭⎫ ⎝⎛∆-⎪⎪⎭⎫ ⎝⎛∆--=∆∆⎪⎪⎭
⎫ ⎝⎛∆-=∆⎪⎪⎭

⎝⎛∆-∆=∆
∆∆⎰⎰
⎰⎰






d d d d f --= (2.3.11)
在相同的测量条件下观测值L 和其真误差∆的平均误差估值的计算公式是:
σσπθˆ54ˆ2ˆ≈=或者[]n
∆±=θˆ (2.3.12)
三、或然误差
定义:随机变量L 出现在区间),(b a 的概率是⎰
=
<<b
a
dL L f b L a P )()(,则对于偶然
真误差∆来说,出现在区间),(ρρ-的概率是0.5,那么偶然真误差∆的或然误差就是ρ,即:
5.0)(=∆∆⎰+-
ρ
ρd f 。

对于服从正态分布的偶然真误差,有
5.02exp 21
)(22==⎰⎰+-+-
∆⎪⎪⎭

⎝⎛∆-∆∆ρ
ρ
ρ
ρ
σπσd d f 令σ∆=t ,dt d σ=∆
5.02exp 22)(0
2==

⎰++-
⎪⎪⎭
⎫ ⎝⎛-∆∆σ
ρρ
ρπ
dt t d f →查表可知
σσρ3
26745.0≈≈
在相同的测量条件下观测值L 和其真误差∆的或然误差估值的计算公式是:
σρ
ˆ3
2
ˆ= 或者 {}n mid ∆⋅⋅⋅∆∆∆=,,,ˆ321ρ ** 注意:
(1) 只有当观测次数n 较多时,σ、θ和ρ才能够比较准确地反映测量的精度。

(2) 当观测次数n 较少时,σ、比θ和ρ更可靠反映测量的精度。

(3) 一定的测量条件对应于确定的σ、θ和ρ数值,反之亦然。

(4) 等精度观测是指每次观测的σ或者(θ和ρ)相同,并非指每次观测的真误差相同。

(5) 由一系列等精度观测结果求得的σ、θ和ρ,反映了这一系列观测结果的精度,它
又是其中每个单一观测值的精度,也可以是相同测量条件下另外一系列观测结果的
精度。

四、极限误差
若观测值L 和其真误差∆是仅含有偶然误差的随机变量,并且真误差∆服从
),0(2σN ~∆的正态分布,则真误差∆出现在各种区间的概率是:
683.0)()(≈∆∆=<∆<-⎰+-σ
σ
σσd f P
955.0)()22(22≈∆∆=<∆<-⎰+-σ
σσσd f P 997.0)()33(33≈∆∆=<∆<-⎰
+-σ
σ
σσd f P
一般以2倍或3倍的中误差作为偶然真误差的极限,即
σ)3(2=限∆
注意:极限误差知识真误差的限值,在测量上只有闭合差才是真误差,所以通常把极限误差用作求闭合差的允许值上。

五、相对误差
定义:某一物理量观测的中误差与其观测值之比,并归一化,称为这个观测量的相对误差。

举例···
在导线测量中,点位误差是测角误差和量距误差的合并影响,故二者的精度应当取得一致。

纵向相对误差S
S ∆= 横向相对误差ραα'
''
'∆∆=∆=弧度=
)(S u 应当:
ρ
α''''∆∆=S S
练习题:
[1] 已知独立等精度观测某三角锁段共得15个三角形,其闭合差如下表所示。

试求任意三角形的和的中误差、平均误差和或然误差。

[2] 为了鉴定经纬仪的精度,对已知水平角(3000450
''')观测了6次,观测结果如下。

求观测值的中误差、平均误差和或然误差。

7000450'''、5595440'''、8595440'''、4000450'''、9595440'''、7595440'''
[3] 已知两种测量条件下的真误差分别如下:Ⅰ1,0,2,-2,-1;Ⅱ-2,3,-2,2,-3。

试比较两组观测结果的精度,并求观测序列Ⅰ的每一观测值的精度。

[4] 已知导线测量中,距离观测值是mm m 21000±。

求角度观测值以什么样的精度才能与其匹配。

[5] 已知导线测量中,距离观测值是m 500,角度中误差是1''±。

求边长观测值以什么样的精度才能与点位的横向误差匹配。

[6] 已知某段距离的观测值及其中误差是mm m 948.652±。

求1)估计该观测值的真误差可能出现的范围,2)该观测值的相对中误差。

[7] 设两个长度的观测结果是cm m S 46001±=,cm m S 34002±=。

求两个观测结果真误差可能出现的范围,以及断定那个观测结果的精度高。

相关文档
最新文档