第一章误差分析的基本概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 误差分析的基本概念
§1 误差的来源
1. 误差概念 :精确值与近似值之差称为误差,也叫绝对误差。
2. 产生误差的主要原因
① 模型误差:在解决实际问题时,在一定条件下抓住主要因素将现实系统理想化的数学描述称为实际问题的数学模型,这种数学描述常常是近似的,数学模型与实际系统之间存在误差,这种误差称为模型误差。
② 观测误差:数学模型中往往含有一些由观测得到的物理量(如温度、电阻、长度)或由物理量估算出的模型参数,这些观测物理量或模型参数常常与实际数据存在误差。
这种由观察产生的误差称为观测误差。
③ 截断误差:数值计算中用有限运算近似代替无穷过程产生的误差。
例如计算一个无穷次可微函数的函数值时,理论上只要能算出这个函数的泰勒级数值即可,但是实际工程上仅用泰勒级数中前面有限项来近似计算函数值,而舍去高阶无穷小量。
这个被舍的高阶无穷小量正是截断误差。
④ 舍入误差:计算中按四舍五入进行舍入而引起的误差或因计算机字长有限,数据在内存中存放时进行了舍入而引起的误差。
3.举例说明
例1 设一根铝棒在温度t 时的实际长度为L t ,在 t=0℃时的实际长度为L 0,用t l 来表示铝棒在温度为t 时的长度计算值,并建立一个数学模型:)t (L l t α+=10,其中α是由实验观察得到的常数 =α(0.0000238±0.0000001)1/℃,称t t l L -为模型误差,0.0000001/℃是α的观测误差。
这个问题中模型误差产生的原因是:实际上t L 与t 2
有微弱关系,也就是说模型未能完全反映物理过程。
例2 已知x
e 在 x=0 处展开的泰勒级数为:∑
∞
==
n n
x
!
n x e 为了计算近似值,可取前面有限项计算.如取前面五项计算,计算过程中与计算结果都取五位小数得e ≈
1+1+1/2+1/6+1/24≈2.7083,e 取五位小数时的准确值为e ~
=2.71828,于是截断误差为: 0099507083271828
21
5
...!=-≈∑∞
=n n
这表明:只要在计算中采用了有限步运算近似代替无限步运算的方法,截断误差就一定存在。
例3.π=3.1415926…;2=1.41421356…,在计算机上运算时只能用有限位小数,如果我们取小数点后四位小数则:1ρ=π-3.1416 =-0.0000074…;2ρ=2-1.4142=0.000013…就是舍入误差。
另外值得一提的是十进制数转化为二进制数时有时也引起循环小数,因计算机上浮点数存储位数限制而舍弃尾部部分小数,如 ()()2100110001100110.01.0⋅⋅⋅⋅⋅⋅=存储时会引起舍入误差。
这个数制转化问题表明:只要计算机内部采用二进制运算,无论计算机发展的多完善,这个舍入误差理论问题永远存在。
总的来说,误差一般有:模型误差;观测误差;截断误差;舍入误差。
在计算方法这门课程中,截断误差和舍入误差是误差的主要研究对象,讨论它们在计算过程中的传播和对计算结果的影响,并找出误差的上下界,对分析和改进算法都有重大的实际意义。
§2 绝对误差 相对误差 有效数字
定义1:设x 为准确数,*x 为x 的近似值,记e *=x-x * 称e *为x 与x * 的误差,也叫x 与x *的绝对误差。
显然,x= x *+ e * 即近似值加误差就是准确值,因此把e *也叫做近似值x *的修正值,或者说近似值加上修正值就是准确值。
误差可正可负,且有量纲单位,当误差为负时,近似值偏大,叫做“强近似”,当误差为正时,近似值偏小,叫做“弱近似”。
例1 x=π=3.14159265… 按四舍五入的原则保留不同位数的小数,计算其误差。
用一位数字近似表示π 31=*x 14159265.0*1≈e
用三位数字近似表示π 1433.*
=x 00159265.0*3≈e
用五位数字近似表示π 141635.*=x 00000735.0*5-≈e
用六位数字近似表示π 1415936.*
=x 000002650e 6.*≈
定义2:如果*
**||||ε≤-=x x e *ε就叫做近似值x *的“误差限”,也叫绝对误差限。
误差限一定是
一个正数。
我们常用**ε±=x x 来表示近似值*x 的精确度或准确值所在的范围(*
***εε+-x x ,)。
现在引入有效数字的概念。
如果近似值*x 的误差限是某一位上的半个单位,该位到*x 的第一位非零数字共有n 位,我们就说*x 有“n 位有效数字”,或者说*x 准确到该位。
用四舍五入法取准确值的前n 位作为近似值*x ,则*x 有n 位有效数字。
以下观察有效数字的位数n 与误差限之间的关系
005.0102
1
00159265
.0||2*
3=⨯≤
=--x π 3位有效数字 1
23
4
1.3
00005.0102
1
00000735.0||4*
5=⨯≤
=--x π 5位有效数字 1
23456141.3
000005.0102
1
00000265
.0||5*
6=⨯≤
=--x π 6位有效数字 1
23456
95141.3
定义3:若用*x 表示x 的近似值,并将*x 表示成*x =±p n 100321⨯α⋅⋅⋅ααα., (i α及p 为整数,
911≤≤α;90≤α≤i , n i ≤≤2)若其误差限为
n p x x -⨯≤
-1021|*|
就称近似值*
x 具有n 位有效数字.
利用定义3,由有效数字位数n 和近似值*
x 可以确定误差限:n
p -⨯1021。
注意,首先需要特别指出的是,在有效数字的记法中,有效数字0.123×10-3 和0.1230×10-3是有区别的,前者只有三位有效数字,后者却有四位有效数字;其次,如果只知道x * =300000的绝对误差限不超
过500=
3102
1
⨯,则应把它写成300×103或3.00×105,如果仍记为300000,则表示它的误差限不超过0.5,
这是因为前者有三位有效数字,后者有六位有效数字;再次,还需要指出的是,一个准确数字的有效位数,应当说有无穷多位。
例如对于1/4=0.25不能说只有两位有效数字。
例2 若*x =3587.64是x 的具有六位有效字的近似值,那么它的误差限为
005.01021
1021||264*=⨯=⨯≤
---x x
定义4:称x x x x e e r
***
-==为近似值*x 的相对误差,当*
r e 比较小时,有时也把**x
e 称
为近似值*x 的相对误差。
相对误差无量刚。
相对误差可正可负。
我们把相对误差绝对值的上界叫做相对误
差限,记作*
r ε=*ε/|*x |, 其中*ε是*x 的误差限(*ε也叫绝对误差限)。
推论1. 近似数p
n *....x 10021⨯±=ααα(n 、i α及p 为整数, 1≤1α≤9; 0≤i α≤9, 2≤ i ≤n )有n 位有效数字,则其相对误差限为:
()
1n 1
r
10
21x --⨯≤
=αεε|
|**
*
证明: 由于p n x 10021⨯ααα±=....*有n 位有效数字,故*x 与x 的绝对误差限应为
n
p x x -⨯≤
-102
1
||*
由相对误差限的定义得:
*
*
**1021
x x
x x n
p r -⨯≤
-=
ε
而 ()n n p
x ---⨯++⨯+⨯±=10 (101010)
2211
*ααα
()1
12211
*10
10 (101010)
||----≥⨯++⨯+⨯=p n n p
x αααα
()()n p n p n
p r x -----=≤⨯≤1111**1021
1021|
|1021
ααε
由此可以看出,有效数字位数越多,相对误差限就越小。
推论2:若近似数p n x 10021⨯ααα±=....*( n, i α及p 为整数,1≤1α≤9; 0≤i α≤9,2≤i ≤n )
的相对误差限满足:
()
n r -⨯+≤
11*10121
αε
则*x 至少有n 位有效数字。
证明:()
n
*
*r **|
x ||x ||x x |-⨯+≤⋅=-1110
121
αε
p n x 10021⨯ααα±=....* (高位进1,舍去尾数,其值变大) ()n n p
---⨯α++⨯α+⨯α
±=10101010
2211
...
()()
n
p n p x x ---⨯=++≤-10
21
10121
10
1||111
1*αα
由定义3知道:近似数p n x 10021⨯ααα±=....*有n 位有效数字。
证毕。
例3. 用722.*=x 来表示e 具有三位有效数字的近似值,相对误差限是多少?
解:722.*=x =0.272×101
, n=3 , p=1 , 1α=2 . 由推论1得: 2102
21
-⨯⨯≤
ε*r =0.0025 例4. 为了使20的近似值的相对误差小于%.10,问至少要取几位有效数字? 解: 由推论2 ()
n r -⨯+≤
11*10121αε
104020⨯=.... 故41=α
按题目要求 3
10
10-=<ε%.*r 令.
()
3111010121--<⨯+n α 则有31010--<n 即n 至少要取为4
取n=4查数学用表472420.≈,其相对误差小于 0.1%
§3. 和 差 积 商的误差
1. 和 差 积 商的误差
设*x 是x 的近似值,*y 是y 的近似值,用**y x ±来表示y x ±的近似值,则它的误差为
(x ±y)-(x *±y *)=(x-x *) ±(y-y *) (1-3-1) 于是有如下结论:
结论1: 和的误差是误差之和,差的误差是误差之差。
|(x ±y)-(x *±y *)|≤|x-x *| +|y-y *| (1-3-2)
结论2: 两个数和或差的绝对误差限不超过各数绝对误差限之和。
结论3: 任意多个数和或差的绝对误差限不超过各个数的绝对误差限之和。
结论4: 若令*x x dx -=则相对误差是对数函数的微分
x d x
dx x x x e r ln *
*==-= (1-3-3)
设u=xy 则lnu=lnx+lny dlnu=dlnx+dlny 于是有如下结论: 结论5 乘积的相对误差是各乘数的相对误差之和。
设u=x/y 则lnu=lnx-lny dlnu=dlnx-dlny 于是有如下结论: 结论6: 商的相对误差是被除数的相对误差减去除数的相对误差。
结论7: 任意多次连乘,连除所得计算结果的相对误差限不超过各乘数和除数的相对误差限之和。
证明: 设 w=(uv)/(xy) 则 lnw=lnu+lnv-lnx-lny ; dlnw=dlnu+dlnv-dlnx-dlny |dlnw|≤|dlnu|+|dlnv|+|dlnx|+|dlny| 证毕。
例1设y=f(x) ()*
*
x
f y = 则*
y
的相对误差是 ()
()
dx x f x f
y d '
ln =
例2设n x y =则x n y ln ln =,因此x d n y d ln ln ⋅=.n x 的相对误差是x 的相对误差的n 倍。
2.一般数值运算的误差估计
设n x x x ,,,21⋅⋅⋅的近似值依次是**2*1,,,n x x x ⋅⋅⋅,把近似值代入函数y=f(n x x x ,,,21⋅⋅⋅)运算得*y ,显然*
y 是y 的近似值,*
y 的误差、相对误差如何估计?如果函数y=f(n x x x ,,,21⋅⋅⋅)在(*
*2
*1,,,n x x x ⋅⋅⋅ )附近有连续的二阶偏导数,函数值*
y 的误差可用多元函数在(n x x x ,,,21⋅⋅⋅)处的泰勒展开式得到。
y=f(**2*1,,,n x x x ⋅⋅⋅)
=|)(|)()()(),,,(**
2*
22
1*11
21X X o x x x f x x x f x x x f x x x f n n n
n -+-⋅∂∂+
⋅⋅⋅+-⋅∂∂+
-⋅∂∂+
⋅⋅⋅
令**,y y y x x x i i i -=∆-=∆ 于是y 的误差:
n n
x x f x x f x x f y ∆⋅∂∂+
⋅⋅⋅+∆⋅∂∂+
∆⋅∂∂≈
∆22
11
(1-3-4)
按相对误差定义,y 的相对误差为:
n
n
n n
n n i n i
r x x x x x f x x f
x x x x x f x x f
x x x x x f x x f y e ∆⋅
⋅⋅⋅⋅
∂∂+
⋅⋅⋅+∆⋅
⋅⋅⋅⋅
∂∂+
∆⋅
⋅⋅⋅⋅
∂∂≈
),,,(),,,(),,,()(212
2
212
21
211
*
)()
,,,()()
,,,()(),,,()(*
212*
212
2*
211
*
n r n n
n r n i r n i
r x e x x x f x x f
x e x x x f x x f
x e x x x f x x f y e ⋅⋅⋅⋅⋅⋅
∂∂+
⋅⋅⋅+⋅⋅⋅⋅⋅
∂∂+
⋅⋅⋅⋅⋅
∂∂≈
(1-3-5)
例3 测得某桌面的长a 的近似值a *=120cm ,宽b 的近似值b *=60cm ,若已知|a-a *|≤0.2cm ,|b-b *|≤
0.1cm ,试求近似面积s *=a *b *的绝对误差限与相对误差限。
解: 因为 s=ab ,a b
s b a
s =∂∂=∂∂,,由(1-3-4)和(1-3-5)式
)()()()()(********b e a a e b b e b
s a e a s s e ⋅+⋅=⋅∂∂+⋅∂∂≈
|e *
(s*)|≤|60⨯0.2|+|120⨯0.1|=24cm
2
|e *r (s*)|=
*
****
**)()(b a s e s s e =
≤0033.07200
24≈
故s *的绝对误差限为24 cm 2,相对误差限为0.33% .
§4 近似计算中需要注意的几个问题
1. 要避免两个相近的数相减
在数值计算中,两个相近的数相减,则这两个数的前几位相同的有效数字会在在它们之差中消失,有效数字位数大大减少。
例如计算 x x sin )cos 1(-时,当x 接近于零则应变换x x sin )cos 1(-为)cos 1(sin x x +来计算;再例如计算x x 1-
+,当x 充分大时应变换x x -
+1为)1(1x x +
+来
计算;当x=1000时,若取4位有效数字计算,62.31,64.311==+x x ,两者相减结果为0.02,这个结果只有一位有效数字。
但用)1(1x x ++计算,则得0.01581,它有四位有效数字。
这说明应当尽量避免出现这类运算,改变计算方法可以避免两个相近的数相减而引起有效数字损失。
通常根据具体情况采用一些数学上的恒等变形如因式分解、分子分母有理化、三角函数恒等式、Taylor 展开式等计算公式。
2. 两个相差很大的数进行计算时,要防止大数“吃掉”小数 例1 计算二次方程()010110992=++-x x
解:因式分解得二次方程两根为:9101=x ,12=x ; 按求根公式:)2()4(22,1a ac b b x -±-=;
其中 1109+=-b =101010000000000101010⨯+⨯..。
若计算机上只能表达到小数后八位,则对阶运算时1=101000000000010⨯.在计算中将不起作用,因此,91010101.0=⨯≈-b 。
类似的分析将有22
4b ac b ≈-,||42b ac b ≈- (对阶运算时4ac 作零处理)故求得两个近似根9110≈x ,02≈x ;类似
方程还有许多如 :
()010
110
2
=++-n
n
x x
这表明无论计算机发展的多完善,这个大数“吃”小数的问题永远存在。
因此,设计算法或编制程序时,一般不要将大小相差非常悬殊的两个数放在一起来运算。
3. 要注意计算步骤的简化,减少运算的次数
简化计算公式十分重要,它直接影响着计算的速度和误差的积累,有时可以使一项无法实现的计算能够实现,快速富氏变换就是典型例子。
下面我们以计算多项式的值为例来说明简化计算公式的重要性。
例2 计算多项式()011a x a x a x p n n n n +++=--... (1-4-1)的值,若直接用上面公式来计算,计算k 次项k k x a 的值需要进行k 次乘法,所以计算多项式()011a x a x a x p n n n n +++=--...共需n(n+1)/2次乘法和n 次加法才能得到批p (x )的值,但如果我们将公式(1-4-1)改写成下面的形式:
()0121a a a a x a x x x x p n n n ++⋅⋅⋅+++⋅⋅⋅=--)))(((
令 ⎩⎨
⎧
+⋅==--k
n k k n
a x u u a u 10 (1-4-2)
对k=1,2,…, n 反复执行算式(1-4-2)的第2式,则共需n 次乘法和n 次加法即可得到一个多项式值。
这就是著名的秦九韶算法。
从上面简单的例子可以看出化简公式不仅能减少运算次数,提高计算速度,而且还能简化逻辑结构,减少误差积累。
4. 使用递推关系要注意递推方向的选择,以控制误差的扩大 例3 计算 ⎰=-1
01dx e x e I x n n n=0,1,2,…,7
利用定积分的分部积分法,容易得出递推关系式:11--=n n nI I ,在已知0I 之后可算721I I I ⋅⋅⋅,而得到表(1-4-1)中的第一列。
当然也可以按恒等形式的递推关系式:I n-1=(1-I n )/n ,在已知7I 之后,可算得
⋅⋅⋅56I I ,而得到表(1-4-1)中的第二列,这八个积分的精确值为表(1-4-1)中的第三列。
表(1-4-1) 两种递推算法对比表
n I
第一种计算法 第二种计算法 真值
I0 I1 I2 I3 I4 I5 I6 I7 0.6321 0.3680 0.2640 0.2080 0.1680 0.1600 0.400 0.7200
0.6320 0.3680 0.2643 0.2073 0.1708 0.1455 0.1269 0.1124 0.6321 0.3679 0.2642 0.2073 0.1709 0.1455 0.1268 0.1124 由表中看出,在第一种算法中,随着递推次数的增大,计算结果偏离真值越来越远;而在第二种算法中,随着递推次数的增大,计算结果能稳定地接近真值。
我们称第一种算法是不稳定的递推算法,第二种算法是稳定的递推算法。
两种算法仅仅只是递推顺序不同,为什么却会出现不同的误差传播呢?如果精确值0
I 的近似值*0I 有误差0E =*00I I -;精确值011I I -=,近似值*
0*11I I -=,1I 与*1I 有误差1E =*11I I -=0E -;…,
精确值n I 的近似值*n I 有误差n E =*n n I I -=0)!()1(E n n -;这就是说若*
0I 有误差0E ,则*n I 的误差的绝对值就是
误差0E 的绝对值的n!倍;类似分析可以知道若近似值*n I 有误差n E ,则*0I 的误差的绝对值就是误差n E 的绝
对值的1/(n!)倍。
这表明第一种算法计算过程中误差不断扩大,而第二种算法计算过程中误差不断被缩小,这正是算法是否稳定的实质。
通过上述几个问题的简单讨论,我们可以看出,即使有了数学模型,进一步甚至数学上已经有了完善的结果,但仍然存在能不能在计算机上解算和如何实现解算的问题。
所以我们必须研究数值计算方法,寻求数学问题在计算机上的有效算法。
习题一
1.下列各近似数的绝对误差限是最末位的的半个单位,试指出各近似数的绝对误差限及其有效数字位数。
6000106,48.253,100.0,001.0,105.3*
63
*
5*
4*
3*
2*
1=⨯====-=x x x x x x , 2.用秦九韶法计算P(x)=2x 3+7x 2
-9 在x=2处的值。
3.若a=1.1062, b=0.947是经四舍五入后得到的近似值,问a+b, a×b 有几位有效数字。
4.设下列近似数均为有效数字,试求各近似数的绝对误差、相对误差和有效数字的位数。
(1) 3580; (2)0.00476; (3) 0.1430×103; (4) 2958×10-2; (5) 5.85000 .
5.真空中自由落体运动距离s 与时间关系由公式s=22
1
gt 确定,假定重力加速度g 是准确的,而对t 的测
量有±0.1秒的误差,证明当t 增加时,距离S 的绝对误差增加而相对误差却减少。
6.若1/4用精确值0.25来表示,问有多少位有效数字。
7.正方形的边长约为100cm ,应该怎样测量,才能使其面积的误差不超过1cm 2。