反问题概述及其数值求解方法阐述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反问题概述及其数值求解方法阐述
姓名:赵天骐 学号:1014203026
学院:电气与自动化工程学院 专业:电气工程
1.反问题概述
1.1什么是反问题
近30年来,反问题不仅是学术领域中的一个话题,它已经被广泛的应用到工程学、医学、地质学、经济学、物理学等领域,无论在理论还是应用方面均取得了飞速的发展。
随着计算科学的发展,人们从计算的角度研究反问题,更加频繁地被应用于解决实际问题,比如其在石油勘测、医学图像处理、遥感技术、经济决策等领域。
但是,究竟什么是反问题?对此常常仁者见仁,智者见智。
它的严格定义很难给出,有点“只能意会,不能言传”的味道。
美国斯坦福大学的J. B. Keller (1976)提出:“若在两个问题中,一个问题的表述或处理涉及到或包含了有关另一个问题的全部或部分的知识,我们称其中一个为正问题(Direct problem),另一个为反问题(Inverse problem)。
”C. W. Groetsch则认为:”反问题是很难定义的,但是几乎每一个数学家都能马上判断出一个问题是正问题还是反问题。
”苏联学者Levrentiev则指出:“偏微分方程的反问题是指从偏微分方程解的某些泛函去确定偏微分方程的系数或右端项。
”T. Robinson的观点是:“在数学上,通常是有了方程而要求此方程的解。
现在的情况是有了方程的解,必须把对应的方程找出来。
我喜欢后者。
”事实上,上述对反问题的各种说法虽然揭示了反问题和正问题类似于对偶的一种关系,但没有直观地反映出反问题的一个主要特征。
通常情况下,反问题在Hadamard意义下是不适定的。
其学术性的描述为:在两个相互为逆的问题中,如果一个问题在Hadamard意义下是不适定的,特别是若问题的解不连续地依赖于原始数据,则称该不适定问题为反问题。
即通常意义下的反问题一般应该是Hadamard不适定的,这也正是我们研究反问题的困难所在。
那么,什么是Hadamard意义下不适定呢?1923年,Hadamard给出了相反的定义,即什么是适定的。
我们称同时满足如下三个条件的问题是适定的:
(1)问题解的存在性;
(2)问题解的唯一性;
(3)问题的解连续依赖于定解条件(解连续依赖性或稳定性);
否则,不满足三个条件的任何一个,则称该问题是不适定的;而如果不满足第三个条件,则称为是Hadanmrd 意义下不适定的。
关于反问题更浅显的理解可表述为:对于,若已知给出算子A 和f ,g 未知,那么求g 是正问题;反之,若已知A 和g ,f 未知,求f 则是其反问题。
此时,f 可能不连续依赖于算子A 。
对()A f g =于此类问题,经典的做法往往是借助于
某种范数意义下*A f 与g 的差达到极小值的f
作为f 的近似。
最小二乘近似便是人们常常使用的办法,即2arg min ()f
f g A f =- 。
1.2 线性反问题的例子
依据上节中对反问题的认识,本节给出有关反问题的简单实例在此之前,我们先说明反问题的分类。
反问题的分类没有严格限制,分类方法也多种多样,一般来说:根据算子A 的线性或非线性特征,我们可以把反问题分为线性反问题和非线性反问题;根据正问题模型的来源,我们也可把反问题分为反散射问题、反源问题等等;根据反问题信号的来源,我们也可把其分为辨识问题、设计问题、控制问题等等;除此之外,还有其他多种分类方法。
针对各类不同的反问题,目前国际上均有相关的专题研究,比如热点的问题有反散射问题、计算机断层成像问题、电阻抗断层成像问题、图像恢复问题等。
下面给出一个线性反问题的例子
考虑一根2m 长的细杆,细杆两端的温度为0,细杆中点有一处热源。
假设细杆是一维的,即对细杆上的任意一点有[0,2]x ∈,那么,把稳定状态下该细杆的热传导方程可简化为: 220200
x x T f x
T T γ==∂-=∂==
(1-1) 这里,f 是热源,显然,由条件,我们可假设()f x 仅在1x =处不为零,γ是热传导系数,并假定它是一个不依赖温度和位置的常数。
对于这个简单的热传导模型,下面我们可以对这个模型定义其有关的正问题和反问题了。
通常情况是,对于给定的γ及f ,求细杆的温度分布函数T 。
如果称该问题为正问题。
那么换一个思路,当达到稳定状态时,在细杆上均匀布置N 个观测点,得到了N 个点
的温度观测值,f 按上述假设,要求热传导系数γ。
此时,就可以称该问题为前面问题的反问题,或者有一个更科学的说法叫参数识别问题。
为更清晰地了解正问题与反问题的求解,我们接下来对上述问题的数值求解进行简述。
这里,假设5γ=,热源f 在中点值为10。
如果利用有限元求解正问题,易知所得解线性方程组即为*K T b γ=,解此方程即得细杆上分布各点的温度用此正问题的来模拟反问题中的条件,即加上服从Gauss 分布的噪声作为测量误差,以此作为在N 个观测点获得的温度测量值,反求γ的值。
我们将使用最小二乘法来求解γ。
即求优化问题2
arg min ()T h γγγ'=- 的解作为γ的近似值。
向量T '是测量值(()T T T δ'=+),即加入噪声的有限元解,而()h γ为有限元近似解。
1.3 反问题数值求解的主要方法 从上述算例可以看出,反问题的数值求解最终往往归结为一个优化问题,但是通常情况下的反问题并非如上述示例易于求解,他们往往表现出高度的病态性,即不适定性,如果我们仅仅简单地用最小二乘法进行处理,往往和真实结果有很大的偏差。
因此需要寻找一些方法减少由不适定性所带来的困难。
本文所介绍正则化方法就是针对不适定问题的一种重要而普遍使用的方法。
除此之外,针对某些特定的反问题,人们提出了大量有效的方法,如拉东变换、反散射方法、最优设计方法等,对于非线性或许多大规模问题,往往借助迭代法求解,如:最速下降法,共轭梯度法,Landweber 迭代法,Kaczmarz 迭代法等等,这里不一一阐述。
接下来主要计对正则化方法进行概述。
2. Tikhonov 正则化方法
Tikhonov 正则化方法的思想被很多数学家独立发现过,但是直到上世纪60年代,数学家A. N. Tikhonov 和D. L. Phillips 分别独立的提出了解决不适定问题的正则化方法,即Tikhonov 正则化方法,该方法才得到学术界的公认。
该方法最初是在函数空间上考虑的,关于该方法的详尽介绍,几乎可以在任何一本介绍反问题的专著和教材中找到。
这里仅进行简单的介绍。
考虑模型问题Kf g =,K 是一个条件数很大的病态矩阵,当此线性方程组没有唯一解时,一般利用最小二乘法求得其最佳的近似解,即: 2min f f Kf g =- (2-1)
对上述目标函数关于f 求Frechet 导数,得 K Kf K g ''=
(2-2)
K '是的共辄矩阵,很显然,是一个非负定的对称矩阵,但由于K 是病态的,K K '也是病态的,那么得到的近似解必然不满足稳定性的条件。
Tikhonov 正则化方法的主要思想是通过增加一个罚函数项来求解一个非病态问题,即:
22min f f Kf g f αα=-+ (2-3)
上式就是离散形式下的Tikhonov 正则化方法的表达式,如果我们把矩阵K 看作是函数空间中的紧算子,f 和g 均看作是某类函数,运用函数空间的有关理论,我们可以得出一般意义下的Tikhonov 正则化方法。
由上式,我们立即得到
()K K I f K g αα''+= (2-4) 通过调节α值的大小,我们可以迅速的求解得到其稳定的近似解,1()f K K I K g αα-''=+,得到的近似解,也被称之为Tikhonov 近似解,α被称之为正则化因子或正则化参数,而且该参数的选取对于Tikhonov 正则化方法发挥作用至关重要。
接下来从多个角度对Tikhonov 正则化方法进行阐述。
2.1 变分形式的Tikhonov 正则化方法
考虑二次泛函, 22()F f Kf g f αα=-+ (2-5) 令f α是最小化上述泛函的解,利用希尔伯特空间的有关性质,对所有在容许域内的向量函数ω和t R ∈,f α满足: {}220()0t d K f t g f t dt ωαω=+-++=
(2-6)
根据内积的有关性质和运算可得,
,,0(*)*,0Kf g K f K K I f K g ωαωαω-+=⇔+-= (2-7)
对所有的在容许域上的向量函数上式均成立,由此,我们得出最优解f α满足:
1(*)*0
()K K I f K g f K K I K g αααα-+-=''=+ (2-8)
可以看到,这和解普通最小二乘得出的结果是一致的。
2.2 广义的Tikhonov 正则化
所谓广义的Tikhonov 正则化,考虑将惩罚项2f
α替换为2*()L f f α-,此
时,我们称替换后的正则化算子
22*()Kf g L f f α-+- (2-9) 为广义的Tikhonov 正则化算子。
通过变量代换*u f f =-算子可变形为: 22Ku g Lu α'-+ (2-10)
运用上节的变分技术,我们可得该算子的极小化解为:
1*(**)(**)f K K L L K g L Lf αα-'=+- (2-11) 2.3 从统计学角度看Tikhonov 正则化
考虑有限维情形下的观测数据d 和未知数据f ,运用贝叶斯理论,可将f 和观测误差向量η看作是随机向量,那么,观测数据d 也成为了一个随机向量。
考虑最小均方差估计问题: {}2min f f sol E f f =- (2-12)
E 是期望算子,f 服从概率密度分布函数()f p f 。
如果g Kf =是准确值且观测误差η是可加的,分布函数为()p ηη,那么我们可得到如下一些关系:
d g Kf g d d Kf η
ηη
=+==--=
(2-13) 我们假设f 和η是相互独立的,根据统计学的有关知识可知,估计值f
为条件期望{}E f d 时满足上述极小化等式。
即:
{}()f d f E f d fp f df ==⎰ (2-14) 这里f d p 是f 的条件密度分布。
由贝叶斯理论,我们有 d f f d d f p p p p = (2-15)
由假设f 和η相互独立,那么有
()()d f p d p g Kf η=- (2-16) 则,1()()d f f d p p p g Kf p f η-=-。
接下来,考虑当f 和η是相互独立的服从正
态分布的向量, 1**122
1**1221
1()exp(()())2(2)1
1()exp(()())2(2)T f f N f T f M p f f f f f p ηηπηηηηηπ--=--Γ-Γ=--Γ-Γ (2-17)
其中*f 和*η分别是f 和η的期望,f Γ和ηΓ。
分别是他们的协方差矩阵。
当满足上述条件时,有如下结论:
2**()min f f f L K L g f sol f L L f ηηη-⎛⎫⎛⎫=- ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ (2-18)
这正是广义Tikhonov 正则化方法曾得到的结论。
因此,广义Tikhonov 正则化方法等价于满足高斯分布模型的贝叶斯最小均方差估计方法。