浅谈大地测量中的病态问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈大地测量中的病态问题
摘要:大地测量中的病态问题是广泛存在的,并引起了越来越多的重视。
许多
国内外的专家学者对这一问题进行了深入的研究,提出了一系列诊断方法和消除方法。
本文主要对病态问题产生的机制进行了分析,对这些方法进行了扼要剖析,并对病态问题的发展以及前景做了简要论述。
关键词:大地测量病态问题诊断方法消除方法
ABSTRACT: Ill-conditioned problems are widely existed in geodetic surveying and have aroused many scholars’ value. To solve this problem, many experts and scholars both at home and abroad are devoted to the research. And they put forward a series of diagnose methods and estimate methods in order to dealing with the ill-conditioned problems. This paper mainly speak highly of the reasons of ill-conditioned problems and generalizes the basic principle of these methods and simply discusses the development and prospect of the ill-conditioned problems.
Keywords:geodetic surveying ill-conditioned problem the method of diagnose the method of eliminate
一、前言
杨元喜院士在其佳作《中国大地测量数据处理60年重要进展》中对新中国成立以来我国学者在大地测量数据处理方面所取得的成就做了系统的归纳,并指出不适定问题尤其是病态问题是大地测量数据处理中的一个至关重要的问题。
众所周知,病态问题作为不适定问题的一个重要分支是客观存在的,如在某些控制网平差、大地测量反演、重力场的向下延拓以及航天飞行器的精密轨道解算等方面都存在病态问题。
怎样对病态问题行之有效的诊断以及探索处理病态问题的新方法,是现代测量误差理论及数据处理研究中的一项重要课题。
目前大地测量界对病态问题的研究主要集中在两个方面:一是如何建立病态问题的有效诊断方法;二是寻求效果更好的病态问题解法。
针对前者,归庆明、欧吉坤、郭建峰等学者近年来做了很多工作,在探讨设计矩阵是否具有复共线性以及采用无偏最小二乘估计的合理性方面取得了一定
的成果,在前人研究的基础之上创造性的提出了诸如特征分析法、条件数法以及行列式法等相关方法。
对于后者,李家权、欧吉坤、许厚泽等学者提出了一系列行之有效的解法,比如两步解法、多步解法、SVD奇异值修正解法等。
实践表明:上述诊断方法以及消除方法在某些特殊情况下所得到的结果是相当可观的,但是都或多或少的存在局限性。
比如过度套用数学算法而忽略了大地测量中实际问题的物理意义,此外过于强调条件数大小而忽略从源头上杜绝病态问题的产生也是其一大弊端。
因而如何更好地利用数学而又不拘泥于数学的形式,不被数学的一些条条框框所束缚,充分考虑大地测量实际,探讨独特的适应于大地测量领域的病态问题新方法,是当前大地测量学者所面临的一个迫切任务。
二、病态问题的相关理论
2.1病态模型的分类
从源头上来分的话病态模型可以简单地划分为两大类:线性模型与非线性模型。
李斐曾对二者有过有过系统的分析,并对非线性病态问题造成的扰动进行了系统的论述。
他认为,对于线性问题而言:数据的病态性、估计量的病态性和极小化准则的病态性是一致的,最后都反映在设计矩阵的复共线性上。
但是对于非线性问题以往先对其线性化,但是它对展开初值点异常的敏感以及伴随着观测精度的提高,因线性近似所产生的模型误差越发显著,在某种程度上甚至超过了观测误差。
因而非线性病态问题除了要分析模型本身的病态性外, 还要考虑非线性最小二乘算法中截断误差和近似正交过程等扰动对病态分析的影响。
对于常规大地测量问题而言,非线性问题皆可轻而易举的转化为线性问题,并且对结果不会有太大影响。
有鉴于此,为了简便起见,在无特殊说明的情况下,下文所讲述的皆为线性病态模型。
李斐提出了广义条件数来对非线性病态问题的扰动进行度量,并得到了相当可观的结果。
值得注意的是应当注意严格正交近似法与近似正交法的区别:前者是先求法方程在线性化后者则恰恰相反。
2.2病态问题产生的原因
凡事皆有因,有因必有果。
病态问题也不例外。
陆翠翠对此有过详细的论述。
他指出病态性的产生,与参数选取、观测以及计算方法密切相关。
2.2.1参数选取
在建立一个平差模型时,由于在平差前不可能对所有参数的规律全部了解,往往造成过度参数化,使得参数之间存在着一定程度的复共线性,从而导致模型病态。
值得注意的是造成模型的过度参数化真是所谓的Ⅰ类病态问题,特别强调应当注意其参数优选方法(卢秀山曾对此做过系统分析),包括分组时基于投影正交选择法以及不分组时基于QR选择法。
2.2.2观测的原因
观测的原因是指统计分析中的采样不足或测量当中观测量不够。
在统计分析中,受条件所限,以局部来代替整体。
此时设计矩阵表现出严重的复共线性,其实质是因采样不足而引起的模型病态。
此即为所谓的Ⅱ类病态问题。
在测量实践中,因观测数据不足引起的系统病态也是常见的,主要发生在后方交会的观测模式中,尤其是在GNSS定位中。
2.2.3计算方法的原因
从计算的角度讲,导致病态性的原因包括两个方面,一是所采用计算方法本身的数值稳定性,二是机器的字长。
二者本质上皆是Ⅱ类病态问题。
众所周知,稳定的计算方法是获得精度较好的近似解的前提;此外机器字长的限制也是引起结果失真的原因。
在计算的过程中,若采用字长较长的机器计算,可以大大削弱或克服病态性的影响
2.3、病态问题的诊断
2.3.1诊断原因以及原则
病态问题与系统的观测结构密切相关,归庆明通过对复共线性与病态性关系的研究,发现在线性模型的最小二乘估计这种情形下,模型的病态性等同于数据的病态性, 即设计阵的复共线性。
所谓复共线性本质上是一个数据问题,所以对复共线性我们只能说“诊断”,而不能说“检验”它是否存在。
因此对模型病态性的诊断可以转化为对设计阵复共线性的诊断。
复共线性诊断的主要任务是:分析设计阵的列向量间是否存在复共线性;到底有多少个复共线性关系;每一个复
共线性的严重程度、复共线性存在于哪些数据列之间;以及评价采用LS 估计作为测量平差模型未知参数的估计的合理性等等。
2.3.2诊断方法概述
关于复共线性的诊断、复共线性严重程度的度量以及复共线性对LS 估计等的影响程度的研究,是近年来十分引人注目的一个热点问题。
截止目前,人们已经提出了10 余种诊断技术。
诸如直观诊断法、行列式法、特征分析法、数值相关性理论、条件预优技术等,这些方法各有千秋,有对复共线性的定性分析也有定量分析,随着产生时间的长短大都呈现出越来越精确的态势。
下面笔者将就其中比较有代表性的方法进行将要论述。
2.3.2.1特征分析法
郭建峰对特征分析法有过详细的论述,他认为如果法矩阵至少有一个特征根很小, 则意味着设计阵的列向量间必然存在复共线性。
他对这一问题以及其反问题进行了证明。
结果表明:设计阵存在复共线性等价于法矩阵至少有一个特征根很接近于零。
他把“视法矩阵是否有一个特征根很接近于零作为判定复共线性存在的依据”这样一种诊断复共线性的方法, 称之为特征分析法。
特征分析法固然通过简单的计算就可以很容易给出全部的复共线性关系。
然而特征根“很接近于零”是一个很模糊的说法,在具体应用时,究竟什么样的数算是“很接近于零”较难把握。
2.3.2.2条件数法
有鉴于上文所提到的特征分析法定性分析所面临的困难,边少锋提出了定量分析的条件数法。
直观上,条件数度量了法矩阵的特征根的散布程度,病态性的严重程度依赖于法矩阵的最小特征根相对于最大特征根有多小。
这样就解决了前面特征分析法中究竟什么样的数算是“很接近于零”的把握问题。
但是条件数法的判断存在一个经验值问题,而这个经验值有很大程度上取决于主观判断。
因而条件数法是对特征分析法的补充而不是完全替代。
为此归庆民提出了CIVDP(条件指标——方差分解比方法),其通过条件指标来判断复共线性的数量,通过方差分解比来定位这些复共线性的位置。
理论上十分严谨但实践上有待商榷。
2.3.2.3基于行列式法诊断的矩阵向量正交度
病态问题的行列式诊断法将法方程系数矩阵的行列式作为病态问题诊断的
数值指标,但是在某种程度上也存在着类似于特征分析法的致命弱点。
有鉴于此,党亚民等提出了一种诊断病态问题的数值指标——矩阵向量正交度。
结果表明矩阵向量正交度是一种病态问题诊断的优良数字指标,整体上反映了矩阵向量的复共线性,具有明确的几何意义,有利于从系统观测结构的角度把握病态问题的起因。
此外,类似于矩阵的条件数,矩阵向量正交度也是一个相对数值指标,它解决了“矩阵的体积很接近“零”在实际应用中难以把握的问题。
2.4、病态问题的解法
概略的讲,病态问题的解算方法主要分为两大类:直接法和间接法。
前者包含SVD奇异值分解法、迭代算法、遗传算法以及误差转移法等方法;而后者则由岭估计、主成分估计以及Tikhonow正则化方法构成。
方法不同,对问题处理的程度也就不尽相同。
下文将对一些颇具代表性的方法进行简要说明。
2.4.1SVD奇异值分解法
很多学者诸如欧吉坤、柳林涛以及王振杰等皆对此法进行了深入研究,其核心思想是设法改进设计阵的奇异值状态,以达到解决病态性的影响的目的。
他们研究的成果无外乎分为两类:截断奇异值分解法以及修正奇异值法。
前者通过舍
去某些小的奇异值而保留相对较大的奇异值(这里所提到奇异值均指非负奇异值, 而且是按降序排列),适用于奇异值呈阶梯型分布的设计矩阵,在此应当注意截断参数的选择,存在一定的主观臆断性往往难以取舍,常用的方法有F假设检验法、L曲线法以及极小化均方误差法。
后者主要适用于奇异值呈均匀下降的设计矩阵,对于如何进行修正,亦没有统一的见解,不同的学者有不同的看法。
杨文采针对地球物理问题中病态性非常严重的情况,提出了一类奇异值分解方法。
其基本思想是对大的奇异值作小的修正, 而对小的奇异值作较大的修正。
然而对于大地测量问题而言,条件数相对较小。
此时若再利用此法不免有附庸风雅之嫌。
有鉴于此,王振杰在杨文采的基础之上提出了一种更适合大地测量病态问题解算的新的奇异值修正方案。
其与杨文采的方法原理雷同,只是在奇异值修正的位置上略有差异。
实验表明:王振杰提出的奇异值修正方案的精度比其他的修正方案高一个甚至几个数量级, 甚至于优于岭估计以及截断奇异值分解方法,结果是相当可观的。
2.4.2谱修正迭代法
所谓谱修正迭代法既是在法方程的两端加上X,但是实例表明该方法的收敛
速度不尽人意。
为此牛作鹏等人试图将X的系数变成r,实践表明收敛速度是相当可观的。
此外谱修正迭代法与常用的岭估计等方法不同,它是一种无偏估计;他不仅适用于病态问题,还适用于良态和秩亏问题,对于一般问题可不比对其病态与否的判断即可在一个统一程序在求解。
2.4.3Tikhonow正则化方法
其基本思路是通过正则化方法将病态问题转化为病态性较轻或良性问题,然
后再进行解算,以期获得良好结果。
基于此王振杰运用Tikhonow正则化理论对测量中最基本的G-M 模型的病态问题进行了深入研究, 提出了一种新的克服模型
病态性的方法——两步解法。
两步解法第一步的实质是岭估计,只是在选取正则化矩阵时选取单位阵,同岭估计一样用L曲线法来确定正则化参数;第二部的实质是广义岭估计,取第一步求得的均方误差逆矩阵的对角元素作为正则化矩阵,依然用L估计确定正则化参数,所不同的是需要进行一个转换。
实例表明:两步解法明显优于岭估计以及截断奇异值分解法。
为了在特定精度下运用正则化方法求解病态问题,蒋敏卫在两步解法的基础之上提出了多步解法。
其需要先设定一个阈值,类似于两步解法反复迭代,直到相邻两步的相对参数估计值小于阈值。
值得注意是的,阈值的选取应当拿捏得当。
2.4.4虚拟观测方法
该方法与上文所述方法有着质的区别,它在充分运用数学理论的基础之上,最大限度的考虑解的物理意义。
朱建军等对这一方法有过详细的探讨,他将先验约束条件作为一类互相独立的虚拟观测值,从而将复杂的病态问题转化为常见的测量平差问题。
方法不可谓不新!该方法首次赋予岭参数以物理意义——权比,避免了传统选取岭参数是人为因素的影响,结果是相当可观的!
三、小结与感想
3.1小结
本文以病态问题为主线,简要概述了其在大地测量领域的发展历程,并深刻剖析了它的分类、产生原因、诊断方法以及消除方法等等。
对每一小部分又做了一定程度的分析,对其中的一些比较有代表性的经典算法扼要说明了其基本原理以及突出优点和应当特别注意的问题。
限于篇幅等原因对算例只简要说明了结果,
并未进行深刻剖析。
详情可在随文所附文献清单中所列文献中获取,在此不再赘述。
3.2感想
总体而言,看这二十余篇文献的确切时间也就一周左右。
老师您三月份就给了我文献,可我硬是尘封了如此之久,直到最后一刻箭在弦上不得不发才仓促着手。
如此恶习不改,万事皆废!
事情既已发生,隐瞒固属无用,后悔亦属徒然。
一周前刚开始的时候可谓是步履维艰。
中文文献很多理论不知所云,一些很基础的东西也是举棋不定;英文文献更是寸步难行,好不容易将生词查完,连贯起来却如雾里看花。
就这样我硬是咬紧牙关坚持了下来,对病态问题的理解也从最初的懵懂无知到现在的一知半解,虽不能融会贯通却也差强人意。
有鉴于此,在写作时我只能对病态问题泛泛而谈,只涉及到一些最基本的理论而对稍微晦涩一点的则是点到为止。
不求有新,但求无错。
因此本文的内容可以说五分之一是由我原创,五分之二是由文献中的话转述或加工改编而来,另外五分之二则可以说基本上是对文献中原话的引用了。
对此只能表示歉意,除此之外实在是无能为力了。