空间内插方法比较

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

I
插方法比较
i
一.空间数据的插值
用各种方法采集的空间数据往往是按用户自己的要求获取的采样观测值,亦既数据集合是由感兴趣的区域内的随机点或规则网点上的观测值组成的。

但有时用户却需要获取未观测点上的数据.而已观测点上的数据的空间分布使我们有可能从已知点的数据推算出未知点的数据值。

在已观测点的区域内估算未观测点的数据的过程称为内插:在已观测点的区域外估算未观测点的数据的过程称为外推。

空间数据的内插和外推在GIS中使用十分普遍c 一般情况下.空间位宜越靠近的点越有可能获得与实际值相似的数据.而空间位宜越远的点则获得与实际值相似的数据的可能性越小。

下面介绍一些常用的内插方法。

K边界内插
使用边界内插法时.首先要假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。

边界内插的方法之一是泰森女边形法。

泰森多边形法的基木原理是,未知点的昴佳值由最邻近的观测值产生。

如图4・6・1所示。

泰森女边形的生成算法见§。

2、趋势面分析
趋势而分析是一种多项式回归分析技术。

筝项式回归的基木思想是用筝项式表示线或而.按員小二乘法原理对数据点进行拟合.拟合时假定数据点的空间坐标X、Y为独立变虽,而表示特征值的Z坐标为因变虽。

X数据为一维时,可用回归线近似表示为:2二勺+©左
其中.a。

、a】为女项式的系数c M1n个采样点方差和为最小时,则认为线性回归方程与被拟合曲线达到了
> (Z i - G)' = min 最佳配准,如图4-6-2左图所示,即:
Z = CI O + a x X + a2X 2(二次曲线)
在GIS中.数据往往是二维的,在这种情况下,需婆用到二元二次或岛次多项式:
2 = %,+珂*+02丫+色才+%刃+色护(欤曲血)多项式的次数并非越商越好.超过3次的多元笫项式往往会导致奇异解,因此.通常使用二次藝项式。

趋势而是一种平滑函数,难以正好通过原始数据点,除非数据点数和笋项式的系数的个数正好相同。

这就是说,女重回归中的残差属正常分布的独立误差•而且趋势面拟合产生的偏差几乎都具有一定程度的空间非相关性。

3.局部内插
在GIS中.实际的连续空间表血很难用一种数学餅项式來描述,因此,往往使用局部内插技术.即利用局部范圉内的已知采样点的数据内插出未知点的数据。

常用的有线性内插、双线性女项式内插、双三次多项式(样条函数)内插。

⑴、线性内插
线性内插的多项式函数为:7 = a^x +
只要将内插点周鬧的3个数据点的数据值帯入女项式.即可解算出系数a, a】.a2o
(2)、双线性参项式内插
双线性多项式内插的多项式函数为:7 = a o ++ a2Y a^XY
只要将内插点周围的4个数据点的数据值带入多项式,即可解算出系数弘卷a3o
如果数据是按正方形格网点布迓的(如图4-6-3)•贝I]可用简单的公式即可计算出内存点的数据值。

设正方形的四个角点为A、B、C. D,其相应的特征值为Z A Z B・3 Z o> P点相对于A点的坐标为dX、dY,则插值点的持征值Z为:
口。

dX、“ 就Y、口。

dY. dX 仃dX dY。

dX、dY 仃-丁)“1-丁)•乙+〔1-•丁•為 + 〒•了.Zc+Q-了)•了 .乙(3).双三次多项式(样条函数)内插
双三次多项式是一种样条函数。

样条函数是一种分段函数,对于n次多项式.在边界处其n・l阶导数连续。

因此,样条函数每次只用少址的数据点,故内插速度很快:样条函数通过所有的数据点,故可用于精确的内插,可以保留微地貌特征:样条函数的n・l阶导数连续,故可用于平滑处理。

双三次多项式内插的多项式函数为:
Z = + a.Y + a.X1 + 十十a,X,十 a.XY 2十仏X?卩?
+ a9X2Y +如严十知灯'十如2乂吵十知么八厂十如疋'护十知/'厂将内插点周圉的16个点的数据帯入餅项式,可计算出所有的系数。

4、移动平均法
在未知点X处内插变虽Z的值时,最常用的方法之一是在局部范困(或称窗口)内计算个数据点的平均2(z)= —
值。

既:汽i
对干二维平面的移动平均法也可用相同的公式,但位置Xi应被坐标矢虽焉代替。

窗口的大小对内插的结果有决定性的影响。

小窗口将増强近距离数据的影响:大窗口将増強远距离数据的影响.
减小近距离数据的影响。

X观测点的相互位宜越近,其数据的相似性越强:十观测点的相互位宜越远.其数据的相似性越低。

W 此在应用移动平均法时,根据采样点到内插点的距离加权讣算是很自然的。

这就是加权移动平均法. 即:
其中.入是采样点i对应的权值.常取的形式有:
加权平均内插的结果随使用的函数及其参数、采样点的分布.窗口的大小等的不同而变化°通常使用的采样点数为6-8点。

对于不规则分布的采样点需耍不断地改变窗口的大小、形状和方向,以获収一定数虽的采样点。

空间内插方法比较(空间统计学)
摘要:空间内插可以分为几何方法、统汁方法、空何统讣方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。

介绍了每一种方法的适用范用、算法和优缺点。

指岀没有绝对最优的空间内插方法,必须对数据进行空间探索分析.根据数据的特点,选择垠优方法:同时.应对内插结果做严格的检验。

开发通用空间内插软件、智能化内插以及加强相关基础研尤将是空间内插研尤的重点。

1空间内插
根据已知地理空间的特性探索未知地理空间的特性是许笋地理研尤的第一步,也是地理学的基木问题。

常规方法无法对空间中所有点进行观测,但是我们可以获得一定数虽的空间样木,这些样木反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。

在这一意义上,空间内插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。

其目标可以归纳为:①缺值估计:估讣某一点缺失的观测数据,以提商数据密度:②内插等值线:以等值线的形式直观地显示数据的空何分布:③数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。

空间内插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。

这些地区的常规观测常常不能满足婆求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。

在这些方面,缺值估讣和数据格网化将发挥重要的作用。

(1)缺值估计。

族种科学考察中形式多样的短期观测是提岛数据观测密度的重耍方式,无形中起到「加密台站的作用:而且由于这些考察常常到达人迹罕至的舟海拔和极地等区域.有助于了解区域内观测变虽的完整空间分布。

但是.这些观测序列往往很短,短则数十天,长不过几年。

如何利用周圉台站的长序列观测资料和短期观测木身的信息.将观测变址插补到长序列是一个重要问题C
(2)数据格网化。

规则格网能够更好地反映连续分布的空间现毀,并对他们的变化作出模拟。

现代地球科学模型和气候模型.如GCM (—般环流模型),都婆求与GIS数据模型和遥感数据高度兼容的空间数据集。

格网化的数据.尤其是规则矩形格网.已成为目前地学模型的主要数据形式。

因此.对已知观测台站的观测数据进行空间内插.得到格网化数据是模型的第一步。

空间内插一般包括这样几个过程:①内插方法(模型)的选择:②空间数据的探索分析.包括对数据的均值、
方差、协方差.独立性和变界函数的估汁等:③内插方法评价:④重新选择内插方法•直到合理:⑤内插。

因此.通过比较而选择一个合用的、适合于数据空间分布特点的内插方法是空间内插的关键。

木文将空间内插分类为几何方法、统讣方法、空间统计方法、函数方法、随机模拟方法.物理模型模拟方法和综合方法,通过比较研尤,指出每一种方法的适用范圉、算法和优缺点。

2空间内插方法比较
空间内插可依据:①确定或随机:②点与面:③全局或局部等标准分类。

木文依据内插方法的基木假设和数学木质,把空间内插分类为以下几种方法。

几何方法
是最简讯的空间内插方法。

几何方法基于〃地理学第一定律”的基木假设.即邻近的区域比距离远的区域更相似。

几何方法的优点是计算开销少.具有普适性.不需婆根据数据的特点对方法加以调整。

十样木数据的密度足够大时,几何方法一般能达到满总的精度。

几何方法的最大问題是,无法对误差进行理论估计。

最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。

2丄1泰森多边形(辰近距离法)
泰森女边形用于生成“领地"或控制区域。

实际上.尽管泰森藝边形产生于气候学领域,它却特别适合于专题数据的内插•因为它生成专題与专题之间明显的边界.不会有不同级别之间的中间现象。

泰淼女边形的算法非常简讯,未采样点的值等于与它距离最近的采样点的值。

2.1.2反距离加权方法
反距离加权法是最常用的空间内插方法之一。

它认为与未采样点距离最近的若T•个点对未采样点值的貳献最大,其贡献与距离成反比。

可用下式表示:
⑴式中.Z是估计值,Zi是第i (i=l. .... n)个样木.Di是距离.p是距离的毎,它显着影响内插的结果,它的选择标准是最小平均绝对误差。

Husar等的研尤结果表明.幕越商,内插结果越具有平滑的效果。

统讣方法
其基木假设是,一系列空间数据相互相关.预测值的趋魁和周期是与它相关的其它变址的函数。

统讣方法的优点是计算开销不大,有一定的理论基础.能够对误差作出整体上的估计。

但是,其前提是一定要有好的采样设讣.如果采样过程不能反映出表面变化的重婆因素.如周期性和趋势.则内插一定不能取得好的效果。

常用的统il•方法有趋筠面方法和多元回归方法。

221趋势面
趋势面根据有限的观测数据拟合曲而.进行内插。

它适用于:①能以空间的视点诠释趋势和残差:②观测有限.内插也基于有限的数据。

十趋势和残差分别能与区域和局部尺度的空间过程相联系时.趋势面分析垠有用。

趋势面方法可以被定义为:y=A0+e (2)
式中.y是n“维矩阵•对应干n个样木:A是n个样木的坐标矩阵:8是趋势面参数矩阵。

A和6依赖于趋势面的次数。

趋势面的次数是它最重婆的特征。

是残差.通常是一个独立随机变So 'l i残差是随机独立时,统讣检验有效:但实际上,趋势血中的残差常是自相关(特别是趋劈面的次数较低时),因此•检验是显着有偏差的。

残差的空间自相关可以用随机过程模型模拟。

由于趋势面的以上特性.它的目标有时并非最佳拟合,而是把数据分成区域趋魁组分和局部的残差。

2.2.2多元回归
在各种统讣方法中•使用较女的是回归分析,其特点是不需要分布的先验知识。

筝元回归在数学形式上与趋势面很相似.但是.它们又有着显着的不同。

首先.在趋势面分析中.A是坐标矩阵.而在回归分析中.它可以是任慰变虽。

其次,在趋筠而方法中.模型的拟合严格地遵从自常数、一次.二次、立方等的顺序.主要的问題是确定模型的次数.因此,趋势面分析有内在的女重共线性问题:而在命元回归中,
尽管也存在藝重共线性.但它并非内在的,可以通过逐步回归解决,因此.相对于趋势面的选择次数.筝元回归的核心问題是选择变虽(主成分分析等方法有助于选择变址)和区分模型。

空间统II* (Geostatistics)方法
空间统汁又称地质统计学,于20世纪50年代初开始形成.60年代在法国统il•学家Matheron的大址理论研尤匸作基础上逐渐趋于成熟。

其基木假设是建立在空间相关的先验模型之上的。

假定空间随机变虽:具有二阶平稳性.或者是服从空间统计的木征假设(intrinsichypothesis。

则它具有这样的性质:距离较近的采样点比距离远的采样点更相似.相似的程度、或空间协方差的大小.是通过点对的平均方差度虽:的。

点对差片的方差大小只与采样点间的距离有关,而与它们的绝对位宜无关。

空间统计内插的最大优点是以空间统计学作为其坚实的理论基础,可以克服内插中误差难以分析的问題,能够对误差做岀逐点的理论估计:它也不会产生回归分析的边界效应。

缺点是复朵.计算址大,尤其是变片函数(variogram)是几个标准变异函数模型的组合时.计算址很大:另一个缺点是变界函数需要根据经验人为选定°空间统讣方法以Kriging及其各种变种(Cokriging 等〉为代表。

2.3.1Kriging 内插
(1)Kriging内插的公式Kriging内插由南非地质学家Krig©发明,并因此而命名。

Matheron给出了Kriging的一般公式。

Kriging内插的公式为:
(3)式中,z(xi)为观测值,它们分别位于区域内xi位宜:X0是一个未采样点:入i为权,并且其和等于
lo即
(4)选取汕使2^(x0)的估计无偏•并且使方差o[DD(丿2]c[][DD)] 2 e小于任总观测值线形组
合的方差。

垠小方差由下式给定:
(5)它由下式得到:
(6)式中,y(xh xj)是z在采样点xi和xj之间的半方差(semi-variance) ■ v(4x0)是z在采样点xi和未知点xo之间的半方差.这些虽都从适宜的变界函数得到。

e是极小化处理时的拉格朗日乘数。

估计半方差是一个较为复杂的过程,这一过程称为空间数据探索分析(ESDA)。

(2)空间数据探索分析(ESDA〉
对于Kriging内插而言,空间数据探索分析的目标是建立半方差Y(h)和点对之间的空间距离h之间的关系,即变异函数。

由于空间统汁的木征假设可以表示为以下两个公式:
•任总两个距离为h的两点间的差值的数学期望为0:
EZ(x)・Z(x+h)) =0(7)
•任总两个距离为h的两点间的差值的方差最小:
Var (Z(x)・Z(x+h)) =E {U(x)・U(x+h)) 2} =2y(h) (8)
因此.由下式估计半方差V(h):
(9)这一关系R卩变异函数。

它提供了内插、优化采样的有用信息。

Kriging内插的第一步是根据样木找到适合的变片函数理论模型。

最常用的变界函数模型有:nugget.球(6L抬数、岛斯.阻尼正弦、显和线形模盘。

其中.前几种模型在一定的范困内达到极大方差,而线形模型的方差増长没有极限。

以下是几种基木变片函数的形式,这些变井函数的特性分别是:
•Nugget模型缺乏空间相关。

•球面模型空间相关随距离的增长逐渐衰减.为距离>8后,空间相关消失。

•抬数模型空间相关随距离的增长以抬数形式衰减,相关性消失于无穷远。

e表示距离,在此距离上笳%的变虽的可变性趋于稳定。

•商斯模型空间相关随距离的增长而衰减•相关性消失于无穷远。

曲线起始一段的形状是抛物线,表示变址的空间变化非常平滑。

•阻尼正弦模型阻尼正弦模型适宜于周期性变化的空间变量.但其变化强度随距离的増长而衰减C 8表示周期C
•线性模空空间可变性随距离的増长而呈线性地增长,不会在某一距离稳定下來。

变异函数的形式是内插质虽的关键。

需要注意:的是.由于不同的区域有不同的空间模式•因而也就有不同的变界函数。

而空间内插都有一个隐含的假定,即空间是连续的.因此.在选择变界函数模型之前•检查数据以确定空间连续性是十分必要的。

2.3.2Cokriging 内插
Cokriging (共协kriging)内插的基木原理与Kriging相同.但它通过考虑一个以上变fit而优化估计:内插由于考虑J'变虽之间的关系而得到改善。

例如.在估计温度、降水等气候变址时.海拔商度是附加的重嬰变量° Cokriging内插包括以下过程:①确定笫个观测值之间空间相关的持征:②借助于变界函数利交叉变片函数(cross variogram) >对相关建模:③利用这些函数估计•内插值。

除公式(7)、(8)外,Cokriging引入一个新的假定.即两个变虽之间差值的方差最小。

Var (Z(x)-Zk(x)) =2yk(h) (10)
式中,Zk(x)是与估计值Z(x)相关的第k个变虽。

Cokriging中引入交叉变片函数,它是两个不同变虽之间的相关随距离变化的函数°它与简单•变界函数不同,前者的形式是方差,因此总为正或零:而后者的形式为协方差,因此可以为正.负或零。

如果两个变虽向相反的方向变化,交叉变界函数为负:如果两个变址的变化相独立•交叉变界函数为零。

交叉变异函数的形式为:(11)
Cokriging内插的关键是估汁交叉变异函数.以分析变虽自身以及变址之间的空间相关。

Cokriging的其它过程都是与Kriging 一致的。

函数方法
是使用函数逼近曲倆的一种方法。

函数方法在空间内插领域大多用于一些特殊场合.如利用岛密度的商程数据产生等高线.为提商格网数据的空间分辨率而内插数据等。

对于利用有限的观测数据进行缺值预测和内插格网,函数方法多不适合•因为它难以满足内插的精度•也难以估讣误差。

函数方法的特点是不需要对空间结构的预先估计.不需婆做统讣假设。

缺点是难以对误差进行估计•点稀时效果不好。

常用的函数方法有:傅里叶级数.样条函数、双线性内插、立方卷积法等。

2.4.1傅里叶级数
对于周期性的数据序列.如每浪.可以利用傅里叶级数将它们分解为正弦波和氽弦波。

2.4.2样条函数方法
样条函数是使用函数逼近曲面的一种方法。

样条函数易操作.计算量不大.它与空间统汁方法相比具有以下特点,不需要对空间方差的结构做预先估ih不需要做统汁假设,而这些假设往往是难以估汁和验证的:同时.十表面很平滑时.也不牺牲精度°样条函数适合于非常平滑的表【仏一般要求有连续的一阶和二阶导数:它适合于根据很密的点内插等值线.特别是从不规则三角网(TIN)内插等值线。

样条函数的缺点是难以对误差进行估汁,点稀时效果不好°样条函数的种类很多,最常用的有B样条、张力样条和薄盘样条等。

2.4.3双线性内插
双线性内插和立方卷积法都主嬰用于网格数据的内插(重采样)• 一般很少用于根据离散数据内插空间分布。

它使用与待估计网格距离最近的4个网格值,线性内插获得新的网格值。

双线性内插方法的优点是数据重采样后的结果较为平滑.没有阶跃效应,
同时具有较岛的精度°缺点是网格被平均化.具有低频滤波的效果:边缘被平滑.有些极值丢失了。

2.4.4立方卷积法
是昴常使用的网格数据内插方法之一。

它使用与待估计网格距离最近的16个网恪值.根据立方卷积公式讣算输岀。

立方卷积公式有几个不同版木.有的产生低通滤波的效果,有的产生岛通滤波的效果.较好的方法应该在商频信息和低频信息的取舍间取得平衡。

立方卷积法的优点是采样结果的统汁信息(均值和方差)与原数据的相似程度比其他采样方法商。

缺点是数据值被改变,伏I此不能用于类型数据(专题图)的内插。

立方卷积法特别适宜于显着改变J'网格尺寸,但要保持原数据统讣特性的数据内插.如数字高程数据的重采样。

随机模拟方法
其基木假设与空间统计方法不同,随机模拟认为地理空间具有非平稳性,是空间界质的。

它通过空间分布现象的可选的、等概系的、数值表达(地图)來对空间不确定性建模。

对应不确定性.可以接受可选的多个答案。

与空间统汁方法不同.随机模拟方法不是产生唯一的估计结果,它产生一系列可选的结果. 它们都与实际数据一致.而且相关模空将它们联系起來。

随机模拟方法的最大优点是定义了各种随机变虽之间的空间相关,这类相关可以根据相邻数据把商度不确定性的先验分布更新为低不确定性的后验分布。

缺点是建模困难,计算量大。

常用的随机模拟方法有高斯过程、马尔科夫过程、蒙特卡罗方法、人工神经网络方法等。

确定性模拟
其基木假设是变址的空间分布受物理定律控制•因此,可以使用物理模型或半经验、半物理的模型模拟空间分布。

对于这一类内插.常常是使用有限的观测值获得一些必须的经验参数,再把这些参数代入到物理模型之中。

典型的例子是.GCM是一个纯物理模型.但它的参数化使用了经验方法。

在山区气候变虽的内插过程中.也大址使用这种方法。

确定性模拟的最大优点即它的确定性,它不依赖或很少依赖观测样木。

但空间现象是否可以被确定性地预测以及我们是否可以持这一乐观的信念十分值得怀疑。

综合方法
是以上几种方法的综合。

对于空间变量,一般能够用不同的方法分别对结构化变址、随机变虽和观测误差(残差)建模。

王劲峰把空间变址分解为:
空间变址二趋势+周期+随机+噪声(12)
并分别用统汁方法、谱函数、人工神经网络和随机过程建模描述相应的成分。

综合方法还适宜于能够得到辅助性数据.如遥感数据的场合。

通过从辅助性数据中提取空间模式.在合理的数据结构.如四叉树的支持下,划分空间同质的区域.从而逼近最佳的预测值。

3结论与建议
结论
(1)空间内插可依据其基木假设和数学木质分类为:几何方法.统汁方法、空间统il•方法.函数方法、随机模拟方法、物理模型模拟方法和综合方法。

(2)空间内插是极为重要的GIS空间分析方法。

对于观测台站稀少,而测点分布又极不合理的地区,空间内插是研究这些区域空间变量空间分布的基木方法,是建立空间模型的前提之一。

(3)空间数据探索分析是分析地理数据的重要匸具.它的一个重要目标是估汁空间变虽的变异函数°变界函数反映空间相关随距离变化的特征.可以用几个基木变界函数模型描述。

根据变界函数.可以判断数据是否具有平稳性,是否符合空间统计的木征假设。

(4)木文比较了主要的空间内插方法,分析了各种方法的假设.适用范用、算法和优缺点,并且重点介绍了空间统计方法。

必须抬出,对于众筝的空间内插方法而言,没有绝对垠优的空间内插方法.只有特定条件下的最优方法。

因此.必须依据数据的内在特征.依据对数据的空间探索分析.经过反复实验.选择昴优的空间内插方法。

同时.应对内插结果做严格的检验。

对空间内插研尤的建议
(1)开发通用空间内插软件。

空间内插是地理学的基木问题.也是GIS重要的空间分析方法。

但现有的GIS 软件中包括的空间内插方法都很少,如ARC/INFO中只有趋势血、Kriging和一些特定用途的函数方法,而且它们的界面不友好.难以使用。

因此,应开发具有以下特点的通用空间内插软件:①包括尽可能笋的空间内插例程:②智能化的人机界而,提供友好的人机界面,通过一系列有关用户总图、目标和数据特性的问题,引导用户.使用户选择最适宜的方法:③良好的数据库接口,与GIS的兼容性c利用ODBC (开放数据库互联)等技。

相关文档
最新文档