两种空间插值方法的比较研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两种空间插值方法的比较研究
摘要:距离倒数加权法算法简单,容易实现,适合分布较均匀的采样点集,但容易出现“牛眼”现象;克里金法是一种无偏最优估计法,精度较高,适合空间自相关程度高的数据,但其算法复杂,实现较难。这两种
方法各有其适用情形,本文比较了这两种方法的优劣并提出算法优化的思路。
关键字:距离倒数加权,克里金,优化
1引言
空间插值是根据一组已知的离散数据或分区数据,按照某种假设推求出其他未知点或未知区域的数据的过程,简单的说就是由已知空间特性推求未知空间特性。它是地学研究中的基本问题,也是GIS 数据处理的重要内容。在利用GIS 处理空间数据的过程中,需要进行空间插值的场合很多,如采样密度不够、采样分布不合理、采样存在空白区、等值线的自动绘制、数字高程模型的建立、区域边界分析、曲线光滑处理、空间趋势预测、采样结果的2.5维可视化等[1]。通过归纳,空间插值可以简化为以下三种情形:(1)现有离散曲面的分辨率、像元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影像(航空像片、遥感影像)从一种分辨率或方向转换为另一种分辨率或方向的影像。(2)现有连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续曲面从一种空间切分方式变为另一种空间切分方式,从TIN 到栅格、栅格到TIN 或矢量多边形到栅格。(3)现有数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面[2]。。 现有的空间插值方法多种多样,但每一种方法都有其适用情形和无法避免的缺陷,本文分析了距离倒数加权法和克里金法的插值结果,并提出改进的思路。 2方法
距离倒数加权法和克里金法都是建立在地理学第一定律之上的,即:空间距离越近,地理事物的相似性越大[3]。它们都是通过确定待插点周围采样点的权重来求取待插点的估计值,可统一表示。设n x x ,,1 为区域上的一系列观测点,)(,),(1n x Z x Z 为相应的观测值。待插点0x 处的值)(0x Z 可采用一个线性组合来估计:
∑==n
i i i x Z x Z 10)()(λ (1)
但距离倒数加权法只考虑采样点与待插点之间的距离,而克里金法不仅考虑距离,还要考虑采样点的空间分布及其与待插点的空间方位关系[4]。
2.1距离倒数加权法
距离倒数加权权重i λ的赋值表达式为
[][]
0;,,2,1),(),(100>==∑=--αλααm i x x d x x d m i i i i (2)
式中,幂指数α越小,权重越趋向取平均值;α越大,越近的点权重越大,越远的点权重越小[5]。当α为零时,就是等权模型,即m i /1=λ,等权虽然简单易操作,但忽略了地理学第一定律。有的文献[6]采用下列方案确定权值i λ
[]
⎩⎨⎧==else x x d x x d x x d x x d n i i ,0),(),...,,(),,(min ),(,
121λ (3)
它相当于待插点取最邻近点的值,即泰森多边形法(最近邻点插值法)。
2.2克里金法
地质统计学是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学[4]。克里金插值法是地质统计学的重要组成部分,也是地质统计学的核心。
2.2.1区域化变量
能用空间分布来表征一个自然现象的变量称为区域化变量,它反映了区域内的某种特征或现象。区域化变量根据区域内位置的不同而取不同的值,可以说,它是与位置有关的随机变量。在进行采样观测以后,可以将其表示为一个空间点函数
),,()(w v u x x x Z x Z = (4)
式中, w v u x x x ,, 为三维直角坐标系中的三轴。
区域化变量具有以下几个特性:
随机性:区域化变量是一个随机变量,它具有局部的、随机的、异常的特征;结构性:区域化变量在一定范围内具有某种程度的相似性,即自相关性,当超出这一范围时,自相关性消失;空间局限性:即这种结构性的表现被限定在一定的空间内;连续性:不同的区域化变量具有不同程度的连续性,其连续性是有变异函数来表示的;异向性:区域化变量可能表现为各向同性,也可能表现为各向异性[4,7]。
2.2.2平稳假设
克里金插值法是一种无偏最优估计法[8],其中,无偏是指偏差为0,即要服从二阶平稳或本证假设。
1.二阶平稳
当区域化变量)(x Z 满足下列两个条件时,称其为二阶平稳或弱平稳,在整个研究区内有)(x Z 的数学期望存在,且等于常数,即:
m h x Z E x Z E =+=)]([)]([ (5)
在整个研究区内,)(x Z 的协方差函数存在且平稳,即只依赖于滞后h ,而与x 无关:
)()]()([)]
([)]([)]()([)}
(),({2
h C m h x Z x Z E h x Z E x Z E h x Z x Z E h x Z x Z Cov =-+=+-+=+ (6)
特殊的,当0=h 时,上式变为)0()]([C x Z Var =,即方差存在且为常数。
2.本征假设
是比二阶平稳更弱的平稳假设,当区域化变量)(x Z 的增量)()(h x Z x Z +-满足下列两条件时,称其为满足本征假设或内蕴假设。在整个研究区内有
0)]()([=+-h x Z x Z E (7)
增量)()(h x Z x Z +-的方差函数存在且平稳(即不依赖于x ):
)
(2)
,(2)]()([)]}()([{)]()([)]
()([22
2h h x h x Z x Z E h x Z x Z E h x Z x Z E h x Z x Z Var γγ==+-=+--+-=+- (8)
2.2.3变异函数
变异函数是地统计学特有的基本工具,它既能描述区域化变量的空间结构性变化,又能描述其随机性变化。区域化变量)(x Z 在点x 和h x +处的值)(x Z 与)(h x Z +差的方差的一半称为区域化变量)(x Z 的变异函数,记为),(h x γ。在二阶平稳假设或本征假设的条件下,有
2
22)]()([2
1)]}([)([{)]()([2
1)]()([2
1
),(h x Z x Z E h x Z E x Z E h x Z x Z E h x Z x Z Var h x +-=+--+-=+-=γ (9) 由上式可知,变异函数依赖于自变量x 和h ,当变异函数),(h x γ仅仅依赖于距离h 而与位置x 无关时,),(h x γ可改写为)(h γ,即
2)]()([2
1)(h x Z x Z E h +-=
γ (10) 具体表示为