第十四章 空间插值

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


整体插值方法将小尺度的、局部的变化看作随机和非结 构性噪声,从而丢失了这一部分信息。局部插值方法恰 好能弥补整体插值方法的缺陷。 整体插值方法通常不直接用于空间插值,而是用来检测 总趋势和不同于总趋势的最大偏离部分,即剩余部分, 在去除了宏观趋势后,可用剩余残差来进行局部插值。


精确插值:产生通过所有观测点的曲面。

是一种多项式回归分析模型,用多项式表示线或 面,按最小二乘法原理对数据点进行拟合。 A、当数据为一维时, 1)线性回归: 2)二次或高次多项式:
B、数据是二维的 二元二次或高次多项式

多项式分析
◦ 多项式趋势面随着N值的不同,其形态也不同。
一次多项式
二次多项式
三次多项式
◦ 一般地讲,N值越大,拟合精度越高。拟合精度C以下式 表示,通常C为60%~70%时,该多项式就能够揭示空 间趋势。




局部内插法只使用邻近的数据点(样本控制点)来估计未知点的值,步 骤如下: ◦ 定义一个邻域或搜索范围; ◦ 搜索落在此邻域范围的数据点; ◦ 选择能表达这有限个点空间变化的数学函数; ◦ 为未知的数据点赋值。 将复杂的地形地貌分解成一系列的局部单元,在这些局部单 元内部地形曲面具有单一的结构,由于范围的缩小和曲面形态的简 化,用简单曲面即可描述地形曲面。 局部内插方法: ◦ 泰森多边形(Voronoi边形、边界内插) ◦ 样条函数插值法 ◦ 反距离权重内插 ◦ Kriging插值(空间自由协方差最佳内插) ◦ 密度估算 单个数据点的改变只影响其周围有限的数据点。


趋势面分析的核心就是从实际观测值出发推算趋势面, 一般采用回归分析方法,使得残差平方和最小从而估 计趋势面参数。 假设二维空间中有n个观测点(xl,yl)(l=1,2,…,n), 观测值为zl(l=1,2,…,n)则空间分布z的趋势面可表 示为N次多项式
根据最小二乘法,可得
利用克莱姆法则可以求出各个参数ai




设某地理要素的实际观测数据为zi(xi,yi) (i=1,2,…,n),趋势值拟合值为
,则有
式中, 为剩余值(残差值)

用来计算趋势面的数学方程式有多项式函数和傅立叶级数, 其中最常用的是多项式函数。因为任何一个函数都可以在 一个适当的范围内用多项式来逼近,而且调整多项式的次 数,可使所求的回归方程适合实际问题的需要。
◦ 多种 kriging 方法

① ②
内插方法(模型)的选择; 空间数据的探索性分析,包括对数据的均值、方 差、协方差、独立性和变异函数的估计等;

④ ⑤
进行内插;
内插结果评价; 重新选择内插方法,直到合理;

内插生成最后结果。


精确性:
参数的敏感性:许多的插值方法都涉及到一个或多个参数, 如距离反比法中距离的阶数等。有些方法对参数的选择相当 敏感,而有些方法对变量值敏感。后者对不同的数据集会有 截然不同的插值结果。希望找到对参数的波动相对稳定,其 值不过多地依赖变量值的插值方法。 耗时:一般情况下,计算时间不是很重要,除非特别费时。 存储要求:同耗时一样,存储要求不是决定性的。特别是在 计算机的主频日益提高,内存和硬盘越来越大的情况下,二 者都不需特别看重。

0 7
1
2
3
4
5
6
7
8
9 7 6 5 4 3
6
5
4
3
2
7 6
1 2 3 4 5 6 7
2 1 0 9
1
0 0
58
从存在的观测数据中找到一个函数关 系式,使该关系式最好的逼近这些已 知的空间数据,并能根据函数关系式 推求出区域范围内其它任意点的值。
将空间上离散点的测量 4 数据转换为连续的曲面 数据,即填补样本点之 间的数据空白,以便与 3 其它空间现象的分布进 2 行建模研究。

趋势面拟合适度的R2检验
式中,
为剩余平方和,它表示随机因素对z的离差 为回归平方和,它表示p个自变量对因变 量z的离差的总影响
R2越大,趋势面的拟合度就越高。

趋势面拟合适度的显著性F检验
• 检验的办法是在显著性水平下,查F分布表得Fa。若计算的F 值大于临界值Fa ,则认为趋势面方程显著;否则,不显著。 • p为多项式项数(不包括常数项),

一、控制点 控制点是已知数值的点。已知点、样本点、观测点。 控制点的数量和分布极大地影响空间插值的精度。
1. 2. 3.
二、空间插值的类型 整体插值和局部插值; 精确插值和近似插值。 确定性插值和地统计插值;

整体插值:用研究区所有采样点数据进行全区特征 拟合。在整个区域用一个数学函数表达地形曲面, 采用全部控制点计算未知点数据。 整个区域的数据都会影响单个插值点,单个数据点 变量值的增加、减少或者删除,都对整个区域有影 响。 典型例子是:全局趋势面分析 、回归模型、 Fourier Series(周期序列)



整个区域上函数的唯一性、能得到全局光滑连续的 空间曲面、充分反映宏观地形特征等。 在空间内插中,一般是与局部内插方法配合使用, 例如在使用局部内插方法之前,利用整体内插去掉 不符合总体趋势的宏观地物特征。整体内插函数常 常用来揭示整个区域内的地形宏观起伏态势。
◦ 在精确插值中,插值点落在观测点上,内插值等于估计值。

近似插值:插值产生的曲面不通过所有观测点。
◦ 当数据存在不确定性时,应该使用近似插值,由于估计值替 代了已知变量值,近似插值可以平滑采样误差。

确定性方法 ◦ 基于未知点周围点的值和特定的数学公式,来 直接产生平滑的曲面;

基于自相关性 (测量点的统计关系),根据 测量数据的统计特征产生曲面; 由于建立在统计学的基础上,因此不仅可 以产生预测曲面,而且可以产生误差和不 确定性曲面,用来评估预测结果的好坏
2)模型检验 (1)趋势面拟合适度的R2检验。结果表明,二次趋势面 回归模型和三次趋势面回归模型的显著性都较高,而且三 次趋势面较二次趋势面具有更高的拟合程度。 (2)趋势面适度的显著性F检验。在置信水平a=0.05下, 查F分布表得F2a=F0.05(5,6)=4.53, F3a=F0.05(9,2)= 19.4。显然, F2> F2a ,而F3< F3a,故二次趋势面的回 归方程显著而三次趋势面不显著。因此,F检验的结果表 明,用二次趋势面进行拟合比较合理。
序号 1 2 3 4 5 6 7 8 9 10 11 12
降水量Z/mm 27.6 38.4 24 24.7 32 55.5 40.4 37.5 31 31.7 53 44.9
横坐标x/104m 0 1.1 1.8 2.95 3.4 1.8 0.7 0.2 0.85 1.65 2.65 3.65
纵坐标y/104m 1 0.6 0 0 0.2 1.7 1.3 2 3.35 3.15 3.1 2.55

如何生成表面? 如何才能获得尽可能精确的表面? 如何评价和比较分析的结果?
空间插值:用已知点的数值来 估算其他点的数值的过程。 内插:在已观测点的区域内估算 未观测点的数据的过程; 外推:在已观测点的区域外估算 未观测点的数据的过程。——预 测 空间插值的结果是形 通过已知的空间数据,找到一 成栅格,因此空间插值也 个函数关系式,使关系式最好得 可以理解为将点状矢量数 据转化为栅格数据的过程。 逼近这些已知的空间数据,并能 够根据该函数关系式,推求出区 也是将点数据转换为面数 域范围内其他任意点或多边形分 据的一种方法。 区范围的值。
③ ④

可视化、可操作性(插值软件选择):三维的透视图等。
(1) 交叉验证 交叉验证法(cross-validation),首先假定每一测点的 要素值未知,而采用周围样点的值来估算,然后计算所有样 点实际观测值与内插值的误差,以此来评判估值方法的优劣。 各种插值方法得到的插值结果与样本点数据比较。
优点 ◦ 产生平滑的曲面; ◦ 结果点很少通过原始数据点, 只是对整个研究曲产生最佳 拟合面; 缺点 ◦ 高次多项式在数据区外围产 生异常高值或低值


建立因变量与自变量的联系 自变量的选择:非空间属性、空间属性 求解方法与趋势面类似 例子:流域雪水量模型,山区降水量估算模型
整体内插函数保凸性较差,采样点的增减或移动都 需要对多项式的系数作全面调整,从而采样点之间 会出现难以控制的振荡现象,致使函数极不稳定, 从而导致保凸性较差。 多项式物理意义不明显 解算速度慢且对计算机容量要求高 不能提供内插区域的局部地形特征。 由于以上缺点,在空间内插中整体内插并不常用
2014-4-22

地理学中可能遇到的问题: 了解天津市空气质量宏观分布
天津市空气质量监测点

了解我国某个地区的气候状况 气象站分布-温度降水 某观测站因意外存在缺测、漏测 解决问题的难点: 到研究区每个点进行观测是非常困难的——时间、人力 或财力都不允许。




GIS不仅对实际可视的地面对象进行计算,还可以 对实际上无法显示,但是可以用数值表示并可视化, 称为统计面。 构建统计面实际上和地形分析方法类似,只是要求 输入的数据为点数据样本。 由于点数据无法形成一个面,因此需要对点与点之 间的空白区域进行估计,以构成一个完整的面,这 个构成,成为空间插值。
1
已知数据
0 0 1 2
函数关系式
3 4 5 6
未知数据
7 8 9
距离衰减效应
Tobler(1970)”地理学第一定律”描述了这样的性质:
空间位置上越靠近的点,越可能具有相似的观察值;而 距离越远的点,其特征值相似的可能性越小。
所有的事物或现象在空间上都是有联系的,但相距 近的事物或现象之间的联系一般较相距远的事物或 现象间的联系要紧密。


缺值估计
◦ 如何在没有测点的地区得到我们需要的数据? ◦ 测点自然或人为的原因,缺少某天或某个时间段的数据。

内插等值线
◦ 形象直观的显示空间数据分布 ◦ 平面制图

数据格网化
◦ 以不规则点图元组织的Z变量的数据,并不适合于图形显示, 也不适于进行分析。多数空间分析要求将Z值转换成一个规 则间距空间格网,或者转换成不规则三角形网。 ◦ 规则格网数据更好的显示空间数据连续分布
上表为某流域1月份降水量与各观测点的坐标位置数据
1)建立趋势面模型 运用上述介绍的趋势面分析原理,首先采用二次多项式进行趋 势面拟合,用最小二乘法求得拟合方程为 z=5.998+17.438x+29.787y-3.558x2+0.375xy-8.070y2 (R2=0.839,F=6.236) 再采用三次趋势面进行拟合,用最小二乘法求得拟合方程为 z=-48.810Fra Baidu bibliotek37.557x+130.130y+8.389x2-33.166xy-62.740y24.133x3+6.138x2y+2.566xy2+9.785y3 (R2=0.965,F=6.054)
2)
3)
(1)规则采样
(2)随机采样
(3)断面采样
(4)成层随机采样
(5)聚集采样
(6)等值线采样

趋势面模型 回归模型

通常把实际的地理曲面分解为趋势面和剩余面两部分,前 者反应地理要素的宏观分布规律,属于确定性因素作用的 结果;而后者则对应于微观区域,被认为是随机因素影响 的结果。 趋势面分析的一个基本要求就是,所选择的趋势面模型应 该是剩余值最小,而趋势值最大,这样拟合度精确度才能 达到足够的准确性。 趋势面分析是通过回归分析原理,运用最小二乘法拟合一 个二维非线性函数,模拟地理要素在空间上的分布规律, 展示地理要素在地域空间上的变化趋势。 在数学上,拟合数学曲面要注意两个问题:一是数学曲面 类型(数学表达式)的确定,二是拟合精度的确定。
(2)“实际”验证
将部分已知变量值的样本点作为“训练数据集”,用于插 值计算;另一部分样点 “验证数据集”,该部分站点不参 加插值计算。然后利用“训练数据集” 样点进行内插,插 值结果与“训练数据集”验证样点的观测值对比,比较插值 的效果。
1)
采样点的空间位置对空间插值的结果影响很大。 理想情况是研究区内均匀布点:但当区域景观存在有规律 的空间分布模式时,用完全规则的采样网络可能会得到片 面的结果; 完全随机的采样:采样点的分布位置是不相关的,完全随 机采样可能会导致采样点的分布不均,一些点的数据密集, 另一些点的数据缺少。 规则采样和随机采样的结合方法是成层随机采样,即划分 为规则格网,每个格网中的样本数固定,但单个点随机地 分布于规则格网内。
相关文档
最新文档