第十四章 空间插值
空间插值技术在地质模型构建中的应用
空间插值技术在地质模型构建中的应用
引言
地质模型构建是地质学研究中非常重要的工作之一,通过对地球表面地质要素的建模,可以帮助我们更好地理解地球的演化历史和资源分布情况。而空间插值技术作为一种常用的地质模型构建方法,为我们提供了一种快速、准确地获取地质信息的工具。本文将探讨空间插值技术在地质模型构建中的应用,并介绍一些常用的插值方法。
一、空间插值技术简介
空间插值技术是一种通过已知数据点的信息推断未知点的值的方法。其主要思想是通过已有数据点的空间分布特征,利用一定的数学算法和统计模型,推算出未知点的属性值。在地质模型构建中,空间插值技术可以用于不同地质要素的建模,如地形、土壤厚度、矿藏分布等。
二、常用的空间插值方法
1. 克里金法(Kriging)
克里金法是一种基于地质变量的自相关性进行空间预测的插值方法。其基本假设是地质变量在空间上具有一定的自相关性,即离得越近的样点之间的差异越小。该方法通过构建半方差函数来描述自相关性,进而根据样点之间的空间距离和半方差函数的参数来预测未知点的属性值。克里金法在地质模型构建中广泛应用,能够较好地揭示地质现象的空间关联性。
2. 逆距离加权法(IDW)
逆距离加权法是一种基于距离的插值方法。其基本思想是未知点的属性值与其邻近点之间的距离成反比,距离越近的邻近点对未知点的影响越大。该方法简单、
易于理解,但对于离未知点较远的邻近点的影响较小,可能导致插值结果出现较大误差。逆距离加权法在地质模型构建中常用于数据稀疏或数据分布不规则的情况。
3. 其他插值方法
除了克里金法和逆距离加权法,还有一些其他的空间插值方法可供选择,如样条插值、径向基函数插值等。这些方法各有特点,可以根据实际情况选择合适的方法进行地质模型的构建。同时,也可以结合不同的插值方法,通过集成模型的方式获得更准确的结果。
空间插值介绍简洁明了
• 空间插值的概念 • 空间插值的类型 • 空间插值的方法
空间插值概念
空间插值——空间插值常用于将离散点的测量数据转换为连 续的数据曲面,以便与其它空间现象的分布模式进行比较, 它包括了空间内插和外推两种算法。空间内插算法:通过已 知点的数据推求同一区域未知点数据。空间外推算法:通过 已知区域的数据,推求其它区域数据。
n
高次曲面插值评价
• 高次曲面插值根据变量值已知点和变量值未知点的坐标所 构成的圆锥,进行插值,为从离散点构建一个连续的表面 提供了一个比较优秀的插值方法。
• 由于在计算权重系数时需要已知点的距离矩阵及其逆矩阵, 因而当数据点增多时,矩阵及其逆的求解都比较费时。
五、趋势面分析
• 通常把实际的地理曲面分解为趋势面和剩余面两部分,前 者反应地理要素的宏观分布规律,属于确定性因素作用的 结果;而后者则对应于微观区域,被认为是随机因素影响 的结果。 • 趋势面分析的一个基本要求就是,所选择的趋势面模型应 该是剩余值最小,而趋势值最大,这样拟合度精确度才能 达到足够的准确性。 • 趋势面分析是通过回归分析原理,运用最小二乘法拟合一 个二维非线性函数,模拟地理要素在空间上的分布规律, 展示地理要素在地域空间上的变化趋势。 • 在数学上,拟合数学曲面要注意两个问题:一是数学曲面 类型(数学表达式)的确定,二是拟合精度的确定。
空间插值分析课件
后者则对应微观区域,被认为是随机因素影响的结果。
29
4.趋势面法
趋势面法分析
趋势面分析是通过回归分析原理,运用最小二乘法拟合一 个非线性函数。
主要是模拟地理要素在空间上的分布规律,展示地理要素 在地域空间上的变化趋势。
在气象要素空间插值计算中,数据往往是二维或者多维的 ,在这种情况下趋势面方程需要用二元二次或者高次多项 式表示,其中二元一次趋势面、二元二次趋势面、二元三 次趋势面方程分别表达为:
5m-10m的间隔下的半方差图
41
6.克里金法
半变率图的组成
块金值(c0,Nuddget): 当h = 0时
的非零变率,由不可解释的原因
引起 ;
空间自相关部分:C/(c0+c)
基台值(c0+c;sill): 半变率曲线变 平缓时的变率值,表明在某个距 离上样本点不再存在相关性,通 常等于数据集的方差;
交叉验证
对每种插值方法重复下面的步骤,实现对不同插值方法的 比较: 从数据集中除去一个已知点的测量值; 用剩余的点估计除去点的值; 比较原始值和估计值,计算出估计值的预测误差。
针对每个已知点,进行上述步骤,然后评价不同插值方法 的精确度。常用的评价指标是均方根(RMS):
RMS
1 n
n i1
空间插值——精选推荐
5/51
空间插值
变异函数和协方差函数的联系:
2γ(h) = Vr(Y(s + h) − Y(s)) = Vr(Y(s + h)) + Vr(Y(s)) −2Co(Y(s + h), Y(s)) = 2[C(0) − C(h)].
因此γ(h) = C(0) − C(h)。
6/51
空间插值
给定C我们能获得γ,但是反过来给定γ能否获得C?这需要 加一些条件,即{Y(s), s ∈ D} 是遍历的。如 果{Y(s), s ∈ D} 是遍历的,则当 h → 0时C(h) → 0,这 里 h 定义为h向量的长度。因此lim h →∞ γ(h) = C(0), C(h) = lim →∞ γ() − γ(h)。
C(s − s ) = σ2ρ((s − s )TB(s − s ))
这里ρ是在Rr空间上的相关系数函数,B为正定阵。当r = 2, C(s − s )的等高线图为椭圆。另一个是乘积几何非各向同性 (product geometric anisotropy):
C(s−s ) = σ2ρ1((s−s )TB1(s−s ))ρ2((s−s )TB2(s−s )).
误差如下
33/51
空间插值
E[Y∗(s0) − Y(s0)]2
n
= E[ α(Y(s) − Y(s0))]2
空间插值
输出 RMS 文件
• 通过对比输入数据库中各位置与插值栅格 表面中相同位置的值,RMS 误差文件可生 成插值的均方根误差。 • RMS 误差值还可确定插值法 {阶数} 参数的 最佳使用值,方法是不断更改阶数值直到 RMS 误差降为最低。另外,还会报告卡方 (Chi-square) 值。
全局多项式插值法
空间插值
贺欣欣
空间插值是用已知点的数值来估 算其它点的数值的过程
例如:在一个没有数据记录的地点,其降水 量可通过对附近气象站已知降水量记录的 插值来估算出来。
ຫໍສະໝຸດ Baidu
在GIS应用中主要用于估算出栅 格中每个象元的值。因此空间 插值是将点数据转换成面数据 的一种方法,目的是使点数据 也能用于空间分析和建模。
• 但是平整的纸张无法精确贴合带有山谷地 形的地表。不过,如果可以将纸张弯曲一 下,就会更贴合。为数学公式添加一个项 也可以达到类似的效果,即平面的弯曲。 平面(纸张无弯曲)是一个一阶多项式 (线性)。二阶多项式(二次)允许一次 弯曲,三阶多项式(三次)允许两次弯曲, 依此类推;在 Geostatistical Analyst 中最 多允许 10 次弯曲。下图在概念上展示出一 个与山谷拟合的二阶多项式。
在概念上,趋势插 值法类似于取一 张纸将其插入各 凸起点之间(凸 起到一定高度)。 下图展示的是从 平缓山丘采集而 来的一组高程采 样点。使用的纸 张为洋红色
空间插值方法简介
9.3 地统计插值
表3 样本数据检验标准值
误差值 时期
70年代 80年代 90年代 2000年代
ME
0.004 0.002 0.007 0.021
RMSE
0.817 0.825 0.843 0.853
MSE
0.003 0.002 0.006 0.015
测样点
对于整个数据集来讲,观测样 点的值处于正常范围,但与其 相邻测量点比较,它又偏高或
偏低。
注:全局或局部离群值的存在,对于 预测均有不利的影响。
离群值的查找
全局离群值
孤立存在或被一群 显著不同的值包围
用半变异/协方差函数云 识别离群值
离群值的查找
局部离群值
离群值的查找
局部离群值在半变异函数云图上往往分布在x轴的左端,而且在Y轴上的位 置较高,也就是说,样点对距离很小但是变异很大。
空间插值常用的两种方法:
确定性插值方法:
地统计方法:
反距离权重(IDW)
3模型分析
不同的方法有其适用的条件
当数据不服从正态分布时,若服从对数正态分布,则选用对数正态克里格; 若不服从简单分布时,选用析取克里格。 当数据存在主导趋势时,选用泛克里格。 当只需了解属性值是否超过某一阈值时,选用指示克里格。 当同一事物的两种属性存在相关关系,且一种属性不易获取时,可选用协同 克里格方法,借助另一属性实现该属性的空间内插。当假设属性值的期望值为 某一已知常数时,选用简单克里格。 当假设属性值的期望值是未知的,选用普通克里格。
python 空间插值方法
python 空间插值方法
在Python中,空间插值通常使用各种不同的方法来实现,包括基于机器学习的方法,如K-近邻插值(K-Nearest Neighbors)、支持向量机(SVM)、人工神经网络(ANN)等。另一种常见的方法是使用像Scipy 库中的Scipy.interpolate模块提供的函数。
下面是一个使用Scipy库进行空间插值的简单示例:
```python
from scipy import interpolate
import numpy as np
import matplotlib.pyplot as plt
# 假设我们有一个点的列表,其中包含要插值的点的坐标和值
points = np.array([
[1, 2, 3],
[2, 3, 4],
[3, 4, 5],
# ... 其他点
])
# 我们使用的是线性插值,所以我们需要一个线性插值函数
f = interpolate.interp1d(points[:, 0], points[:, 1])
# 现在我们可以插值任何我们想要的点的坐标和值
new_point = np.array([5, 5])
interpolated_value = f(new_point[0])
print(interpolated_value)
```
这个例子使用了线性插值,但Scipy库提供了许多其他类型的插值方法,如多项式插值、样条插值等。你可以根据你的具体需求选择适合的方法。
如果你正在处理大量的数据,或者需要更高级的插值方法,你可能需要使用像Gridder这样的库。Gridder是一个专门用于处理空间数据的库,它提供了一种方法来从离散的空间数据点创建网格,并使用Scipy 库的插值函数对网格上的点进行插值。这可以帮助你处理非常大的数据集,而不会消耗大量的内存。
第十四章 空间插值
2)
3)
(1)规则采样
(2)随机采样
(3)断面采样
(4)成层随机采样
(5)聚集采样
(6)等值线采样
趋势面模型 回归模型
通常把实际的地理曲面分解为趋势面和剩余面两部分,前 者反应地理要素的宏观分布规律,属于确定性因素作用的 结果;而后者则对应于微观区域,被认为是随机因素影响 的结果。 趋势面分析的一个基本要求就是,所选择的趋势面模型应 该是剩余值最小,而趋势值最大,这样拟合度精确度才能 达到足够的准确性。 趋势面分析是通过回归分析原理,运用最小二乘法拟合一 个二维非线性函数,模拟地理要素在空间上的分布规律, 展示地理要素在地域空间上的变化趋势。 在数学上,拟合数学曲面要注意两个问题:一是数学曲面 类型(数学表达式)的确定,二是拟合精度的确定。
(2)“实际”验证
将部分已知变量值的样本点作为“训练数据集”,用于插 值计算;另一部分样点 “验证数据集”,该部分站点不参 加插值计算。然后利用“训练数据集” 样点进行内插,插 值结果与“训练数据集”验证样点的观测值对比,比较插值 的效果。
1)
采样点的空间位置对空间插值的结果影响很大。 理想情况是研究区内均匀布点:但当区域景观存在有规律 的空间分布模式时,用完全规则的采样网络可能会得到片 面的结果; 完全随机的采样:采样点的分布位置是不相关的,完全随 机采样可能会导致采样点的分布不均,一些点的数据密集, 另一些点的数据缺少。 规则采样和随机采样的结合方法是成层随机采样,即划分 为规则格网,每个格网中的样本数固定,但单个点随机地 分布于规则格网内。
空间插值方法
空间插值方法
一、空间插值方法概述
空间插值方法是指在给定的有限点数据集合上,通过某种数学模型,
对未知位置的数值进行估计或预测的方法。它广泛应用于地理信息系统、遥感、气象、环境监测等领域中,是一种重要的数据处理和分析
手段。常见的空间插值方法包括:反距离权重法、克里金法、径向基
函数插值法等。
二、反距离权重法
1. 原理
反距离权重法是一种基于距离加权平均的插值方法。其基本思想是:
对于未知点,用已知点到未知点之间的距离作为权重系数,将已知点
的观测值按照这些系数进行加权平均,得到未知点的估计值。该方法
假设空间变量在空间上具有连续性,并且与其邻近区域内观测值相关。
2. 步骤
(1)确定待插值点和邻近观测点
(2)计算待插值点与邻近观测点之间的欧式距离或曼哈顿距离等
(3)根据距离计算每个邻近点的权重系数
(4)将邻近点的观测值按照权重系数进行加权平均,得到待插值点的估计值
3. 优缺点
反距离权重法简单易懂,计算速度快,适用于数据密度较小、空间变异性较大的情况。但其估计结果容易受到邻近点数量和距离的影响,可能出现插值误差较大的情况。
三、克里金法
1. 原理
克里金法是一种基于统计学原理的空间插值方法。其基本思想是:通过对已知点之间的空间关系进行建模,利用半方差函数来描述变量在空间上的相关性,并通过最小二乘法求解出半方差函数中未知参数,从而得到未知位置处的预测值。该方法假设空间变量在空间上具有稳定性,并且与其邻近区域内观测值相关。
2. 步骤
(1)确定待插值点和邻近观测点
(2)计算待插值点与邻近观测点之间的欧式距离或曼哈顿距离等
空间插值——插值方法的适用范围
空间插值——插值⽅法的适⽤范围
空间确定性插值,以研究区域内部的相似性或者平滑度为基础,由已知样点来创建表⾯。
1、IDW
相近相似原理,反距离加权。
样点分布要尽可能均匀,且布满整个插值区域。
对于不规则分布的样点,插值时利⽤的样点往往也不均匀的分布在周围不同的⽅向上,这样对每个⽅向上的插值结果的影响不同,准确度也会降低。
2、全局多项式插值
⼀个多项式计算预测值,即⽤⼀个平⾯或曲⾯进⾏全区特征拟合。⾮精确插值法,不与实际样点完全重合。
要求样点模拟的属性在研究区域表⾯的变化是平缓的。或者检验长期变化的,全局性趋势的影响(即趋势⾯分析)时使⽤。⼀般选三次拟合。
3、局部多项式内插
多个多项式,每个多项式处在特定重叠的邻近区域内。不是精确内插。
当需要建⽴平滑表⾯且确定变量的⼩范围的变异时可以使⽤。能描述数据集中含有的短程变异。更多地⽤来解释局部变异。
4、径向基函数
包括平⾯样条函数、张⼒样条函数、规则样条函数、⾼次曲⾯函数、反⾼次曲⾯样条函数五种。
适⽤于表⾯变化平缓的表⾯。
当在较短的⽔平距离内,表⾯发⽣较⼤变化,或者⽆法确定采样点数据的准确性,或者采样数据具有较⼤不确定性时,不适⽤。
空间插值
§1 插值概论
1 插值
用已知点来估算其他未知点的过程。
在GIS中,空间插值主要用于栅格数据,估算出栅格中每个单元的值。空间插值是将点数据转换为面数据的一种方法。
2 需要插值的原因:
现有数据不能完全覆盖所要求的区域;现有离散曲面的分辨率、像元大小、方向与要求不符;现有连续曲面的数据模型与要求不一致;
3 内插和外推
内插:在已观测点的区域内估算未观测点的数据的过程。
外推:在已观测点的区域外估算未观测点的数据的过程.——预测。
4 空间插值基础:控制点
控制点分布;控制点密度;控制点的自相关程度
§2 内插方法
1 全局内插
在整个区域用一个数学函数来表达地形曲面。
采用全部控制点计算未知点的数据。
2 局部内插
将复杂的地形地貌分解成一系列的局部单元,在这些局部单元内部地形曲面具有单一的结构,由于范围的缩小和曲面形态的简化,用简单曲面就可较好的描述地形曲面。
采用样本控制点计算未知点的数据。
3 内插方法
整体内插:趋势面分析;回归模型
局部方法:泰森多边形(V oronoi边形,边界内插);反距离权内插;样条函数内插技术;克里金内插方法;密度估算
4 趋势面分析的步骤
数学曲面函数确定; 内插曲面的复杂程度;计算量;系数求解;最小二乘法;拟合精度分析
5 整体内插缺点
由于以下缺点,在空间内插中整体内插并不常用:
整体内插函数保凸性较差:采样点的增减或移动都需要对多项式的系数作全面调整,从而采样点之间会出现难以控制的振荡现象,致使函数极不稳定,从而导致保凸性较差;
多项式系数物理意义不明显
解算速度慢且对计算机容量要求较高。
空间插值IDW
pFeatureClass.Search(pSpatialFilter, false);
return pFeatureCursor; }
IDW实现-公共函数5
空间插值方法的分类
整体拟合法
局部拟合法
确定性 随机性 确定性
随机性
趋势面 回归(非 (非精确) 精确)
泰森(精确)、 克里金(精 密度估算(非精 确) 确)、反距离权 重(精确)、薄 板样条(精确)
空间插值主要方法
空间插值常用于将离散点的测量数据转换为连续的数据
曲面,它包括内插和外推两种算法。前者是通过已知点的
int m_nFieldIndex;
public IRasterLayer pRasterLayer = new RasterLayerClass(); protected const string TemporaryRasterDatasetName = "tmp_";
//栅格类型格式枚举 public enum ESRIRasterFormat
数据计算同一区域内其他未知点的数据,后者则是通过已知 区域的数据,求未知区域的数据。
主要的内插方法有:
反距离加权(Inverse Distance Weighted) 全局多项式(Global Polynomial Interpolation) 全局多项式(Local Polynomial Interpolation) 径向基函数(Radial Basis Funtions) 克里格内插( Kriging )
时空数据分析中的空间插值算法
时空数据分析中的空间插值算法随着时空数据的爆炸式增长,如何更好地分析这些数据已成为一个重要的话题。其中,空间插值算法被广泛应用于时空数据的分析中。本文将介绍空间插值算法在时空数据分析中的应用和优缺点。
一、什么是空间插值算法
空间插值算法是一种根据研究区域内已知采样点的数据,推断出未知位置上的数值的方法。简单来说,就是通过给定的点,推断未知点的值。
二、空间插值算法在时空数据分析中的应用
空间插值算法在时空数据分析中有着广泛的应用。例如,空气质量监测、城市交通流量预测、林火预测等。其中,最常见的应用是在地理信息系统(GIS)中。GIS的一个主要作用是将空间关系转化为数据,然后进行地理空间分析。空间插值算法在GIS中用于将离散的采样点转化为均匀的栅格数据,以便于地理空间分析。
三、空间插值算法的优缺点
空间插值算法有着独特的优缺点。首先,空间插值算法可以对
缺失或不完整的数据进行插值,从而填补数据空白。其次,空间
插值算法可以将离散的采样点转化为均匀的栅格数据,以便于地
理空间分析。
然而,空间插值算法也有其缺点。例如,空间插值算法不适用
于非线性数据。此外,如果采样点之间的间距太大,则插值误差
将非常大。
四、常见的空间插值算法
1. Kriging 插值法
Kriging 插值法是一种基于统计学理论的插值算法。这种方法通过对已知样本进行方差分析,从而求出未知位置的数据。Kriging
插值法的优点是能够准确地捕捉数据点之间的空间相关性。然而,
该算法的缺点是需要对输入数据有一定的了解,并且计算时间较长。
2. IDW 插值法
地理信息技术专业中的空间插值方法介绍
地理信息技术专业中的空间插值方法介绍
地理信息技术专业中的空间插值方法是指通过对已有的地理信息数
据进行分析和处理,以得到未知地点或像素点上的数值。空间插值方
法在地理信息系统中具有重要的应用价值,它能够对数据进行插值处理,填补数据缺失的区域,提高数据的空间分辨率,并为地理现象和
趋势的研究提供有力支持。本文将介绍地理信息技术专业中常用的空
间插值方法及其原理。
一、反距离权重插值法
反距离权重插值法(IDW)是地理信息技术专业中常用的一种插值
方法。它的原理是通过计算待插值点与已知点之间的距离关系,按照
一定的权重来进行插值。距离越近的点具有更大的权重,反之则权重
较小。IDW方法简单直观,适用于均匀分布的点数据。然而,在处理
非均匀分布的点数据时,IDW方法可能会产生较大的误差。
二、克里金插值法
克里金插值法(Kriging)是一种以空间自相关性为基础的插值方法。它通过对已知点的空间变异性进行分析,根据空间结构进行插值,能
够更精确地估算未知点的值。克里金插值方法利用样本点之间的空间
关系,确定协方差函数,从而进行插值。它能够量化空间变异性,并
给出插值结果的置信度。克里金插值法适用于具有明显空间相关性的
数据。
三、三角网插值法
三角网插值法(TIN)是一种基于地理信息系统中的三角网模型的插值方法。它通过将地理空间划分为一系列不规则的三角形,根据三角形边界上的点来进行插值。TIN方法可以克服均匀分布数据中的孔洞问题,对于不规则分布的数据具有较好的适应性。然而,在处理大规模数据时,TIN方法的计算量较大。
四、径向基函数插值法
地理空间数据分析中的空间插值技术的使用教程
地理空间数据分析中的空间插值技术的使用教程
地理空间数据分析中的空间插值技术是一种用于推测缺失空间点的数
值数学方法,通过已知点的数值来推测未知点的数值,从而实现空间数据
补全和矫正。常见的空间插值技术包括反距离加权插值、克里金插值、贝
叶斯插值等。本文将介绍常用的空间插值技术及其在地理空间数据分析中
的应用。
1.反距离加权插值
反距离加权插值是一种简单且易于理解的插值方法。其基本思想是对
未知点的值进行预测时,根据该点到已知点的距离进行加权计算。距离较
近的已知点将得到更高的权重,距离较远的已知点将得到较低的权重。通
过加权平均计算,可以得到未知点的估计值。
在地理空间数据分析中,反距离加权插值常用于地形高程、土壤类型、气象数据等空间属性的补全和预测。例如,根据一定范围内的气象站点数据,可以推测未来其中一地点的气温、降雨量等数据。
2.克里金插值
克里金插值是一种基于统计学原理的插值方法,其基本思想是通过对
空间变量的自相关性进行建模,推断未知点的值。克里金插值可以提供对
未知点的预测值及其不确定性的估计。
在地理空间数据分析中,克里金插值常用于地质勘探、环境监测、地
下水位预测等领域。例如,根据一定面积内的地下水位监测点数据,可以
推测未来其中一地点的地下水位及其可能的变化范围。
3.贝叶斯插值
贝叶斯插值是一种基于贝叶斯统计学原理的插值方法,它通过考虑先
验信息和观测数据的后验概率分布,对未知点的值进行推测。贝叶斯插值
可以提供对不确定性的量化估计,并能够进行参数灵敏度分析。
在地理空间数据分析中,贝叶斯插值常用于地震研究、空气质量监测、森林覆盖度估计等领域。例如,通过考虑不同监测站点的观测数据及其空
地质统计学教案中的空间插值与地质预测
地质统计学教案中的空间插值与地质预测地质统计学是地质学中一门重要的学科,它通过对地质数据的统计分析来揭示地质过程和地质现象的规律。其中,空间插值是地质统计学中常用的一种方法,它能够基于有限的观测数据,预测未来可能出现的地质情况,对地质预测具有重要意义。
一、空间插值的基本原理
空间插值是一种通过已知点的观测数据,在未知区域内进行数值推算的方法。它通过将已知点的属性值与其空间位置相联系,从而实现对未知点的属性值估计。在地质统计学中,空间插值常用于将离散的地质数据整合成平滑连续的地质场景,为地质预测提供依据。
常用的空间插值方法包括Kriging插值、IDW(反距离加权)插值和样条插值等。Kriging插值方法通过对地质数据进行半变异函数的拟合,找到最佳的插值权重,从而实现对未知点的属性值预测。IDW插值方法则基于离未知点越近的已知点权重越大的假设,进行属性值的估计。而样条插值则通过生成平滑的曲线或表面,对未知点进行属性值的估计。
二、地质预测中的空间插值应用
在地质预测中,空间插值被广泛应用于矿产资源评估、环境地质灾害预测、地下水资源分析等领域。以矿产资源评估为例,地质学家常常需要通过有限的采样点数据,对整个矿区的矿产资源进行评估。通
过利用空间插值方法,可以对矿产的丰度、赋存形式等进行预测,为
矿产勘探和资源管理提供科学依据。
除此之外,空间插值还可以应用于地下水资源分析。地下水是人类
生活和工业生产中不可或缺的重要资源,而地下水的空间分布对于水
资源的管理和保护至关重要。通过利用地下水监测站点的观测数据,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
整体插值方法将小尺度的、局部的变化看作随机和非结 构性噪声,从而丢失了这一部分信息。局部插值方法恰 好能弥补整体插值方法的缺陷。 整体插值方法通常不直接用于空间插值,而是用来检测 总趋势和不同于总趋势的最大偏离部分,即剩余部分, 在去除了宏观趋势后,可用剩余残差来进行局部插值。
精确插值:产生通过所有观测点的曲面。
是一种多项式回归分析模型,用多项式表示线或 面,按最小二乘法原理对数据点进行拟合。 A、当数据为一维时, 1)线性回归: 2)二次或高次多项式:
B、数据是二维的 二元二次或高次多项式
多项式分析
◦ 多项式趋势面随着N值的不同,其形态也不同。
一次多项式
二次多项式
三次多项式
◦ 一般地讲,N值越大,拟合精度越高。拟合精度C以下式 表示,通常C为60%~70%时,该多项式就能够揭示空 间趋势。
局部内插法只使用邻近的数据点(样本控制点)来估计未知点的值,步 骤如下: ◦ 定义一个邻域或搜索范围; ◦ 搜索落在此邻域范围的数据点; ◦ 选择能表达这有限个点空间变化的数学函数; ◦ 为未知的数据点赋值。 将复杂的地形地貌分解成一系列的局部单元,在这些局部单 元内部地形曲面具有单一的结构,由于范围的缩小和曲面形态的简 化,用简单曲面即可描述地形曲面。 局部内插方法: ◦ 泰森多边形(Voronoi边形、边界内插) ◦ 样条函数插值法 ◦ 反距离权重内插 ◦ Kriging插值(空间自由协方差最佳内插) ◦ 密度估算 单个数据点的改变只影响其周围有限的数据点。
趋势面分析的核心就是从实际观测值出发推算趋势面, 一般采用回归分析方法,使得残差平方和最小从而估 计趋势面参数。 假设二维空间中有n个观测点(xl,yl)(l=1,2,…,n), 观测值为zl(l=1,2,…,n)则空间分布z的趋势面可表 示为N次多项式
根据最小二乘法,可得
利用克莱姆法则可以求出各个参数ai
设某地理要素的实际观测数据为zi(xi,yi) (i=1,2,…,n),趋势值拟合值为
,则有
式中, 为剩余值(残差值)
用来计算趋势面的数学方程式有多项式函数和傅立叶级数, 其中最常用的是多项式函数。因为任何一个函数都可以在 一个适当的范围内用多项式来逼近,而且调整多项式的次 数,可使所求的回归方程适合实际问题的需要。
◦ 多种 kriging 方法
① ②
内插方法(模型)的选择; 空间数据的探索性分析,包括对数据的均值、方 差、协方差、独立性和变异函数的估计等;
③
④ ⑤
进行内插;
内插结果评价; 重新选择内插方法,直到合理;
⑥
内插生成最后结果。
①
②
精确性:
参数的敏感性:许多的插值方法都涉及到一个或多个参数, 如距离反比法中距离的阶数等。有些方法对参数的选择相当 敏感,而有些方法对变量值敏感。后者对不同的数据集会有 截然不同的插值结果。希望找到对参数的波动相对稳定,其 值不过多地依赖变量值的插值方法。 耗时:一般情况下,计算时间不是很重要,除非特别费时。 存储要求:同耗时一样,存储要求不是决定性的。特别是在 计算机的主频日益提高,内存和硬盘越来越大的情况下,二 者都不需特别看重。
0 7
1
2
3
4
5
6
7
8
9 7 6 5 4 3
6
5
4
3
2
7 6
1 2 3 4 5 6 7
2 1 0 9
1
0 0
58
从存在的观测数据中找到一个函数关 系式,使该关系式最好的逼近这些已 知的空间数据,并能根据函数关系式 推求出区域范围内其它任意点的值。
将空间上离散点的测量 4 数据转换为连续的曲面 数据,即填补样本点之 间的数据空白,以便与 3 其它空间现象的分布进 2 行建模研究。
趋势面拟合适度的R2检验
式中,
为剩余平方和,它表示随机因素对z的离差 为回归平方和,它表示p个自变量对因变 量z的离差的总影响
R2越大,趋势面的拟合度就越高。
趋势面拟合适度的显著性F检验
• 检验的办法是在显著性水平下,查F分布表得Fa。若计算的F 值大于临界值Fa ,则认为趋势面方程显著;否则,不显著。 • p为多项式项数(不包括常数项),
一、控制点 控制点是已知数值的点。已知点、样本点、观测点。 控制点的数量和分布极大地影响空间插值的精度。
1. 2. 3.
二、空间插值的类型 整体插值和局部插值; 精确插值和近似插值。 确定性插值和地统计插值;
整体插值:用研究区所有采样点数据进行全区特征 拟合。在整个区域用一个数学函数表达地形曲面, 采用全部控制点计算未知点数据。 整个区域的数据都会影响单个插值点,单个数据点 变量值的增加、减少或者删除,都对整个区域有影 响。 典型例子是:全局趋势面分析 、回归模型、 Fourier Series(周期序列)
整个区域上函数的唯一性、能得到全局光滑连续的 空间曲面、充分反映宏观地形特征等。 在空间内插中,一般是与局部内插方法配合使用, 例如在使用局部内插方法之前,利用整体内插去掉 不符合总体趋势的宏观地物特征。整体内插函数常 常用来揭示整个区域内的地形宏观起伏态势。
◦ 在精确插值中,插值点落在观测点上,内插值等于估计值。
近似插值:插值产生的曲面不通过所有观测点。
◦ 当数据存在不确定性时,应该使用近似插值,由于估计值替 代了已知变量值,近似插值可以平滑采样误差。
确定性方法 ◦ 基于未知点周围点的值和特定的数学公式,来 直接产生平滑的曲面;
基于自相关性 (测量点的统计关系),根据 测量数据的统计特征产生曲面; 由于建立在统计学的基础上,因此不仅可 以产生预测曲面,而且可以产生误差和不 确定性曲面,用来评估预测结果的好坏
2)模型检验 (1)趋势面拟合适度的R2检验。结果表明,二次趋势面 回归模型和三次趋势面回归模型的显著性都较高,而且三 次趋势面较二次趋势面具有更高的拟合程度。 (2)趋势面适度的显著性F检验。在置信水平a=0.05下, 查F分布表得F2a=F0.05(5,6)=4.53, F3a=F0.05(9,2)= 19.4。显然, F2> F2a ,而F3< F3a,故二次趋势面的回 归方程显著而三次趋势面不显著。因此,F检验的结果表 明,用二次趋势面进行拟合比较合理。
序号 1 2 3 4 5 6 7 8 9 10 11 12
降水量Z/mm 27.6 38.4 24 24.7 32 55.5 40.4 37.5 31 31.7 53 44.9
横坐标x/104m 0 1.1 1.8 2.95 3.4 1.8 0.7 0.2 0.85 1.65 2.65 3.65
纵坐标y/104m 1 0.6 0 0 0.2 1.7 1.3 2 3.35 3.15 3.1 2.55
如何生成表面? 如何才能获得尽可能精确的表面? 如何评价和比较分析的结果?
空间插值:用已知点的数值来 估算其他点的数值的过程。 内插:在已观测点的区域内估算 未观测点的数据的过程; 外推:在已观测点的区域外估算 未观测点的数据的过程。——预 测 空间插值的结果是形 通过已知的空间数据,找到一 成栅格,因此空间插值也 个函数关系式,使关系式最好得 可以理解为将点状矢量数 据转化为栅格数据的过程。 逼近这些已知的空间数据,并能 够根据该函数关系式,推求出区 也是将点数据转换为面数 域范围内其他任意点或多边形分 据的一种方法。 区范围的值。
③ ④
⑤
可视化、可操作性(插值软件选择):三维的透视图等。
(1) 交叉验证 交叉验证法(cross-validation),首先假定每一测点的 要素值未知,而采用周围样点的值来估算,然后计算所有样 点实际观测值与内插值的误差,以此来评判估值方法的优劣。 各种插值方法得到的插值结果与样本点数据比较。
优点 ◦ 产生平滑的曲面; ◦ 结果点很少通过原始数据点, 只是对整个研究曲产生最佳 拟合面; 缺点 ◦ 高次多项式在数据区外围产 生异常高值或低值
建立因变量与自变量的联系 自变量的选择:非空间属性、空间属性 求解方法与趋势面类似 例子:流域雪水量模型,山区降水量估算模型
整体内插函数保凸性较差,采样点的增减或移动都 需要对多项式的系数作全面调整,从而采样点之间 会出现难以控制的振荡现象,致使函数极不稳定, 从而导致保凸性较差。 多项式物理意义不明显 解算速度慢且对计算机容量要求高 不能提供内插区域的局部地形特征。 由于以上缺点,在空间内插中整体内插并不常用
2014-4-22
地理学中可能遇到的问题: 了解天津市空气质量宏观分布
天津市空气质量监测点
了解我国某个地区的气候状况 气象站分布-温度降水 某观测站因意外存在缺测、漏测 解决问题的难点: 到研究区每个点进行观测是非常困难的——时间、人力 或财力都不允许。
GIS不仅对实际可视的地面对象进行计算,还可以 对实际上无法显示,但是可以用数值表示并可视化, 称为统计面。 构建统计面实际上和地形分析方法类似,只是要求 输入的数据为点数据样本。 由于点数据无法形成一个面,因此需要对点与点之 间的空白区域进行估计,以构成一个完整的面,这 个构成,成为空间插值。
1
已知数据
0 0 1 2
函数关系式
3 4 5 6
未知数据
7 8 9
距离衰减效应
Tobler(1970)”地理学第一定律”描述了这样的性质:
空间位置上越靠近的点,越可能具有相似的观察值;而 距离越远的点,其特征值相似的可能性越小。
所有的事物或现象在空间上都是有联系的,但相距 近的事物或现象之间的联系一般较相距远的事物或 现象间的联系要紧密。
缺值估计
◦ 如何在没有测点的地区得到我们需要的数据? ◦ 测点自然或人为的原因,缺少某天或某个时间段的数据。
内插等值线
◦ 形象直观的显示空间数据分布 ◦ 平面制图
数据格网化
◦ 以不规则点图元组织的Z变量的数据,并不适合于图形显示, 也不适于进行分析。多数空间分析要求将Z值转换成一个规 则间距空间格网,或者转换成不规则三角形网。 ◦ 规则格网数据更好的显示空间数据连续分布
上表为某流域1月份降水量与各观测点的坐标位置数据
1)建立趋势面模型 运用上述介绍的趋势面分析原理,首先采用二次多项式进行趋 势面拟合,用最小二乘法求得拟合方程为 z=5.998+17.438x+29.787y-3.558x2+0.375xy-8.070y2 (R2=0.839,F=6.236) 再采用三次趋势面进行拟合,用最小二乘法求得拟合方程为 z=-48.810Fra Baidu bibliotek37.557x+130.130y+8.389x2-33.166xy-62.740y24.133x3+6.138x2y+2.566xy2+9.785y3 (R2=0.965,F=6.054)
2)
3)
(1)规则采样
(2)随机采样
(3)断面采样
(4)成层随机采样
(5)聚集采样
(6)等值线采样
趋势面模型 回归模型
通常把实际的地理曲面分解为趋势面和剩余面两部分,前 者反应地理要素的宏观分布规律,属于确定性因素作用的 结果;而后者则对应于微观区域,被认为是随机因素影响 的结果。 趋势面分析的一个基本要求就是,所选择的趋势面模型应 该是剩余值最小,而趋势值最大,这样拟合度精确度才能 达到足够的准确性。 趋势面分析是通过回归分析原理,运用最小二乘法拟合一 个二维非线性函数,模拟地理要素在空间上的分布规律, 展示地理要素在地域空间上的变化趋势。 在数学上,拟合数学曲面要注意两个问题:一是数学曲面 类型(数学表达式)的确定,二是拟合精度的确定。
(2)“实际”验证
将部分已知变量值的样本点作为“训练数据集”,用于插 值计算;另一部分样点 “验证数据集”,该部分站点不参 加插值计算。然后利用“训练数据集” 样点进行内插,插 值结果与“训练数据集”验证样点的观测值对比,比较插值 的效果。
1)
采样点的空间位置对空间插值的结果影响很大。 理想情况是研究区内均匀布点:但当区域景观存在有规律 的空间分布模式时,用完全规则的采样网络可能会得到片 面的结果; 完全随机的采样:采样点的分布位置是不相关的,完全随 机采样可能会导致采样点的分布不均,一些点的数据密集, 另一些点的数据缺少。 规则采样和随机采样的结合方法是成层随机采样,即划分 为规则格网,每个格网中的样本数固定,但单个点随机地 分布于规则格网内。