第七章 空间数据分析模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当dZ很小时两者接近
不同方向的方差云图
高 程 差 异 的 平 方 根
高程点间的距离
高 度 差 的 平 方 根
XLS
间隔
草地蝗虫分布的空间变异
• 倪绍祥教授国家基金的中相关工作 • 草地蝗虫的危害性
<10
<15
<5
<20
A
B
半方差图 A:各向同性 B:各向异性
A
B
半方差模型参数 A:各向同性 B:各向异性
3)数据越多,方差函数估计越准确。
4)一旦实验方差函数拟合成理论方差函数,点位和块段克立 格插值方差取决于数据空间结构和方差函数模型的形态, 而不是数值本身。常规制图方法的预测误差决定于均质土 壤区域的确认。
5)块段克立格在点位数据集成到更大区域时非常有用,它通 过概括可以降低预测误差。
6)大多数插值技巧,包括克立格,都平滑数据,所以极大和 极小值都被去除。这些极端值可能有必要保留。 7)当数据不足时,所有非地统计方法都可以给出一张图。但 是你不知道它的质量到底如何。当数据足以计算方差函数 时,克立格方法就具有连续变异的独立样点预测方差而言 优于其他方法,当变异不连续时,单值景观制图结果可能 更好。 8)当数据丰富时,所有插值方法结果相近。效率最高的计算 和插值工具就是最好选择。克立格方法的主要困难之一就 是缺乏便宜、易用的软件
常用的方法
• 趋势面 • 倒数加权 • 三角网
3.1 点、块克里格插值
• 点克里格
– 估计指定点的值。局部估值方法,每一估值都 是由其邻近观测值加权平均计算而得 – 用于研究指定点值及其可能的变异
• 块克里格
– 对中心在X0的小区或块段进行估值 – 绘制性质的等值线图,图中的等值线较平滑 – 用于研究变异的区域格局
wij
pi p j dij
k
近邻
• 特定空间实体的近邻是与该实体邻接的其 他空间实体的集合 • 近邻依赖于邻接的定义
距离、邻接、交互、近邻的关系
三 空间自相关分析
• 空间中相近的样点具有某种相似性,相距 较远的样点往往不相似-空间自相关 • 解释和寻找存在的空间聚集性或“焦点”
空间自相关的类型
两种不同认识,但原理上互相联系
第一种:实用地、当然地理解变异 研究对象均质空间单元构成 观察点位的数据可以被外推到更大的区域
第二种:通过科学探索来理解变异 自然和人类活动导致空间变异的多样性
wenku.baidu.com
2 空间变异模型
传统的 常规模型 具有边界,边界内是均一的
现代的 连续模型 变异是连续的,具有不同的型式
对空间变异的处理
• 全程自相关 • 局部自相关
– 相关的范围
自相关性测度
• 空间数据类型:点或面
• Moran’sI, GearyC和G参数(Getis和Ord, 1992, 1995, 1996)
• 有关算法参PDF
1. Moran’sI
• 包括全程和局部两个参数,用来分析空间 的相关性 • I值越大,表明正的空间相关性越强
3 生态学谬误
• 当特定汇总层次的观察值之间的统计关系 假定可以接受,并且在更细的层次接受同 样关系的时候,产生这个问题
• 将得到的整体内的关系推论到个体之中
4 空间尺度
• 不同对象的表现需要的不同尺度
• 在大陆尺度,城市用点来表示。在区域尺 度,城市用面来表示。在局部尺度,城市 成为复杂的点、线、面和网络的集合体。 • 研究对象的空间尺度影响空间分析。因此, 应当选定正确的或合适的空间尺度
A. 单值图
A1
...
An
计算和上色
B. 单值图加点位数据
A1
...
An 计算平均和上色
C. 点位数据
插值
等值线图
A1
...
An 栅格图
4 空间数据插值
• 利用点的信息估计未知点的值 • 存在多种插值方法
– – – – – GRID TIN 克里格 等方位差值 趋势拟合法
五 趋势面分析
• 空间的变化规律 • 原因分析 • 观测面=区域趋势十局部异常+随机干扰
5 空间非均一性和边界效应
• 区分空间分析与传统统计分析的重要标志 是空间的不均一性 • 边界效应是不均一问题的一个特殊类型
二 空间数据关系
• 地理现象的空间连续性是空间属性的最基 本性质
1. 空间格局
• 存在三种空间格局类型:规则分布,随机分 布,聚集分布
2 空间数据关系
• • • • 距离(distance) 邻接(adjacency) 交互(interaction) 近邻(neighborhood)
怎么获得趋势面
• 多项式回归分析
– 趋势面分析的实质是进行数据的拟合,对因变 量无特别的要求,自变量是地理坐标
• Y=f(x,y)
– Y=c0+a1*x1+b1*y1+c1x1*y1+…
• 不注重精度和检验
六 区域化变量与克吕格插值
1 区域化变量
• 地统计学方法假定在一定空间范围内性质的 变异可以用一个连续随机但是空间上相关的 随机域来模拟。这样的性质称为区域化变量
盖度
蚁蝗密度
蝗虫密度、草场盖度的半方差图和交叉检验图
蚁蝗密度的协同克立格分析结果
使用地统计方法进行空间分析的优缺点仍在争论之中 1)克立格是一种最优估值技术,数据符合内蕴假设并且方差 函数定义得当的条件下。预测误差与其他局部权重方法相 比要低。 2)“真实”变异越平滑,方差函数拟合和估值越容易,基底方 差也越低, 预测误差也低。
3 泛克立格插值 将趋势面分析和残差的克立格插值结果加和,即构成 了泛克立格方法分析的结果
泛克立格插值结果
3.3 协同克里格
协同克立格分析是一种空间数据的解释技术,其基本的思想 是利用变量之间的空间相关关系进行估计或预测。按照如 下的统计准则,它可能是目前最好的空间数据分析方法 1)真值和估计值之间不存在偏差 2)估计值具有最小的方差
为什么叫空间自相关?
• 相关 • 自相关 • 空间自相关
2 可变区域单位问题
• 统计汇总的区域层次不同,统计结果间的 关系也就不同 • 由汇总单位产生的影响有两个
– 第一个影响与分析的空间尺度和汇总效应有关。 汇总之后的平均值更接近于回归线,使得散点 图的结果更接近于线性,导致相关系数增加。 一般通过汇总往往产生更好的拟合结果。 – 第二个影响是不同汇总方法得到的结果实质上 是不同的。
• 随机方法
– 承认所研究的对象是一个复 杂的自然体,必须通过采样 方法来研究 – 只能估计其属性的量值而且 这些估计受制于概率规则, 即任何估计的准确性都只具 有某种概率
• 每一个属性ai在每个图上单 元j中的数值都可以估计为 Uaij±e,其中e是一个正态 分布的随机误差
3 空间采样
从点位值到区域值-两种模型的差异
各向同性的点克立格插值
3.2 泛克里格
普通克立格方法(OK)要求数据是二阶平稳的 或纯平稳的。如果数据在空间上存在明显 的趋势,那么,应该使用泛克立格方法进 行分析
步骤
1趋势分析 分析数据中存在的空间上的变化趋势,获得拟合模型。 这部分的分析内容与前面的趋势面分析相同 2 残差的克立格分析 与普通克立格分析相同,不同的是,使用的数据是原 始数据减去趋势数据,即残差数据
• 2协方差的二阶平稳性 和半方差函数的内秉 性平稳
– 在相同方向和相同距离 的任意两点之间的协方 差相同。协方差依赖于 距离而不是位置
2 方差变异函数
度量Z的空间连续性的自然方法是比较间隔为 h的两个点x,x+h的值Z(x)和Z(x+h) 一个直接的度量关系是两个值间的绝对差 dZ( h)= Z(x)- Z(x+h)
• 模型 Z=m(x)+c’(x)+e’’
• 半方差函数
区域化变量的特点
• 随机性。即局部不规则的随机性质,可以 进行统计推断。 • 结构性。即存在某种空间自相关,可用某一 数学函数来表示。
空间平稳性假设
• 空间变异分析假设存 在空间平稳性 • 随机过程不具有二阶 平稳性 • 1 均值平稳性
– 均值独立于位置,在样 本之间是常数
2. GerayC参数
• 进行局部自相关分析 • C值大于0,表明正的值四周为高值环绕, 小于0,则为低值环绕,0则为无聚集特征。
3. G统计量
• 局部自相关分析
• 较高的G值表明位置周围是较高的数据,即数据 具有聚集性 • 模拟表明 (Ord 和 Getis 1994),在xi 周围不存在 空间聚集的原假设的条件下,G的分布接近与正 态。对于不同的观察值N,在不同的显著性概率 下G值各不相同。 • 例如,在90%的概率下,N=40对应的G值为 2.7913。
距离
• 空间实体间的直线距离或球面距离
D
邻接
• 是名义的、双向的相 等的距离
• 指定距离 内
– 有相对性
• 实体相邻
D
交互
• 是距离和邻接的综合 • 出发点:事物与近处的关系更密切 • 从数学上讲,可将两个空间实体之间的交 互度表示为0(无交互)和1(高度交互) 之间的数
交互的一个定义方式
1 wij k dij
• 空间数据分析(Spatial data analysis)
– 对具有空间坐标的属性 数据的分析
空间数据分析模型
• 针对空间数据所建立起来的反映数据空间 变异规律的模型,这些模型可以揭示地理 现象的本质特征,并用来进行空间预测
一 空间数据分析中的若干问题
• • • • • 空间自相关 可变区域单位问题 生态学谬误 空间尺度 空间非均一性和边界效应
1 空间自相关
• 空间中相近的样点具有某种相似性, 相距较远的样点往往不相似-空间自
相关
空间自相关
• 空间自相关性使得传统的统计学方法不能 直接用于分析地理现象的空间特征 • 传统的统计学方法的基本假设就是独立性 和随机性。为了分析具有空间自相关性的 地理现象,需要对传统的统计学方法进行 改进与发展,从而产生了空间统计学
什么是趋势面
蝗虫密度分级图
空间插值
观测面
观测面:空间上数据的实际分布曲面
什么是趋势面
趋势面
• 反映数据在空间上分布主要规律的曲面
观测面=趋势面十局部异常
局部异常=观测面-趋势面
区分趋势和异常
• 趋势 – 变化比较缓慢、影 响遍及整个研究区 的区域成分组成 • 局部异常 – 变化比较快,其影 响在区内并非处处 可见的成分
第七章 空间数据分析模型
空间数据分析模型
一 空间数据分析中的若干问题 二 空间数据关系 三 空间自相关分析 四 空间变异性 五 趋势面分析 六 区域化变量与克里格插值
区分两个概念
• 空间分析(Spatial analysis)
– 对空间对象之间关系的 分析 – 通过分析空间坐标的关 系得到对空间对象的关 系
• 传统上,科学家通过定义系统分类单元和 均质制图单元来逐渐排除过多的变异,直 到可以操作的程度
两种模型的差异
• 假设是均质的 • 通过采样确定均质区 的差异 • 产生分布图 • 假设是变异的 • 通过采样确定变异的 程度和范围 • 产生分布图
分析变异的方法
• 确定性方法
– 不承认属性观测值的不确定 性 – 连续模型认为性质的变化是 一个平稳的可微分过程,而 常规模型认为类型图没有内 部变异
四 空间变异分析
• 特定时刻现象在空间上的变 化 • 地理学的主要研究内容
1 空间变异
空间变异是空间不相似 从量变到质变的过程
• 空间连续性是空间属性的最基本性质
• 空间中相近的样点具有某种相似性,相距较远的 样点往往不相似 • 不相似性增大到某种程度即产生了空间变异 • 空间变异
– 复杂变异 – 规则变异
3 克里格插值
• 利用原始数据和半方差函数的结构性,对 未采样点的区域化变量进行无偏最佳估值 的一种方法。该方法的一个有用特点是能 够计算出每个估值的误差大小(估值方差), 从而能知道估值的可靠性程度。 • 多种类型,如简单克立格,正常克立格, 点状克立格,块段克立格,通用克立格, 协克立格,不连续克立格及指标克立格等
协同克立格方法在所使用的变量空间模式与常见的 物理过程相联系时最为成功。
Leenaers etal(1989) 荷兰南北Geul河冲积平原表土重金属(Cd,Pb和Zn)含量分布 进行制图 协同克立格方法
污染物总是吸附于缓慢沉降的细颗粒,因此重金属污染分布 在长期停留的地方富集。 结果发现,冲积平原中泛滥河水停留时间最长的地方重金属 含量最高,简单地说该区域相对高程与重金属含量有很强 的负相关,据此可以利用高程数据进行重金属含量的协同 克立格估值插值
要处理的问题是:有两个空间变量,如果第二个变量的分
布广,采样密度更高,而第一个变量难以测定或测定的费 用较高,那么,可以利用有限样本的变量之间的空间关系 来改进对于第一个变量的估计。
步骤
1 定义协同变量(第一个变量和第二个变量) 2 对两个变量进行半方差分析(包括方差图 模型),识别观察值的空间关系特征,并 用函数模型化 3 进行交叉半方差分析,确认两个变量相关 性 4 进行空间估计和预测
相关文档
最新文档