地统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因此,公式可以改写为
( x, h)
从上式可知,变异函数依赖于两个自变量 x和h,当变异函数 ( x, h) 仅仅依赖于距离 h 而与位置x无关时, ( x, h) 可改写成 (h),即
1 (h) E[ Z ( x) Z ( x h)] 2 2
1 E[ Z ( x) Z ( x h)] 2 2
第2节 地统计分析方法
地统计方法的基本原理 应用实例
地统计学是以区域化变量理论为基础, 以变异函数为主要工具,研究那些在空间 分布上既有随机性又有结构性,或空间相 关和依赖性的自然现象的科学。 协方差函数和变异函数是以区域化变 量理论为基础建立起来的地统计学的两个 最基本的函数。地统计学的主要方法之一, 克立格法就是建立在变异函数理论和结构 分析基础之上的。
Z ( x ) Z ( xu , x v , x w )
Cov[Z ( x), Z ( x h)] E[Z ( x)Z ( x h)] E[Z ( x)]E[Z ( x h)]
(4.2.2)
协方差函数的计算公式
1 N (h) c ( h) [Z ( xi ) Z ( xi )][ Z ( xi h) Z ( xi h)](4.2.3) N (h) i 1
Z 式中:h为两样本点空间分隔距离或距离滞后; ( xi ) 为 Z (x) 在空间位置 x i 处的实测值;Z ( xi h) 是 Z (x) 在 x i 处距离偏离h的实测值[i=1,2,…, (h) ],N (h) 是分隔 N 距离为h时的样本点对(paris)总数, ( xi )和 Z ( xi h) Z 分别为 Z ( xi ) 和 Z ( xi h) 的样本平均数,即
( x, h) Var[ Z ( x) Z ( x h)]
1 2 1 1 E[ Z ( x) Z ( x h)]2 {E[ Z ( x)] E[ Z ( x h)]}2 2 2
(4.2.7)
在二阶平稳假设条件下,对任意的h有
E[Z ( x h)] E[Z ( x)]
i 1
变异函数的计算公式
设 Z (x) 是系统某属性Z在空间位置x处 的值,Z (x)为一区域化随机变量,并满足二 阶平稳假设,h为两样本点空间分隔距离, Z ( xi )和 Z ( xi h分别是区域化变量 Z (x)在空间 ) 位置 x i 和 xi h处的实测值[i=1,2,…,N(h)], 那么,变异函数 (h)的离散计算公式为
(37 34) 2 (34 30) 2 (39 39) 2 (39 37 ) 2 (37 36) 2 (36 33) 2 (37 41) 2 (41 37) 2 (37 36) 2 (36 32) 2 (32 29) 2 (36 40) 2 (40 33) 2 (33 35) 2 (35 29) 2 (29 30) 2 (38 34) 2 (28 32) 2 ]
0 ( h) h2 2 c 0 c(1 e a )
2 2
h0
(4.2.14)
h0
3a
式中:c0和c意义与前相同,a也不是变程。当h
h
时, e a 1 e 3 0.95 1 ,即 ( 3a) c0 c ,因此高斯模型的 1 变程 a 约为 3a 。当 c0 0, c 1 时,称为标准高斯函数 模型。
1 N (h) ( h) [ Z ( x i ) Z ( x i h)] 2 (4.2.10) 2 N (h) i 1
这样对不同的空间分隔距离h,计算出相 c 应的 c(h)和 (h) 值。如果分别以h为横坐标,(h)或
(h) 为纵坐标,画出协方差函数和变异函数曲
线图,就可以直接展示区域化变量Z(x)的空间 变异特点。可见,变异函数能同时描述区域化 变量的随机性和结构性,从而在数学上对区域 化变量进行严格分析,是空间变异规律分析和 空间结构分析的有效工具。
(38 35) 2 (35 37 ) 2 (40 43) 2 (43 37 ) 2 (36 35) 2 (42 42) 2
2 (42 35)2 (35 35)2 35 35) (40 39)2 (39 38)2 (38 37 )2 (
一、地统计方法的基本原理
(一)区域化变量
当一个变量呈现为空间分布时,就称之为 区域化变量(regionalized variable)。这种变量 常常反映某种空间现象的特征,用区域化变量 来描述的现象称之为区域化现象。 区域化变量,亦称区域化随机变量,G. Matheron(1963)将它定义为以空间点x的三个 直角坐标为自变量的随机场 Z x Z ( xu , xv , xw ) 。 区域化变量具有两个最显著,而且也是最 重要的特征,即随机性和结构性。
(二)协方差函数
协方差函数的概念
区域化随机变量之间的差异,可以用空间协方差来表示。 在概率论中,随机向量X与Y的协方差被定义为
cov( x, y) E[( x Ex)( y Ey)]
(4.2.1)
区域化变量在空间点x和x+h处的两个随机变量和的二阶 混合中心矩定义为Z(x)的自协方差函数,即
(4.2.13)
式中: c0 和 c 意义与前相同,但 a 不是变程。 当h=3α 时, e 1 e 0.95 1,即 (3a) c0 c ,从而 1 指数模型的变程 a 约为 3a 。当c0=0,c=1时,称 为标准指数模型。
h a 3
④高斯模型:其一般公式为
①纯块金效应模型:其一般公式为
0 ( h) c0 h0 h0
(4.2.11)
式中:c0>0,为先验方差。该模型相当 于区域化变量为随机分布,样本点间的协方 差函数对于所有距离h均等于0,变量的空间 相关不存在。
②球状模型:其一般公式为
0 3h h3 (h) c0 c( 3 ) 2a 2a c0 c h0 0ha ha
=385/72=5.35
同样计算出
(2) 9.26 (3) 17.55
(h) (h)
(4) 25.69 (5) 22.90
最后,得到南北方向和西北—东南方向上 的变异函数计算结果见下表。同样可以计算东
西方向上的变异函数。
方向
h N(h)
1 36 5.3 5 2 27 9.2 6 3 21 17.55
变异函数的理论模型
地统计学将变异函数理论模型分为3大类: 第1类是有基台值模型,包括球状模型、指 数模型、高斯模型、线性有基台值模型和纯块金 效应模型; 第2类是无基台值模型,包括幂函数模型、 线性无基台值模型、抛物线模型; 第3类是孔穴效应模型。
下面有代表性地介绍几种常见的变异函数理 论模型。
(4.2.8)
(4.2.9)
变异函数的性质
设Z(x)是区域化变量,在满足二阶平稳 假设条件下,变异函数式具有如下性质: (1) (0) =0,即在h=0处,变异函数为0;
(2) (h) = (h) ,即 (h) 关于直线h=0是 对称的,它是一个偶函数; (3) (h)≥0,即 (h) 只能大于或等于0;
(4.2.12)
式中:c0 为块金(效应)常数;c为拱 高;c0+c为基台值;a为变程。当c0=0,c=1时, 称为标准球状模型。球状模型是地统计分析 中应用最广泛的理论模型,许多区域化变量 的理论模型都可以用该模型去拟合。
③指数模型:其一般公式为
0 ( h) h c 0 c(1 e a ) h0 h0
上述3个参数可从变异函数曲线图直接 得到,或通过估计曲线回归参数得到。 第4个参数,即分维数用于表示变异函 数的特性,由变异函数 (h)和间隔距离h之间 的关系确定
2 (h) h ( 42 D )
分维数D为双对数直线回归方程中的斜 率,它是一个无量纲数。分维数D的大小, 表示变异函数曲线的曲率,可以作为随机变 异的量度。但该随机分维数D与形状分维数 有本质的不同。
1 Z ( xiBaidu Nhomakorabea) N
Z (x )
i 1 i
N
(4.2.4)
i
1 Z ( xi h) N
Z ( x h)
i 1
N
(4.2.5)
若 Z ( xi ) = 以改写为
Z ( x i h)
=m(常数),则上式可
(4.2.6)
1 N (h) c ( h) [ Z ( x i ) Z ( x i h)] m 2 N (h) i 1
式中:m为样本平均数,可由一般算术平 均数公式求得,即
1 m N
Z (x )
i 1 i
n
(三)变异函数
变异函数的概念
变异函数variograms),又称变差函 数、变异矩,是地统计分析所特有的基本 工具。 在一维条件下变异函数定义为,当空 间点x在一维x轴上变化时,区域化变量Z(x) 在点x和x+h处的值Z(x)与Z(x+h)差的方差的 一半为区域化变量Z(x)在x轴方向上的变异 函数,记为γ(h),即
图4.2.2 缺失值情况下样本数对的组成和计算过程 ☉为缺失值
首先计算南北方向上的变异函数值,由变 异函数的计算公式可得
(1)
1 [( 40 42)2 (42 37 )2 (37 35)2 (35 36)2 (36 38)2 (37 38)2 2 36
(4)|h|→∞时, (h) →c(0)或 () =c(0),即 当空间距离增大时,变异函数接近先验方差
1 N c(0) [ Z ( xi )]2 m 2 N (h) i 1
(5)[- (h) ]必须是一个条件非负定函数, 由[- ( xi x j ) ]构成的变异函数矩阵在条件 n i 0 时,为非负定的。
当变异函数随着间隔距离h的增大,从非零值达到 一个相对稳定的常数时,该常数称为基台值C0+C。 当间隔距离h=0时,γ (0)= C0,该值称为块金值或 块金方差(nugget variance)。 基台值是系统或系统属性中最大的变异,变异函 数达到基台值时的间隔距离a称为变程。变程表示在 h≥a以后,区域化变量Z(x)空间相关性消失。 块金值表示区域化变量在小于抽样尺度时非连续 变异,由区域化变量的属性或测量误差决定。
例如:假设某地区降水量Z(x)(单位: mm)是二维区域化随机变量,满足二 阶平稳假设,其观测值的空间正方形网 格数据如图4.2.1所示(点与点之间的距 离为h=1 km)。试计算其南北方向及西 北和东南方向的变异函数。
图4.2.1 空间正方形网格数据(点间距h=1 km)
从图4.2.1可以看出,空间上有些点,由 于某种原因没有采集到。如果没有缺失值, 可直接对正方形网格数据结构计算变异函数; 在有缺失值的情况下,也可以计算变异函数。 只要“跳过”缺失点位置即可(图4.2.2)。
南北
4 13 25.69 5 5 22.90
方向
h N(h)
1.4 1 32 7.0 6
西北—东南
2.82 21 12.95 4.24 13 30.85 5.65 8 58.13 7.07 2 50.0 0
(h)
(h)
变异函数的参数
变异函数有4个非常重要的参数,即基台 值(sill)、变程(range)或称空间依赖范围 ( range of spatial dependence ) 、 块 金 值 ( nugget ) 或 称 区 域 不 连 续 性 值 ( localized discontinuity)和分维数(fractal dimension)。 前3个参数可以直接从变异函数图中得到。 它们决定变异函数的形状与结构。 变异函数的形状反映自然现象空间分布结 构或空间相关的类型,同时还能给出这种空间 相关的范围。