第九讲地统计分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基础知识
地统计(Geostatistics)又称地质统计,是在法国著 名统计学家 G. Matheron 大量理论研究的基础上 逐渐形成的一门新的统计学分支。它是以区域化 变量为基础,借助变异函数,研究既具有随机性 又具有结构性,或空间相关性和依赖性的自然现 象的一门科学。 凡是与空间数据的结构性和随机性,或空间相关性 和依赖性,或空间格局与变异有关的研究,并对 这些数据进行最优无偏内插估计,或模拟这些数 据的离散性、波动性时,皆可应用地统计学的理 论与方法。 地统计分析的核心就是通过对采样数据的分析、对 采样区地理特征的认识选择合适的空间内插方法 1 创建表面。
3
区域化变量
当一个变量呈现一定的空间分布时,称之为区 域化变量,它反映了区域内的某种特征或现象。 区域化变量与一般的随机变量不同之处在于, 一般的随机变量取值符合一定的概率分布,而 区域化变量根据区域内位置的不同而取不同的 值。而当区域化变量在区域内确定位置取值时, 表现为一般的随机变量,也就是说,它是与位 置有关的随机变量。 区域化变量具有两个显著特征:即随机性和结 构性。
(一)协方差函数
协方差函数的概念
区域化随机变量之间的差异,可以用空间协方差来表示。 在概率论中,随机向量X与Y的协方差被定义为
cov( x, y) E[(x Ex)( y Ey)]
(4.2.1)
E(.)为期望值. 区域化变量在空间点x和x+h处的两个随机变量 和的二阶混合中心矩定义为Z(x)的自协方差函数,即
前提假设
随机过程 地统计学认为研究区域中的所有样本值都是随 机过程的结果,即所有样本值都不是相互独 立的,它们是遵循一定的内在规律的。因此 地统计学就是要揭示这种内在规律,并进行 预测。 正态分布 若不符合正态分布的假设,应对数据进行变换, 转为符合正态分布的形式,并尽量选取可逆 的变换形式。
式中:m为样本平均数,可由一般算术平 均数公式求得,即
1 m N
Z (x )
i 1 i
n
(二)变异函数
变异函数的概念
变异函数variograms),又称变差函 数、变异矩,是地统计分析所特有的基本 工具。 在一维条件下变异函数定义为,当空 间点x在一维x轴上变化时,区域化变量Z(x) 在点x和x+h处的值Z(x)与Z(x+h)差的方差的 一半为区域化变量Z(x)在x轴方向上的变异 函数,记为γ(h),即
Z ( xi ) 式中:h为两样本点空间分隔距离或距离滞后; 为 Z ( x) 在空间位置 x i 处的实测值;Z ( xi h) 是 Z ( x) 在 x i 处距离偏离h的实测值[i=1,2,…, N ( h) ],N ( h) 是分隔 距离为h时的样本点对(paris)总数, Z ( xi )和 Z ( xi h) 分别为 Z ( xi ) 和 Z ( xi h) 的样本平均数,即
Z ( x) Z ( xu , xv , xw )
Cov[Z ( x), Z ( x h)] E[Z ( x)Z ( x h)] E[Z ( x)]E[Z ( x h)]
(4.2.2)
协方差函数的计算公式
1 N (h) c(h) [ Z ( xi ) Z ( xi )][Z ( xi h) Z ( xi h)](4.2.3) N (h) i 1
2
平稳性
包括两种平稳性:一类是均值平稳;另一类是与协方差 函数有关的二阶平稳和与半变异函数有关的内蕴平稳。 均值平稳,即假设均值是不变的并且与位置无关; 二阶平稳是假设具有相同的距离和方向的任意两点的 协方差是相同的,协方差只与这两点的值相关而 与它们的位置无关; 内蕴平稳假设是指具有相同距离和方向的任意两点的 方差(即变异函数)是相同的。二阶平稳和内蕴 平稳都是为了获得基本重复规律而作的基本假设, 通过协方差函数和变异函数可以进行预测和估计 预测结果的不确定性。
E[Z ( x h)] E[Z ( x)]
因此,公式可以改写为
( x, h )
从上式可知,变异函数依赖于两个自变量 x和 h ,当变异函数 ( x, h) 仅仅依赖于距离 h 而与位置x无关时, ( x, h) 可改写成 (h) ,即
1 (h) E[ Z ( x) Z ( x h)] 2 2
1 Z ( xi ) N
Z (x )
i 1 i
N
(4.2.4)
i
1 Z ( xi h) N
ห้องสมุดไป่ตู้
Z ( x h)
i 1
N
(4.2.5)
若 Z ( xi ) = 以改写为
Z ( xi h)
=m(常数),则上式可
(4.2.6)
1 N ( h) 2 c(h) [ Z ( x ) Z ( x h )] m i i N (h) i 1
1 E[ Z ( x) Z ( x h)] 2 2
(4.2.8)
(4.2.9)
变异函数的性质
设Z(x)是区域化变量,在满足二阶平稳 假设条件下,变异函数式具有如下性质: (1) (0) =0,即在h=0处,变异函数为0;
(2) (h) = (h) ,即 (h) 关于直线 h=0 是 对称的,它是一个偶函数; (3) (h)≥0,即 (h) 只能大于或等于0;
( x, h) Var [ Z ( x) Z ( x h)]
1 方差等于平方均值减去均值的平方 2 1 1 E[ Z ( x) Z ( x h)] 2 {E[ Z ( x)] E[ Z ( x h)]} 2 2 2
(4.2.7)
在二阶平稳假设条件下,对任意的h有
4
地统计学是以区域化变量理论为基础, 以变异函数为主要工具,研究那些在空间 分布上既有随机性又有结构性,或空间相 关和依赖性的自然现象的科学。 协方差函数和变异函数是以区域化变 量理论为基础建立起来的地统计学的两个 最基本的函数。地统计学的主要方法之一, 克立格法就是建立在变异函数理论和结构 分析基础之上的。
地统计(Geostatistics)又称地质统计,是在法国著 名统计学家 G. Matheron 大量理论研究的基础上 逐渐形成的一门新的统计学分支。它是以区域化 变量为基础,借助变异函数,研究既具有随机性 又具有结构性,或空间相关性和依赖性的自然现 象的一门科学。 凡是与空间数据的结构性和随机性,或空间相关性 和依赖性,或空间格局与变异有关的研究,并对 这些数据进行最优无偏内插估计,或模拟这些数 据的离散性、波动性时,皆可应用地统计学的理 论与方法。 地统计分析的核心就是通过对采样数据的分析、对 采样区地理特征的认识选择合适的空间内插方法 1 创建表面。
3
区域化变量
当一个变量呈现一定的空间分布时,称之为区 域化变量,它反映了区域内的某种特征或现象。 区域化变量与一般的随机变量不同之处在于, 一般的随机变量取值符合一定的概率分布,而 区域化变量根据区域内位置的不同而取不同的 值。而当区域化变量在区域内确定位置取值时, 表现为一般的随机变量,也就是说,它是与位 置有关的随机变量。 区域化变量具有两个显著特征:即随机性和结 构性。
(一)协方差函数
协方差函数的概念
区域化随机变量之间的差异,可以用空间协方差来表示。 在概率论中,随机向量X与Y的协方差被定义为
cov( x, y) E[(x Ex)( y Ey)]
(4.2.1)
E(.)为期望值. 区域化变量在空间点x和x+h处的两个随机变量 和的二阶混合中心矩定义为Z(x)的自协方差函数,即
前提假设
随机过程 地统计学认为研究区域中的所有样本值都是随 机过程的结果,即所有样本值都不是相互独 立的,它们是遵循一定的内在规律的。因此 地统计学就是要揭示这种内在规律,并进行 预测。 正态分布 若不符合正态分布的假设,应对数据进行变换, 转为符合正态分布的形式,并尽量选取可逆 的变换形式。
式中:m为样本平均数,可由一般算术平 均数公式求得,即
1 m N
Z (x )
i 1 i
n
(二)变异函数
变异函数的概念
变异函数variograms),又称变差函 数、变异矩,是地统计分析所特有的基本 工具。 在一维条件下变异函数定义为,当空 间点x在一维x轴上变化时,区域化变量Z(x) 在点x和x+h处的值Z(x)与Z(x+h)差的方差的 一半为区域化变量Z(x)在x轴方向上的变异 函数,记为γ(h),即
Z ( xi ) 式中:h为两样本点空间分隔距离或距离滞后; 为 Z ( x) 在空间位置 x i 处的实测值;Z ( xi h) 是 Z ( x) 在 x i 处距离偏离h的实测值[i=1,2,…, N ( h) ],N ( h) 是分隔 距离为h时的样本点对(paris)总数, Z ( xi )和 Z ( xi h) 分别为 Z ( xi ) 和 Z ( xi h) 的样本平均数,即
Z ( x) Z ( xu , xv , xw )
Cov[Z ( x), Z ( x h)] E[Z ( x)Z ( x h)] E[Z ( x)]E[Z ( x h)]
(4.2.2)
协方差函数的计算公式
1 N (h) c(h) [ Z ( xi ) Z ( xi )][Z ( xi h) Z ( xi h)](4.2.3) N (h) i 1
2
平稳性
包括两种平稳性:一类是均值平稳;另一类是与协方差 函数有关的二阶平稳和与半变异函数有关的内蕴平稳。 均值平稳,即假设均值是不变的并且与位置无关; 二阶平稳是假设具有相同的距离和方向的任意两点的 协方差是相同的,协方差只与这两点的值相关而 与它们的位置无关; 内蕴平稳假设是指具有相同距离和方向的任意两点的 方差(即变异函数)是相同的。二阶平稳和内蕴 平稳都是为了获得基本重复规律而作的基本假设, 通过协方差函数和变异函数可以进行预测和估计 预测结果的不确定性。
E[Z ( x h)] E[Z ( x)]
因此,公式可以改写为
( x, h )
从上式可知,变异函数依赖于两个自变量 x和 h ,当变异函数 ( x, h) 仅仅依赖于距离 h 而与位置x无关时, ( x, h) 可改写成 (h) ,即
1 (h) E[ Z ( x) Z ( x h)] 2 2
1 Z ( xi ) N
Z (x )
i 1 i
N
(4.2.4)
i
1 Z ( xi h) N
ห้องสมุดไป่ตู้
Z ( x h)
i 1
N
(4.2.5)
若 Z ( xi ) = 以改写为
Z ( xi h)
=m(常数),则上式可
(4.2.6)
1 N ( h) 2 c(h) [ Z ( x ) Z ( x h )] m i i N (h) i 1
1 E[ Z ( x) Z ( x h)] 2 2
(4.2.8)
(4.2.9)
变异函数的性质
设Z(x)是区域化变量,在满足二阶平稳 假设条件下,变异函数式具有如下性质: (1) (0) =0,即在h=0处,变异函数为0;
(2) (h) = (h) ,即 (h) 关于直线 h=0 是 对称的,它是一个偶函数; (3) (h)≥0,即 (h) 只能大于或等于0;
( x, h) Var [ Z ( x) Z ( x h)]
1 方差等于平方均值减去均值的平方 2 1 1 E[ Z ( x) Z ( x h)] 2 {E[ Z ( x)] E[ Z ( x h)]} 2 2 2
(4.2.7)
在二阶平稳假设条件下,对任意的h有
4
地统计学是以区域化变量理论为基础, 以变异函数为主要工具,研究那些在空间 分布上既有随机性又有结构性,或空间相 关和依赖性的自然现象的科学。 协方差函数和变异函数是以区域化变 量理论为基础建立起来的地统计学的两个 最基本的函数。地统计学的主要方法之一, 克立格法就是建立在变异函数理论和结构 分析基础之上的。