空间统计学第六章终
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 因此,式(6.4)可改写为 γ(x,h)=1/2*E[Z(x)—Z(x+h)]2
(6.5)
• 从式(6.5)可知,变异函数依赖于x和h,当变异函数仅 依赖于h,与x无关时,变异函数γ(x,h)可改写成γ(h), 即 (6.6) γ(h)= 1/2*E[Z(x)—Z(X+h)]2 • 此时,以h为横坐标,以γ(h)=为纵坐标做出的图形就叫 变异函数图。
• 由于区域化变量具有以上特点,应有一种函数来 描述它,既能兼顾到区域化变量的随机性又能反映 其结构性。 • 为此,法国统计学家Matheron G在20世纪60年代提 出了空间协方差和变异函数。尤其是变异函数能同 时描述区域化变量的随机性和结构性,为从数学上 严格地分析区域化变量提供了有力工具。
这种假设要求的条件太强,一般不易达到且不好 验证,在实际中不采用这种假设,常采用另一种 弱平稳假设,或称为二阶平稳假设。
• 当区域化变量满足下列两个条件时,称该区域化变 量满足二阶平稳: ① 在整个研究区内,区域化变量Z(x)的数学期望 对任意x存在且等于常数,即E[Z(x)]=m(常数), 任意x。 ② 在整个研究区内,区域化变量的空间协方差函 数对任意x和h存在且平稳(只依赖步长h,与x无 关),用式子表达,即
Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]-m2=C(h),任意x,h
当h=0时,上式变为C(0)=Var[Z(x)],说明方差函数也存在 且为常数。
• 二阶平稳假设是假定协方差存在,但是要求变异函 数存在比要求协方差函数存在的条件要弱些。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的 期望值,另外一个也大于自身的期望值,那么两个变量之间的协方 差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另 外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。 如果X与Y是统计独立的,那么二者之间的协方差就是0。
的寄生物可能是病源。
空间统计学可以帮助我们处理大的复杂数 据集, 这是GIS经常面对的事情。
Contents
一
二 区域化变量理论 空间自相关 变异函数及结构分析
三 四
克里格估计方法
一、区域化变量理论
• 基本概念
Z x2 , Z ( x1 ,(x ,x2 , , x,nx,n )) 为定义在 {X , X , X }上 随机函数:称 1, 的一个随机函数,若对任意 (样本空间)都 有一个函数 Z ( x1 , x2 , xn ) 与之对应,且当 x1 , x2 , xn 固定时,函数 Z ( x1 , x2 ,, xn , ) 为一随机变量。
协方差函数 协方差表示的是两个变量总体误差的方差
随机过程Z(t)在时间t1和t2处的随机变量Z(t1)、 Z(t2)的二阶混合中心矩定义为随机过程的协方差函 数记为Cov{Z(t1),Z(t2)},即
Cov{Z(t1),Z(t2)}=E[Z(t1)—EZ(t1)][Z(t2)—EZ(t2)]
(6.1)
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种 空间相关性,且在不同的空间分辨率下呈现不同 之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间 分布不规则的)观测值,而无重复观测数据。因 此,空间现象的了解与描述是极为复杂的,而传 统方法,尤其是建立在独立样本上的统计方法, 不适合分析空间数据。
They are exploratory tools that help you measure spatial processes, spatial distributions, and spatial relationships. There are a lot of different types of spatial statistics, but they are all designed to examine spatial patterns and processes.
• 区域化变量是一种在空间上具有数值的实 函数,它具有以下属性:
各向异性 连续性 空间局限性
区域化变量被 限制于一定空 间范围,这称 为几何域。在 几何域内,区 域化变量的属 性最为明显; 在几何域外, 不明显。
不同的区域 化变量具有 不同程度的 连续性,用 相邻样点之 间的变异函 数来描述。
当区域化变 量在各个方 向上具有相 同性质时称 各向同性, 否则称为各 向异性。
• 空间统计学
空间统计学主要是以区域化变量理论为基础, 以变异函数为基本工具来研究那些分布于空间 中并呈现出一定结构性(空间分布上有一定程 度的相关性或连续性)和随机性的自然现象的 科学。
• 经典统计学
经典统计是以概率论为基础的一门研究随机现 象统计规律的应用数学学科。
空间统计 VS. 经典统计
Z ( x1 , x2 , xn ) Z ( x1 , x2 ,, xn , )
x1 , x2 , xn
区域化变量: 以空间点X的直角坐标Xu,Xv,Xw 为自变量的随机场Z(Xu,Xv,Xw)=Z(X),称为 一个区域化变量。
区域化变量功能
区域化变量的两重性表现在当空间点X 固定之后,Z(X)是一个随机变量,这就 体现了其随机性;另外在空间中两个不 同点X与X+h处得区域化变量值具有某种 程度的相关性,这就体现了其结构性的 一面。
空间统计分析方法由分析空间变异与结构 的半变异函数和用以空间局部估计的克立 格插值法两个主要部分组成,是GIS(地理 信息系统)空间分析的一个重要技术手段。
空间统计
Spatial StatiHale Waihona Puke Baidutics
Spatial Statistics = Spatial Data + Statistics
Definition: A distinction may be made between spatial statistics and statistics in general. The most obvious difference is that spatial statistics are used to analyze data which have a spatial location. Spatial statistics give explicit consideration to spatial properties such as location, spatial patterns, spatial arrangement, distance, etc. This spatial dimension tends to make spatial statistics more complex than ordinary nonspatial statistics.
http://en.wikipedia.org/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则 地理分析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所 要求的样本独立性假设不满足。
如果地理学从根本上值得研究, 必然是因为地理现象在空间上的 变化不是随机的。 经典统计:随机
LOGO
空间统计学分析
Identifying “Hot”
肯塔基河
坎伯兰郡
• 空间统计分析方法由来
由于空间现象之间存在不同方向、不同距 离成分等相互作用,使得传统的数理统计 方法无法很好地解决空间样本点的选取、 空间估值和两组以上空间数据的关系等问 题,因此,空间统计分析方法应运而生。
• 空间统计分析方法组成
• 如果Z(x)是定义在二维、三维空间中的区域化变量,则x 是二维、三维空间中的点,h是二维、三维空间中的向量。 这是,就要考虑二维、三维变异函数了。
• 根据数理统计可知,要估计变异函数值,就要估 计数学期望E[Z(x)—Z(X+h)]2 ,而这又必须有若 干对Z(x)和Z(x+h)的值,才可通过求的平均数的 办法来估计上述的数学期望。 • 但遗憾的是在实际工作中只能得到一对这样的数 值,因为人们不能恰在空间同一点上重复取得二 个样品,这就在统计推断上发生了困难。 • 为了克服这一困难,就需要对Z(x)做一些假设, 常用的是二阶平稳假设和内蕴(本征)假设。
为什么要用空间统计 (Why ) 一句话:尽可能地利用已知信息。
为什么要用空间统计
可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道
问题“怎么样”,更想知道“哪里怎么样”
空间统计学可以帮助我们准确地判断具体 地理模式的原因。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中
γ(x,h)=1/2*Var[Z(x)—Z(x+h)]2
=1/2*E[Z(x)—Z(x+h)]2—1/2*{E[Z(x)]—E[Z(x+h)]}2
(6.4)
• 在实际的空间统计学研究中,多要做些假设。通 常是做二阶平稳假设或做内蕴假设(后面详细 讲),在这两种假设下均有 E[Z(x+h)]=E[Z(x)]
(Tobler,1970).
Tobler, W. R. (1970). "A computer movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
1 2 n
t 随机过程:当随机函数中只有一个自变量x1 (时 间)时,称为随机过程,记为 Z (t , ) 或Z(t) 。随 机过程是与时间有关的随机函数。
随机场:当随机函数Z依赖于2个或2个以上自 变量时,称该随机函数为随机场。最常用的是 有3个自变量Xu,Xv,Xw(空间点X的3个直角坐标) Z ( x1Z(Xu,Xv,Xw) , x2 , , xn , ) 。 的随机场,记为
二、空间统计 VS. 经典统计
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
空间统计的基本思想:
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things
类似地,当Z(x)是个区域化变量时,在空间 点x和x+h处的两个随机变量Z(x)和Z(x+h)的 二阶混合中心矩定义为区域化变量Z(x)的自 协方差函数,即
Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]—E[Z(x)]E[Z(x+h)] (6.2)
区域化变量Z(x)的自协方差函数亦称为协方 差函数,一般地,协方差函数依赖于空间点 x和向量h。当h=0时,协方差函数变为
• 平稳性假设及内蕴假设
• (1)平稳性假设
设某一随机函数Z(x),其空间分布律不因平移而改变,即 若对任一向量h,关系式 F(z1,z2,…,x1,x2,…)=F(z1,z2,…,x1+h,x2+h,…) 成立时,则该随机函数为平稳性随机函数。 确切的说,无论位移向量h多大,两个k维向量的随机变量 {Z(x1),Z(x2),…,Z(xk)}和 {Z(x1+h),Z(x2+h),…,Z(xk+h)}有相同的分布律。
Cov[Z(x),Z(x+0)]=E[Z(x)]2—{E[Z(x)]}2 (6.3)
• (半)变异函数
首先就一维的情况来定义变异函数。设区域化变量 Z(x)定义在一维数轴x上,我们把区域变量Z(x)在点 x和x+h处的值Z(x)与Z(x+h)差的方差一半定义为区 域变量Z(x)在x轴上的变异函数,记为γ(x,h),即
(6.5)
• 从式(6.5)可知,变异函数依赖于x和h,当变异函数仅 依赖于h,与x无关时,变异函数γ(x,h)可改写成γ(h), 即 (6.6) γ(h)= 1/2*E[Z(x)—Z(X+h)]2 • 此时,以h为横坐标,以γ(h)=为纵坐标做出的图形就叫 变异函数图。
• 由于区域化变量具有以上特点,应有一种函数来 描述它,既能兼顾到区域化变量的随机性又能反映 其结构性。 • 为此,法国统计学家Matheron G在20世纪60年代提 出了空间协方差和变异函数。尤其是变异函数能同 时描述区域化变量的随机性和结构性,为从数学上 严格地分析区域化变量提供了有力工具。
这种假设要求的条件太强,一般不易达到且不好 验证,在实际中不采用这种假设,常采用另一种 弱平稳假设,或称为二阶平稳假设。
• 当区域化变量满足下列两个条件时,称该区域化变 量满足二阶平稳: ① 在整个研究区内,区域化变量Z(x)的数学期望 对任意x存在且等于常数,即E[Z(x)]=m(常数), 任意x。 ② 在整个研究区内,区域化变量的空间协方差函 数对任意x和h存在且平稳(只依赖步长h,与x无 关),用式子表达,即
Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]-m2=C(h),任意x,h
当h=0时,上式变为C(0)=Var[Z(x)],说明方差函数也存在 且为常数。
• 二阶平稳假设是假定协方差存在,但是要求变异函 数存在比要求协方差函数存在的条件要弱些。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的 期望值,另外一个也大于自身的期望值,那么两个变量之间的协方 差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另 外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。 如果X与Y是统计独立的,那么二者之间的协方差就是0。
的寄生物可能是病源。
空间统计学可以帮助我们处理大的复杂数 据集, 这是GIS经常面对的事情。
Contents
一
二 区域化变量理论 空间自相关 变异函数及结构分析
三 四
克里格估计方法
一、区域化变量理论
• 基本概念
Z x2 , Z ( x1 ,(x ,x2 , , x,nx,n )) 为定义在 {X , X , X }上 随机函数:称 1, 的一个随机函数,若对任意 (样本空间)都 有一个函数 Z ( x1 , x2 , xn ) 与之对应,且当 x1 , x2 , xn 固定时,函数 Z ( x1 , x2 ,, xn , ) 为一随机变量。
协方差函数 协方差表示的是两个变量总体误差的方差
随机过程Z(t)在时间t1和t2处的随机变量Z(t1)、 Z(t2)的二阶混合中心矩定义为随机过程的协方差函 数记为Cov{Z(t1),Z(t2)},即
Cov{Z(t1),Z(t2)}=E[Z(t1)—EZ(t1)][Z(t2)—EZ(t2)]
(6.1)
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种 空间相关性,且在不同的空间分辨率下呈现不同 之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间 分布不规则的)观测值,而无重复观测数据。因 此,空间现象的了解与描述是极为复杂的,而传 统方法,尤其是建立在独立样本上的统计方法, 不适合分析空间数据。
They are exploratory tools that help you measure spatial processes, spatial distributions, and spatial relationships. There are a lot of different types of spatial statistics, but they are all designed to examine spatial patterns and processes.
• 区域化变量是一种在空间上具有数值的实 函数,它具有以下属性:
各向异性 连续性 空间局限性
区域化变量被 限制于一定空 间范围,这称 为几何域。在 几何域内,区 域化变量的属 性最为明显; 在几何域外, 不明显。
不同的区域 化变量具有 不同程度的 连续性,用 相邻样点之 间的变异函 数来描述。
当区域化变 量在各个方 向上具有相 同性质时称 各向同性, 否则称为各 向异性。
• 空间统计学
空间统计学主要是以区域化变量理论为基础, 以变异函数为基本工具来研究那些分布于空间 中并呈现出一定结构性(空间分布上有一定程 度的相关性或连续性)和随机性的自然现象的 科学。
• 经典统计学
经典统计是以概率论为基础的一门研究随机现 象统计规律的应用数学学科。
空间统计 VS. 经典统计
Z ( x1 , x2 , xn ) Z ( x1 , x2 ,, xn , )
x1 , x2 , xn
区域化变量: 以空间点X的直角坐标Xu,Xv,Xw 为自变量的随机场Z(Xu,Xv,Xw)=Z(X),称为 一个区域化变量。
区域化变量功能
区域化变量的两重性表现在当空间点X 固定之后,Z(X)是一个随机变量,这就 体现了其随机性;另外在空间中两个不 同点X与X+h处得区域化变量值具有某种 程度的相关性,这就体现了其结构性的 一面。
空间统计分析方法由分析空间变异与结构 的半变异函数和用以空间局部估计的克立 格插值法两个主要部分组成,是GIS(地理 信息系统)空间分析的一个重要技术手段。
空间统计
Spatial StatiHale Waihona Puke Baidutics
Spatial Statistics = Spatial Data + Statistics
Definition: A distinction may be made between spatial statistics and statistics in general. The most obvious difference is that spatial statistics are used to analyze data which have a spatial location. Spatial statistics give explicit consideration to spatial properties such as location, spatial patterns, spatial arrangement, distance, etc. This spatial dimension tends to make spatial statistics more complex than ordinary nonspatial statistics.
http://en.wikipedia.org/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则 地理分析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所 要求的样本独立性假设不满足。
如果地理学从根本上值得研究, 必然是因为地理现象在空间上的 变化不是随机的。 经典统计:随机
LOGO
空间统计学分析
Identifying “Hot”
肯塔基河
坎伯兰郡
• 空间统计分析方法由来
由于空间现象之间存在不同方向、不同距 离成分等相互作用,使得传统的数理统计 方法无法很好地解决空间样本点的选取、 空间估值和两组以上空间数据的关系等问 题,因此,空间统计分析方法应运而生。
• 空间统计分析方法组成
• 如果Z(x)是定义在二维、三维空间中的区域化变量,则x 是二维、三维空间中的点,h是二维、三维空间中的向量。 这是,就要考虑二维、三维变异函数了。
• 根据数理统计可知,要估计变异函数值,就要估 计数学期望E[Z(x)—Z(X+h)]2 ,而这又必须有若 干对Z(x)和Z(x+h)的值,才可通过求的平均数的 办法来估计上述的数学期望。 • 但遗憾的是在实际工作中只能得到一对这样的数 值,因为人们不能恰在空间同一点上重复取得二 个样品,这就在统计推断上发生了困难。 • 为了克服这一困难,就需要对Z(x)做一些假设, 常用的是二阶平稳假设和内蕴(本征)假设。
为什么要用空间统计 (Why ) 一句话:尽可能地利用已知信息。
为什么要用空间统计
可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道
问题“怎么样”,更想知道“哪里怎么样”
空间统计学可以帮助我们准确地判断具体 地理模式的原因。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中
γ(x,h)=1/2*Var[Z(x)—Z(x+h)]2
=1/2*E[Z(x)—Z(x+h)]2—1/2*{E[Z(x)]—E[Z(x+h)]}2
(6.4)
• 在实际的空间统计学研究中,多要做些假设。通 常是做二阶平稳假设或做内蕴假设(后面详细 讲),在这两种假设下均有 E[Z(x+h)]=E[Z(x)]
(Tobler,1970).
Tobler, W. R. (1970). "A computer movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
1 2 n
t 随机过程:当随机函数中只有一个自变量x1 (时 间)时,称为随机过程,记为 Z (t , ) 或Z(t) 。随 机过程是与时间有关的随机函数。
随机场:当随机函数Z依赖于2个或2个以上自 变量时,称该随机函数为随机场。最常用的是 有3个自变量Xu,Xv,Xw(空间点X的3个直角坐标) Z ( x1Z(Xu,Xv,Xw) , x2 , , xn , ) 。 的随机场,记为
二、空间统计 VS. 经典统计
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
空间统计的基本思想:
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things
类似地,当Z(x)是个区域化变量时,在空间 点x和x+h处的两个随机变量Z(x)和Z(x+h)的 二阶混合中心矩定义为区域化变量Z(x)的自 协方差函数,即
Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]—E[Z(x)]E[Z(x+h)] (6.2)
区域化变量Z(x)的自协方差函数亦称为协方 差函数,一般地,协方差函数依赖于空间点 x和向量h。当h=0时,协方差函数变为
• 平稳性假设及内蕴假设
• (1)平稳性假设
设某一随机函数Z(x),其空间分布律不因平移而改变,即 若对任一向量h,关系式 F(z1,z2,…,x1,x2,…)=F(z1,z2,…,x1+h,x2+h,…) 成立时,则该随机函数为平稳性随机函数。 确切的说,无论位移向量h多大,两个k维向量的随机变量 {Z(x1),Z(x2),…,Z(xk)}和 {Z(x1+h),Z(x2+h),…,Z(xk+h)}有相同的分布律。
Cov[Z(x),Z(x+0)]=E[Z(x)]2—{E[Z(x)]}2 (6.3)
• (半)变异函数
首先就一维的情况来定义变异函数。设区域化变量 Z(x)定义在一维数轴x上,我们把区域变量Z(x)在点 x和x+h处的值Z(x)与Z(x+h)差的方差一半定义为区 域变量Z(x)在x轴上的变异函数,记为γ(x,h),即