第四章 空间统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

探索性空间统计分析(Exploratory Spatial Data Analysis, ESDA),是指利用统计学原理和图形图 表相结合对空间信息的性质进行分析、 鉴别 ,用以 引导确定性模型的结构和解法。它实质上是一种“ 让数据说话” 的分析技术。 地统计(Geostatistics)又称地质统计,是法国著 名统计学家 G. Matheron在大量理论研究的基础上 逐渐形成的一门新的统计学分支。 它是以区域化变 量为基础, 借助变异函数,研究既具有随机性又具 有结构性,或具有空间相关性和依赖性的自然现象 的一门科学。
局部空间自相关分析方法包括 三种分析方法:
空间联系的局部指标(Local indicators of spatial association ,缩写为LISA): 局部 (Local) Moran I和局部Geary系数 G统计量 Moran散点图

1.空间联系的局部指标(LISA)
空间联系的局部指标(LISA)满足下列两个条件:
S0 Wij
i 1 j n n
S1 Wij Wji
i 1 j 1
n
n
2
2
4 n xi x n n 2 S3 Wi. W .i k i 1 2 i 1 n 2 xi x n Wi.为空间相临权重矩阵i 行 W.i为i 列 j 1
w ( x
j i ij n
n
n
i
x)( x j x)
n ij
i
x
2
S
2
w
i 1 j i

式中: I为Moran指数
1 2 S ( xi x ) n i 1 n x xi n i 1
2
I的期望值: E ( I) = - 1 / ( n - 1)随着样本 数 n的增大将逐渐趋于 0。 式 中, i、 j代表不同的空间 单元代号; n表示所有空间单 元的个数; x表示空间单元的 属性值;

如果xi是位置(区域)i的观测值,则该变量 所有相邻区域 的全局Moran指数I,用如下公式计算: 的协方差之和
I
x j x n wij xi x 所有相邻区域 i 1 i 1 j 1
n n
w x
i 1 j 1 ij i 1
n
n
n
的标准差之和
两种最常用的确定空间权重矩阵的规则:
(1)简单的二进制邻接矩阵
多边形邻接标准:两个空 间单元是否具有公共边或 公共点,前者定义为边相邻, 后者定义为角相邻。
究对象为中心,一定距离为 半径,将落入半径范围内的 (2)基于距离的二进制空间权重矩阵 研究对象定义为相邻。
1 当区域i和j相邻接 wij 其它 距离邻接标准:以某一研 0




(三)局部空间自相关

全局型指标能够判断出现象在空间上的整体 分布情况,但难以探测出聚集的位置所在及区 域相关的程度。忽略了空间过程的潜在不稳 定。到底是高高集聚还是低低集聚?哪个区 域单元对全局贡献更大?这就必须进行局部 空间自相关分析。局部指标用于反映整个大 区域中 ,一个局部小区域单元上的某属性值 与相邻局部小区域单元上同一属性值的相关 程度。
( xi x ) I i wij ( x j x ) 2 S j
I i n( xi x ) wij ( x j x )
=》

(x
i
j i
x)2
nzi wij z j
j
z z
T
z i wij z j
j
式中:其中

z j 和 z i 是经过标准差标准化的观测值。

Geary系数C的取值一般在0~2之间,大于1表示负相关, 等于1表示不相关,而小于1表示正相关。
对于Moran指数,计算结果可采用随机分布或近似
正态分布进行验证。可以用标准化统计量Z来检验n
个区域是否存在空间自相关关系,Z的计算公式为: 检验是否显著,可以通过查标准正态
分布表计算z的p值,再将它与显著性 I E ( I水平α进行比较。一般来说, ) Z │z│>1.96,则在0.05水平上显著; VAR( I ) │z│>1.64,则在0.1水平上显著。 当Z值为正且显著时,表明存在正的空间自相关,也就
w
i 1 j 1 n i 1
n
n
ij
zi z j
zi
2
n z T Wz S0 zT z

Moran指数I的取值一般在-1~1之间,大于0表示正相关即属性值高 的区域与属性值高的区域聚集在一起,属性值低的区域与属性值低 的区域聚集在一起。小于0表示负相关,等于0表示不相关;值越 趋近于1,总体空间差异越小。值越趋近于-1,总体空间差异越大。 当Moran I接近于-1/(n-1)时,观测值之间才相互独立,即属性的分 布呈无规律的随机分布状态。

(一)空间权重矩阵
通常定义一个二元对称空间权重矩阵W,来表
达n个位置的空间区域的邻近关系,其形式如下:
w11 w W 21 wn1 w12 w22 wn 2 w1n w2 n wnn
式中:Wij表示区域i与j的邻近关系。 权重的确定主要依据地理特征 ,如地区边界和 距离等 ,这样可以保证空间权重矩阵的外生性 。它可以根据多边形邻接标准或距离邻接标准 来度量。n表示n个区域单元。
Moran散点图的四个象限,分别对应于区域单元与其邻
居之间四种类型的局部空间联系形式:

第一象限代表了高观测值的区域单元被同是高值的 区域所包围的空间联系形式;
第二象限代表了低观测值的区域单元被高值的区域 所包围的空间联系形式; 第三象限代表了低观测值的区域单元被同是低值的 区域所包围的空间联系形式;
1 当区域i和j的距离小于d时 wij 其它 0
(二)全局空间自相关


Βιβλιοθήκη Baidu

衡量空间自相关的指标有Moran指数I、Geary系数C、 G统计量等,他们都有全局指标和局部指标两种。全 局空间关联指标用于探测某现象在整个研究区域的 空间分布模式,分析其是否有聚集特性存在。 Moran指数I是由 Moran于 1948年提出的 ,反映的是 空间邻接或空间邻近的区域单元属性值的相似程度。 Geary 系数与Moran指数存在负相关关系。 由于 Moran指数不能判断空间数据是高值聚集还是 低值聚集 , Getis和 Ord于 1992提出了全局 G系数。 G系数一般采用距离权 , 要求空间单元的属性值为正。
第四章 空间统计分析初步
探索性空间统计分析 地统计分析方法

引子





空间统计分析,即空间数据(Spatial Data)的统计分析, 是现代计量地理学中一个快速发展的方向领域。 空间统计分析,其核心就是认识与地理位置相关的数据间的 空间依赖、空间关联或空间自相关,通过空间位置建立数据 间的统计关系。 空间统计分析的任务就是运用统计分析方法,建立空间统计 模型,从凌乱的数据中挖掘空间自相关和空间变异规律。 在地球表面 ,每一个事物都 什么方法? 和其它事物相联系 ,而距离 经典统计方法的基本假设:样本独立 越近则它们的联系也越强。 地理学第一定律 地统计学理论与方法
i j
对统计量的检验与局部Moran指数相似,其检验
值为:
Z (Gi )
Gi E (Gi ) VAR(Gi )
显著的正值表示在该区域单元周围,高观测值的
区域单元趋于空间集聚,而显著的负值表示低观测 值的区域单元趋于空间集聚
与Moran指数只能发现相似值(正关联)或非相似
性观测值(负关联)的空间集聚模式相比(高高集聚 或者低低集聚),具有能够探测出区域单元属于高 值集聚还是低值集聚的空间分布模式。
Z (I i ) I i E(I i ) VAR( I i )
局部Moran指数检验的标准化统计量为:
2. G统计量

全局G统计量的计算公式为:
G wij xi x j / xi x j
i j i j

对每一个区域单元的统计量为:
Gi wij x j / x j
3.Moran散点图



以(Wz,z)为坐标点的Moran散点图,常来研 究局部的空间不稳定性,它对空间滞后因子Wz 和z数据对进行了可视化的二维图示。 全局Moran指数,可以看作是Wz对于z的线性回 归系数,对界外值以及对Moran指数具有强烈影 响的区域单元,可通过标准回归来诊断出。 由于数据对(Wz,z)经过了标准化,因此界外 值可易由2-sigma规则可视化地识别出来。

Geary 系数C计算公式如下:
C
n 1 wij xi x j 2
n n i 1 j 1 n
2 wij xi x
i 1 j 1 i 1
n
n
2
式中:C为Geary系数;其它变量同上式。
如果引入记号:
S 0 wij
i 1 j 1
n
n
z i ( xi x )
z T [ z1 , z 2 ,, z n ]
z j (x j x)

则全局Moran指数I的计算公式也可以进一步写成:
n I S0
w
i 1 j 1
n
n
ij
( xi x )( x j x )
( xi x ) 2
i 1
n
n S0
是说相似的观测值(高值或低值)趋于空间集聚;
当Z值为负且显著时,表明存在负的空间自相关,相似
的观测值趋于分散分布,如高值与低值的观测值集聚;
当Z值为零时,观测值呈独立随机分布。
对于Z的计算公式 式中:
E I
Z
I E(I ) VAR( I )
1 (n 1)
nn 2 3n 3S1 nS2 3S0 k n 2 n S1 2nS2 6S0 2 E I 2 VarI n 1n 2n 3S0 2



第四象限代表了高观测值的区域单元被低值的区域
所包围的空间联系形式。


与局部Moran指数相比,其重要的优势在于能 够进一步具体区分区域单元和其邻居之间属于 高值和高值、低值和低值、高值和低值、低值 和高值之中的哪种空间联系形式。 并且,对应于Moran散点图的不同象限,可识 别出空间分布中存在着哪几种不同的实体。 将Moran散点图与LISA显著性水平相结合,也 可以得到所谓的“Moran显著性水平图”,图 中显示出显著的LISA区域,并分别标识出对应 于Moran散点图中不同象限的相应区域。
(1)每个区域单元的LISA,是描述该区域单元
与其周围显著的相似值区域单元之间空间集聚程 度的指标;
(2)所有区域单元LISA的总和与全局的空间联
系指标成比例。 局部Moran指数(Local Moran)和局部Geary指 数(Local Geary)的定义可以满足这两个条件。

局部Moran指数被定义为:

第1节 探索性空间统计分析
一、基本原理与方法 (一)空间权重矩阵 (二)全局空间自相关 (三)局部空间自相关 二、应用实例 三、软件实现

一、基本原理与方法
空间自相关(Spatial autocorrelation)是指同一个变量在 不同空间位置上的相关性。目的在于检验空间单元与其 相邻的空间单元的属性间是否具相似性。 如何定义“相邻”?——空间权重矩阵 空间自相关分析可分以下 3个过程: 首先建立空间权重矩阵,以明确研究对象在空间位置上的 相互关系; 其次进行全局空间自相关分析,判断整个区域是否存在空 间自相关现象或集聚现象; 最后进行局部空间自相关分析,找出空间自相关现象存在 的局部区域。
二、应用实例
(一)中国大陆各省份人均GDP的空间关联分析
根据各省份之间的邻接关系,采用二进制邻接权
重矩阵,选取各省份1998—2002年人均GDP的自然 对数,依照公式计算全局Moran指数I,计算其检 验的标准化统计量Z(I),结果如表4.1.3所示。
年份 1998 1999 2000 2001 2002 I 0.5001 0.5069 0.5112 0.5059 0.5013 Z 4.5035 4.5551 4.5978 4.5532 4.5326 P 0.0000 0.0000 0.0000 0.0000 0.0000
相关文档
最新文档