空间统计-空间自相关分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间自相关分析
1.1 自相关分析
空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。
空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。
1.1.1 全局空间自相关分析
全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。
Moran's I 系数公式如下:
11
2
11
1
()()I ()()n n
ij i j i j n n
n
ij i i j i n w x x x x w x x =====--=
-∑∑∑∑∑(式 错误!文档中没有指定样式的文字。-1)
其中,n 表示研究对象空间的区域数;i x 表示第i 个区域内的属性值,j x 表示第j 个区域内的属性值,x 表示所研究区域的属性值的平均值;ij w 表示空间权重矩阵,一般为对称矩阵。
Moran's I 的Z-score 得分检验为:
Z =
式 错误!文档中没有指定样式的文字。-2)
当|Z|>1.96,p<0.05时,拒绝无效假设,认为总体Moran's I ≠0,存在空间自相关。Moran's I 系数的取值为[-1,1]。当其取值大于0时,表明所研究区域存在空间正相关,且取值越接近1,表明空间正自相关性越强,研究对象呈聚集分布;当其取值小于0时,表明所研究区域存在空间负相关,取值越接近-1,表明空间负自相关性越强,研究对象呈均匀分布;当其取值接近于0,研究对象呈随机分布,不存在自相关性。 1.1.2 局部空间自相关分析
全局空间自相关分析所针对的是研究区域整体上的空间相关性。除此之外,研究区域不同局部的空间相关性可能各有各自的特征。这些特征的分析与比较,需要通过局部空间自相关分析来实现。局部空间自相关主要用局部Moran's I 系数(LISA-- local indicators of spatial autocorrelation)和局部Getis 系数(G i )来反映属性变量在局部区域范围内的空间聚集程度。
局部空间Moran's I 系数提供了每个空间单元相关性的判定,对于第i 个区域单元来说,Moran's I 的LISA 定义如下:
2
1
(),i n
i i ij j
j x x
I w x
x j S
=-=-≠∑且(式 错误!文档中没有指定样式的文字。-3)
其中,n 表示研究对象空间的区域数,i x 表示第i 个区域内的属性值,j x 表示第j 个区域内的属性值,x 表示所研究区域的属性值的平均值,
2
2
11()n i i S x x n ==-∑,1
1n i i x x n ==∑,ij w 为空间权重矩阵。
同样利用 Z-score 得分检验对Moran's I 的 LISA 统计量进行假设检验,即:
Z =
(式 错误!文档中没有指定样式的文字。-4)
当|Z|>1.96时,p<0.05,拒绝无效假设,认为Moran's I i ≠0,存在局部空间自相关。
LISA 系数用于解释疾病空间是否存在聚集性。LISA >0时表明局部空间单元与相邻空间单元之间存在空间正相关性,表现为“高-高”或“低-低”聚集,
LISA <0时表明局部空间单元与相邻空间单元之间存在空间负相关性,表现为“低-高”或“高-低” 聚集。
Getis 系数(i G )用于探测疾病空间聚集性的“热点”或“冷点”区域。局部Getis 系数(*i G )定义为:
**n
ij j
i i w x
w x
G -=
∑(式 错误!文档中没有指定样式的文字。-5)
其中,j x 代表空间区域内的属性值,s 代表标准差,ij w 为空间权重。
*
1
n
i ij j w w ==∑,211
n
i ij j s w ==∑.
*0i G >时表示聚集区域为高值区即发病的热点区域,*0i G <时表示聚集区
域为低值区即发病的冷点区域,i G 接近或等于零时表明该区域没有发生聚集。
【案例4-3】
利用OpenGeoDa ,对湖南省某疾病的发病率(模拟数据)进行空间自相关性分析,探索该疾病在湖南省的空间相关程度。本节所用的数据为湖南省矢量地图、湖南省某疾病数据,部分数据如表 错误!文档中没有指定样式的文字。-1所示,表 错误!文档中没有指定样式的文字。-2为表 错误!文档中没有指定样式的文字。-1的字段变量说明。
表 错误!文档中没有指定样式的文字。-1湖南省某疾病发病率(部分数据)
CNTY_CODE NAME Tpopu NUM RATE 430102 芙蓉区 53.92 24 0.445103858 430103 天心区 48.74 8 0.164136233 430104 岳麓区 81.89 82 1.001343265 430105 开福区 59.5 8 0.134453782 430111 雨花区 75.5 28 0.370860927 430122 望城区 56.21 4 0.071161715 430121 长沙县 103.78 5 0.04817884 430124 宁乡县 121.84 10 0.082074852 430181 浏阳市 129.77 154 1.186714957 430202
荷塘区
30.83
38
1.232565683