空间统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间集聚。 当Moran’s I 为显著的负值时,存在显著的负相关,相似的观测值趋于分散分布。
当Moran’s I 接近期望值(-1/(n-1),随着样本数量的增大,该值趋于0)时,
表明不存在空间自相关,观测值在空间上随机排列,满足经典统计分析所要求的独 立、随机分布假设。
Байду номын сангаас
29
随机检验(Permutation test)
(the Second Law of Geography)。
13
基本分析方法/分析指标
空间权重矩阵
空间权重矩阵是对空间邻接关系的定义,是空间统计分析运算的基础 之一。
全局空间自相关 局部空间自相关
14
空间权重矩阵
空间权重矩阵(spatial weight matrix)
对空间邻居(spatial neighborhood)或邻接关系的描述,通常定义一个二 元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系。 目前对于空间权重指标的构建,主要基于两类特征:连通性(Continuity) 和距离(Distance)。此外,还可以通过面积、可达度等方式对空间权重指 标进行构建。
通常约定,一个空间单元与其自身不属于邻居关系,即矩阵中主对角线上元素值为0。
18
在实际应用中,一般根据以下两种规则定义邻居: 公共边界 如果第i和第j个空间单元具有公共边界,则认为它们是邻居,空间权重矩阵中 的元素为1;否则,不是邻居,元素为0。 距离 如果第i和第j个空间单元之间的距离位于给定的临界距离d之内,则认为它们 是邻居,空间权重矩阵中的元素为1;否则,不是邻居,元素为0。 Cliff-Ord广义空间权重矩阵
3 4 4
1 2
3 2 3
3.1 -4.39
-2.09 0.46 -3.06
I=0.0317. If this value is close to 0 there is very little spatial autocorrelation, which is what we have found in this example
i
n
( ( xi x ) 2 ) 2
i
n
其他符号同上。
28
通常将Moran’s I 解释为一个相关系数,取值范围从-1到+1。0< I <1表示正的 空间自相关,I = 0表示不存在空间自相关,-1< I <0表示负的空间自相关。
当Moran’s I 显著为正时,存在显著的正相关,相似的观测值(高值或低值)趋于
wij bij dij
其中dij是i和j之间的距离,bij是i和j之间的公共边界占i周长的比例。
19
20
全局空间自相关统计指数
空间自相关度量的意义 发现空间分布模式 如何度量?
(a) 空间集聚(空间相似)
(b) 空间间隔(空间相异)
(c) 空间随机
21
全局空间自相关(global spatial autocorrelation)
地理学第一定律
地球表面上的事物或现象之间存在着某种联系,并以相似或差 异的方式表现出来。 Tobler(1970) “地理学第一定律”描述了这样性质:“所有的 事物或现象在空间上都是有联系的,但相距近的事物或现象之间
的联系一般较相距远的事物或现象间的联系要紧密”。
在空间统计学中,相似事物或现象在空间上集聚(集中)的性 质称之为空间自相关(Spatial autocorrelation)。空间上的相关性 或关联性(Spatial associatiaon)是自然界存在秩序与格局的原因 之一(Goodchild 1986)。
式中
S 0 wij
i j
n
n
n
n
1 n n S1 ( wij w ji ) 2 2 i j
S 2 ( wi wi ) 2
i
n
wi wij 和 wi w ji 分别是空间权重矩阵 W 的第 i 行和第 i 列元素之和
j 1
j 1
27
在随机分布假设下,Moran’s I 的期望值和方差分别表示为:
30
Geary’s C
Geary’s C 也是一种较常用的空间自相关统计量,其结果解释类似于Moran’s I (Cliff and Ord 1981)。其形式为:
n 1 C 2S0
w ( x
i 1 j 1 n ij i 1
n
n
i
x j )2
( xi x ) 2
对该统计量的统计推断也是根据相应的标准化Z值。
通过在正态或随机两种分布假设下得到I的期望值和方差来分别进行假设检验。 26
在正态分布假设下,Moran’s I 的期望值和方差分别为:
En ( I )
1 (n 1)
2 n 2 S1 nS2 3S 0 2 VARn ( I ) En ( I ) 2 S 0 ( n 2 1)
主要描述整个研究区域上空间对象之间的关联程度,以表明空间对象之间是
否存在显著的空间分布模式。
(Cliff and Ord, 1981) 全局空间自相关分析主要采用全局空间自相关统计量(如Moran’s I、 Geary’s C、General G)进行度量。
22
全局空间自相关统计指数
Moran’s I
24
+4.55
+5.54
+2.24
+3.10
-5.15
-4.39 +0.46
+9.02
-2.09 -3.06
Tabulated lattice data
x 1 1 2 2 2 y 2 3 1 2 3 z 4.55 5.54 2.24 -5.15 9.02
Adjacency matrix, W
3 3
7
(A)
(B)
(C) I =-1.000 I =-0.393
(D)
(E)
I =0.000
I =+0.393
I =+0.857
空间模式的量化
8
专题三 空间统计分析
9
空间统计分析
空间统计分析,即空间数据(spatial data)的统计分析,
是现代计量地理学中一个快速发展的方向和领域。 空间统计分析,其核心是认识与地理位置相关的数据间的 空间依赖、空间关联或空间自相关,通过空间位置建立数据 间的统计关系。
Moran’s I 统计量是一种应用非常广泛的空间自相关统计量,它的具体形式如 下(Cliff and Ord,1981):
I
n S0
w
i j 1
n
n
ij
( xi x )( x j x )
i
( x
i
n
x)2
1 n 其中,xi 表示第 i 个空间位置上的观测值, x n xi ,wij是空间权重矩阵W i 1
地理学第一定律
在地理学中,每一个空间位置上的事物(现象)都具有区别于 其他位置上的事物(现象)的特点,这种差异性被称为空间异质 性(Spatial heterogeneity)(Anselin 1988)。
与地理学第一定律所描述的空间依赖性相对应,Goodchild
(2003)将空间异质性总结为“地理学第二定律”。 Goodchild在2003年的UCGIS年会上做了一场题为“地理信息科 学基本定律(The Fundamental Laws of GIScience)”的报告。在 该报告中,Goodchild将“空间异质性”概括为地理学第二定律
25
Moran’s I 的检验
对观测值在空间上不存在空间自相关(或独立、随机分布)这一原假设进 行检验时,一般根据标准化以后的Moran’s I 值或 z 值,即:
I E( I ) ZI VAR( I )
在统计推断的过程中,通常需要对变量x的分布做出假设。
一般分两种情况:一是假设变量 x 服从正态分布;二是在分布未知的情况下, 用随机化方法得到 x 的近似分布。
16
空间权重矩阵(spatial weight matrix)
基于距离特征的空间权重指标,又可以称为空间距离指标。 空间距离指标选择空间对象间的距离(如反距离、反距离平方值、距离负指 数等)定义权重矩阵。 如Cliff和Ord曾提出的Cliff-Ord空间权重指标,即是将距离作为指标定义的 一部分。
wij [dij ]a [ij ]b
,i = 1,2,…,n;j = 1,2,…,n
其中,dij为空间对象间的距离,βij为空间对象共享边界的长度,a、b为两类距
离的权重调整系数。
17
空间权重矩阵(spatial weight matrix)
空间数据集中不同实体单元间存在不同程度的空间关系,在实际使用中,一 般通过矩阵形式给出空间逐点的空间权重指标,称为空间权重矩阵。
的观测值通过函数f表达,i∈S,S是所有空间单元的集合。
5
•空间依赖性的产生原因
空间相互作用 测量误差
6
•空间异质性(Spatial Heterogeneity)
yi f i ( xi , i , i )
i代表空间观测单元,fi表示因变量yi与自变量xi、参数向量i和误差项i之 间具体的函数关系。
15
空间权重矩阵(spatial weight matrix)
基于连通性特征的空间权重指标,又可以称为空间邻接指标。 三种基本的空间邻接定义方式:考虑横纵方向邻接关系的“卒”型、考虑对 角线方向邻接关系的“象”型以及综合考虑上述方向的“后”型。 空间邻接影响不仅仅局限于两个单元的相邻,一个空间单元还可通过相邻单 元对外围非相邻单元产生影响,对于这类影响可以通过设定空间二阶乃至高阶 邻接指标进行表达。
ER (I )
1 (n 1)
n((n 2 3n 3) S1 nS2 3S 02 ) b2 ((n 2 n) S1 2nS2 6 S 02 ) VARR ( I ) S 02 (n 1)(n 2)(n 3)
2 ER (I )
式中
b2
n ( xi x ) 4
3
空间数据很少符合正态分布
位置信息非常重要 依赖(Dependence)是一种规律(rule) 空间相互作用、空间外部性、空间溢出等 空间尺度非常重要
4
•空间依赖性(Spatial Dependence)
yi f ( y1 , y2 ,, y N )
变量Y在第i个空间单元上的观测值由该空间系统中其他空间单元上
w11 w W 21 ... wn1
w12 w22 ... wn 2
... w1n ... w2 n ... ... ... wnn
W是一个nn的正定矩阵,矩阵的每一行指定了一个空间单元的“邻居集合”。 一般地,面状观测值用连通性指标:若面状单元i和j相邻,则wij=1;否则,wij=0。 点状观测值用距离指标:若点i和j之间的距离在阈值d以内,则wij=1;否则, wij=0。
(n×n)的元素,表示了空间单元之间的拓扑关系,S0 是空间权重矩阵W的所有 元素之和。
反映的是空间邻接或空间邻近的区域单元属性值的相似程度。
23
用矩阵形式表示如下:
n X 'WX I S0 X ' X
其中,X 是 xi 与其均值的离差向量(n×1),W 是(n×n)的空间权重矩阵,S0 含义同上。
在不存在空间自相关的假设下,观测值x1,…,xn可被认为是观测值被随机分配到n个 空间位置上的一次随机过程。当观测值为n时,可能的空间组合次数为n!,这n!次 随机排列构成观测值在原假设条件下的分布。根据这一分布,可以得到统计量的
期望值和方差。
蒙特卡罗检验( Monte Carlo test )
当n比较大时,这些观测值的随机排列的组合数非常大。通常情况下是利用k个随 机数生成方法来构建一个经验的原始分布。 当k=99时,可以满足5%显著性水平下 的检验;当k=999次,可以满足1%显著性水平的检验。k值越大,经验分布越接近 原假设下的分布状态。可以根据这种经验分布来检验一个观测值的出现是否为 “小概率事件”,从而判断是拒绝还是接受原假设。
地图分析与应用 Map Analysis and Applications
李飞雪
南京大学地理信息科学系
0
2
0 2
3 3
0 3
3 2
2 3
0 3
3
3
2 0
3 3
2 3
3 0
3 2
3 0
3 2
0 3
3
3
0
2
3 0
3 2
3 0
2 3
3 3
2 0
数据概括相同,空间模式不同
2
数据分析的缺点
以经典统计理论为基础 标准正态分布 缺失位置信息
相关文档
最新文档