第四章+空间统计分析初步
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甘肃农业大学资源与环境学院
一、基本原理与方法
www.gsau.edu.cn
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n 个位置的空间区域的邻近关系,其形式如下
w11 w12 w1n
W
w21
w22
w2n
wn1
wn2
wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可
能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
❖ 1854年8月到9月英国伦敦霍乱 流行时,当局始终找不到发病的 原因,后来医生约翰·斯诺 (John Snow) 参与调查。
❖ 他在绘有霍乱流行地区所有道路、 房屋、饮用水机井等内容的1: 6500比例尺地图上,标出了每 个霍乱病死者的居住位置,得到 了霍乱病死者居住分布图。
霍乱病死者居住分布图(J甘o肃h农n业S大no学w资,源1与8环54境)学院
第1节 探索性空间统计分析
Leabharlann Baidu
www.gsau.edu.cn
➢基本原理与方法 ➢应用实例
✓ 并且,对应于Moran散点图的不同象限,可识别出空间分布中 存在着哪几种不同的实体。
✓ 将Moran散点图与LISA显著性水平相结合,也可以得到所谓的 “Moran显著性水平图”,图中显示出显著的LISA区域,并分 别标识出对应于Moran散点图中不同象限的相应区域。
甘肃农业大学资源与环境学院
二、应用实例
✓
局部Moran指数检验的标准化统计量为
Z(Ii )
Ii E(Ii ) VAR(Ii )
甘肃农业大学资源与环境学院
www.gsau.edu.cn
G统计量
❖ 全局G统计量的计算公式为
G
wij xi x j /
xi x j
ij
ij
❖ 对每一个区域单元的统计量为
Gi wij x j / x j
www.gsau.edu.cn
中国大陆30个省级行政区人均GDP的空间关联分析。根据各省 (直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵, 选取各省(直辖市、自治区)1998—2002年人均GDP的自然对数, 依照公式计算全局Moran指数I,计算其检验的标准化统计量Z (I),结果如下表所示。
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
甘肃农业大学资源与环境学院
空间统计的基本思想:
www.gsau.edu.cn
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).
i
j
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓ 对统计量的检验与局部Moran指数相似,其检验值为
Z
(Gi
)
Gi E(Gi ) VAR(Gi )
✓ 显著的正值表示在该区域单元周围,高观测值的区域单 元趋于空间集聚,而显著的负值表示低观测值的区域单元趋 于空间集聚,与Moran指数只能发现相似值(正关联)或非相似 性观测值(负关联)的空间集聚模式相比,具有能够探测出区 域单元属于高值集聚还是低值集聚的空间分布模式。
当Z值为零时,观测值呈独立随机分布。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
❖ G系数探测高值聚集的能力强于低值聚集; ❖ 当研究范围内同时存在高值和低值聚集时,G系数会
受聚集区域规模的影响,当高值聚集区域和低值聚集 区域规模相当时,G系数往往为正数,表明G系数对高 值敏感; ❖ Moran指数主要受聚集区域规模的影响,随着空间 聚集范围的扩展,Moran指数会明显增大。
Tobler, W. R. (1970). "A computer movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
甘肃农业大学资源与环境学院
www.gsau.edu.cn
探索性空间数据分析(ESDA)
ESDA是指利用统计学原理和图形图表相结合 对空间信息的性质进行分析、鉴别,用以引 导确定性模型的结构和解法。
ESDA与EDA区别在于它考虑了数据的空间特 性,在方法上它将数据分解为一般趋势和叠 加于其上的局部变化两部分。然后用一定的 数学函数去拟合由样本点产生的经验变率函 数,进行诸如克立格内插等空间操作。
甘肃农业大学资源与环境学院
Moran散点图
www.gsau.edu.cn
以(Wz,z)为坐标点的Moran散点图,常来研究局部的 空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视 化的二维图示。
全局Moran指数,可以看作是Wz对于z的线性回归系数, 对界外值以及对Moran指数具有强烈影响的区域单元,可通 过标准回归来诊断出。
空间数据分析与传统统计分析主要有两大差异:
(1)空间数据间并非独立,而是在维空间中具有某种空间相关 性,且在不同的空间分辨率下呈现不同之相关程度;
(2)地球只有一个,大多数空间问题仅有一组(空间分布不规 则的)观测值,而无重复观测数据。因此,空间现象的了 解与描述是极为复杂的,而传统方法,尤其是建立在独立 样本上的统计方法,不适合分析空间数据。
由于数据对(Wz,z)经过了标准化,因此界外值可易由 2-sigma规则可视化地识别出来。
甘肃农业大学资源与环境学院
Moran散点图的4个象限, 分别对应于区域单元与其邻居 之间4种类型的局部空间联系 形式:
第1象限代表了高观测值的 区域单元被高值的区域所包围 的空间联系形式;
第2象限代表了低观测值的 区域单元被高值的区域所包围 的空间联系形式;
如果是位置(区域)的观测值,则该变量的全局Moran指
数I,用如下公式计算
n n
n
wij xi x x j x
I i1 j1
nn
n
wij xi x 2
i1 j1
i 1
nn
wij (xi x)(x j x)
i1 ji
nn
S 2
wij
i1 ji
式中: I 为Moran指数;
如果地理学从根本上值得研究,必然是 因为地理现象在空间上的变化不是随机 的。 经典统计:随机
甘肃农业大学资源与环境学院
为什么要用空间统计
www.gsau.edu.cn
➢ 可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么
样”,更想知道“哪里怎么样”
➢ 空间统计学可以帮助我们准确地判断具体地理模 式的原因。
S 2 1
n
i
(xi x)2 ;
x
1 n
n i 1
xi
。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓
Geary 系数C计算公式如下
n n
n 1
wij xi x j 2
C
i1 j1
nn
n
2 wij xi x2
i1 j1
i 1
式中:C为Geary系数;其他变量同上式。
n
wij zi z j
i1 j1
n
z T Wz
S0
n
(xi x)2
S0
n
zi2
S0 zT z
i 1
i 1
Moran指数I的取值一般在[-1,1]之间,小于0表示负相 关,等于0表示不相关,大于0表示正相关;
Geary系数C的取值一般在[0,2]之间,大于1表示负 相关,等于1表示不相关,而小于1表示正相关。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
两种最常用的确定空间权重矩阵的规则
①简单的二进制邻接矩阵
1 当区域i和j相邻接
wij 0
其他
②基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时
wij 0
其他
甘肃农业大学资源与环境学院
www.gsau.edu.cn
(二)全局空间自相关
✓ Moran指数和Geary系数是两个用来度量空间 自相关的全局指标。 ✓ Moran指数反映的是空间邻接
或空间邻近的区域单元属性值 的相似程度。 ✓ Geary 系数与Moran指数存在 负相关关系。
Patrick A.P.Moran (1917-1988)
甘肃农业大学资源与环境学院
www.gsau.edu.cn
第四章 空间统计分析
甘肃农业大学 资源与环境学院
本章主要内容
www.gsau.edu.cn
➢第一节 探索性空间统计分析 ➢第二节 地统计分析方法
甘肃农业大学资源与环境学院
空间统计分析
www.gsau.edu.cn
✓ 空间统计分析,即空间数据(spatial data)的统 计分析,是现代计量地理学中一个快速发展的方向 和领域。
✓
如果引入记号
nn
S0
wij
i1 j 1
z j (xj x)
zi (xi x)
zT [z1, z2 ,, zn ]
甘肃农业大学资源与环境学院
www.gsau.edu.cn
则全局Moran指数I的计算公式也可以进一步写成
nn
nn
I n
wij (xi x)(x j x)
i1 j1
甘肃农业大学资源与环境学院
www.gsau.edu.cn
对于Moran指数,可以用标准化统计量Z来检验n个区域是否存 在空间自相关关系,Z的计算公式为
Z I E(I) VAR(I )
当Z值为正且显著时,表明存在正的空间自相关,也就是说相似 的观测值(高值或低值)趋于空间集聚;
当Z值为负且显著时,表明存在负的空间自相关,相似的观测值 趋于分散分布;
✓ 空间统计分析,其核心就是认识与地理位置相关的 数据间的空间依赖、空间关联或空间自相关,通过 空间位置建立数据间的统计关系。
✓ 空间统计分析的任务,就是运用有关统计方法,建 立空间统计模型,从凌乱的数据中挖掘空间自相关 与空间变异规律。
甘肃农业大学资源与环境学院
空间统计 VS. 经典统计
www.gsau.edu.cn
http://en.wikipedia.org/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
甘肃农业大学资源与环境学院
www.gsau.edu.cn
空间自相关是普遍存在的,否则地理分 析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所要求的样 本独立性假设不满足。
甘肃农业大学资源与环境学院
(三)局部空间自相关
www.gsau.edu.cn
局部空间自相关分析方法包括3种: 空间联系的局部指标(LISA); G统计量; Moran散点图。
甘肃农业大学资源与环境学院
空间联系的局部指标(LISA)
www.gsau.edu.cn
空 间 联 系 的 局 部 指 标 ( local indicators of spatial association ,缩写为LISA)满足下列两个条件:
www.gsau.edu.cn
甘肃农业大学资源与环境学院
第3象限代表了低观测值 的区域单元被低值的区域所 包围的空间联系形式;
第4象限代表了高观测值 的区域单元被低值的区域所 包围的空间联系形式。
www.gsau.edu.cn
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓ 与局部Moran指数相比,其重要的优势在于能够进一步具体区 分区域单元和其邻居之间属于高值和高值、低值和低值、高值和 低值、低值和高值之中的哪种空间联系形式。
(1)每个区域单元的LISA,是描述该区域单元周围 显著的相似值区域单元之间空间集聚程度的指标;
(2)所有区域单元LISA的总和与全局的空间联系指 标成比例。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
LISA包括局部Moran指数(local Moran index) 和局部Geary指数(local Geary index),下面重 点介绍和讨论局部Moran指数。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓
局部Moran指数被定义为
可进一步写成
I
i
(xi S2
x)
j
wij (x j x)
n(xi x) wij (x j x) nzi wij z j
I i
j
(xi x)2
j
zT z
zi wij zj
j
i
式中:zi 和 z j是经过标准差标准化的观测值。
一、基本原理与方法
www.gsau.edu.cn
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n 个位置的空间区域的邻近关系,其形式如下
w11 w12 w1n
W
w21
w22
w2n
wn1
wn2
wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可
能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
❖ 1854年8月到9月英国伦敦霍乱 流行时,当局始终找不到发病的 原因,后来医生约翰·斯诺 (John Snow) 参与调查。
❖ 他在绘有霍乱流行地区所有道路、 房屋、饮用水机井等内容的1: 6500比例尺地图上,标出了每 个霍乱病死者的居住位置,得到 了霍乱病死者居住分布图。
霍乱病死者居住分布图(J甘o肃h农n业S大no学w资,源1与8环54境)学院
第1节 探索性空间统计分析
Leabharlann Baidu
www.gsau.edu.cn
➢基本原理与方法 ➢应用实例
✓ 并且,对应于Moran散点图的不同象限,可识别出空间分布中 存在着哪几种不同的实体。
✓ 将Moran散点图与LISA显著性水平相结合,也可以得到所谓的 “Moran显著性水平图”,图中显示出显著的LISA区域,并分 别标识出对应于Moran散点图中不同象限的相应区域。
甘肃农业大学资源与环境学院
二、应用实例
✓
局部Moran指数检验的标准化统计量为
Z(Ii )
Ii E(Ii ) VAR(Ii )
甘肃农业大学资源与环境学院
www.gsau.edu.cn
G统计量
❖ 全局G统计量的计算公式为
G
wij xi x j /
xi x j
ij
ij
❖ 对每一个区域单元的统计量为
Gi wij x j / x j
www.gsau.edu.cn
中国大陆30个省级行政区人均GDP的空间关联分析。根据各省 (直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵, 选取各省(直辖市、自治区)1998—2002年人均GDP的自然对数, 依照公式计算全局Moran指数I,计算其检验的标准化统计量Z (I),结果如下表所示。
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
甘肃农业大学资源与环境学院
空间统计的基本思想:
www.gsau.edu.cn
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).
i
j
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓ 对统计量的检验与局部Moran指数相似,其检验值为
Z
(Gi
)
Gi E(Gi ) VAR(Gi )
✓ 显著的正值表示在该区域单元周围,高观测值的区域单 元趋于空间集聚,而显著的负值表示低观测值的区域单元趋 于空间集聚,与Moran指数只能发现相似值(正关联)或非相似 性观测值(负关联)的空间集聚模式相比,具有能够探测出区 域单元属于高值集聚还是低值集聚的空间分布模式。
当Z值为零时,观测值呈独立随机分布。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
❖ G系数探测高值聚集的能力强于低值聚集; ❖ 当研究范围内同时存在高值和低值聚集时,G系数会
受聚集区域规模的影响,当高值聚集区域和低值聚集 区域规模相当时,G系数往往为正数,表明G系数对高 值敏感; ❖ Moran指数主要受聚集区域规模的影响,随着空间 聚集范围的扩展,Moran指数会明显增大。
Tobler, W. R. (1970). "A computer movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
甘肃农业大学资源与环境学院
www.gsau.edu.cn
探索性空间数据分析(ESDA)
ESDA是指利用统计学原理和图形图表相结合 对空间信息的性质进行分析、鉴别,用以引 导确定性模型的结构和解法。
ESDA与EDA区别在于它考虑了数据的空间特 性,在方法上它将数据分解为一般趋势和叠 加于其上的局部变化两部分。然后用一定的 数学函数去拟合由样本点产生的经验变率函 数,进行诸如克立格内插等空间操作。
甘肃农业大学资源与环境学院
Moran散点图
www.gsau.edu.cn
以(Wz,z)为坐标点的Moran散点图,常来研究局部的 空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视 化的二维图示。
全局Moran指数,可以看作是Wz对于z的线性回归系数, 对界外值以及对Moran指数具有强烈影响的区域单元,可通 过标准回归来诊断出。
空间数据分析与传统统计分析主要有两大差异:
(1)空间数据间并非独立,而是在维空间中具有某种空间相关 性,且在不同的空间分辨率下呈现不同之相关程度;
(2)地球只有一个,大多数空间问题仅有一组(空间分布不规 则的)观测值,而无重复观测数据。因此,空间现象的了 解与描述是极为复杂的,而传统方法,尤其是建立在独立 样本上的统计方法,不适合分析空间数据。
由于数据对(Wz,z)经过了标准化,因此界外值可易由 2-sigma规则可视化地识别出来。
甘肃农业大学资源与环境学院
Moran散点图的4个象限, 分别对应于区域单元与其邻居 之间4种类型的局部空间联系 形式:
第1象限代表了高观测值的 区域单元被高值的区域所包围 的空间联系形式;
第2象限代表了低观测值的 区域单元被高值的区域所包围 的空间联系形式;
如果是位置(区域)的观测值,则该变量的全局Moran指
数I,用如下公式计算
n n
n
wij xi x x j x
I i1 j1
nn
n
wij xi x 2
i1 j1
i 1
nn
wij (xi x)(x j x)
i1 ji
nn
S 2
wij
i1 ji
式中: I 为Moran指数;
如果地理学从根本上值得研究,必然是 因为地理现象在空间上的变化不是随机 的。 经典统计:随机
甘肃农业大学资源与环境学院
为什么要用空间统计
www.gsau.edu.cn
➢ 可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么
样”,更想知道“哪里怎么样”
➢ 空间统计学可以帮助我们准确地判断具体地理模 式的原因。
S 2 1
n
i
(xi x)2 ;
x
1 n
n i 1
xi
。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓
Geary 系数C计算公式如下
n n
n 1
wij xi x j 2
C
i1 j1
nn
n
2 wij xi x2
i1 j1
i 1
式中:C为Geary系数;其他变量同上式。
n
wij zi z j
i1 j1
n
z T Wz
S0
n
(xi x)2
S0
n
zi2
S0 zT z
i 1
i 1
Moran指数I的取值一般在[-1,1]之间,小于0表示负相 关,等于0表示不相关,大于0表示正相关;
Geary系数C的取值一般在[0,2]之间,大于1表示负 相关,等于1表示不相关,而小于1表示正相关。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
两种最常用的确定空间权重矩阵的规则
①简单的二进制邻接矩阵
1 当区域i和j相邻接
wij 0
其他
②基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时
wij 0
其他
甘肃农业大学资源与环境学院
www.gsau.edu.cn
(二)全局空间自相关
✓ Moran指数和Geary系数是两个用来度量空间 自相关的全局指标。 ✓ Moran指数反映的是空间邻接
或空间邻近的区域单元属性值 的相似程度。 ✓ Geary 系数与Moran指数存在 负相关关系。
Patrick A.P.Moran (1917-1988)
甘肃农业大学资源与环境学院
www.gsau.edu.cn
第四章 空间统计分析
甘肃农业大学 资源与环境学院
本章主要内容
www.gsau.edu.cn
➢第一节 探索性空间统计分析 ➢第二节 地统计分析方法
甘肃农业大学资源与环境学院
空间统计分析
www.gsau.edu.cn
✓ 空间统计分析,即空间数据(spatial data)的统 计分析,是现代计量地理学中一个快速发展的方向 和领域。
✓
如果引入记号
nn
S0
wij
i1 j 1
z j (xj x)
zi (xi x)
zT [z1, z2 ,, zn ]
甘肃农业大学资源与环境学院
www.gsau.edu.cn
则全局Moran指数I的计算公式也可以进一步写成
nn
nn
I n
wij (xi x)(x j x)
i1 j1
甘肃农业大学资源与环境学院
www.gsau.edu.cn
对于Moran指数,可以用标准化统计量Z来检验n个区域是否存 在空间自相关关系,Z的计算公式为
Z I E(I) VAR(I )
当Z值为正且显著时,表明存在正的空间自相关,也就是说相似 的观测值(高值或低值)趋于空间集聚;
当Z值为负且显著时,表明存在负的空间自相关,相似的观测值 趋于分散分布;
✓ 空间统计分析,其核心就是认识与地理位置相关的 数据间的空间依赖、空间关联或空间自相关,通过 空间位置建立数据间的统计关系。
✓ 空间统计分析的任务,就是运用有关统计方法,建 立空间统计模型,从凌乱的数据中挖掘空间自相关 与空间变异规律。
甘肃农业大学资源与环境学院
空间统计 VS. 经典统计
www.gsau.edu.cn
http://en.wikipedia.org/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
甘肃农业大学资源与环境学院
www.gsau.edu.cn
空间自相关是普遍存在的,否则地理分 析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所要求的样 本独立性假设不满足。
甘肃农业大学资源与环境学院
(三)局部空间自相关
www.gsau.edu.cn
局部空间自相关分析方法包括3种: 空间联系的局部指标(LISA); G统计量; Moran散点图。
甘肃农业大学资源与环境学院
空间联系的局部指标(LISA)
www.gsau.edu.cn
空 间 联 系 的 局 部 指 标 ( local indicators of spatial association ,缩写为LISA)满足下列两个条件:
www.gsau.edu.cn
甘肃农业大学资源与环境学院
第3象限代表了低观测值 的区域单元被低值的区域所 包围的空间联系形式;
第4象限代表了高观测值 的区域单元被低值的区域所 包围的空间联系形式。
www.gsau.edu.cn
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓ 与局部Moran指数相比,其重要的优势在于能够进一步具体区 分区域单元和其邻居之间属于高值和高值、低值和低值、高值和 低值、低值和高值之中的哪种空间联系形式。
(1)每个区域单元的LISA,是描述该区域单元周围 显著的相似值区域单元之间空间集聚程度的指标;
(2)所有区域单元LISA的总和与全局的空间联系指 标成比例。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
LISA包括局部Moran指数(local Moran index) 和局部Geary指数(local Geary index),下面重 点介绍和讨论局部Moran指数。
甘肃农业大学资源与环境学院
www.gsau.edu.cn
✓
局部Moran指数被定义为
可进一步写成
I
i
(xi S2
x)
j
wij (x j x)
n(xi x) wij (x j x) nzi wij z j
I i
j
(xi x)2
j
zT z
zi wij zj
j
i
式中:zi 和 z j是经过标准差标准化的观测值。