空间初步分析地统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18、空间统计分析初步
(1)空间统计分析:空间数据的统计分析,是现代计量地理学中一个快速发展的方向和领域。其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。
(2)两种最常用的确定空间权重矩阵的规则:①简单的二进制邻接矩阵 ②基于距离的二进制空间权重矩阵
(3)全局空间自相关:: Moran指数和Geary系数是两个用来度量空间自相关的全局指标。Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。Geary 系数与Moran指数存在负相关关系。
Moran指数I的取值一般在[-1,1]之间,小于0表示负相关,等于0表示不相关,大于0表示正相关;
Geary系数C的取值一般在[0,2]之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。
(4)局部空间自相关:局部空间自相关分析方法包括3种:空间联系的局部指标(LISA) ;G统计量 ; Moran散点图。
①空间联系的局部指标(LISA):空间联系的局部指标(local indicators of spatial association ,缩写为LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。LISA包括局部Moran指数和局部Geary指数。
②Moran散点图:以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2-sigma规则可视化地识别出来。
Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:第1象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第2象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第3象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式;第4象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。
与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。将Moran散点图与LISA显著性水平相结合,也可以得到所谓的“Moran显著
性水平图”,图中显示出显著的LISA
区域,并分别标识出对应于Moran散点图中不同象限的相应区域。
19、地统计分析方法
(1)地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。协方差函数和变异函数是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析基础之上的。
(2)基本原理:①区域化变量:当一个变量呈现为空间分布时,就称之为区域化变量。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为区域化现象。区域化变量,亦称区域化随机变量,G. Matheron(1963)将它定义为以空间点x的三个直角坐标为自变量的随机场。区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性
②协方差函数:区域化随机变量之间的差异,可以用空间协方差来表示。
③变异函数:又称变差函数、变异矩,是地统计分析所特有的基本工具。变异函数有4个非常重要的参数,即基台值、变程或称空间依赖范围、块金值或称区域不连续性值和分维数。前3个参数可以直接从变异函数图中得到。它们决定变异函数的形状与结构。变异函数的形状反映自然现象空间分布结构或空间相关的类型,同时还能给出这种空间相关的范围。
④克立格插值方法:又称空间局部估计或空间局部插值法,是地统计学的主要内容之一。克立格法是建立在变异函数理论及结构分析基础之上的,它是在有限区域内对区域化变量的取值进行无偏最优估计的一种方法。克立格法适用的条件是,如果变异函数和相关分析的结果表明区域化变量存在空间相关性。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。
克立格插值 是根据变异函数模型而发展起来的一系列地统计的空间插值方法,包括:普通克立格法;泛克立格法;指示克立格法;析取克立格法;协同克立格法等。
克立格插值的关键就是计算权重系数。显然,权重系数的求取必须满足两个条件:1.无偏性2.最优性
地统计学与经典统计学方法的区别:
1.经典统计学的研究变量必须为纯随机变量,而地统计学中的区域变量既有随机性又有结构性;
2.经典统计学研究变量理论上可以无限重复,或者可以进行大量的重复观测实测,而地统计学研究变量不能进行这样的重复实验,因为区域性变化取值的
唯一性
3.经典统计学每次抽样必须独立,而地统计学中两个相邻样本不一定保
持独立,具有一定的空间相关性;
4.经典统计学以频率分布为基础,地统计学除了掌握样本的统计特征外,还要研究区域化特征相关分布。
联系:它们都是在大量采样的基础上,通过对样本属性的频率的分布或均值方差关系以及相关分析,确定其空间分布及相关关系。