GIS算法基础lecture4_空间自相关
空间自相关模型概念
空间自相关模型概念是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性
。空间自相关是事物和现象在空间上的相互依赖、相互制约、相互影响和相互作用,是事物和现象本身所固有的属性,是地理空间现象和空间过程的本质特征。
常见的空间自相关分析模型有全局自相关检验和局部自相关检验两种。全局自相关系数是用来验证整个研究区域的空间模式和度量属性值在整个区域空间上的分布态势或集聚状况,表示全局空间自相关的指标和方法很多,主要包括Global
Moran'sI指数和Geary指数。
空间相关性..知识讲解
“全局自相关 全局Moran指数 性分析指标” (最常用)
全局G指数
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
国外理论研究进展
1.最早起源于生物计量学研究。19世纪60年 代使用空间自相关研究生态学、遗传学等。 2.Could于1970年首次提出空间自相关的概念。
3.Moran(1950)将相关系数推广到二维空间并定 义了第一个度量空间相关性的方法——Moran指数。
4.Geary(1954)提出Geary系数概念,标志着空 间自相关分析方法的雏形形成。
国内理论研究进展
19世纪90年代引入
颜峰华(2006) 提出了多种尺度 分布的Getis空间 自相关统计方法 并验证了其能比 较全面的反应地 表特征参量分布 的空间信息。
朱士松、李满春( 2006)从矢量数据和 栅格数据两方面对名 义尺度的空间自相关 性进行研究提出了一 种测度名义尺度的空 间自相关指数——自 邻接指数,为空间数 据分析提供了新的思 路。
散布点图分析法的创生代表9moran散布点图分析法的创生代表着空间自相关理论的基本形成国内理论研究进展2006从矢量数据和栅格数据两方面对名义尺度的空间自相关性进行研究提出了一种测度名义尺度的空间自相关指数自邻接指数为空间数据分析提供了新的思张松林张昆2007基于模拟的空间区域研究发现了局部g系数优于局部moran指颜峰华2006提出了多种尺度分布的getis空间自相关统计方法较全面的反应地表特征参量分布的空间信息
空间统计-空间自相关分析
空间自相关分析
1.1 自相关分析
空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。
空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。
1.1.1 全局空间自相关分析
全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。
Moran's I 系数公式如下:
11
2
11
1
()()I ()()n n
ij i j i j n n
n
ij i i j i n w x x x x w x x =====--=
-∑∑∑∑∑(式 错误!文档中没有指定样式的文字。-1)
空间自相关
制作人: 学号: 专业:
空间自相关
全局空间自相关:检验空间邻接或空间邻近的区 域单元属性值空间相关性存在与否,空间统计学 上使用的统计量有Moran’s I、Geary’s C, Getis’G 等,其中常用的是Moran’s I。Moran指数I 的取值 一般在[-1,1],大于0表示各单元间存在空间正相 关,单元内的观察值有趋同趋势;小于0表示负相 关,单元内的观察值有不同的趋势;等于0表示不 相关,属于独立随机分布。
空间自相关
空间权重矩阵的选择:空间权重矩阵包含了区域 之间空间位置的依赖关系信息。可用相邻性指标 或距离指标来估计不同区域间的地理位置关系。 基于距离的空间权重矩阵需确定区域中心,因此 在目前我国ESDA应用领域最常见的是选择相邻权 重矩阵。
操作步骤
准备数据:福建省67个县市的shp图层; 2013年67县市人均GDP数据; 借助软件:Arcgis、Geoda等
空间自相关
局部空间自相关:同样具有Moran’s I、Geary’s C, Getis’G 等指标,但常用Local Moran’s I 来衡量, Anselin将其称为LISA。LISA被用来揭示空间地域 单元与其临近空间单元属性特征值之间的相似性 或相关性,也用于识别“热点区域”以及其数据 的异质检验。
自动生成的权重有错误,需在 arcgis里重新打开该图层,根 据poly_ID修改权重。
全局空间自相关与局部空间自相关
全局空间自相关与局部空间自相关
空间自相关是一种在地理学研究中,用于研究不同尺度的空间内空间相关性的统计技术。空间自相关可以分为全局空间自相关和局部空间自相关。
全局空间自相关是指对特定空间分布特征,进行宽范围分析强调广阔空间范围内的空间过程,主要研究空间分布表现特性的一般规律性及大的空间差异的程度。全局空间自相关通常使用栅格技术建立空间分布数据,采用全局空间自相关指数,评价不同栅格单元之间的空间关系。
局部空间自相关是指局部对地理现象中特定分布空间相关性进行专题分析,以研究特定空间范围内空间格局变化及尺度特征,通常情况下局部空间关联指数会比全局空间关联指数准确得多。可以以点做为单位,也可以以面为单位,研究相邻的几个单元的空间关系,从而发现某空间分布的局部格局,如惯性、结构网等。
空间自相关分析是衡量一定空间尺度上地理现象的一种重要的统计方法,在利用GIS研究空间结构方面有重要的成果。它可以以全局空间自相关或局部空间自相关的方式研究空间格局,但也有一些局限性,如空间结构可能是由时间及其它因素导致的临时性变化,而排除这些因素则会严重影响其结果。
(完整word版)空间自相关统计量
空间自相关的测度指标
1全局空间自相关
全局空间自相关是对属性值在整个区域的空间特征的描述[8]。表示全局空间自相关的指标和
方法很多,主要有全局Moran ’s I 、全局Geary's C 和全局Getis-Ord G
[3,5]都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的。
全局Moran ’s I
全局Moran 指数I 的计算公式为:
()()
()∑∑∑∑∑=====---=n i n j n i i
ij n i n j j i ij x x w x x x x w n I 111211
∑∑∑∑=≠=≠--=n i n i j ij n i n i j j i ij w S x x x x w 121))((
其中,n 为样本量,即空间位置的个数. x i 、x j 是空间位置i 和j 的观察值,w ij 表示空间位置i 和j 的邻近关系,当i 和j 为邻近的空间位置时,w ij =1;反之,w ij =0。全局Moran 指数I 的取值范围为[—1,1]。
对于Moran 指数,可以用标准化统计量Z 来检验n 个区域是否存在空间自相关关系,Z 的计算公式为:
)()(I VAR I E I Z -==i n w n w S x x d w i i i n i j i j ij
≠----∑≠j )2/()1())((
E (I i )和VAR(I i )是其理论期望和理论方差。数学期望EI=-1/(n-1)。
当Z 值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z 值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z 值为零时,观测值呈独立随机分布。
空间自相关法
空间自相关法
空间自相关法是统计工具之一,主要用来研究不同时期、不同地点之间的空间特征。有两种空间自相关检验方法:一种是检验空间自相关(空间相关性),另一种是检验空间自相似(空间相似性)。
1. 空间自相关检验
空间自相关检验是一种用于检验一个变量在空间上是否存在相关性的方法。它可以用来确定空间数据之间具有相关性的程度。常用的空间自相关检验包括Moran指数测试、Geary指数测试以及Local Moran指数测试等等。
2. 空间自相似度检验
空间自相似度检验是一种检验空间数据之间的联系性的方法。它的目标是检验不同的空间区域之间是否存在着某种形式的空间表达式,即空间自相似度。常用的空间自相似度检验包括LISA检验和Geary指数检验。
- 1 -
全局空间自相关和局部空间自相关
全局空间自相关和局部空间自相关
全局空间自相关(Global Autocorrelation)指的是一个空间统计模型中采用的技术,它可以检测一个空间数据集中的模式,以及这些模式是如何随着距离而变化的。它可以用来测量空间数据集中的元素之间的相关性,以及它们是如何随着距离而变化的。
局部空间自相关(Local Autocorrelation)是指一种空间统计模型,它可以用来检测空间数据集中的局部模式,以及这些模式是如何随着距离而变化的。它可以用来测量空间数据集中的元素之间的相关性,以及它们是如何随着距离而变化的。
GIS算法基础 4
(2)全路径栅格化
“分带法”,即按行计算起始列号和终止列号(或按列计算起始行号和终 止行号)的方法。
10
(2)全路径栅格化
方法:根据矢量的首末点和倾角a的大小,在带内计算出行号(ia,ie)或
列号(ja,je)。当|x2-x1|<|y2-y1|时,计算行号ia,ie;当|x2-x1|≥|y2-y1|时,计 算列号ja,je;
11
(2)全路径栅格化
▪ |x2-x1|≥|y2-y1|时的计算过程: 设当前处理行为第i行,栅格边长为m。
➢ (1)计算矢量倾角a的正切:tana =(y2-y1) / (x2-x1)
➢
(2)计算起始列号ja
ja
[(
y0
(i 1)m tan a
y1
x1
x0 )
m] 1
➢
(3)计算终止列号je
《地理信息系统算法基础》第五讲
空间数据转换算法
本讲内容
▪ 1 矢量数据向栅格数据转换 易 ▪ 2栅格数据向矢量数据转换 难
2
1. 矢量数据向栅格数据转换
▪ 1.1矢量点的栅格化 ▪ 1.2矢量线的栅格化 ▪ 1.3矢量面的栅格化
3
1.1矢量点的栅格化
将点的矢量坐标xj换算为栅格行、列 号的公式为:
▪ 对于线状栅格数据的细化,算法有多种,目前可归纳为两大类: ▪ 第一类是基于距离变换,首先得到骨架像元,然后跟踪距离变换图中
正空间自相关
正空间自相关是一种用于图像处理和分析的技术,用于测量图像中像素之间的相关性。它可以帮助我们了解图像中的重复模式、纹理和结构。
正空间自相关的计算步骤如下:
1.首先,将原始图像转换为灰度图像,如果原始图像已经是灰度图像,则可以跳过此步骤。
2.对灰度图像进行归一化处理,将像素值映射到0到1的范围内。
3.对归一化后的图像进行零均值化处理,即减去图像的平均值。
4.计算图像的自相关函数。自相关函数是通过计算图像中每个像素与其周围像素的相似性来衡量的。具体而言,对于每个像素,将其与周围像素进行乘积,并将所有乘积值相加,得到该像素的自相关值。
5.可以将自相关函数可视化为一个二维图像,其中每个像素的值表示该像素与原始图像中其他像素的相关性。
正空间自相关可以用于许多图像处理任务,例如纹理分析、图像匹配和目标检测。通过分析自相关图像,我们可以提取图像中的重复模式和结构信息,从而帮助我们理解图像的内容和特征。
空间自相关分析的一些关键问题
一、空间自相关
<一>权重
计算权重的方法有很多种~
ARC/NOF 可以自动生成拓扑关系,可以自动生成多边形地图的连接矩阵(空间权重矩阵的生成方法分析与实验①)
倒数法
1 二进制矩阵算法
2
3
<二>全局空间自相关还有多种表现方式
二
通过建设中的散点图中的直线的斜率等于莫兰的I系数(全局空间自相关)。
<三>局部空间自相关何谓属性值标准化形式
1局部自相关系数专题图2局部自相关聚类分析图
如何转换
转换方法~
图的右上方的第1象限,表示高集聚增长的地区被高集聚的其他地区所包围(HH),代表正的空间自相关关系的集群;左上方的第2象限,表示低集聚增长的地区被高集聚增长的其他地区所包围(LH),代表负的空间自相关关系的集群;左下方的第3象限,表示低集聚增长的地区被低集聚增长的其他地区所包围(LL),代表正的空间自相关关系的集群;右下方的第4象限,表示高集聚增长的地区被低集聚增长的其他地区所包围(HL),代表负的空间自相关关系的集群。第1、第3象限正的空间自相关关系揭示了区域的集聚和相似性,而第2、第4象限负的空间自相关关系揭示区域的异质性。如果观测值均匀地分布在4个象限则表明地区之间不存在空间自相关性。
邻近值的加权平均值为Y轴!!!!!
二空间操作
<一>普通的空间操作
包括:放大、缩小、全幅显示、漫游、自由缩放、鹰眼
<二>地图信息的多风格显示
直方图
分级图
<三>数据操作
数据编辑(主要是针对属性表,包括删除、修改、新数据的生成)
数据导出:选定一定区域(用不同的工具,多边形,圆,折线等)导出对应区域的属性表。
空间统计-空间自相关分析
空间自相关分析
1.1 自相关分析
空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。
空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。
1.1.1 全局空间自相关分析
全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。
Moran's I 系数公式如下:
11
2
11
1
()()I ()()n n
ij i j i j n n
n
ij i i j i n w x x x x w x x =====--=
-∑∑∑∑∑(式 错误!文档中没有指定样式的文字。-1)
利用ARCGIS进行空间统计分析
利用ARCGIS进行空间统计分析
空间统计分析是利用GIS(地理信息系统)软件进行的一种分析方法,可以帮助我们理解和解释地理数据的空间模式和关联性。ARCGIS是一款
功能强大的GIS软件,在进行空间统计分析方面有着广泛的应用。
ARCGIS提供了多种空间统计分析的工具和函数,如空间自相关、聚
类分析、热点分析、插值分析等。下面将分别介绍这些分析方法的应用。一、空间自相关
空间自相关分析用于研究地理数据的空间相关性。通过计算地理单位
之间的空间相关性指数,可以帮助我们发现和理解空间数据的空间分布模式。ARCGIS提供了Moran's I指数和Geary's C指数等空间自相关分析
方法。
Moran’s I指数是一种常用的空间自相关指数,用于测量地理单位
之间的空间相关性。通过计算每个地理单位与其邻近单位之间的相似性,
并与总体平均值进行比较,得出Moran's I指数的值。该值介于-1和1
之间,正值表示正相关,负值表示负相关,0表示无相关。通过观察Moran’s I指数的空间模式图和Z分布图,我们可以确定地理数据的空
间分布模式(聚集、随机或分离)。
Geary's C指数与Moran’s I指数类似,用于测量地理单位之间的
空间相关性。计算方法也类似,通过比较每个地理单位与其邻近单位之间
的相似性,得出Geary's C指数的值。Geary's C指数的值介于0和2之间,接近0表示正相关,接近2表示负相关,1表示无相关。
二、聚类分析
聚类分析用于发现地理数据的空间聚集模式。通过计算地理单位之间
的相似性,将相似的单位聚集在一起,形成空间聚类区域。ARCGIS提供
空间相关性..知识讲解
国外理论研究进展
1.最早起源于生物计量学研究。19世纪60年 代使用空间自相关研究生态学、遗传学等。 2.Could于1970年首次提出空间自相关的概念。
3.Moran(1950)将相关系数推广到二维空间并定 义了第一个度量空间相关性的方法——Moran指数。
4.Geary(1954)提出Geary系数概念,标志着空 间自相关分析方法的雏形形成。
国内理论研究进展
19世纪90年代引入
颜峰华(2006) 提出了多种尺度 分布的Getis空间 自相关统计方法 并验证了其能比 较全面的反应地 表特征参量分布 的空间信息。
朱士松、李满春( 2006)从矢量数据和 栅格数据两方面对名 义尺度的空间自相关 性进行研究提出了一 种测度名义尺度的空 间自相关指数——自 邻接指数,为空间数 据分析提供了新的思 路。
“全局自相关 全局Moran指数 性分析指标” (最常用)
全局G指数
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
空间相关性..
空间相关性的含义:
空间自相关性是研究一定地理单元里某
种现象存在与周围其他现象存在的联系,从另 一个角度而言,空间自相关是研究同一种现象 的聚集和分散程度。
国外致力于空间相关性方 法的研究
国内致力于空间相关性方 法的创新与应用
空间自相关(spatial autocorrelation) ——指一 些变量在同一个分布区内的观测数据之间潜在的 相互依赖性。
空间局部自相关测度及arcgis中的实现
空间自相关是用来测度地利实体的空间分布状况的,具体而言,就是看看它们是有规律的(集聚式或是间隔式),还是随机的(就像在方盘里随意投下一把细针)。这里说的局部自相关,就是可以用来测度以每个地理单元为中心的一小片区域的聚集或离散效应。理论上解释起来,的确有点枯燥。倘若换一个视角,利用我们学习过的经济地理的知识来关联的看,就比较容易些。若将城、镇、村都看作这样的空间单元,那么这种局部自相关的测度就可以判别出以城市为中心的这片区域内,城市对于农村的经济总量或劳动力是呈离心带动效应还是向心吸引作用,即区域上的发展是均衡式的,还是极化型的。最常用的局部自相关的测度指数为Local Moran I,它是由全局自相关指数Moran I发展而来的。(关于Moran I的公式与含义,图书馆里有若干本书提到,譬如北大邬伦的那本、黄皮的城市地理信息系统、还有邬建国写的那本景观书:其实质就是在时间序列的自相关系数上,也就是对不同时间的变量数值所做的相关系数上,添加了对空间邻接矩阵的考虑)。所有Local Moran I之和即为Moran I。I的值从1到-1之变化,反映了由空间相邻相似的正相关向空间相邻相异的负相关的过渡。ArcGIS9加强了其ArcToolBox的空间统计分析功能,一下子多出了好多的内容。由ArcGIS Desktop进入,选择toolbox,最后一类菜单功能即为spatial statistics,其中分有诸多子功能。这里要用的Local Moran I,为第二类中的第一项,即mapping cluster里的Cluster and Outlier Analysis (Anselin Local Morans I)。下面要做的是一些填空,input feature class打开你所需要研究的图层。input field是你所需要研究的属性列。output feature class为输出结果的存储位置,需要注意的是每次运算时需给出一个新文件名,它不可以覆盖已有文件。再下面就是些重要的运算参数了:第一,空间关系的判别准则,ArcGIS提供了四种方法,即反距离法、反距离平方法、二值法和综合法。反距离就不解释了,所谓二值法就是以某距离为阈值,小于此距离的范围赋予1,认为相邻,否则为0。综合法则兼顾使用了二值判别和反距离判断,在阈值内为1,超过一定阈值后呈反距离衰减。需要注意的是,进行这些距离运算之前,请确保你的数据是有空间参照的,否则ArcGIS会因为没有距离单位和比例尺而拒绝操作。距离计算:可以使用欧氏距离或曼哈顿距离,欧氏距离不再解释,曼哈顿距离是计算两点之间距离在x、y两方向分别投影的距离之和。它更适合于城镇街区中的距离计算。标准化策略:可以选
GIS算法基础lecture4 空间自相关
n
相Baidu Nhomakorabea系数计算表
月份 1 气温(x) -4.7 地温(y) -3.6 xy 16.92 x2 22.09 y2 12.96
2
3 4 5
-2.3
4.4 13.2 20.2
-1.4
5.1 14.5 22.3
3.22
22.44 191.40 450.46
5.29
19.36 174.24 408.04
1.96
G统计量--高/低 集中趋势
Getis-Ord General指数(高/低变化工具)度量对整体区域 的高低值的集中度。 例1:可以用这个统计工具去比较一个城市内不同犯罪类型的 分布模式,这样我们就能够看出该地区是犯罪比较集中(热点 地区多),还是犯罪很分散。计算得出很高的值说明在研究区 域高于平均值的区域比较聚集。较低的值说明低于平均值的区 域趋向聚集。可以计算得出该区域的标准化z值使我们能看出高、 低值是否具有统计显著性。 例2:比较总结空间现象在不同地方和不同时段的聚集程度。 典型的有城市和城市人口集中。用高/低值聚集分析,你能够比 较西方城市与东方城市的集聚水平(城市形态学),或者在一 个城市内不同时段的人口集中程度的比较(城市增长和密度分 析)
例子
测度不同时段少数民族的分化——这种分化 的趋势是在扩大还是在减小。 总结疾病或趋势在空间和时间上的扩散—— 也就是说疾病趋势是保持集中在一些地区还 是扩散到很多地区 。 比较一个城市内不同犯罪类型的分布模式 比较一个城市内不同时段的人口集中程度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 3323.19 (138.8)(155.7) 12 1 1 2 2 3056.16 (138.8) 3616.11 (155.7) 12 12 0.9995
正态分布
生产与科学实验中很多随机变量的概率分布都可以 近似地用正态分布来描述。例如,在生产条件不变 的情况下,产品的强力、抗压强度、口径、长度等 指标;同一种生物体的身长、体重等指标;同一种 种子的重量;测量同一物体的误差;弹着点沿某一 方向的偏差;某个地区的年降水量;以及理想气体 分子的速度分量,等等。一般来说,如果一个量是 由许多微小的独立随机因素影响的结果,那么就可 以认为这个量具有正态分布(见中心极限定理)。 从理论上看,正态分布具有很多良好的性质 ,许 多概率分布可以用它来近似;还有一些常用的概率 分布是由它直接导出的,例如对数正态分布、t分 布、F分布等
空间自相关有三种:
正自相关:是指附近的观测值很可能是彼此 相似的 负自相关:是指附近的观测值很可能是彼此 不同的,较少见 零自相关:是指无法辨别空间效应,观测值 在空间上似乎是随机分布的
空间自相关分析
自相关分析的结果可用来解释和寻找存在的 空间聚集性或“焦点”。空间自相关分析需 要的空间数据是点或面数据,分析的对象是 具有点/面分布特性的特定属性。 全程空间自相关分析用来分析在整个研究范 围内指定的属性是否具有自相关性。 局部空间自相关分析用来分析在特定的局部 地点指定的属性是否具有自相关性
1、nearest Neighbor Analysis
The observed average distance between nearest neighbors The expected average for a hypothetical random distribution
The ratio is less than 1 if the point pattern is more cluster than random, and greater than 1 if the point pattern is more dispersed than random. The zscore indicates the likelihood that the pattern could be a result of random chance.
例子
测度不同时段少数民族的分化——这种分化 的趋势是在扩大还是在减小。 总结疾病或趋势在空间和时间上的扩散—— 也就是说疾病趋势是保持集中在一些地区还 是扩散到很多地区 。 比较一个城市内不同犯罪类型的分布模式 比较一个城市内不同时段的人口集中程度
Moran’s I 统计量
moran’s I 统计量度量空间自相关(要素属性 相近程度)的程度,它的计算不但考虑要素的 属性值而且还包括要素之间的距离。给定一系 列的要素和相应的属性值,它评估要素的分布 是否使集聚分布,离散分布还是随机分布。 Moran’s指数接近1表示集聚,接近-1表示离 散
空间统计学
空间自相关是指空间位置上越靠近事物或现象就越 相似,即事物或现象具有空间位置的依赖关系。如 气温、湿度等的空间分布体现了与海陆距离、海拔 高程的相关性。如果没有空间自相关性,地理事物 和现象的分布将是随意的,地理学中的空间分布规 律就不能体现。 空间自相关性使得传统的统计学方法不能直接用于 分析地理现象的空间特征,因为传统的统计学方法 的基本假设就是独立性和随机性。为了分析具有空 间自相关性的地理现象,需要对传统的统计学方法 进行改进和发展,空间统计学就应运而生了。
ArcGIS 9中的空间统计工具箱包括了一系列工具,用来分析地 理要素的空间分布形态。传统的统计并不考虑地理要素的空间 关系,而在空间统计中,要素的空间关系是分析中需要考虑的 必要的,处于绝对重要地位的因素。
1、nearest Neighbor Analysis
1、nearest Neighbor Analysis
2 1 (∑xi ) n 2 1 (∑yi ) n
相关系数(correlation coefficient)
rxy为要素x与y之间的相关系数,它就是表 示该两要素之间相关程度的统计指标,其 值在[-1,1]区间之内
rxy>0,表示正相关,即两要素同向发展 rxy<0,表示负相关,即两要素异向发展 rxy 的绝对值越接近于1,表示两要素的关系越 密切; 越接近于0,表示两要素的关系越不密 切
26. 9
26. 0
28. 2
24. 6
26. 5
19. 5
21. 1
12. 5
13. 4
用导出公式
rxy l xy l xx l yy
x y xy
i i i i
2 2 x y 2 2 i i xi yi n n
正态分布
正态分布normal distribution一种概率分布。
正态分布是具有两个参数μ和σ2的连续型随机变量的分布 第一参数μ是服从正态分布的随机变量的均值, 第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为: 取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小; σ越小,分布越集中在μ附近,σ越大,分布越分散。
4.0 -2.8 138.8
13.4
4.6 -1.9 155.7
167.50
18.40 5.32 3323.19
156.25
16.00 7.84 3056.16
179.56
21.16 3.61 3619.11
r
( xi )( yi ) xi yi n 2 2 ( xi ) ( yi ) 2 2 xi yi n n
全局Moran 统计量公式:
I n wij xi x x j x
n n i 1 j 1 n
w x
i 1 j 1 ij i 1
n
n
i
x
w ( x
i 1 j i ij
n
n
i
x)(x j x)
n ij
2
S
2
w
i 1 j i
nzi wij z j
j
z z
T
z i wij z j
j
式中: zi 和 z j 是经过标准差标准化的观测值。 局部Moran指数检验的标准化统计量为
Z (I i ) I i E(I i ) VAR( I i )
Moran’s I 公式的由来:
方差
协方差
Moran’s I 公式的由来:
3、地理相关程度的度量方法
简单直线相关程度的度量
相关程度
研究两个地理要素之间的相互关系是否密切
相关方向
正相关:y值随x的增加而变大或随x的减少而变小 负相关:y值随x的增加而变小或随x的减少而增大
相关系数(correlation coefficient)
Covariance
相关系数(correlation coefficient) 样本相关系数的计算公式为
n
相关系数计算表
月份 1 气温(x) -4.7 地温(y) -3.6 xy 16.92 x2 22.09 y2 12.96
2
3 4 5
-2.3
4.4 13.2 20.2
-1.4
5.1 14.5 22.3
3.22
22.44 191.40 450.46
5.29
19.36 174.24 408.04
1.96
ArcGIS 空间统计工具箱
空间统计工具箱是为那些需要使用高级的方法来解决其空间分 析问题的gis用户设计的。 空间统计主要的工作是研究空间自 相关性(Spatial Autocorrelation),分析空间分布的模式, 例如聚类(cluster)或离散(dispersed)。通过使用 ArcGIS 9中的空间统计工具,用户可以以一种非常直观而简单 的方式获得这些信息。
d =
2
∑( x
i= 1
i
x)
方差与标准差 方差是从平均概况衡量一组地理数据与平均值 的离散程度。方差计算公式为
n 1 ∑ (x σ2 = n i= 1 i
x) 2
标准差为方差的平方根,计算公式为
σ= 1 n
∑( xi
i= 1
n
x) 2
2、地理相关的意义
相关与地理相关
相关是指两个或两个以上变数间相互关系是否密切。在 研究这种关系时并不专指哪一个是自变量,哪一个是因 变量,而视实际需要确定。相关分析仅限于测定两个或 两个以上变数具有相关关系者,其主要目的是计算出表 示两个或两个以上变数间的相关程度和性质 地理相关,就是应用相关分析法来研究各地理要素间的 相互关系和联系强度的一种度量指标 地理要素之间的相关分析的任务,是揭示地理要素之间 相互关系的密切程度。而地理要素之间相互关系的密切 程度的测定,主要是通过对相关系数的计算与检验来完 成的
•举例,北京市多年各月平均气温与5cm深的平均地温,如表所 示,请计算两者的相关系数
月 份 1 2 3 4 5 6 7 8 9 10 11 4.0 4.6 12 -2.8 -1.9
气 温
地 温
-4.7 -2.3 4.4 -3.6 -1.4 5.1
13. 2
14. 5
20. 2
22. 3
24. 2
n
S2
1 2 ( x x ) ; i n i 1 n x xi 。 n i 1
x) 局部Moran指数被定义为: I i ( xi wij ( x j x ) 2 S
j
可进一步写成
I i
n( xi x ) wij ( x j x )
2 ( x x ) i i j
G统计量--高/低 集中趋势
Getis-Ord General指数(高/低变化工具)度量对整体区域 的高低值的集中度。 例1:可以用这个统计工具去比较一个城市内不同犯罪类型的 分布模式,这样我们就能够看出该地区是犯罪比较集中(热点 地区多),还是犯罪很分散。计算得出很高的值说明在研究区 域高于平均值的区域比较聚集。较低的值说明低于平均值的区 域趋向聚集。可以计算得出该区域的标准化z值使我们能看出高、 低值是否具有统计显著性。 例2:比较总结空间现象在不同地方和不同时段的聚集程度。 典型的有城市和城市人口集中。用高/低值聚集分析,你能够比 较西方城市与东方城市的集聚水平(城市形态学),或者在一 个城市内不同时段的人口集中程度的比较(城市增长和密度分 析)
r
( X X )(Y Y ) ( X X ) (Y Y )
2
2
l XY l XX lYY
1 (∑xi ) (∑yi ) n
l xy = l xx = l yy =
∑( x ∑( x
i
x )( yi x) = y)2 =
2
y) =
∑x y
i
i
i
∑x
2
i
∑( yi
2 y ∑i
26.01 210.25 497.29
Baidu Nhomakorabea
6
7 8 9
24.2
26.0 24.6 19.5
26.9
28.2 26.5 21.1
650.98
733.20 651.90 411.45
585.64
676.00 605.16 380.25
723.61
795.24 702.25 445.21
10
11 12 总和
12.5
Gi wij x j / x j
i j
对G统计量的检验与局部Moran指数相似,其检验值为
Z (Gi ) Gi E (Gi ) VAR(Gi )
显著的正值表示在该区域单元周围,高观测值 的区域单元趋于空间集聚,而显著的负值表示低观测 值的区域单元趋于空间集聚,与Moran指数只能发现 相似值(正关联)或非相似性观测值(负关联)的空间集 聚模式相比,具有能够探测出区域单元属于高值集聚 还是低值集聚的空间分布模式。
Lecture 4 空间自相关
数学基础,相关分析,正态分布 空间自相关
1、描述地理数据分布离散程度的指标
极差 指所有数据中最大值与最小值之差,计算公式为
R = max {xi } min{xi }
离差
i
i
指每一个地理数据与平均值的差,计算公式为
di = xi
离差平方和
x
它从总体上衡量一组地理数据与平均值的离散程度,其计 n 算公式为
Moran’s I 公式的由来:
Moran’s指数接近1表示集聚,接近-1表示离散。 可以计算出相应的Z值来评价观测的集聚或离散是 否统计显著
G统计量--高/低 集中趋势
G统计量
全局G统计量的计算公式为
G wij xi x j / xi x j
i j i j
对每一个区域单元的统计量为