空间自相关MoransI
莫兰指数量化空间效应
莫兰指数量化空间效应
莫兰指数量化空间效应的统计工具是用于衡量空间数据集中的空间自相关程度的一种方法。
它是由英国地理学家莫兰(P. A. P. Moran)于1950年提出的,被广泛应用于地理信息系统、地理统计学和空间数据分析等领域。
莫兰指数(Moran's I)是一种常用的空间自相关指标,它量化了空间数据中的空间相关性。
莫兰指数的取值范围在-1到1之间,具体解释如下:
如果莫兰指数接近1,表示空间数据呈现正相关性,即相邻地区之间的观测值趋向于相似。
这意味着空间集聚现象,即相似的值聚集在一起。
如果莫兰指数接近-1,表示空间数据呈现负相关性,即相邻地区之间的观测值趋向于相异。
这意味着空间离散现象,即相异的值集中在一起。
如果莫兰指数接近0,则表示空间数据之间不存在空间自相关性,即观测值之间的空间分布是随机的。
通过计算莫兰指数,可以帮助研究者了解空间数据的分布特征,发现空间集聚或空间分散的模式,进而进行空间数据的模式识别、空间规划和空间预测等工作。
需要注意的是,莫兰指数的计算依赖于空间权重矩阵(spatial weight matrix),即用于衡量空间单位之间关联程度的矩阵。
在计算莫兰指数时,需要事先确定权重矩阵的构建方式,通常有邻近法(contiguity-based)、距离法(distance-based)等不同的方法。
综上所述,莫兰指数作为一种空间自相关性的量化指标,在空间数据分析中具有重要的应用价值,有助于深入理解空间数据的空间关
联特征和空间分布规律。
莫兰指数moran’s i以距离为标准的空间相邻权重矩阵
莫兰指数moran’s i以距离为标准的空间相邻权重矩阵1. 引言1.1 概述莫兰指数(Moran’s I)是一种常用于测量地理空间数据集中程度的统计指标。
它通过衡量每个地理单位与其相邻地理单位之间的相似性,帮助我们了解地理数据的空间自相关性。
莫兰指数最早由美国地理学家Patrick A.P. Moran 在1950年提出,并且在各个研究领域广泛应用,包括城市规划、环境科学、社会经济等。
1.2 文章结构本文将首先介绍莫兰指数的定义和计算方法。
然后,重点讨论以距离为标准的空间相邻权重矩阵对莫兰指数的影响。
接着,我们将通过应用领域和案例分析来展示莫兰指数在实际问题中的应用价值。
在讨论与实验结果分析部分,我们将解读莫兰指数的含义,并对不同距离标准下的空间相邻权重矩阵进行对比分析。
最后,在结论和展望部分,我们将总结研究结果并提出未来工作计划。
1.3 目的本文旨在深入探讨莫兰指数及其在空间自相关性研究中的应用。
首先,我们将详细介绍莫兰指数的定义和计算方法,使读者对该统计指标有一个清晰的理解。
其次,通过实际案例和应用分析,我们将展示莫兰指数在不同领域中的应用价值,并提供一些实用的分析方法和技巧。
最后,我们将通过对比不同距离标准下的空间相邻权重矩阵来评估莫兰指数的灵敏度,以增进对该指标性能特征的认识。
通过本文的阅读,读者将能够深入了解莫兰指数及其在地理空间数据分析中的应用,为未来相关研究提供参考和借鉴。
2. 莫兰指数moran’s i:2.1 莫兰指数的定义:莫兰指数(Moran's I)是一种用于衡量空间自相关性的统计方法,其主要用途是分析地理数据中的空间聚集或分散程度。
莫兰指数可以帮助我们了解数据是否表现出空间集聚的趋势,即相似值是否在地理空间上彼此聚集。
莫兰指数通过比较每个地理单元与其周围相邻单元之间的变量值来计算。
它利用观测值、权重矩阵和方差来计算一个综合性的统计量,该统计量在-1到1之间取值。
空间数据分析
空间数据分析报告—使用Moran's I统计法实现空间自相关的测度1、实验目的(1)理解空间自相关的概念和测度方法。
(2)熟悉ArcGIS的基本操作,用Moran's I统计法实现空间自相关的测度。
2、实验原理2.1空间自相关空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj上同一变量的相关性。
对于任何空间变量(属性)Z,空间自相关测度的是Z的近邻值对于Z相似或不相似的程度。
如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。
2.2空间随机性如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。
Hanning则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,若下式成立,则是空间独立的:式中,n为研究区域中面积单元的数量。
若变量时类型数据,则空间独立性的定义改写成式中,a,b是变量的两个可能的类型,i≠j。
2.3Moran's I统计Moran's I统计量是基于邻近面积单元上变量值的比较。
如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。
设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为∑∑∑∑∑======n i n j ij n i n j ijn i W W n I 1111j i 12i )y -)(y y -(y )y -(y式中,等号右边第二项∑∑==n 1i n 1j j i ij)y -)(y y -(y W 类似于方差,是最重要的项,事实上这是一个协方差,邻接矩阵W 和)y -)(y y -(y j i 的乘积相当于规定)y -)(y y -(y j i 对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,则I 为负。
moran's i指数
moran's i指数
x
Moran's I指数
Moran's I指数是一种空间自相关统计指标,是用来评估地理空间研究的经典方法。
它通过计算每个空间单元内的数值之间的相关系数来衡量空间数据之间的相关性,从而可以检测出潜在的空间规律。
Moran's I指数是由于Moran(1950)首次提出,目前仍然被用作空间研究中的经典统计指标。
Moran's I指数的定义是:
I=∑i=1N∑j=1N(x(i)-x)(x(j)-x)/SxxWij
其中,x(i)表示第i个空间单元内的变量值,x表示变量值的总和,SxxWij表示wij的空间权重值与变量值变化幅度的乘积之和。
Moran's I指数在地理空间数据分析中有广泛的应用。
它可以用来评估数据集中空间变量的空间相关性,以及地理空间环境和社会变量之间的空间相关性。
此外,Moran's I指数还可以用来探索社会空间结构,并识别出城市空间格局中的聚集、区分、秩序和景观差异等空间模式。
Moran's I指数还可以用来检测空间自相关的正负、强度以及可靠性。
它也可以用来识别住宅和社会设施之间的空间分布特征,以及社会-空间关系。
此外,Moran's I指数还可以用来研究空间结构的聚集、混乱、单一和空洞特征。
- 1 -。
空间统计-空间自相关分析
空间自相关分析1.1 自相关分析空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。
若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。
空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。
1.1.1 全局空间自相关分析全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。
首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。
Moran's I 系数公式如下:112111()()I ()()n nij i j i j n nnij i i j i n w x x x x w x x =====--=-∑∑∑∑∑(式 错误!文档中没有指定样式的文字。
-1)其中,n 表示研究对象空间的区域数;i x 表示第i 个区域内的属性值,j x 表示第j 个区域内的属性值,x 表示所研究区域的属性值的平均值;ij w 表示空间权重矩阵,一般为对称矩阵。
Moran's I 的Z-score 得分检验为:Z =式 错误!文档中没有指定样式的文字。
MoranI 指数 空间自相关
Moran’s Autocorrelation Coefficient inComparative MethodsEmmanuel ParadisMay29,2015This document clarifies the use of Moran’s autocorrelation coefficient to quantify whether the distribution of a trait among a set of species is affected or not by their phylogenetic relationships.1Theoretical BackgroundMoran’s autocorrelation coefficient(often denoted as I)is an extension of Pear-son product-moment correlation coefficient to a univariate series[2,5].Recall that Pearson’s correlation(denoted asρ)between two variables x and y both of length n is:ρ=ni=1(x i−¯x)(y i−¯y)ni=1(x i−¯x)2ni=1(y i−¯y)21/2,where¯x and¯y are the sample means of both variables.ρmeasures whether,on average,x i and y i are associated.For a single variable,say x,I will measure whether x i and x j,with i=j,are associated.Note that withρ,x i and x j are not associated since the pairs(x i,y i)are assumed to be independent of each other.In the study of spatial patterns and processes,we may logically expect that close observations are more likely to be similar than those far apart.It is usual to associate a weight to each pair(x i,x j)which quantifies this[3].In its simplest form,these weights will take values1for close neighbours,and0otherwise.We also set w ii=0.These weights are sometimes referred to as a neighbouring function.I’s formula is:I=nS0ni=1nj=1w ij(x i−¯x)(x j−¯x)ni=1(x i−¯x)2,(1)where w ij is the weight between observation i and j,and S0is the sum of all w ij’s:1S0=ni=1nj=1w ij.Quite not so intuitively,the expected value of I under the null hypothesisof no autocorrelation is not equal to zero but given by I0=−1/(n−1).Theexpected variance of I0is also known,and so we can make a test of the nullhypothesis.If the observed value of I(denotedˆI)is significantly greater thanI0,then values of x are positively autocorrelated,whereas ifˆI<I0,this willindicate negative autocorrelation.This allows us to design one-or two-tailedtests in the standard way.Gittleman&Kot[4]proposed to use Moran’s I to test for“phylogeneticeffects”.They considered two ways to calculate the weights w:With phylogenetic distances among species,e.g.,w ij=1/d ij,where d ijare distances measured on a tree.With taxonomic levels where w ij=1if species i and j belong to the samegroup,0otherwise.Note that in thefirst situation,there are quite a lot of possibilities to setthe weights.For instance,Gittleman&Kot also proposed:w ij=1/dαij if d ij≤cw ij=0if d ij>c,where c is a cut-offphylogenetic distance above which the species are consideredto have evolved completely independently,andαis a coefficient(see[4]fordetails).By analogy to the use of a spatial correlogram where coefficients arecalculated assuming different sizes of the“neighbourhood”and then plotted tovisualize the spatial extent of autocorrelation,they proposed to calculate I atdifferent taxonomic levels.2Implementation in apeFrom version1.2-6,ape has functions Moran.I and correlogram.formula im-plementing the approach developed by Gittleman&Kot.There was an errorin the help pages of?Moran.I(corrected in ver.2.1)where the weights werereferred to as“distance weights”.This has been wrongly interpreted in my book[6,pp.139–142].The analyses below aim to correct this.2.1Phylogenetic DistancesThe data,taken from[1],are the log-transformed body mass and longevity offive species of primates:>body<-c(4.09434,3.61092,2.37024,2.02815,-1.46968)>longevity<-c(4.74493,3.3322,3.3673,2.89037,2.30259)>names(body)<-names(longevity)<-c("Homo","Pongo","Macaca","Ateles","Galago")2The tree has branch lengths scaled so that the root age is one.We read thetree with ape,and plot it:>library(ape)>trnwk<-"((((Homo:0.21,Pongo:0.21):0.28,Macaca:0.49):0.13,Ateles:0.62)" >trnwk[2]<-":0.38,Galago:1.00);">tr<-read.tree(text=trnwk)>plot(tr)>axisPhylo()GalagoAtelesMacacaPongoHomo10.80.60.40.20We choose the weights as w ij=1/d ij,where the d’s is the distances measuredon the tree:>w<-1/cophenetic(tr)>wHomo Pongo Macaca Ateles GalagoHomo Inf2.38095241.02040820.80645160.5Pongo 2.3809524Inf1.02040820.80645160.5Macaca1.02040821.0204082Inf0.80645160.5Ateles0.80645160.80645160.8064516Inf0.5Galago0.50000000.50000000.50000000.5000000InfOf course,we must set the diagonal to zero:>diag(w)<-0We can now perform the analysis with Moran’s I:3>Moran.I(body,w)$observed[1]-0.07312179$expected[1]-0.25$sd[1]0.08910814$p.value[1]0.04714628Not surprisingly,the results are opposite to those in[6]since,there,the distances(given by cophenetic(tr))were used as weights.(Note that the argument dist has been since renamed weight.1)We can now conclude for a slighly significant positive phylogenetic correlation among body mass values for thesefive species.The new version of Moran.I gains the option alternative which specifies the alternative hypothesis("two-sided"by default,i.e.,H1:I=I0).As expected from the above result,we divide the P-value be two if we define H1as I>I0:>Moran.I(body,w,alt="greater")$observed[1]-0.07312179$expected[1]-0.25$sd[1]0.08910814$p.value[1]0.02357314The same analysis with longevity gives:>Moran.I(longevity,w)$observed[1]-0.1837739$expected[1]-0.251The older code was actually correct;nevertheless,it has been rewritten,and is now much faster.The documentation has been clarified.The function correlogram.phylo,which computed Moran’s I for a tree given as argument using the distances among taxa,has been removed.4$sd[1]0.09114549$p.value[1]0.4674727As for body,the results are nearly mirrored compared to[6]where a non-significant negative phylogenetic correlation was found:it is now positive but still largely not significant.2.2Taxonomic LevelsThe function correlogram.formula provides an interface to calculate Moran’s I for one or several variables giving a series of taxonomic levels.An example of its use was provided in[6,pp.141–142].The code of this function has been simplified,and the graphical presentation of the results have been improved.correlogram.formula’s main argument is a formula which is“sliced”,and Moran.I is called for each of these elements.Two things have been changed for the end-user at this level:1.In the old version,the rhs of the formula was given in the order of thetaxonomic hierarchy: e.g.,Order/SuperFamily/Family/Genus.Not re-specting this order resulted in an error.In the new version,any order is accepted,but the order given it is then respected when plotted the correlogram.2.Variable transformations(e.g.,log)were allowed on the lhs of the formula.Because of the simplification of the code,this is no more possible.So it is the responsibility of the user to apply any tranformation before the analysis.Following Gittleman&Kot[4],the autocorrelation at a higher level(e.g., family)is calculated among species belonging to the same category and to dif-ferent categories at the level below(genus).To formalize this,let us write the different levels as X1/X2/X3/.../X n with X n being the lowest one(Genus in the above formula):w ij=1if X k i=X k j and X k+1i =X k+1jw ij=0otherwisek<nw ij=1if X k i=X k j w ij=0otherwisek=nThis is thus different from the idea of a“neighbourhood”of different sizes,but rather similar to the idea of partial correlation where the influence of the lowest level is removed when considering the highest ones[4].To repeat the analyses on the carnivora data set,wefirst log10-transform the variables mean body mass(SW)and the mean female body mass(FW):>data(carnivora)>carnivora$log10SW<-log10(carnivora$SW)>carnivora$log10FW<-log10(carnivora$FW)5We first consider a single variable analysis (as in [6]):>fm1.carn <-log10SW ~Order/SuperFamily/Family/Genus>co1<-correlogram.formula(fm1.carn,data =carnivora)>plot(co1)q q qq−0.20.00.20.40.6M o r a n 's IGenus Family SuperFamily Orderq q P >= 0.05P < 0.05A legend now appears by default,but can be removed with legend =FALSE .Most of the appearance of the graph can be customized via the option of the plot method (see ?plot.correlogram for details).This is the same analysis than the one displayed on Fig.6.3of [6].When a single variable is given in the lhs in correlogram.formula ,an object of class "correlogram"is returned as above.If several variables are analysed simultaneously,the object returned is of class "correlogramList",and the correlograms can be plotted together with the appropriate plot method:>fm2.carn <-log10SW +log10FW ~Order/SuperFamily/Family/Genus >co2<-correlogram.formula(fm2.carn,data =carnivora)>print(plot(co2))6M o r a n 's I −0.20.00.20.40.6Genus FamilySuperFamilyOrderBy default,lattice is used to plot the correlograms on separate panels;using lattice =FALSE (actually the second argument,see ?plot.correlogramList )makes a standard graph superimposing the different correlograms:>plot(co2,FALSE)7−0.20.00.20.40.6M o r a n 's I q q q qqqGenus Family SuperFamily Orderlog10SW log10FWq q P >= 0.05P < 0.05The options are roughly the same than above,but do not have always the same effect since lattice and base graphics do not have the same graphical pa-rameters.For instance,legend =FALSE has no effect if lattice =TRUE .3Implementation in ade4The analysis done with ade4in [6]suffers from the same error than the one done with Moran.I since it was also done with a distance matrix.So I correct this below:>library(ade4)>gearymoran(w,data.frame(body,longevity))class:krandtestMonte-Carlo testsCall:as.krandtest(sim =matrix(res$result,ncol =nvar,byr =TRUE),obs =res$obs,alter =alter,names =s)Test number:2Permutation number:999Alternative hypothesis:greaterTest Obs Std.Obs Pvalue1body -0.062567892.15233420.0012longevity -0.229904370.34614140.414other elements:NULL8The results are wholly consistent with those from ape,but the estimated coefficients are substantially different.This is because the computational meth-ods are not the same in both packages.In ade4,the weight matrix isfirst transformed as a relative frequency matrix with˜w ij=w ij/S0.The weights are further transformed with:p ij=˜w ij−ni=1˜w ijnj=1˜w ij,with p ij being the elements of the matrix denoted as P.Moran’s I isfinally computed with x T P x.In ape,the weights arefirst row-normalized:w ijni=1w ij,then eq.1is applied.Another difference between both packages,though less important,is that in ade4the weight matrix is forced to be symmetric with(W+W T)/2.In ape, this matrix is assumed to be symmetric,which is likely to be the case like in the examples above.4Other ImplementationsPackage sp has several functions,including moran.test,that are more specifi-cally targeted to the analysis of spatial data.Package spatial has the function correlogram that computes and plots spatial correlograms.AcknowledgementsI am thankful to Thibaut Jombart for clarifications on Moran’s I.References[1]J.M.Cheverud,M.M.Dow,and W.Leutenegger.The quantitative as-sessment of phylogenetic constraints in comparative analyses:sexual dimor-phism in body weight among primates.Evolution,39:1335–1351,1985.[2]A.D.Cliffand J.K.Ord.Spatial Autocorrelation.Pion,London,1973.[3]A.D.Cliffand J.K.Ord.Spatial and temporal analysis:autocorrelationin space and time.In E.N.Wrigley and R.J.Bennett,editors,Quantita-tive Geography:A British View,pages104–110.Routledge&Kegan Paul, London,1981.[4]J.L.Gittleman and M.Kot.Adaptation:statistics and a null model forestimating phylogenetic effects.Systematic Zoology,39:227–241,1990. [5]P.A.P.Moran.Notes on continuous stochastic phenomena.Biometrika,37:17–23,1950.[6]E.Paradis.Analysis of Phylogenetics and Evolution with R.Springer,NewYork,2006.9。
空间自相关
空间自相关
空间权重矩阵的选择:空间权重矩阵包含了区域 之间空间位置的依赖关系信息。可用相邻性指标 或距离指标来估计不同区域间的地理位置关系。 基于距离的空间权重矩阵需确定区域中心,因此 在目前我国ESDA应用领域最常见的是选择相邻权 重矩阵。
操作步骤
准备数据:福建省67个县市的shp图层; 2013年67县市人均GDP数据; 借助软件:Arcgis、Geoda等
空间自相关
局部空间自相关:同样具有Moran’s I、Geary’s C, Getis’G 等指标,但常用Local Moran’s I 来衡量, Anselin将其称为LISA。LISA被用来揭示空间地域 单元与其临近空间单元属性特征值之间的相似性 或相关性,也用于识别“热点区域”以及其数据 的异质检验。
注意事项:文件夹及文件名必须是英文,否则 Geoda软件无法识别
操作步骤
1、打开arcgis,加载福建省县市图层,将2013年 人均GDP数据导入属性表
2、打开Geoda,点击file—open project,加载福建 省县市shp图层
3、创建权重。 点击toolsweights-creat.
自动生成的权重有错误,需在 arcgis里重新打开该图层,根 据poly_ID修改权重。
4、点击space,分别点 univariate Moran和 univariate LISA,输出 Moran散点图和LISA集聚 图
5、识别Moran散点图各象限散点所对应 的县域单元。选择象限内散点,所对应区 域单元在底图已显示出来。
空间自相关在 OpenGeoda 中的实现
制作人: 学号: 专业:
Hale Waihona Puke 空间自相关全局空间自相关:检验空间邻接或空间邻近的区 域单元属性值空间相关性存在与否,空间统计学 上使用的统计量有Moran’s I、Geary’s C, Getis’G 等,其中常用的是Moran’s I。Moran指数I 的取值 一般在[-1,1],大于0表示各单元间存在空间正相 关,单元内的观察值有趋同趋势;小于0表示负相 关,单元内的观察值有不同的趋势;等于0表示不 相关,属于独立随机分布。
moran’s i 指数
moran’s i 指数
Moran'sI指数是一种用于空间数据分析的统计指标,用于衡量
空间相关性的强度和方向。
该指数通常用于地理信息系统和地理统计学中,帮助研究人员了解特定地理区域内不同地点之间的相似性和差异性。
Moran's I指数的值介于-1和1之间,其中负值表示负相关性,正值表示正相关性。
值越接近-1或1表示相关性越强,而值越接近0则表示没有空间相关性。
该指数的计算基于空间自相关性,即某个地点与其周围地点的相似程度。
它涉及到地理空间的权重矩阵,该矩阵定义了每个地点与其周围地点之间的距离和权重关系。
然后使用Moran's I公式计算出指数的值。
Moran's I指数在许多领域都可以应用,包括城市规划,环境研究和社会科学。
它可以帮助研究人员确定特定地理区域内不同地点之间的相似性和差异性,以及空间相关性如何影响各种社会和环境问题。
- 1 -。
空间转录组moransi方法
空间转录组moransi方法
空间转录组(spatial transcriptomics)是一种用于研究组织中基因表达的技术,它可以提供对细胞类型和基因表达模式的空间分布的信息。
而Moran's I方法是一种用于空间数据的统计分析方法,可用于检测空间相关性。
在空间转录组研究中,Moran's I方法可以用来分析基因表达的空间相关性,以揭示基因在组织中的空间分布模式。
Moran's I方法基于Moran's I统计量,该统计量可以衡量空间数据的空间自相关性。
在空间转录组研究中,可以利用Moran's I方法来分析组织中基因表达的空间分布是否存在聚集现象,从而揭示基因表达的空间相关性。
这有助于我们理解基因在组织中的空间定位和相互作用模式。
Moran's I方法的应用通常涉及到构建空间权重矩阵,该矩阵用于描述不同位置之间的空间关联程度。
然后,通过计算Moran's I统计量来评估基因表达的空间相关性。
这种方法可以帮助研究人员识别在组织中具有显著空间聚集模式的基因,从而深入了解基因在组织结构中的功能和相互关系。
总的来说,空间转录组Moran's I方法提供了一种强大的工具,可以帮助研究人员深入了解基因在组织中的空间分布模式和相互作用,为我们理解生物体内基因表达调控的空间特征提供了重要的信息。
通过Moran's I方法的应用,研究人员可以更全面地认识基因
在组织结构中的功能和调控机制,为生命科学研究提供了新的视角
和方法。
基于Moran统计量的空间自相关理论发展和方法改进
三、技术改进
近年来,随着大数据和人工智能技术的发展,基于Moran统计量的空间自相关 理论在数据采集、处理和分析方法上进行了许多创新。
三、技ቤተ መጻሕፍቲ ባይዱ改进
1、数据采集技术:传统的方法主要依赖于调查和统计数据,但这些数据的获 取成本较高且更新速度慢。现在,利用遥感、GIS等技术,可以更快速、准确地 获取空间数据,为空间自相关分析提供了更丰富、更实时的数据源。
五、结论与展望
展望未来,空间自相关理论仍有广阔的发展空间。随着大数据和技术的不断 发展,将会有更多高效、准确的空间数据获取和处理技术涌现,为空间自相关分 析提供更多可能性。此外,新的空间自相关分析方法也正在不断开发和完善,可 以更好地满足不同领域的研究需求。可以预见,未来空间自相关理论将会在更多 领域发挥更大的作用,帮助人们更好地理解和解决各种实际问题。
谢谢观看
三、技术改进
2、数据处理技术:以往的空间自相关分析主要依赖于手动或半自动的方式, 无法处理大规模的数据。而现在,利用编程和算法,可以自动、高效地处理大规 模的空间数据,提高了分析的效率和准确性。
三、技术改进
3、数据分析方法:除了传统的Moran统计量,现在还有许多新的方法用于空 间自相关分析,如Geary系数、Getis-Ord G*等。这些方法可以提供更丰富的空 间自相关信息,如局域自相关和异质性等。
此外,我们还发现这两个指标的计算方法和应用领域也存在一定的差异。 Moran指数多应用于经济、人口等数据的空间自相关研究,而G系数则更多地应用 于生态系统、自然灾害等领域。这可能与不同领域的数据特点和研究者的问题有 关。
结论
结论
本次演示通过对比分析全局空间自相关Moran指数和G系数的特点及应用,揭 示了这两个指标在反映空间数据的聚集性和关联性方面的差异。这有助于深化对 全局空间自相关的理解,为相关领域的研究提供参考。然而,由于研究范围的限 制,本次演示未能涵盖所有相关领域的应用情况。未来可以进一步拓展这两个指 标在其他领域的应用对比研究,同时加强其理论和方法论的探讨。
空间自相关分析在地学中的应用
I[lo]=(N/sumW)*(sumWCIJ/sumV) #比较通过一步一步算得I值与用spdep里的moran函 数计算的值,结果一样。 #listW=nb2listw(rook3x3,style="B") #conf=summary(listW) #MI[lo]=moran(vector,listW,conf$n,conf$S0)$I } win.metafile(filename = "MoranI.wmf",width = 5.96, height = 4.08) #par(pin=c(4.5,2.5),mar=c(4.3,4.1,0.3,0.3)) plot(density(I),main="Moran'I概率密度图") dev.off()
Pb
Ni
指数模型
指数模型
0.023
0.052
0.247
0.155
26.679
23.642
0.093
0.337
0.973
0.876
Zn
指数模型
0.039
0.083
17.424
0.465
0.871
重金属元素的空间自相关变化图(Moran’s I)
重金属元素的空间自相关标准化图(1km间隔)
不同途径求得的重金属空间变程(km)
LOOP=10000
I=numeric(LOOP) #MI=numeric(LOOP) for(lo in 1:LOOP){ #combn函数是在vect中产生的9!个排列中每循环一次就在总的 排列中选择一个样本,这样 #循环LOOP次就产生LOOP个vect的排列 vector=combn(vect,9,sample) WCIJ=matrix(NA,N,N)
空间自相关局部指标Moran指数和G系数研究
空间自相关局部指标Moran指数和G系数研究一、本文概述本文旨在深入研究空间自相关的局部指标,特别是Moran指数和G系数。
空间自相关分析是地理学和空间统计学中的重要工具,用于量化地理空间现象中观测值之间的依赖性和关联性。
本文首先将对空间自相关的基本概念进行介绍,阐述其在地理空间数据分析中的意义和应用。
随后,本文将重点介绍Moran指数和G系数这两种局部空间自相关指标。
我们将对这两种指标的计算方法、性质以及优缺点进行详细的阐述,并通过实例演示它们在空间数据分析中的具体应用。
我们还将对Moran指数和G系数在不同地理空间数据场景下的适用性进行比较分析,为实际应用提供指导。
本文还将对Moran指数和G系数在地理学、环境科学、城市规划等领域的研究进展进行综述,分析它们在不同领域的应用案例和实际效果。
我们将对这两种局部空间自相关指标的未来研究方向进行展望,以期推动相关领域的研究进展和应用发展。
通过本文的研究,我们期望能够为读者提供关于Moran指数和G 系数的全面、深入的理解,为他们在地理空间数据分析中的实际应用提供有益的参考和指导。
二、空间自相关理论基础空间自相关,也称为空间依赖性,是地理学、环境科学、经济学和社会学等多个学科领域中一个核心概念。
它描述的是地理空间中相邻或相近的观测值之间存在的相关性。
在空间统计和空间分析中,这种相关性常常被用来理解和解释空间现象的分布模式和演变过程。
Moran指数是最常用的空间自相关全局指标之一,它度量的是整个研究区域内所有观测值之间的平均相关性。
Moran指数的取值范围在-1到1之间,其中正值表示正相关(即相似的观测值在空间上趋于聚集),负值表示负相关(即不相似的观测值在空间上趋于聚集),而0则表示无空间自相关(即观测值在空间上随机分布)。
I = (n Σ(x_i - ¯x)(x_j - ¯x)W_ij) / (Σ(x_i - ¯x)^2 ΣW_ij)其中,n是研究区域内的观测值数量,x_i和x_j是相邻或相近的观测值,¯x是所有观测值的平均值,W_ij是空间权重矩阵的元素,用于表示观测值i和j之间的空间关系。
moran's i 案例解读
moran's i 是一种空间自相关性分析方法,广泛应用于地理信息系统、城市规划、社会经济学等领域。
通过计算地理空间要素之间的相关性,可以揭示出地理现象的空间分布模式和空间相互作用规律。
本文将以具体案例为例,解读 moran's i 方法在实际中的应用和解释。
一、案例背景我们以一组城市的人口密度数据为例,来介绍moran's i 方法的应用。
假设我们有某国家的若干城市,每个城市的人口密度数据如下:1. 城市A:1000人/km²2. 城市B:1500人/km²3. 城市C:800人/km²4. 城市D:1200人/km²5. 城市E:1300人/km²6. 城市F:900人/km²我们将利用 moran's i 方法来分析这些城市的人口密度数据是否存在空间相关性。
二、moran's i 方法计算在进行 moran's i 方法计算之前,首先需要构建城市之间的空间权重矩阵。
我们假设城市之间的空间联系由距离决定,距离越近,城市之间的联系越密切。
根据这一假设,我们可以采用欧氏距离来构建空间权重矩阵,假设城市A到城市B的距离为100km,城市A到城市C的距离为150km,以此类推,得到空间权重矩阵如下:1. 城市A:0, 100, 150, 250, 200, 3002. 城市B:100, 0, 200, 150, 100, 2503. 城市C:150, 200, 0, 100, 150, 1004. 城市D:250, 150, 100, 0, 100, 1505. 城市E:200, 100, 150, 100, 0, 2006. 城市F:300, 250, 100, 150, 200, 0接下来,我们可以利用空间权重矩阵来计算 moran's i 统计量。
moran's i 统计量的计算公式如下:moran's i = (n / W) * (ΣΣwij * (xi - x̄) * (xj - x̄)) / Σ(xi - x̄)²其中,n 为样本数量,W 为所有权重值的总和,wij 为城市 i 和城市 j 之间的空间权重,xi 表示城市 i 的人口密度,x̄表示所有城市的人口密度的均值。
空间自相关局部指标Moran指数和G系数研究
I )e Lb a r oGor h f m tn cn , c ooRs rs n Ky a ro e a iI o ao ic S o e u ead 2 o ty f g p cnr i Se e h l f o c
En io m n ce e,Ea tCh n r lUniest v rn e tS in c s i a No ma v ri y,S an a 2 0 2 h gh i 0 06
空间自相关--MoransI
空间⾃相关--MoransI重庆各区县乡村⼈⼝所占⽐例的空间⾃相关分析选题:在ArcGIS中分别计算全局Moran’I 指数和局部Moran’I指数,分析重庆各区县乡村⼈⼝所占⽐例的空间关联程度。
实验⽬的:根据重庆市各区县之间的邻接关系,采⽤⼆进制邻近权重矩阵,选取各区县2008年的重庆各区县的总⼈⼝及乡村⼈⼝,计算出重庆各区县乡村⼈⼝所占的⽐例,在ArcGIS⾥⾯分别计算全局Moran’I 指数和局部Moran’I指数,分析空间关联程度。
实验数据:1.重庆统计年鉴中2008年重庆市各区县的总⼈⼝及乡村⼈⼝数量(excel表格)2.重庆市各区县的⽮量图(shp.⽂件)软件:ArcGIS10.2操作过程与结果分析:第⼀步:导⼊Excel数据⽂件和重庆市各区县的⽮量图,并建⽴关联1. Catalog——Folder Connections,在对应的⽂件夹下打开重庆市各区县城镇化率的EXCEL表格及重庆市各区县shp⽂件为关联字段,将两个⽂件关联起来3.右键单击关联后的重庆区县界shp.⽂件,导出为Export_Output⽂件,新⽂件的属性表如下:第⼆步:计算全局Morans I1.打开ArcToolbox,选择Spatial Statistics Tools——AnalyingPatterns——Spatial Autocorrelation(Morans I)选择⼆进制邻接矩阵⽅法来确定空间权重矩阵(即当区域i和具有公共边或公共点时,两区域的距离矩阵设为1,若不相邻接,其距离矩阵设为0),选择欧式距离作为计算距离的⽅法,对数据进⾏标准化处理后计算全局Moran’I指数度量空间⾃相关2.输出结果:3.结果分析:Z得分值在[-1.65,1.65]之间,区县乡村⼈⼝所占⽐例的观测值在空间上表现为独⽴随机分布;Z值⼤于1.65且显著时相似观察值在空间上表现为集聚分布(⾼值或低值),⼩于-1.65且显著时相似观测值在空间上趋于分散分布。
莫兰指数原理教程
莫兰指数(Moran's I)是空间自相关性分析中常用的统计度量,用于评估一个空间数据集中相似值是否倾向于在空间上聚集或离散。
空间自相关是指空间单元中观测值的系统性的空间排列模式。
如果相似的观测值(高或低)倾向于彼此靠近,则被认为是正的空间自相关;如果相似的观测值倾向于彼此远离,则被认为是负的空间自相关;如果观测值是随机分布的,则被认为没有空间自相关。
莫兰指数的计算基于空间权重矩阵和各空间单元的特征值。
空间权重矩阵定义了空间单元之间的相邻关系,可能基于地理距离、邻接性或其他空间关系。
莫兰指数的值范围从-1(完全的负空间自相关)到+1(完全的正空间自相关)。
值接近0通常表示没有空间自相关,即数据在空间上是随机分布的。
莫兰指数的计算公式如下:$$I = \frac{N}{W} \times \frac{\sum_{i=1}^{N} \sum_{j=1}^{N} w_{ij}(X_i - \bar{X})(X_j -\bar{X})}{\sum_{i=1}^{N}(X_i - \bar{X})^2}$$其中:$I$ 是莫兰指数。
$N$ 是空间单元的数量。
$X_i$ 是空间单元$i$ 的观测值。
$\bar{X}$ 是所有空间单元观测值的平均值。
$w_{ij}$ 是空间权重矩阵中单元$i$ 和单元$j$ 之间的权重。
$W$ 是所有空间权重的总和,即$W = \sum_{i=1}^{N} \sum_{j=1}^{N} w_{ij}$。
莫兰指数的显著性测试通常通过计算标准化的Z得分来完成,这可以通过下列公式得到:$$Z(I) = \frac{I - E[I]}{\sqrt{VAR[I]}}$$其中$E[I]$ 是莫兰指数的期望值,在随机分布的假设下,$E[I]$ 接近于$-1/(N-1)$。
$VAR[I]$ 是莫兰指数的方差。
在实际应用中,通常使用统计软件或地理信息系统(GIS)软件来计算莫兰指数。
例如,R 语言中的`spdep` 包,Python 中的`PySAL` 库或者ArcGIS 和QGIS 等GIS软件都提供了计算莫兰指数的工具。
空间自相关MoransI
空间⾃相关MoransI空间⾃相关是什么?在空间中,某⼀空间单元和其周围的其它空间单元,就空间单元中的某种属性存在相关性,称为空间⾃相关。
如长江三⾓洲、珠江三⾓洲地区经济⾼度发达,企业产业链在地理临近区域之间紧密联系,表现出⾼度的空间聚集性和空间正相关性。
如何产⽣的?主要有以下⼏个⽅⾯:空间分组空间交互空间扩散如何度量?1. 可以⽤Moran's I进⾏检验,其数学公式如下:Moran′sI=N∑ij w ij∑i∑j w ij(x i−¯x)(x j−¯x)∑i(x i−¯x)2式中,I⼤体在[-1,1]区间内。
i,j为多边形编号,w ij为i,j之间的空间连接矩阵,¯x为研究区域内的属性均值。
2. 可以⽤半变异函数检验semi-variogram,计算公式如下:γ(h)=12n(h)∑n(h)s=1[x(s)−x(s+h)]2式中,n(h)为距离为h的点对数。
详解Moran′sI检验Moran′sI指数是为了检验空间的⾃相关性。
如果I>0,则说明空间正相关;若I<0,说明空间不相关;若I=0,说明空间中不相关。
先验假设(⼜称零假设)零假设声明:所分析的属性在研究区域内的要素之间是随机分布的。
说明在零假设条件下,空间内所分析的属性是不存在⾃相关性的。
在该假设条件下,运⽤Moran′sI⼯具,得到p值和z得分,通过p值和z得分来判断是否拒绝零假设,若拒绝则表明空间中所分析的属性存在⾃相关性。
什么是p值和z得分?p值表⽰概率。
对于Moran′sI检验⼯具来说,p 值表⽰所观测到的空间要素属性是由某⼀随机过程创建⽽成的概率。
当p 很⼩时,意味着所观测到的空间要素属性不太可能产⽣于随机过程(⼩概率事件),因此可以拒绝零假设。
z 得分和 p 值都与标准正态分布相关联。
相应的p值对应唯⼀的z得分。
z得分的计算⽅法如下:z=I−E(I)√v(I)N(0,1) E(I)=−1n−1v(I)=E(I2)−[E(I)]2空间权重矩阵的获取空间权重的获取需要⽤到空间关系概念化的知识,通过空间关系的概念化来确定空间权重矩阵。
Stata空间相关检验详细步骤
Stata空间相关检验详细步骤
第⼀步:⽣成权重矩阵
输⼊命令:spweight var1 var2 , panel(29) time(5) matrix(wei) eigw stand table ptable(其中spweight需要安装)
29代表29个省份;5代表年限;wei代表接下来产⽣的截⾯矩阵为weics,产⽣的⾯板矩阵为weixt;最终结果为标准化以后的权重矩阵。
第⼆步:检验是否存在空间⾃相关性(计算Moran的指数)
⾸先,输⼊use weics.dta即打开截⾯权重表
其次,输⼊spatwmat using weics.dta, name(weics) standardize即将截⾯权重表weics进⾏标准化,并重新命名为weics
然后,输⼊截⾯数据,将2009年的截⾯数据输⼊到软件中,保存并命名为2009shuju.dta,并输⼊use 2009shuju.dta
接着,输⼊spatgsa lq,weights(weics) moran twotail,(其中spatgsa需要安装),即⽤截⾯权重weics计算出因变量lq的全域morna’s I指数值,其结果如下所⽰
morna’s I=0.273,可以说lq存在明显的空间⾃相关。
空间自相关统计量
空间自相关的测度指标1全局空间自相关全局空间自相关是对属性值在整个区域的空间特征的描述..表示全局空间自相关的指标和方法很多;主要有全局Moran ’sI 、全局Geary ’sC 和全局Getis-OrdG 3;5都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的..全局Moran ’sI全局Moran 指数I 的计算公式为: 其中;n 为样本量;即空间位置的个数..x i 、x j 是空间位置i 和j 的观察值;w ij 表示空间位置i 和j 的邻近关系;当i 和j 为邻近的空间位置时;w ij =1;反之;w ij =0..全局Moran 指数I 的取值范围为-1;1..对于Moran 指数;可以用标准化统计量Z 来检验n 个区域是否存在空间自相关关系;Z 的计算公式为:)()(I VAR I E I Z -==in w n w S x x d w i i i n i j i j ij≠----∑≠j )2/()1())((EI i 和VARI i 是其理论期望和理论方差..数学期望EI=-1/n-1..当Z 值为正且显着时;表明存在正的空间自相关;也就是说相似的观测值高值或低值趋于空间集聚;当Z 值为负且显着时;表明存在负的空间自相关;相似的观测值趋于分散分布;当Z 值为零时;观测值呈独立随机分布..全局Geary ’sC全局Geary ’sC 测量空间自相关的方法与全局Moran ’sI 相似;其分子的交叉乘积项不同;即测量邻近空间位置观察值近似程度的方法不同;其计算公式为: 全局Moran ’sI 的交叉乘积项比较的是邻近空间位置的观察值与均值偏差的乘积;而全局Geary ’sC 比较的是邻近空间位置的观察值之差;由于并不关心x i 是否大于x j ;只关心x i 和x j 之间差异的程度;因此对其取平方值..全局Geary ’sC 的取值范围为0;2;数学期望恒为1..当全局Geary ’sC 的观察值<1;并且有统计学意义时;提示存在正空间自相关;当全局Geary ’sC 的观察值>1时;存在负空间自相关;全局Geary ’sC 的观察值=1时;无空间自相关..其假设检验的方法同全局Moran ’sI..值得注意的是;全局Geary ’sC 的数学期望不受空间权重、观察值和样本量的影响;恒为1;导致了全局Geary ’sC 的统计性能比全局Moran ’sI 要差;这可能是全局Moran ’sI 比全局Geary ’sC 应用更加广泛的原因..全局Geti-OrdG全局Getis-OrdG与全局Moran’sI和全局Geary’sC测量空间自相关的方法相似;其分子的交叉乘积项不同;即测量邻近空间位置观察值近似程度的方法不同;其计算公式为:全局Getis-OrdG直接采用邻近空间位置的观察值之积来测量其近似程度;与全局Moran’sI和全局Geary’sC不同的是;全局Getis-OrdG定义空间邻近的方法只能是距离权重矩阵w ij d;是通过距离d定义的;认为在距离d内的空间位置是邻近的;如果空间位置j在空间位置i的距离d内;那么权重w ij d=1;否则为0..从公式中可以看出;在计算全局Getis-OrdG时;如果空间位置i和j在设定的距离d内;那么它们包括在分子中;如果距离超过d;则没有包括在分子中;而分母中则包含了所有空间位置i和j的观察值xi、xj;即分母是固定的..如果邻近空间位置的观察值都大;全局Getis-OrdG的值也大;如果邻近空间位置的观察值都小;全局Getis-OrdG的值也小..因此;可以区分“热点区”和“冷点区”两种不同的正空间自相关;这是全局Getis-OrdG的典型特性;但是它在识别负空间自相关时效果不好..全局Getis-OrdG的数学期望EG=W/nn-1;当全局Getis-OrdG的观察值大于数学期望;并且有统计学意义时;提示存在“热点区”;当全局Getis-OrdG的观察值小于数学期望;提示存在“冷点区”..假设检验方法同全局Moran’sI和全局Geary’sC..2局部空间自相关局部空间自相关统计量LISA的构建需要满足两个条件:①局部空间自相关统计量之和等于相应的全局空间自相关统计量;②能够指示每个空间位置的观察值是否与其邻近位置的观察值具有相关性..相对于全局空间自相关而言;局部空间自相关分析的意义在于:①当不存在全局空间自相关时;寻找可能被掩盖的局部空间自相关的位置;②存在全局空间自相关时;探讨分析是否存在空间异质性;③空间异常值或强影响点位置的确定;④寻找可能存在的与全局空间自相关的结论不一致的局部空间自相关的位置;如全局空间自相关分析结论为正全局空间自相关;分析是否存在有少量的负局部空间自相关的空间位置;这些位置是研究者所感兴趣的..由于每个空间位置都有自己的局部空间自相关统计量值;因此;可以通过显着性图和聚集点图等图形将局部空间自相关的分析结果清楚地显示出来;这也是局部空间自相关分析的优势所在3;5..局部Moran’sI为了能识别局部空间自相关;每个空间位置的局部空间自相关统计量的值都要计算出来;空间位置为i 的局部Moran ’sI 的计算公式为:局部Moran 指数检验的标准化统计量为:EI i 和VARI i 是其理论期望和理论方差..局部Moran ’sI 的值大于数学期望;并且通过检验时;提示存在局部的正空间自相关;局部Moran ’sI 的值小于数学期望;提示存在局部的负空间自相关..缺点是不能区分“热点区”和“冷点区”两种不同的正空间自相关..局部Geary ’sC局部Geary ’sC 的计算公式为:局部Geary ’sC 的值小于数学期望;并且通过假设检验时;提示存在局部的正空间自相关;局部Geary ’sC 的值大于数学期望;提示存在局部的负空间自相关..缺点也是不能区分“热点区”和“冷点区”两种不同的正空间自相关..局部Getis-OrdG局部Getis-OrdG 同全局Getis-OrdG 一样;只能采用距离定义的空间邻近方法生成权重矩阵;其计算公式为:对统计量的检验与局部Moran 指数相似;其检验值为)()()(i i ii G VAR G E G G Z -==in w n w S x x d w i i i n i j i j ij ≠----∑≠j )2/()1())((当局部Getis-OrdG 的值大于数学期望;并且通过假设检验时;提示存在“热点区”;当局部Getis-OrdG 的值小于数学期望;并且通过假设检验时;提示存在“冷点区”..缺点是识别负空间自相关时效果较差..全局自相关与局部自相关适用性对比分析对于定量资料计算全局空间自相关时;可以使用全局Moran ’sI 、全局Geary ’sC 和全局Getis-OrdG 统计量..全局空间自相关是对整个研究空间的一个总体描述;仅仅对同质的空间过程有效;然而;由于环境和社会因素等外界条件的不同;空间自相关的大小在整个研究空间;特别是较大范围的研究空间上并不一定是均匀同质的;可能随着空间位置的不同有所变化;甚至可能在一些空间位置发现正空间自相关;而在另一些空间位置发现负空间自相关;这种情况在全局空间自相关分析中是无法发现的;这种现象称为空间异质性..为了能识别这种空间异质性;需要使用局部空间自相关统计量来分析空间自相关性;如局部Moran ’sI 、局部Geary ’sC 和局部Getis-OrdG 3;6-7..全局自相关统计量仅仅为整个研究空间的空间自相关情况提供了一个总体描述;其正确应用的前提是要求同质的空间过程;当空间过程为异质时结论不可靠..为了能正确识别空间异质性;需要应用局部空间自相关统计量..。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重庆各区县乡村人口所占比例的空间自相关分析
选题:
在ArcGIS中分别计算全局Moran’I 指数和局部Moran’I指数,分析重庆各区县乡村人口所占比例的空间关联程度。
实验目的:
根据重庆市各区县之间的邻接关系,采用二进制邻近权重矩阵,选取各区县2008年的重庆各区县的总人口及乡村人口,计算出重庆各区县乡村人口所占的比例,在ArcGIS里面分别计算全局Moran’I 指数和局部Moran’I指数,分析空间关联程度。
实验数据:
1.重庆统计年鉴中2008年重庆市各区县的总人口及乡村人口数量(excel表格)
2.重庆市各区县的矢量图(shp.文件)
软件:
操作过程与结果分析:
第一步:导入Excel数据文件和重庆市各区县的矢量图,并建立关联
1.Catalog——Folder Connections,在对应的文件夹下打开重庆市各区县城镇化率的EXCEL表格及重庆市各区县shp文件
2.右键单击重庆区县界shp.文件后,Joins and Relates——Join,选择“地区”为关联字段,将两个文件关联起来
3.右键单击关联后的重庆区县界shp.文件,导出为Export_Output文件,新文件的属性表如下:
第二步:计算全局Morans I
1.打开ArcToolbox,选择Spatial Statistics Tools——Analying
Patterns——Spatial Autocorrelation(Morans I)选择二进制邻接矩阵方法来确定空间权重矩阵(即当区域i和具有公共边或公共点时,两区域的距离矩阵设为1,若不相邻接,其距离矩阵设为0),选择欧式距离作为计算距离的方法,对数据进行标准化处理后计算全局Moran’I指数度量空间自相关
2.输出结果:
3.结果分析:
Z得分值在[,]之间,区县乡村人口所占比例的观测值在空间上表现为独立随机分布;Z值大于且显着时相似观察值在空间上表现为集聚分布(高值或低值),小于且显着时相似观测值在空间上趋于分散分布。
2008年,重庆市各区县城镇化率的全局Moran’s I指数为正值I=,对应的标准化统计量Z=,在正态分布的假设下显着性水平P值为,对Moran 指数检验的结果高度显着,在随机分布假设下,Moran指数I的期望值与方差值分别为和。
说明从整体来看,2008年重庆市各区县乡村人口所占比例存在正的空间自相关,表现为低低集聚,各区县乡村人口所占比例的空间分布并非完全是随机性分布的,而是表现出相似值之间的空间集聚性。
第三步:计算局部Morans I
1.打开ArcToolbox,选择Spatial Statistics Tools——Mapping Clusters—Cluster and Outlier Analysis,选择二进制邻接矩阵方法来确定空间权重矩阵,最后得到重庆市各区县城镇化率的局部Moran’I指数以及相对应的Z统计值和P值
2.输出结果:
2.结
果
分
析
:
属
性
表
里
面
生
成
各
区县对应的局部Moran’I指数以及对应的统计值Z和显着性水平P值,Moran’I指数为正且Z值为正并且在显着性水平α=的条件下通过检验的区域相似值(高值与低值)趋于空间集聚,如下表:满足这一条件的区县包括大渡口区、九龙坡区、南岸区、渝中区、江北区、渝北区、沙坪坝区、北碚区、在空间上表现为高高集聚或低低集聚。
表中Moran指数和Z值都为负的区县,显着性水平没有通过检验,其在空间上的分布呈现出一定的随机性,这主要是因为这些地区邻近趋于经济水平呈现出一定差异性,并没有显着的空间关联。
Moran’I指数一般为[-1,1],表中输出结果中部分区县Moran’I指数略大于1,原因在于这些区域的乡村人口所占比例与全市平均水平相差较大,出现极高或极低值,这并不影响对空间关联的分析。
图中分析结果表明大渡口区、九龙坡区、南岸区、渝中区、江北区、渝北区、沙坪坝区、北碚区的Z值在的显着性水平下显着,出现低低聚集。