空间分布模式与空间相关分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.零假设(null hypothesis):指进行统计检验时预先建立的假设。在空间统计中,零假设指的就是空间位置在一定区域里面呈现完全随机(均匀)分布。在检验结果之前,先对这些结果假设一个数值区间,这个区间一般是符合某种概率分布的情况,如果真实结果偏离了设定的区间,就表示发生了小概率事件。这样原来的假设就不成立了。
如果计算结果落在-2到2之间,就表示假设是可以接受,但是不在这个范围内,就说明发生小概率事件了。有两种可能:1,假设有错误;2,出现了异常值。
2.z得分(Z scores)表示标准差的倍数
标准差:总体各单位标准值与其平均数离差平方的算术平均数的平方根”也就是“标准差能反映一个数据集的离散程度”。比如z得分是+2.5,得到的结果是标准差的正2.5倍,表示数据已经高度聚集。反之,如果是-2.5,那么就表示标准差的负2.5倍,就是高度离散的数据。
置信度:数据落在期望区间的可能性
在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的
6.Moran’s I 法
高的自相关性代表了空间现象聚集性的存在,空间自相关分析的主要功能在于同时可以处理数据的区位和属性。全域型Moran’s I 计算方式是基于统计学相关系数的协方差关系推算出来的。I 值一定介于-1 到1 之间,大于0 为正相关,且值越大表示空间分布的相关性越大,即空间上聚集分布的现象越明显,反之,值越小代表空间分布相关性小,而当值趋于0 时,代表此时空间分布呈现随机分布的情形。若I 值大于0,说明相邻地区拥有相似的数据属性,属性值高或低的地区都有聚集现象;若I 小于0,说明相邻地区属性差异大,数据空间分布呈现高地间隔分布的状态;若I 趋近于0,则相邻空间单元间相关低,某空间现象的高值或低值呈无规律的随机分布状态。若I 值显著大于I 的期望值(I 值为正值且显著),说明两点存在相似关系,若I 值显著小于I 的期望值(I 值为负值且显著),说明两点存在不相似关系。区域空间自相关值累加之和即全域空间自相关Moran’s I 值。
其对应的公式为:
7. 多距离空间聚类分析(Ripley's K 函数)
Ripley's K方法是一种点数据模式的分析方法,利用Ripley's K函数对点数据集
操作步骤(方法)
一、参考文献《多尺度人口增长的空间统计分析》,练习多距离L(d)、全局Moran’I与G*统计量分析,显著性检验的置信区间定义为90%
定义工作空间,对province数据添加投影,选择兰勃特投影
处理数据,将统计数据汇总连接到省区的shp文件;
右键点击“province”,采用Symbology/Quantities/Graduated colors来符号化“人口增长率”字段;观察分布格局;
分布格局为:西部部分地区的人口增长率要明显高于东部,如青海,西藏,新疆。
北方地区主要是京津地区增长率较高,南方的上海和广东地区人口增长率高。由此可知,人口增长率最高的地方主要是发达的地区和贫困地区。发达地区由于人口迁入导致,而贫困地区是由于出生率高于死亡率导致。
提取质心点,求取点对之间的距离;
k(d)函数
先利用province计算点距离,最短为30734米,最长为2216312米
则步长为十,Beginning_Distance (起算距离)选择30000米,Distance_Increment (递增步长)选择220000米
红线是观察值,蓝线是期望值,当观察值在期望值上面的时候,是有集聚关系当观察值处于期望值之下的时候是离散分布。
Global Moran’I
分析:通过Morans’I 指数判断可以判断人口增长率是否存在集聚。Moran’s Index:0.202915大于0,是观测的Moran’s 指数,表示要素呈现空间正相关。
Expected Index-0.030303 小于0,是期望的Moran’s 指数,表示按期望应该是空间负相关。
Variance:0.011789,方差很小接近于0 表示统计值之间差异并不大。
z-score:2.147959,绝对值小于2.58 对应显著性水平,表示正相关不是非常显著。
p-value:0.031717 小于0.1,表示随机分布的可能性小于10%,相关的可能性大于90%。
二、对adabg00数据进行全局与局部的moran I与G统计量分析;
拉丁人口分布:
进行G统计量分析
利用Getis-Ord General G 统计量度量高值或低值的聚集程度。打开ArcToolbox—Spatial Statistics Tools—Average Patterns—High/Low Clustering (Getis-Ord General G)
输入图层选择adabg00.shp,统计的字段是Latino 字段。勾选Generate Report 选项。空间关系选择Inverse Distance(反距离),选项还有反距离平方等。计算距离方法选择欧式距离。是否进行标准化选择默认NONE。点击OK。
结果显示:
分析:阿达县的拉丁裔人口分布具有空间集聚特征,且是高密度人口和高密度人口聚集。
Expected General G:0.000172,表示期望的G 统计量。
Variance:0.000000,方差很小接近于0 表示统计值之间差异很小。
z-score:3.770902,绝对值大于2.58 对应显著性水平,表示聚集非常显著。p-value:0.000163 小于0.1,表示随机分布的可能性小于10%,聚集分布的可能性大于90%,即聚集显著。
全局moran I
利用全局Moran's I 统计量根据要素位置和属性值测量空间自相关性。
打开ArcToolbox, Spatial Statistics Tools, Average Patterns(分析式), Spatial Autocorrelation (Moran I)
输入图层选择adabg00.shp,统计的字段是Latino 字段。勾选Generate Report 选项。空间关系选择Inverse Distance(反距离),计算距离方法选择欧式距离。是否进行标准化选择默认NONE。点击OK。