ARCGIS空间统计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
ArcGIS空间统计分析——空间关系建模
✓ 普通最小二乘法(OLS)
✓ 即多元线性回归,选择一个或几个自变量来对某个因变 量做出解释,探讨自变量和因变量之间的关系。
✓ 例如:探讨到地铁站的距离、周围购物中心数量、小区绿化率等 因素对于某城市的房价的影响。
✓ OLS模型的一般表达式为:
✓ ArcGIS、SPSS、Stata等软件均可以完成多元线性回归的任 务。ArcGIS只默认一种模式——进入,即所有的自变量 均进入最终的结果,而经典统计软件一般都有逐步回归 (Stepwise)的功能。
值。
高。
值的其他要素;类似地,具有低
值的要素排斥具有低值的其他要
素。
Peking University
第十四页,共25页。
14
ArcGIS空间统计分析——空间关系建模
✓ 回归分析是研究两个或两个以上的变量之间关系的一种统计方 法。
✓ 空间回归在经典统计回归分析中考虑了空间自相关性,通过空间 关系把属性数据与空间位置关系结合起来,空间回归可以更好的 解释地理事物的空间关系.
• 为什么要使用空间统计分析?
✓ 空间统计分析使我们更深入、定量化的了解 -空间分布 -空间聚集或分散 -空间关系
Peking University
第二页,共25页。
2
空间统计分析概述
• 我们能用空间统计分析做什么?
✓ 空间分布特征识别
• 根据气象站点的记录,冬季的盛行风行是什么?
• 地区人口中各种族的聚居分布中心在哪?各种族的空间隔 离度有多大?
✓ 高/低聚类的结果:P值较小且在统计上显著,当Z>0时,
高值在研究区聚类,聚集区为热点;Z<0,低值在研究区
聚类,聚集区为冷点。P值较大,则统计上不显著,呈现
空间随机性。
热点
✓ 应用:在访问急症室的次数中查找出现的异常峰值,确定疾 病集中爆发的位置;犯罪分析、流行病学、投票模式分析、 经济地理学、零售分析、交通事故分析以及人口统计学等领 域也有广泛应用。
• ArcGIS空间统计分析
• ArcGIS空间统计分析模块介绍 • 空间分布特征分析
• 空间分布模式分析 • 空间关系建模 • 案例分析
• 相关资源
Peking University
第一页,共25页。
1
空间统计分析概述
• 什么是空间统计分析?
✓ 将空间信息(面积、长度、邻近关系、朝向和空间关系)整 合到经典统计分析中,以研究与空间位置相关的事物和现象的 空间关联和空间关系,从而揭示要素的空间分布规律。
第五页,共25页。
5
ArcGIS空间统计分析——空间分布特征
✓ 三个中心
✓ 中位数中心:识别使数据集中要素之间的总欧氏距离达到最小的位
置。
老年人口分布调查结果
✓ 平均中心:识别一组要素的地理中心(或密度中心)。
✓ 中心要素:标识出点、线或面要素类中位于最中央的要素。
✓ 各自特点:与平均中心相比,中位数中心是一种更为典型的中 心趋势量度;对于中位数中心来说,数据离群值对结果位置的 影响更小;中心要素则是在已有要素中选取。
✓ AБайду номын сангаасcGIS空间统计分析工具箱共包含6个工具包26个工具,
主要覆盖了三个功能。
✓ 与其他工具箱不同的是,空间统计工具箱中的很多 工具都是提供Python源代码的,是可以进行调试的。 还有较多工具是在Model Builder中根据已有工具构 建的。
✓ 不同于其他工具箱仅输出结果的数据文件, ArcGIS空 间统计分析工具箱的结果有很多重要的结果信息是 输出到结果窗口里的。
相关工具。
可以拒绝零假设。数据集中高值
✓ 举例,胖瘦的座位分布
和低值的空间分布在空间上离散
p 值具有统计 可以拒绝零假设。数据集中低 的程度要高于预期。离散的空间
学上的显著性, 值的空间分布与预期的空间分 模式通常反映某种类型的竞争过
且 z 得分为负 布相比在空间上的聚类程度更 程:具有高值的要素排斥具有高
Peking University
第八页,共25页。
8
ArcGIS空间统计分析——空间分布模式
✓ 空间分布模式:从经典统计学的角度出发,结合要 素的空间分布,以统计因子描述空间分布
✓ ArcGIS中有两组工具用于空间模式分析:
✓ 全局统计:从总体上判断要素的分布状态(集聚、分散)
✓ 局部统计:识别要素聚类或分散的位置和程度(热点、冷点)
✓ 空间分布模式分析
• 哪里是生物多样性最高且栖息条件最好的地方?
• 富裕区和贫困区地过渡界限在哪里?随着时间推移,贫 富居住是否更为集聚?
✓ 空间关系建模
• 为什么在某些特定区域癌症发病率如此高?哪些因素的分 布会影响发病率的地区差异?
Peking University
第三页,共25页。
3
ArcGIS空间统计分析——模块介绍
Peking University
第九页,共25页。
9
ArcGIS空间统计分析——空间分布模式
✓ 什么是Z得分,什么是P值?
✓ 如同一般统计检验都假设样本服从某一分布模式一样(如正态分 布),模式分析工具的先验假设是完全空间随机性 (CSR)。
✓ Z得分表示标准偏差,P值表示要素分布是完全空间随机分布 的概率。z 得分和 p 值都与标准正态分布相关联。
Peking University
第四页,共25页。
4
ArcGIS空间统计分析——空间分布特征
✓ 空间分布特征识别解决的问题
✓ 要素分布的地理中心在哪?
✓ 要素分布是否有特定的方向?
✓ 集中特征分析
✓ 包括了中位数中心、平均中心、中心要素、标准距离和线 性方向均值这六个工具。
Peking University
✓ ArcGIS中空间关系建模包括两种回归工具:普通最小二乘法(OLS) 和地理加权回归(GWR),还有两个系数辅助工具。
✓ 普通最小二乘法与SPSS等统计软件的功能类似,而地理加权 回归则比普通最小二乘法更适合于空间数据,并且其回归结果 往往优于OLS。
Peking University
第十五页,共25页。
✓ 空间自相关——Moran's I系数
✓ 判断要素的属性分布是否有统计上显著的聚集或分散现象, 以探讨数据的空间相关性,可以从结果窗口获取结果。
✓ Moran’s I系数取值范围为[-1,1] ✓ 空间集聚:高低值要素分别聚集,高值被高值要素包围,
低值被低值要素包围,反之则为空间分散 ✓ 当Z得分或P值指示统计显著时,如果Moran’s I指数值为
✓ 模式分析工具得到Z得分和P值之后,若P值大于0.1,则说 明要素分布呈现空间随机性。否则,例如Z=-2.00,P=0.04, 则说明在置信度为 95% 时,要素呈现空间负相关。
Z value=2.0 95%的置信区间内 判断要素空间正相关
Peking University
第十页,共25页。
10
ArcGIS空间统计分析——空间分布模式
✓ 椭圆大小选择:一个标准差椭圆面约包含聚类中 68% 的要素, 两个标准差约包含聚类中 95% 的要素,三个标准差约包含 聚类中 99% 的要素。
✓ 与标准距离不同的是,标准差椭圆能标示出要素分布的 特定方向,因而更能体现离散的分布特征。
✓ 案例:在某城市中有4类人种,以各街区的人口普查数据来分 析种族融合程度。
Peking University
第十八页,共25页。
18
ArcGIS空间统计分析——空间关系建模
➢ 选定一定区域内的观测点带入回归计算
➢ 各观测点的计入权重不同
Peking University
第十九页,共25页。
带宽 权重函数
19
ArcGIS空间统计分析——空间关系建模
Peking University
第二十页,共25页。
20
ArcGIS空间统计分析——空间关系建模
✓ 实例分析:地价数据的回归
✓ 案例:浙江省杭州市宗地价格 ✓ 2006-2011年搜集的98个地价样本
✓ 因变量:宗地价值; ✓ 自变量:宗地面积、容积率、到CBD的距离、到西湖的距
离、到钱江的距离、到地铁站的距离、到学校的距离、 到医院的距离、到商场的距离、到快速路的距离、到大 运河的距离。(距离要素通过Analysis Tools里的Near工具 测算) ✓ 来源:张洁.基于GWR模型的城巿住宅地价空间分异研究一一 以杭州巿为例[D].硕士学位论文,浙江大学,2012.
✓ 模型的残差符合正态分布,且不存在空间自相关;
Peking University
第十七页,共25页。
17
ArcGIS空间统计分析——空间关系建模
✓ 为什么要使用地理加权回归(GWR)
✓ OLS在处理空间数据上的不足:OLS可以构造出最佳描述研 究区域中整体数据关系的方程。然而现实中通常研究区内的
Peking University
第十六页,共25页。
16
ArcGIS空间统计分析——空间关系建模
✓ 普通最小二乘法(OLS)结果解释与验证
✓ 各项因子的符号与预期的符号一致; ✓ 方差膨胀因子VIF:自变量是否存在多重共线性; ✓ T检验等因子是否在统计上显著; ✓ 模型的修正R方是否够大,对因变量的解释百分百;
?????选定一定区域内的观测点带入回归计算?各观测点的计入权重不同?带宽?权重函数arcgis空间统计分析空间关系建模?gwr中带宽确定了局部回归的范围穸间权重矩阵函数????????????????????????一个显著的特点就是距离核越远其值越小这是地理学第一定律决定的
目录
• 空间统计分析概述
✓ Moran’ I指数的应用
✓ 纽约州1969、1985、2002的人均年收入(县统计单元)空 间分布。
1969
1985
2002
Z-Value=5.21
Z-Value=4.26
Z-Value=2.40
✓ Mo得ran到’ I=结0.4论0 :随着时间M推ora移n’ I,=0穷.33人和富人在M空or间an’上I=0分.16离度
下降
Peking University
第十二页,共25页。
12
ArcGIS空间统计分析——空间分布模式
✓ 高/低聚类和热点分析
✓ 使用 Getis-Ord General G 统计可度量高值或低值的聚类 程度,并识别具有统计显著性的热点和冷点。
✓ 地热点震点::要活要素动素具强冷应有点度具低的有值冷高,热值且,同点且样分被被析其低他值同要样素具包有围高。值的要素包围;冷
✓ 两者的具体应用:可以通过将 911老紧年急服务电站话最 的平均中心与紧 急响应站的位置进行比较来评估服务佳位水置平;对超过 65 岁的人
口加权,求得其平均中心,从而确定街区老年服务站的理想位置。
Peking University
第六页,共25页。
6
ArcGIS空间统计分析——空间分布特征
✓ 标准距离
数据并非全局一致的,在不同位置具有不同的表现形式。
✓ GWR处理空间数据的优势: ✓ 基于地理学第一定律,考虑了局部特征; ✓ 更适用于空间数据的回归,既使用了空间信息,又使用 了属性信息; ✓ 模型的结果较OLS更好(修正R2更大,残差更小,残差 的空间相关性更小) ✓ 高大上,更容易发paper
✓ 线性方向平均值
✓ 识别一组线的平均方向、长度和地理中心。
✓ 应用:根据气象站点的记录,冬季的盛行风行是什么? 平均风速有多少?
Peking University
第七页,共25页。
7
ArcGIS空间统计分析——空间分布特征
✓ 分散分布特征——标准差椭圆
✓ 创建标准差椭圆以汇总地理要素的空间特征:中心趋势、 离散和方向趋势。
Peking University
第十三页,共25页。
13
ArcGIS空间统计分析——空间分布模式
结果
高/低聚类
✓ 高/低聚类与空间自相关的区别
空间自相关
p✓ 值不计具算有的统函不数能不拒同绝零假设。要素属性值
计学上的显著 的空间分布很可能是随机空间
✓ 性结。果的解释 过程的结果。
✓ 适用的情况:当存在完全均匀分布的值并且要查找高值 学且p上值z的具得值的值 在显有分。和著异高统为性计低正常值,值空和可值布同间低以的相时拒空比峰值绝间 在聚值同零分空类时时布间假高时与上设,聚。预的。,首类期聚数选它时的类据高们空程集测/间度中倾低量分更高向聚空可和于类间以低彼工拒聚值的此绝的具类程零空相。度,假间要互遗则设分高抵。布憾使于在数消的预用空据期。是空间集。如上中,间聚高果高自类值
✓ 测量要素在几何平均中心周围的集中或分散的程度。 ✓ 一个标准差圆面约包含聚类中 68% 的要素;两个标准差圆
约包含聚类中 95% 的要素;三个标准差约包含聚类中 99% 的要素。 ✓ 应用:针对某个区域内各响应消防站在几个月内接到的 紧急电话的分布情况进行度量和比较,以了解哪些消防 站响应的区域较广。
正则表示要素分布为聚集分布,如果Moran’s I指数值为负 则表示要素分散分布。当Z得分或P值指示统计不显著时,空
间要素分布呈现空间随机性。
✓ 对不同时间的同类要素的分布模式,Z分值越大,聚集程度越
大。
Peking University
第十一页,共25页。
11
ArcGIS空间统计分析——空间分布模式