【精品课件】空间统计分析初步
空间数据分析分析解析(课堂PPT)
上下四分位数之间的差值为半极差(H):
H Q3 Q1 极差是度量数据分散性的指标.
36
若数据序列 x1, x2 , , xn 符合正台分布总
体
N (, 2 ) ,则其总体的上下四分位数为:
31
探索性空间数据分析与可视化
1.EDA ESDA与可视化
EDA技术的特点是数据不做假设,而是 利用统计图表,图形和统计概括方法对数据 特征进行分析与描述,从而对数据进行更为 复杂的建模分析.
ESDA技术是EDA的推广,空间数据存 在自相关性,使数据无法满足独立性假设.
32
1.1EDA 与可视化基本方法 包括两种类型:1)计算EDA,2)图形EDA技术 1.1.1箱线图
7
空间分析的研究内容
1)空间数据模型与地理世界的表示 2)探索性空间数据分析与可视化 3)空间数据的性质 4)空间数据分析的点模式方法 5)面数据的空间分析方法与空间回归模型 6)空间连续数据的分析方法 7)地图代数与栅格数据建模技术
8
8)地理模型与决策支持 第2章 空间数据的性质
2.1地理世界的概念模型与数据模型 对现实世界进行高度抽象,概括其概念模型,
然后建立适应于计算机存储与表示的数据模型. 2.1.1地理世界的概念模型
9
1)离散实体
通过其独特的局部化特征相互区别,通过特 定属性的个体被识别,如建筑物,街道等.
离散对象观的重要特征是可以计数.
维数是离散实体的显著特征,实体自然被 抽象为点(只有位置的0维实体),线(具有长 度属性的一维实体)和多边形(占据一定面积 的2维实体).
均海拔高 县的产值
度
份额
道路.河流 区域的人 长度 均收入
土地利用 类型
空间数据统计.ppt
4.空间插值
空间插值常用于将离散点的测量数据转换为连续 的数据曲面,它包括内插和外推两种算法。前者是 通过已知点的数据计算同一区域内其他未知点的数 据,后者则是通过已知区域的数据,求未知区域的 数据。
主要的内插方法有:
反距离加权(Inverse Distance Weighted) 全局多项式(Global Polynomial Interpolation) 全局多项式(Local Polynomial Interpolation) 径向基函数(Radial Basis Funtions) 克里格内插( Kriging )
实验一 空间数据统计、插值
1.空间数据统计
GIS/LIS数据库中的专题数据进行统计分析包括
频数和频率 属性数据的集中特征 平均数、中数和众数
数学期望
最大可能 出现的数
属性数据的离散特征 极差、离差、方差、 标准差和变异系数
1.
工 具 的 调 入 : 工 具
地 统 计 分 析
>
2.表文件数 据的加载
作业
1、利用练习数据制作AOM的克里格插 值图;
2、采用反距离加权、全局多项式、 径向基函数等插值方式制作AOM分布图, 并与克里格插值图进行比较;
3、采用克里格方法制作土壤有机质 含量变化图。
实验二 空间数据的可视化表达
——制作上海市行政区划图
一、实验目的
了解符号化、注记标注、格网绘制以及地图 整饰的意义。 掌握基本的符号化方法、自动标注操作以及 相关地图的整饰和数据的操作。 对数字地图制图有初步的认识。
将道路按class字段分类:分为1~4级道路,并采用 不同的颜色表示;
地铁线符号Color:深蓝色,Width:1.0; 区县界线Color:橘黄色,Width:1.0 ; 区县政府Color:红色,Size:10,样式:Star3; 市政府符号在区县政府基础上改为大小18。
第4章空间统计分析初步——第1节探索性空间统计分析
第4章空间统计分析初步——第1节探索性空间统计分析探索性空间统计分析是空间统计分析的第一步,旨在揭示地理现象的空间分布模式和空间关联关系。
在进行探索性空间统计分析时,主要应用的方法包括空间自相关分析、扫描统计、点模式分析和基尼系数等。
空间自相关分析是用于评估地理现象是否呈现出空间聚集或空间离散的方法。
常用的空间自相关分析方法有Moran's I和Geary's C等。
Moran's I是一种广泛应用的空间自相关指标,它测量了地理现象在空间上的聚集或离散程度。
当Moran's I的值接近1时,表明地理现象呈现出正空间自相关,即相似的值聚集在一起;当Moran's I的值接近-1时,表明地理现象呈现出负空间自相关,即相似的值分散在一起;当Moran's I的值接近0时,表明地理现象呈现出随机分布。
扫描统计是一种常用的空间聚类分析方法,用于寻找地理现象的热点区域和冷点区域。
扫描统计的基本思想是通过不断调整和扫描的空间窗口,在不同的空间尺度上计算地理现象的局部指标,并找出具有显著性的空间聚类区域。
常用的扫描统计方法有卡斯帕-多斯的方法和波尔兹曼-莫丘特的方法等。
通过扫描统计分析,可以确定地理现象的聚集程度,并找到聚集区域的中心。
点模式分析是用于评估地理现象的点空间分布模式的方法。
在点模式分析中,主要用到的指标有距离分布函数和聚类指数等。
距离分布函数是用于描述点之间的距离分布特征的函数,常用的距离分布函数有Ripley's K函数和Clark-Evans函数等。
聚类指数是用于衡量点空间分布中聚集程度的指标,常用的聚类指数有平均距离指数和个体隔离指数等。
通过点模式分析,可以确定地理现象的点分布模式是随机分布、聚集分布还是分散分布。
基尼系数是用于评估地理现象的空间不平等程度的指标。
基尼系数的取值范围为0到1,0表示完全平等,1表示完全不平等。
常用的基尼系数有基尼指数和基尼分位数等。
城市规划系统工程学空间统计分析初步教学PPT
空间统计分析概述
空间自相关分析
空间自相关分析是检验地理事物空间分布特征的方法,通过计算地理事物之间的空间依赖关系,判断其是否存在聚集或离散现象。
空间回归分析
空间回归分析是利用回归分析的方法,对地理事物之间的空间关系进行建模和预测,通过建立因变量和自变量之间的数学关系,揭示空间现象之间的相互影响和作用机制。
总结词
详细描述
城市环境质量分析
05
案例研究
总结词
利用空间统计分析方法评估城市规划方案的合理性和可行性。
详细描述
通过收集该城市的历史地理信息、人口数据、经济数据等,利用空间统计分析技术,如空间自相关分析、空间回归分析等,对城市规划方案进行评估,分析其与现有城市发展状况的匹配度,预测未来发展趋势,为城市规划决策提供科学依据。
城市规划系统工程学的基本原理
城市发展战略规划
通过系统分析交通流量、路网结构等因素,优化城市交通布局。
城市交通规划
城市环境治理
公共设施配置
01
02
04
03
根据居民的需求和城市的资源条件,合理配置公共设施。
应用系统工程学的方法,制定城市的发展战略和目标。
综合分析环境质量、污染源等因素,制定有效的环境治理方案。
新的方法和技术的出现
随着科技的不断进步,新的空间统计分析方法和技术将不断涌现。这些新的方法和技术将进一步提高空间统计分析的精度和效率,为城市规划提供更多的可能性。
与其他领域的交叉融合
空间统计分析不仅在城市规划中具有应用价值,在其他领域如环境监测、商业分析等也有广泛的应用前景。未来,空间统计分析有望与其他领域进行更多的交叉融合,拓展其应用领域和价值。
《空间统计分析》课件
空间回归分析
总结词
适用于具有空间依赖性和异质性的数据
VS
详细描述
空间回归分析适用于具有空间依赖性和异 质性的数据。这些数据通常在地理位置上 存在相关性,并且可能受到局部环境、社 会经济等因素的影响。例如,在疾病地理 学中,可以利用空间回归分析来研究疾病 发病率与地理位置之间的关系。
空间回归分析
总结词
R软件介绍
统计计算和图形呈现的编程语言
01
R是一种开源的统计计算和图形呈现的编程语言,广泛应用于数
据分析和数据挖掘领域。
强大的统计分析功能
02
R提供了大量的统计分析函数和包,可以进行各种统计分析,如
回归分析、聚类分析、主成分分析等。
灵活的可视化功能
03
R支持多种图形绘制系统,如基础图形、lattice和ggplot2等,
传感器数据
通过各种传感器采集的环境监 测数据,如气象站、水文站等
。
其他数据
包括商业数据、政府公开数据 等,涵盖了各种与空间位置相
关的信息。
空间数据的处理方法
数据清洗
去除重复、错误或不完 整的数据,确保数据质
量。
坐标转换
将数据从一种坐标系转 换到另一种坐标系,以
便进行空间分析。
数据聚合
将小区域数据合并为较 大区域,以便进行更高
森林火灾风险的空间分析
总结词
评估森林火灾风险的区域差异
详细描述
利用空间统计分析方法,评估不同区 域的森林火灾风险,识别高风险区域 ,为森林防火和资源管理提供科学依 据。
气候变化对农业产量的影响研究
总结词
分析气候变化对农业产量的影响程度
详细描述
通过空间统计分析,研究气候变化对农业产量的影响程度, 分析不同地区的气候变化对农业产量的贡献,为农业可持续 发展提供决策支持。
空间统计分析方法ppt课件
Geary系数C的取值一般在[0,2]之间,大于1表示负 相关,等于1表示不相关,而小于1表示正相关。
(三)局部空间自相关
描述一个空间单元与其领域的相似程度,能够 表示每个局部单元服从全局总趋势的程度(包括 方向和量级),反映了空间异质性,说明空间依 赖是如何随位置变化的。
局部空间自相关分析方法包括3种: 空间联系的局部指标(LISA); G统计量; Moran散点图
Moran散点图的4个象限, 分别对应于区域单元与其邻居 之间4种类型的局部空间联系 形式:
第1象限代表了高观测值的 区域单元被高值的区域所包围 的空间联系形式;
第2象限代表了低观测值的 区域单元被高值的区域所包围 的空间联系形式;
第3象限代表了低观测值 的区域单元被低值的区域所 包围的空间联系形式;
1. 基本原理与方法
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n个 位置的空间区域的邻近关系,其形式如下
w11 w12 W w21 w22
wn1 wn2
w1n
w2
n
wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
东部的江苏、上海、浙江三省市的Z值在0.05的显著性水 平下显著,天津的Z值在0.1的显著性水平下显著。而东部 上海、江浙等发达省市趋于为一些相邻经济发展水平相对 较高的省份所包围,东部发达地区的空间集聚分布特征也 显现出来。
以(Wz,z)为坐标,进一步绘制Moran散点图
可以发现,多数省(直辖市、自治区)位于第1和第3象限内, 为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象 限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的 高高集聚类型的省(直辖市、自治区)更多一些。
第四章 空间统计分析初步
Weights Matrix Example
Sample Region and Units Simple Contiguity (rook) Matrix 1 1 2 0 1 0 1 0 2 1 0 1 0 1 3 0 1 0 0 0 4 1 0 0 0 1 5 0 1 0 1 0 6 0 0 1 0 1 7 0 0 0 1 0 8 0 0 0 0 1 9 0 0 0 0 0
Social movements (trade unions, demonstrations)
Market analysis (housing and land price variation) Spillover effects (economic spillovers of universities) Regional studies (regional income variation & inequality) Demography (segregation patterns) Political science (election studies)
式中:Wij表示区域i与j的临近关系,它可 以根据邻接标准或距离标准来度量。
两种最常用的确定空间权重矩阵的
规则
根据连接性 ①简单的二进制邻接矩阵
1 当区域i和j相邻接 wij 其他 0
根据距离 ②基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时 wij 其他 0
n
2
S 2 wij
i 1 j i
式中: I 为Moran指数;
1 2 S ( xi x ) ; n i 1 n x xi 。 n i 1
2
The expected value of Moran's I under the
空间统计分析课件
平均数也分简单调和平均数和加权调和平均数,
其公式分别为
X t
n n1
i1 x i
n
Pi
X
tp
i1
n P i
i1 x i
几何平均数(geometric mean ):是n个数据连乘的 积开n次方根,计算公式为
n
X g n xi i 1
ห้องสมุดไป่ตู้•空间统计分析课件
(3)中位数(Median ) 一组数据按从小到大(或从大到小)的顺 序依次排列,处在中间位置的一个数(或 最中间两个数据的平均数,注意:和众数 不同,中位数不一定在这组数据中)。 中位数的定义可知,所研究的数据中有一 半小于中位数,一半大于中位数
•空间统计分析课件
9.2.2 代表数据离散程度的统计量
有时虽然两个数据集的平均数相等,但各数据分 布在平均数左右的疏密程度却不相同,也就是它 们的离散程度不一样,为了把一个数据集的离散 程度表现出来,就需要研究离散度。
离散程度越大,数据波动性越大,以小样本数据 代表数据总体的可靠性越低;离散程度越小,则 数据波动性小,以小样本数据代表数据总体的可 靠性越高。
标准差是方差的平方根,记为
1 n
n i1
(xi
x)2
•空间统计分析课件
(8)变差系数(coefficient of variation) 变差系数也称为离差系数或变异系数,是 标准差与均值的比值,以C v 表示
Cv x 10000
变差系数用来衡量数据相对变化的程度
•空间统计分析课件
9.2.3 代表数据分布形态的统计量
•空间统计分析课件
基本统计量
描述数据特征的统计量
集中趋势
平均数 中位数 众数 分位数
第9章 空间统计分析-PPT精选文档
(1)最大值(max)与最小值(min) 把数据从小到大排列,最前端的值就是最 小值,最后一个就是最大值 (2)极差(range ) 一个数据集的最大值与最小值的差值称为 极差,它表示这个数据集的取值范围
极差计算公式: x=xmax-xmin (xmax为最大值,xmin为最小值) 如: 12,12,13,14,16,21 这组数的极差就是 21-12=9
X
p
Байду номын сангаас
n
i1
Pi x i
n
i1
Pi
例: 你的小测成绩是80分,期末考成绩是90分, 老师要计算总的平均成绩,就按照小测40%、期 末成绩60%的比例来算,所以你的平均成绩是: 80×40%+90×60%=86
调和平均数(harmonic mean ):各个数据的倒数 的算术平均数的倒数,又称为倒数平均数,调和 平均数也分简单调和平均数和加权调和平均数, 其公式分别为 n
7, 8, 8, 8, 9
10, 10, 11, 12
5
4 6
0.20
0.16 0.24
频 率 分 布 表
5(13~15) 13, 13, 14, 14, 15, 15
0.25 0.2 0.15 0.1 0.05 0 1~3 4~6 7~9 10~12
频 率 直 方 图
13~15
9.2.1 代表数据集中趋势的统计量
9.2.2 代表数据离散程度的统计量
有时虽然两个数据集的平均数相等,但各数据分 布在平均数左右的疏密程度却不相同,也就是它 们的离散程度不一样,为了把一个数据集的离散 程度表现出来,就需要研究离散度。 离散程度越大,数据波动性越大,以小样本数据 代表数据总体的可靠性越低;离散程度越小,则 数据波动性小,以小样本数据代表数据总体的可 靠性越高。
第4章空间统计分析课件
2.1 简单的二进制邻接矩阵
123 456 789
车的行走方式
123 456 789 王、后的行走方式
16
17
18
19
20
2.2 基于距离的二进制空间权重矩阵
21
22
空间自相关按功能大致分为两类: 全域型空间自相关(Global Spatia Autocorrelation) 区域型空间自相关(Local Spatia Autocorrelation)
45
人均GDP局部Moran指数表
46
河南地级市人均GDP局部Moran指数
47
48
49
4.2 G统计量
全局G统计量的计算公式为: 对每一个区域单元的统计量为:
50
对统计量的检验与局部Moran指数相似,其检验值为
显著的正值表示在该区域单元周围,高观测值的区域 单元趋于空间集聚,而显著的负值表示低观测值的区 域单元趋于空间集聚。
25
3.1 Moran’s I
设研究区域中存在n个面积单元,第i个 单元上的观测值记为xi,观测变量在n个单 元中的均值记为 ,Moran’s I定义为:
26
-1≤ I ≤1 1表示极强的正空间自相关,-1表示极强的 负空间自相关。
27
对于Moran指数,可以用标准化统计量Z来检 验n个区域是否存在空间自相关关系,Z的计算公 式为:
第4章 空间统计分析
§4.1 空间自相关 Spatial autocorrelation
1
空间统计分析,即空间数据的统计分析,通过 空间位置建立数据间的统计关系。
空间统计学产生的原因: 大多数经典统计学分析要求样本相互独立, 而空间数据间并非完全独立,而是存在依赖性。
ARCGIS空间统计分析演示文稿ppt
• 注意: ARCGIS“空间统计”工具箱,只 要分析中涉及距离(对于空间统计总 是如此),就应使用 投影坐标系(而 不是基于度、分、秒的 地理坐标系) 对数据进行 投影。
1.ARCGIS空间统计任务
➢汇总某分布模式的关键特征。 ➢标识具有统计显著性的空间聚类(热点/
冷点)和空间异常值。 ➢评估聚类或分散的总体模式。 ➢对空间关系建模。
空间模式是否随着时间
推移发生变化?
或高/低聚类 (Getis-Ord
General G)
是否突然出现药品购买高峰?
随着时间推移,该疾病是保持固定 在同一个地理位置,还是扩散到邻 近的地方?
抑制措施是否有效?
空间过程彼此之间是否 多距离空间聚类分析
类似?
(Ripley's K 函数)
该疾病的空间模式是否反映出高危 人群的空间模式?
1.1汇总关键特征
问题
工具
示例
中心在哪里?
平均中心或中位 数中心
人口中心在哪里以及它如何随时间变化?
哪个要素的地理 位置最便利?
中心要素
应将新建的支持中心定址在哪里?
主导方向或方位 是什么?
线性方向平均值
冬பைடு நூலகம்的主要风向是什么? 在此地区如何确定断层线的方位?
哪个犯罪团伙所涉及的地域最大?
要 密 程素集度的程如分度何散或?程融度合、标分准布距(标离准或差方椭向圆)哪种疾病菌株的分布范围最广? 根据动物选择的生活地点,各物种会达到什么样的 融合程度?
商业入室盗窃的空间模式是否偏离 商业场所的空间模式?
数据是否在空间上相关?空间自相关 (Global Moran's I)回性归的残空差间是 自否相表关现?出具有统计显著
第10章-空间统计分析
趋势分析透视图
(五)空间自相关分析
1 空间分布模式 2 空间权重矩阵 3 空间自相关系数
1 空间分布模式
可以划分为聚集模式(clustered pattern)、分散模 式(dispersed pattern)和随机模式(random pattern) 三类。
*逐点内插本质上是局部内插,但与局部分块内
插有所不同;
*逐点内插法的邻域范围大小、形状、位置乃至
采样点个数随内插点的位置而变动,又称为移动 曲面法。
逐点内插法的基本步骤为:
1 定义内插点的邻域范围; 2 确定落在邻域内的采样点; 3 选定内插数学模型; 4 通过邻域内的采样点和内插模型计算内 插点的值;
一 二 三 四 五 基本统计量 探索性数据分析 分级统计分析 空间插值 空间回归分析
Байду номын сангаас
三 分级统计分析
把数据划分成不同的级别,体现 数据自身的特征,为应用研究及专题 制图提供基础。
三 分级统计分析
(一)分级的概念与目的 (二)分级的原则 (三)分级统计的方法
(一) 分级的概念与目的
概念: 根据一定的方法或标准把数据分 成不同的级别。 目的: 区分数据集中个体的差别。
1. 空间统计学产生的原因?
大多数经典统计学分析要求样本相 互独立,而空间数据间并非完全独 立,而是存在依赖性。
2 空间统计分析的目的?
描述事物在空间上的分布特征(随机的、 聚集的或规则的)。 分析数据的空间自相关性,空间自相关 性对空间格局的影响,如何利用这种关 系构建模型
本章主要内容:
逐点内插
空间统计分析
②基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时 wij 其他 0
常用的确定空间权重矩阵的规则(补充)
反距离权重系数:假定随着两点之间距 离的增加,它们之间关系的重要性会出现
线性递减。
wij 1/ dij
常用的确定空间权重矩阵的规则(补充) 而 wij 1/ dij 只体现了线性递减关系,
寻找离群值的主要方式: 1. 利用直方图查找离群值 2. 用半变异/协方差函数云图识别离群值 3. 用Voronoi图查找局部离群值
3.4 全局趋势分析
全局趋势(空间趋势)反映了空间物体在空 间区域上的变化的主题特征,它主要揭示了空间 物体的总体规律,而忽略局部变异。 • 趋势面分析
单击Geostatistical Analyst模块的下拉箭 头选择Explore Data并单击trend anlysis。
当数据呈偏态分布时,由于均值考虑了所有观察值,因此 容易受极端数值的影响,而众数又缺乏良好的数学性质, 依分组求得的众数不够精确,所以此时多选用中位数作为
描述集中性趋势的统计量。
当变量为名义尺度数据时通常只能用众数来描述集中趋势。
2.2 代表数据离散程度的统计量
代表数据离散程度的统计量包括最大值、 最小值、分位数、极差、离差、平均离差、 离差平方和、方差、标准差、变差系数等。 离散程度越大,数据波动性越大,以小 样本数据代表数据总体的可靠性越低。
数据的空间统计分析与经典统计分析方法的关系
共同点:都是在大量采样的基础上,通过对样本的属性值的
频率分布、均值、方差等关系及其相应规则分析,确定其空 间分布格局与相关关系。 不同点:数据的空间统计分析既考虑到样本的大小,又重视 样本空间位置及样本间的距离。空间数据具有空间依赖性 (空间自相关)和空间异质性,扭曲了经典统计分析的假设 条件,使得经典统计分析对空间数据的分析会产生虚假的解 释。经典统计分析模型是在观测结果相互独立的假设基础上
第12章 空间统计分析
矢量,通过以相似系数建立相关矩阵,研究属性变量之间 的亲疏关系。
主因子分析是以属性变量作为坐标轴,以取样点作为 是以属性变量作为坐标轴,
矢量, 矢量,通过以相关系数建立相关矩阵来研究取样点之间的 亲疏关系。 亲疏关系。
关键变量分析则是利用属性变量之间的相关矩阵,通 则是利用属性变量之间的相关矩阵,
第十二章 空间统计分析
空间统计分析
为什么要进行空间统计分析? 为什么要进行空间统计分析? 1、空间数据的直观、综合评价 2、空间数据的主要特征和内在联系 3、空间数据的分类和评价
一、空间统计分析主要类型
1、单变量统计分析——空间数据的直
观、综合评价
2、多变量统计分析——空间数据的分
类和综合评价
二、单变量统计分析
(二)聚类分析 聚类分析
将一组采样点或数据按其亲疏程度进行分类; 亲疏程度指标
欧氏距离、 马氏距离、 切比雪夫距离、 兰氏距离、 绝对距离等
欧氏距离计算
m
Ed ij =
( xik − x jk ) 2 ∑
k =1
变量聚类分析
所谓变量聚类分析就是对一系列数据观测点的属性变量, 按其性质上的亲疏远近程度进行分类。m个属性数据组成了 m维空间,两个数据点在m维空间的相似性可用变量空间欧 几里德距离来表示
是数据标准化后的夹角余弦,其计算公式为: rij是数据标准化后的夹角余弦,其计算公式为:
空间数据分析 ppt课件
综合了城市内部各小区的位置特征。通过距离(可
以结合时间、阻力等线路因素)反映城市中心与区
内各部分之间的具体联系。
5)标准面积指数
S
A As A As
式中:S为标准面积指数;
A为区域面积;As为与区域面
积相等的等边三角形面积。
标准面积指数能反映城市
形状的破碎程度。城市形状
越破碎,则其与等边三角形
4)放射状指数(RADIAL SHAPE INDEX)
放射状指数有两个不同的计算公式,较常使用的
计算公式为:
n
n
放射状指数= | (100di / di ) (100 / n) |
i 1
i 1
式中,di 是城市中心到第i地段或小区中心
的距离,n为地段或小区数量。
这一指标不单纯是从抽象的形状入手,而是
的交集越小而并集越大,所
以其比值越小。不过,通常
认为圆才是真正的紧凑形状,
而并不是等边三角形。
5.坡度和坡向
坡度:水平面与局部地表之间夹角的正切值,包含斜度 (高度变化的最大值比率,常称为坡度)和坡向(变化比率 最大值的方向)
影响到地区的稳定度及水流速度;
坡度的缓急可以从等高线的疏密程度判知; (1) 等高线较疏的地区,地势较平坦;
缓冲区分析 则是对一组或一类地物按缓冲的距离条件, 建立缓冲区多边形,然后将这一图层与需要进行缓冲区分析 的图层进行叠置分析,得到所需结果的一种空间分析方法。
缓冲区分析适用于点、线或面对象,如点状的居民点、 线状的河流和面状的作物区等。
邻域半径R即缓冲距离(宽度),是缓冲区分析的主要数 量指标,可以是常数或变量。
空间对象还可以生成多个缓冲带。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
空间统计的基本思想:
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).
✓
如果引入记号
nn
S0
wij
i1 j1
zi (xi x)
zj (xj x) zT[z1,z2, ,zn]
则全局Moran指数I的计算公式也可以进一步写成
nn
nn
n
I
S0
wij(xi x)(xj x)
i1 j1
n
(xi x)2
n S0
i1
wijzi z j
j1
n
zi 2
n S0
zTWz zT z
霍乱病死者居住分布图(John Snow, 1854)
第1节 探索性空间统计分析
➢基本原理与方法 ➢应用实例
探索性空间数据分析(ESDA)
ESDA是指利用统计学原理和图形图表相结合 对空间信息的性质进行分析、鉴别,用以引 导确定性模型的结构和解法。
ESDA与EDA区别在于它考虑了数据的空间特 性,在方法上它将数据分解为一般趋势和叠 加于其上的局部变化两部分。然后用一定的 数学函数去拟合由样本点产生的经验变率函 数,进行诸如克立格内插等空间操作。
➢ 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。
❖ 1854年8月到9月英国伦敦霍乱 流行时,当局始终找不到发病的 原因,后来医生约翰·斯诺 (John Snow) 参与调查。
❖ 他在绘有霍乱流行地区所有道路、 房屋、饮用水机井等内容的1: 6500比例尺地图上,标出了每 个霍乱病死者的居住位置,得到 了霍乱病死者居住分布图。
①简单的二进制邻接矩阵
1 当区i域 和j相邻接
wij 0
其他
②基于距离的二进制空间权重矩阵
1 当区i和 域j的距离d小 时于
wij 0
其他
(二)全局空间自相关
✓ Moran指数和Geary系数是两个用来度量空间 自相关的全局指标。 ✓ Moran指数反映的是空间邻接
或空间邻近的区域单元属性值 的相似程度。
✓ 空间统计分析的任务,就是运用有关统计方法,建 立空间统计模型,从凌乱的数据中挖掘空间自相关 与空间变异规律。
空间统计 VS. 经典统计
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种空间相关
性,且在不同的空间分辨率下呈现不同之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间分布不规
Z I E(I) VAR(I )
i1
i1
Moran指数I的取值一般在[-1,1]之间,小于0表示负相 关,等于0表示不相关,大于0表示正相关;
Geary系数C的取值一般在[0,2]之间,大于1表示负 相关,等于1表示不相关,而小于1表示正相关。
对于Moran指数,可以用标准化统计量Z来检验n个区域是否存 在空间自相关关系,Z的计算公式为
✓ Geary 系数与Moran指数存在 负相关关系。
Patrick A.P.Moran (1917-1988)
如果是位置(区域)的观测值,则该变量的全局Moran指
数I,用如下公式计算
n n
n
wij xi x xj x
I i1 j1
nn
n
wijxi x2
i1 j1 i1
nn
wij (xi x)(x j x)
i1 ji
nn
S 2
wij
i1 ji
式中: I 为Moran指数;
S2 1
n
i
(xi x)2 ;
1 n
x n i1 xi 。
✓
Geary 系数C计算公式如下
n n
n 1
wij xi x j 2
C
i1 j1
nn
n
2wijxi x2
i1 j1 i1
式中:C为Geary系数;其他变量同上式。
Tobler, W. R. (1970). "A puter movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
第四章 空间统计分析
本章主要内容
➢第一节 探索性空间统计分析 ➢第二节 地统计分析方法
空间统计分析
✓ 空间统计分析,即空间数据(spatial data)的统 计分析,是现代计量地理学中一个快速发展的方向 和领域。
✓ 空间统计分析,其核心就是认识与地理位置相关的 数据间的空间依赖、空间关联或空间自相关,通过 空间位置建立数据间的统计关系。
一、基本原理与方法
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n 个位置的空间区域的邻近关系,其形式如下
w11 w12 w1n
W
w21
w22
w2
n
wn1
wn 2
wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
两种最常用的确定空间权重矩阵的规则
/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则地理分 析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所要求的样 本独立性假设不满足。
如果地理学从根本上值得研究,必然是 因为地理现象在空间上的变化不是随机 的。 经典统计:随机
为什么要用空间统计
➢ 可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么
样”,更想知道“哪里怎么样”
➢ 空间统计学可以帮助我们准确地判断具体地理模 式的原因。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可
能是病源。