空间统计方法概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间统计方法概述
空间计量探索性空间分析
截面数据空间计量模型地理加权回归模型
空间面板计量模型
一、探索性空间分析:
1.探索性空间分析步骤
1)对空间单元进行配对和采样,建立起空间权重矩阵。
2)计算空间自相关系数,包括全域空间自相关系数、局域空间自相关系数。
3)空间自相关系数的显著性检验。
2.空间权重矩阵
1)空间权重矩阵是一种与被解释变量及被解释变量的空间自回归过程相联系的矩阵,用符号W表示。
2)空间权重矩阵的设定
可依据观测对象的地理空间关联或者经济联系来设定权值,W ij衡量地理联系的方法通常有邻近标准和距离标准,按照此种方法确定的W ij为二进制的邻近空间权值矩阵,表示其中的任一元素,采用邻近标准或距离标准。
3)邻近空间矩阵相关概念
分为一阶邻近和高阶邻近,在一阶邻近中,当两个地区有共同边界时才会发生空间关联,用1表示,否则用0表示。
邻近规则有线性相邻、车相邻、象相邻、和王后相邻。
邻近空间矩阵对称且计算简单,适用于测算地理空间效应的影响。
4)距离空间矩阵相关概念
此方法是假定空间相互作用的强度是决定于地区间的质心距离或者区域行政中心所在地之间的距离。
不同的权值指标随着距离d ij的定义而变化,其取值取决于选定的函数形式,有距离的倒数或倒数的平方、欧式距离等。
空间自相关测度点数据
基于密度的方法
样方计数法
核密度估计
基于距离的方法
最近邻指数、G-函数、F-函数
K-函数、M-函数
面数据
全局
H指数、Moran’s I
Geary C、广义G统计量
局域
局部Moran’s I、局部Geary C
局部G统计量、Moran散点图
3.空间数据
1)空间数据的特征
A.观测对象并不独立,所以具有空间依赖性。
B.空间异质性,表示数据的不平稳性。
C.可塑面积单元问题,表示因面积单元的定义不同而导致数据分析结果的不同。
D.空间数据的不确定性,来源于测量上、数据表示方法上、数据分析方法上的不确定性。
2)点数据
点数据是零维的,可以是单独对象目标的抽象表达,也可以是地理单元的抽象表达。
根据观测对象的空间位置研究其分布模式的方法称为空间点模式,一般将点模式区分为三种基本类型:聚集分布、随机分布、均匀分布。
3)面数据
面数据是二维的或者多维的,是指某种类型的对象或现象的区域范围。
4.空间自相关测度方法
1)空间自相关分类
A .全局空间自相关
用以分析空间数据在整个研究区域的空间关联模式,计算全局空间自相关的方法有连接计数统计量、Moran ’s I 、Geary C 、广义G 统计量等。
B .局域空间自相关
用以考察某一区域单元上的某种属性值与邻近单元同一种数据关联性的技术,计算局域空间自相关的方法有局部G 统计量、LISA 、Moran 散点图等。
2)测度方法
A .样方计数法
样方计数法是研究空间点模式最常用的直观方式,通过空间上点分布米芾的变化探索空间分布模式,一般使用随机分布模式作为理论上的标准分布,将样方分析计算的点密度和理论分布做比较,判断点模式属于聚集分布、均匀分布还是随机分布。
B .核密度估计
核密度估计适用于可视化方法表示分布模式,它是使用事件的空间密度来分析表示空间点模式,在核密度估计中,区域内任意一个位置都有一个事件密度,这是和概率密度对应的概念。
核密度的一步定义为:设X 1,…,X n 是从分布密度函数f 的总体中抽取的独立分布样本,估计f 在某点x 处的值f (x ),通常有核估计:
∑=⎪⎭
⎫ ⎝⎛-=n i i n h X x k nh x 11)(f 式中,k ()称为核函数;h>0,为带宽;(x-X i )表示估值点到事件的距离。
C .全局空间自相关统计量Moran ’s I
∑∑∑∑=-=--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-=n i n j i ij n i n j j i ij x x w x x x x w n I 121
其中,I>0表示空间正相关(邻近相似);I<0表示空间负相关(邻近相异)。
D .全局空间自相关统计量Geary C
()()∑∑∑∑∑⎪⎭⎫ ⎝⎛---=-n i n j n i i ij n i n
j j i ij x x w x x w n 22
21c
其中,c >1表示空间负相关;c<1表示空间正相关。
E .局部G 统计量
∑∑=j
j j i ij i x x w G /
F .Moran 散点图
将某个变量的观测值向量与它的空间滞后向量之间的相关关系,通过散点图的形式表示出来,其中横轴对应观测值向量,纵轴对应空间滞后向量,即该观测值周围邻居的加权平均。
二、截面数据空间计量模型
1.空间滞后模型
εβρ++=X WY Y
其中,Y 为N ×1维因变量向量,X 为包含K 个解释变量的N×K 维向量,WY 为空间滞后因子,ε为误差向量;W 为N ×N 维空间权重矩阵,β为解释变量系数,ρ为空间自相关系数。
假定误差服从均值为零,方差为2
σ的对立同分布(i.i.d ),且与解释变量不相关。
在空间滞后模型中,参数反映了自变量对因变量的影响,空间滞后应变量WY 是一内生变量,反映了空间距离对区域行为的作用。
此模型用于探测由于各种空间溢出而产生的空间自相关,这种溢出来自于区域间存在的实质性空间相互作用。
2.空间误差模型 ξελεεβ+=+=W X Y ,
其中,λ为空间自相关系数;ξ为回归误差模型的误差项,假设其都服从均值为零,方差为2σ的独立同分布。
在此模型中,空间自相关反映在误差项中,度量了邻近单元因变量的误差冲击对本单元观测值得影响程度。
3.空间杜宾模型
εγβρ+++=WX X WY Y
其中,WX 表示邻近区域空间滞后解释变量。
此模型反映了区域行为的空间依赖性除直接受到邻近其他地区的影响外,还来源于可能相互依赖的解释变量等外生变量的直接影响。
三、地理加权回归模型
地理加权回归模型(GWR )是一种解决空间非平稳机制的有效方法,它扩展了普通线性回归模型。
在地理加权模型中,利用邻近观测值得子样本数据信息进行局域回归估计而得到的、
随着的空间上局域地理位置变化而变化的变数,GWR 模型可以表示为:
∑=++=k
j ij ij i i j i i i x v u v u 10),(),(y εββ
其中,j β系数的下标j 表示与m ×1观测值联系的阶待估计参数向量,是关于地理位置),(i i v u 的k+1元函数。
空间加权回归模型可以对每个观测值估计出k 个参数向量的估计值,ε是第i 个区域的随机误差,满足零均值、同方差、相互对立等球形扰动假定。
四、空间面板计量模型
1.空间面板数据模型分类
主要有四类:固定效应模型、随机效应模型、固定系数模型和随机系数模型。
2.空间面板数据模型
1)空间滞后面板数据计量模型
it it it it it it x W y y μβρα+++=
其中,it Wy 是因变量的空间滞后变量,主要度量在地理空间上邻近地区的外部效应,是与该区域地理上邻近的区域在时期t 行为变量的加权求和。
2)空间误差面板数据模型
it ;y εμλμμβα+=++=it it it it it it it W x
其中,参数λ衡量了样本观察值得误差项引进的一个区域间溢出成分。
该模型适用于在经济行为的空间依赖性存在误差扰动项中来测度邻近地区因变量的误差冲击对本地区经济行为的影响程度。