空间统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Statistics for spatial data; Noel A.C. Cressie, Wiley& Sons,1991
空间统计学 0 引言 0.1定义
空间统计学由于许多学科的需求发展迅速。
空间统计学涉及的领域:生物学、空间经济学、遥感科学、图像处理、环境与地球科学( 大地测量、地球物理、空间物理、大气科学等等)、生态学、地理学、流行病学、农业经济学、林学及其它学科
空间过程或随机场定义:
{}(),Z s s =∈Z S (1) 式中S 是空间位置s 的集合,可以是预先确定的,也可以随机的,2d
d ⊆=S R 是二维欧
氏空间;()Z s 取值于状态空E 。 空时过程:如考虑时间,则
{}
(,),,(,)d Z s t s s t +=∈∈⨯Z S R R
式中S 是空间位置s 的集合,可以是预先确定的,也可以随机的;t +
∈R ;()Z s 取值于状态空E 。
注意:上述为标量值过程,但也可扩展为向量过程。 0.2 空间数据类型
0.2.1 连续型地学统计数据(Geostatistical data ) 此时, 2d
d ⊆=S R
是连续欧氏子空间,即连续点的集合,随机场{}
(),Z s s ∈S 在实值空间E 上的n 个固定位置n s s s ,,,21 取值。如图为连续型空间数据
(a )降雨量分布图;(b) 土壤孔穴分布图。(符号大小正比于属性变量值)
Geostatistical (spatial) data is usually processed by the geostatistical method that has been set out in considerable detail since Krige published his important paper. In summary, this method consists of an exploratory spatial data analysis, positing a model of (non-stationary) mean plus ( intrinsically stationary) error, non-parametrically estimating variogram or covariogram, fitting a valid model to the estimate, and kriging ( predicting )unobserved parts from the available data. This last step yields not only a predictor, but a mean squared prediction error.
0.2.2 离散型格网数据(Lattice data )
此时, 2d
d ⊆=S R
是固定的离散空间点,非随机点集合,随机场{}(),Z s s ∈S 在
2d d ⊆=S R 的空间点采样。空间点可以是给定邻接图关系、表示成网状的地理区域,
如图2-a 。()Z s 是在s 观测的某种感兴趣的值状态空间可以是、也可以不是实值的,比如GDP 、工业产值、农业产值、房产价格;在遥感图像分析领域,空间点就是规则的像元(pixel)集合图2-b 。
Goals for these types of data includes constructing and analyzing explicative models, quantifying spatial correlations, classification, segmentation, prediction and image restoration
(a) A 型血人口百分比分布图;(b) 256*256 相元灰度分布图
0.2.3 点数据(point data )
此时, 观测位置(sites)的集合, 12(,,
,)n x x x =x ,d i x ∈⊂S R 是随机的, 观测位置
(sites)的个数()n n =x 也是随机的; x 是空间点过程在窗口S 的观测结果。如果在每个位置
i x 记录一个值,则称过程为一个记号或标志过程(marked process )。
如图3-a 所示,在显微镜下看到的一个组织切片(histological section )的细胞中心位置;如图3-b 所示,森林中松树的位置和大小(直径)
(a )组织切片细胞中心分布;(b ) 松树位置和直径大小分布
1 Second-order spatial models and geostatistics 1.1 随机过程背景知识 定义1.1. 随机过程
随机过程是在状态空间E 中取值的一族随机变量{}(),Z Z s s S =∈,S 是空间位置s 的集合。
定义1.2. 二阶过程
对所有s S ∈,如果2
(())E Z s <∞ ,则Z 是一二阶过程。均值是从S 到R 的映射,即
()(())m s E Z s =。对所有 (,)s t S S ∈⨯, Z 的协方差是函数 :c S S R ⨯→,即(,)((),())c s t Cov Z s Z t =。
非负定:1
11
(())()(,)0m
m m
T
i i i j i j i i j Var a Z s Var a a c s s =====≥∑∑∑a Z
正定:1
11
(()()(,)0m
m m
T
i i i j i j i i j Var a Z s Var a a c s s =====>∑∑∑a Z
定义1.3. 高斯过程(正态过程)
如果随机过程{}(),Z Z s s S =∈是一高斯过程,则1()m
i i i a Z s =∑是高斯随机变量,
12((),(),
,())T m Z s Z s Z s =Z ,12()((()),(()),,(()))T m E E Z s E Z s E Z s ==m Z ,是随
机向量,方差协方差为((,))i j m m c s s ⨯=Z Σ,概率密度为
1/2
/211
()(2)exp(2()())m T f π----=---Z
Z Z ΣZ m ΣZ m
一维布朗运动:(0)0Z =,()()~(0,),0Z t Z s N t s t s -->≥,对disjoint interval,是一独立增量过程,协方差((),())min(,)Cov Z t Z s t s =。 可以扩展到二维:
1.2 平稳过程
1.2.1 定义
定义1.4 二阶平稳过程
常数均值,协方差满足平移不变性,即 期望:()(())m s E Z s ==constant
协方差:((),())((),())()Cov Z t h Z s h Cov Z t Z s c s t ++==-