空间统计学试题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间统计学原理及应用
GIS
本作业主要分为四大多数,分别是:
一、问答题
二、计算题
三、操作题
四、收获与感想
一、问答题 (50 分)
1.简述地区化变量与随机变量的差别?( 12)
(1)地理学中大多变量都拥有空间散布特色,如海拔、气温、降雨量、土壤含氮量、臭氧浓度、品位等,它们往常随所在空间地点的不一样表现出不一样的数目特色,这些变量称为地区化变量。
地区化变量描绘的现象拥有空间散布的特
色,经常反应某种空间现象的特色,其所描绘的现象称为地区化现象。
(2)设随机实验 E 的样本空间为 S={e} 。
若对于任一 e∈S,都有一实数 z 与之对应,并且对任何实数 z,事件 {Z ≤z} 都有确定的概率,则称 Z 是一个随机变量。
从定义能够看出,随机变量 Z 是一个实值变量,拥有一个可能的取值范围,跟着随机实验结果的不一样而取不一样的值,当取值于任何区间内时都有必定的概率。
(3)差别:一般随机变量的取值按某种概率散布而变化,而地区化变量则依据其在一个域内的地点取不一样的值,即地区化变量时一般随机变量在域内确定
地点上的特定取值,它是随机变量与地点有关的随机函数。
地区化变量有的是三维的,有的是二维的,此刻二维的地区化变量研究许多。
在实质研究中,很多变量都可当作地区化变量,如气温、降雨量、海拔、土壤重金属含量、大气污染浓度、矿石品位、矿体厚度等。
2.试阐述影响空间统计插值计算结果精度的因素?( 18 分)
空间统计插值计算结果精度的影响因素主要以理论基础、模型算法、时空尺度效应和站点数据属性为主。
(1)模型的理论基础不一样 , 插值结果的精度不一样。
因为考虑了地理因素之间在空间散布上的关系性 , 同时兼备到因素散布自己的自有关特征 , 回归因素选择
合适 , 空间异有关模型能够很好地反应空间变异性与有关性 , 一般能够获得精度较高的插值结果。
(2)模型算法的差别致使插值结果精度的差别 : 反距离加权方法、克里格方法往常优于趋向面方法与函数方法。
这些精度差别 , 能够经过其对插值因素空间
变异性与有关性的不一样反应程度来解说。
反距离加权方法的算法只考虑空间距离有关 , 没有包括方向有关 , 即没有反应因素散布的各向异性 ; 而克里格方法利用半方差函数来胸怀两点间的空间有关性 , 这样权重随样点的空间地点不一样而变化。
当因素空间散布呈各向异性时 , 克里格方法优于反距离加权方法 , 而因素散布呈各向
同性时 , 结果相反。
(3)时空尺度经过影响空间散布的变异性与有关性以及站点数据属性影响
插值精度。
时间尺度是指插值因素特色值所表达的时间范围。
时空尺度不一样 , 地理因素所体现出的空间规律性不一样、空间变异程度不一样 , 进而产生尺度效应。
尺度越大 , 波及的时间空间范围越广 , 分辨率往常随之降落 , 常常忽视了较小尺度的空间变异 , 表现其整合特色与整体趋向;尺度越小 , 时间空间范围相应减小 , 凸现出因素散布的局域特色与时空变异。
而时空尺度效应付空间插值精度的影响主要表现为不一样分析水平上空间变异性与空间有关性的变化以及表征这一变化的特
征数据属性的变化。
(4)站点数据的空间采样特征, 站点样本容量、站点地点、数据空间密度、
数据空间散布、空间变化, 都对插值方法的选择与插值精度拥有极大的影响。
这
些影响详细表现为 : ①站点密度高、样本容量大往常能够增添插值的精度, 但数目过多 , 会带来计算上的麻烦 , 对空间插值也未必就有很大帮助。
②站点数据的数值变化大或取值范围大 , 往常都会降低空间插值的精度。
③地表的复杂程度经过要
素样点数据的变异性与值域来影响空间插值的精度。
④回归变量或协变量与插值变量的有关性越高 , 插值精度越高。
3.联合你导师的研究领域,说说空间统计学方法能够用来解决哪方
面问题?假如临时用不上,请说明原因。
( 20 分)
(1)地统计学的应用领域及其宽泛,可应用于地质学、土壤学、生态学、
环境学随和象学等方面。
①地统计学在地质学中的应用
利用地统计学进行矿产资源储量计算及均匀品位预计;
利用地统计学进行矿产资源展望及找矿勘探;
利用地统计学进行石油勘探开发;
②地统计学在土壤学中的应用
地统计学在土壤物理性质空间变异中的应用;
地统计学在土壤化学性质空间变异中的应用;
地统计学方法在土壤学试验设计和采样方法中的应用;
地统计学在土壤质量管理方面的应用;③地统计学在生
态学中的应用
生态学变量空间变异性的定量描绘和解说;
生物特色的预计;
生态学研究对象的时空变化规律剖析、不一样有关研究对象的时空动向及祸
合关系剖析;
④地统计学在环境学中的应用
土壤环境研究;
水环境研究;
其余有关领域研究(大气污染物散布、声环境评论研究等);
⑤地统计学在气象学中的应用
(2)可见,空间统计学的应用领域是及其宽泛的。
导师(赖格英老师)的
研究领域主假如遥感与 GIS 方面,而目前主要从事的研究领域是 SWAT模型方面,如目前的研究项目 ?鉴于 SWAT模型的鄱阳湖流域岩溶地域非点源污染模拟研究?。
固然其项目主假如使用 SWAT模型进行模拟,可是任何学科都必定与其余学科存在某种必定的联系,互相影响。
如项目中的非点源污染问题,必定会用到空间统计学中间的各样插值方法如克里金插值方法。
还有就是对于鄱阳湖流域中间的岩溶裸露程度必定与植被指数、植被覆盖度、地表温度存在某种关系,为了找出这类关系,必定得用到空间统计学中间的自有关性方法来确定它们之间的关系,如有关系数确实定。
二、计算题( 20 分):假定某地域 8 月份均匀气温在空间上的变异规
律能够用以下各向同性的球状变异函数描绘:
0 h 0
*( h) 2.15
3 h 1 h3
1.15(
10 2 10
3 ) 0 h 10
2
3.30 h 10
下列图给出了该地域x1、x2、x3、x4四个实测点的空间地点及其8 月份均匀气温,试用一般克里格法,经过插值预计 x0点的 8 月份均匀气温,并计算预计偏差。
解答:(详尽的数据内容见 Excel 表,即 ?计算题.xls ?)
已知条件:
从题目中能够获得一些已知的信息,如各个点的温度与各个点之间的距离,
T1=35, T2 =39,T3=37,T4=40。
而一般克里格方程组用矩阵形式表达为:
K M
权重系数可由K-1 M 求得。
相同,一般克里格预计方差用矩阵表达为:
2ck C V,V - T M
解:
第一写出用变异函数表达的一般克里格方程矩阵表达式,为方便起见,将i
和 j 两点处的变异函数值表达为ij 的形式,则矩阵表达式为:
K M
即:
11 12 13 14 1 1 01
21 22 23 24 1 2 02
31 32 33 34 1 3 03
41 42 43 44 1 4 04
1 1 1 1 0 1
为了求解克里格权重值,需要计算矩阵中的变异函数值,则又需要先计算出两点间的距离,而后辈入变异函数公式进行计算。
比如,1 号点和2 号点间的距离为
d 12 1 1 2
因为 0 210 ,因此将距离值代入变异函数中得
12 2.15 1.15(3
2 -
1
2
3
3) 2.4904 2 10 2 10
同理, 1 号点和 X0号点间的距离为直角三角形的斜边d10 1 1 1.41
代入变异函数中得
3 1.41 1 1.413
2.391613148 2.39
10 2.15 1.15
10 -
10
3
2 2
由变异函数的性质可知 h - h ,因此 12
21
2.4904 。
因为点自己间的距离为 0,因此 11 2233 44
00
近似地,能够计算其余点间距离及对应的变异函数值, 将计算结果代入矩阵
得
0 2.49 2.49 2.62 1 1
2.39
2.49
2.62 2.49 1 2.49 2.62 0 2.49 1 2.62 2.49 2.49
0 1 1
1
1
1
2 3 4
2.39 2.39 2.39
1
经过矩阵估算得
123
4
0.25, 0.49
将计算结果代入一般克里格预计量公式得
4
Z ck
i
Z
i 0.25
35 39 37 40 37.75
i
1
将计算数值代入一般克里格预计方差公式得
2 4
i i 0 -
00
0.25 4 2.39 - 0 + 0.49 2.88
ck
i 1
则 X 0 号点的 8 月份均匀气温为 37.75 C ,预计偏差值为 2.88 。
三、软件操作题( 30 分):附件数据是鄱阳湖某草洲的钉螺检查有关数据,主文件钉螺数据是? LogTotal ?,其余文件为 ?服务对象? ,请
用 ILWIS 软件达成以下操作:
( 1)应用 ILWIS 软件对数据进行各向同性与各向异性的空间自有关
剖析,并进行合适议论;
( 2)应用 ILWIS 软件供给的各样变异函数模型对数据进行拟合,并
进行拟合优度比较,确定最优模型;
(3)应用 ILWIS 软件,采纳确定的变异函数模型进行空间内插,剖析结果。
解答:(其操作过程中保留的数据寄存于?作业数据 ?的文件夹)
地统计剖析中主要有:路径剖析、点数据的空间自有关、点的插值、克里格
预计、图的置信区查验、栅格地图的空间自有关等。
(1)应用 ILWIS 软件对数据进行各向同性与各向异性的空间自有关剖析,
并进行合适议论。
路径剖析
点的插值假定点是空间随机散布的。
路劲剖析就是考证点能否随机散布,点
的散布方式有三种:随机、聚类、规则。
检查点的路径方法有俩种:近来的邻居距离,邻居距离的反射。
详细的操作过程以下:
双击 Operation-list中的路径剖析(Pattern analysis )。
翻开对话框,选择点图 LogTotal ,输出表名: LogTotal Pattern analysis,点击Show。
表翻开后,从表里选择新图命令,选者 the Y-Axis,选择OK,然再点击
Distance
OK
for the X-Axis ,ProbAllPnt 或
点数据的空间自有关计算(Moran’ s I和Geary’s c)
详细的操作过程以下:
在 Operation-list双击空间互相关系(Spatial correlation)操作
在对话框中,选中点图LogTotal 。
并且选中 Omnidirectional(各向同性)项。
步长输入 5 米(记得上个学期赵老师有举过近似的例子,当时输入的步长是 125 米,对于步长的输入问题不是很理解,此后发现自己输入 125 后间隔比较大,此后发现当初自己理解错了,最后输入了 5 米)。
输出属性表为 LogTotal_Spatcorr ,而后点击 SHOW按钮。
议论:对于步长( Lag spacing )的选择不是很理解,步长能够自己设置的,步
长不一样主要对变异函数模型拟合的便利有影响,经过查问网上资料认识,步长建议越小越好,越大的话所能够留下的间隔可能不足够用于拟合。
在操作的过程中试试了输入步长为 125 米,此间隔比较大,以下列图所示:
在属性表里,选择新建图按钮,选 Distance for the X-axis ,column I for the Y-axis ,而后点击 OK。
在 Distance x I tab选择红色符号点,而后点击OK。
图表显示的就是Moran’s I ,(其保留的数据名为Moran’ s I )在属性表里从头选择新建图表, c for the Y-axis,点击OK。
结果显示的是 Geary’s c (其保留数据名为Geary’s c )
议论:符号能够选择点、线、面等各样形式来表达,以下列图所示,以线为例
知识增补: Moran 指数和 Geary 系数是两个用来胸怀空间自有关的全局指标。
Moran 指数反应的是空间毗邻或空间邻近的地区单元属性值的相像程度,而Geary 系数与 Moran 指数存在负有关关系。
从统计角度解说一般能够归纳
为:
0<C<1 OR I>0 高度正自有关
C>1 OR I<0高度负正有关
C=1 OR I=0随机失散散布
持续在属性表里,选择新建图按钮,选 Distance for the X-axis , SemiVar for the Y-axis ,而后点击 OK。
(其保留的数据名为SV.grh)
接下来就是各向异性的空间自有关操作:
选中 LogTotal ,右键点击 Statistics的Variogram Surface选项
当Number of lags 输入默认值10,Lag spacing 为 5(以前同向剖析时输入的是 5) 时,发现输出的图像不合理,因此试试改变Number of lags de 值
在试试频频改变 Lag spacing 和 Number of lags 的值后,感觉 Number of lags 的
值为 30,Lag spacing 的值为 5,比较合理。
经过剖析输出的图像,能够看出图像的正北、西北 - 东南方向的样点稀少,差别小。
而相反东北 - 西南方向相反。
最后,决定选用 Lag spacing 的值为 5,方向
为东北 - 西南方向,即 45°和 135°。
(其保留的数据名为VS)
重复上边的操作,在 Operation-list 双击空间互相关系(Spatial correlation )操作
在对话框中,选中点图 LogTotal 。
并且选中 Bidirectional (各向异性)项,输入步长 5 米,方向为 45,容差角度 45 度(容差也是能够自己设置的,这里取默认值),输出属性表为 LogTotal_Spatcorr_b ,而后点击 SHOW按钮。
在属性表里,选择新建图按钮,选 Distance for the X-axis , SemiVar1 for the Y-axis ,而后点击 OK。
在翻开的变异函数图中选择from columns ,选Distance for the X-axis,SemiVar2 for the Y-axis,而后点击OK,达成各向异性的空间有关操作。
(其保留的数据名为SV2.grh )
重复上边的操作,把角度改为 0 度和 90 度,输出属性表分别为LogTotal_Spatcorr_b1 、 LogTotal_Spatcorr_b2
不知为什么选择角度为135 时,显示没法选择。
(0 度保留的数据名为SV3.grh )
(90 度保留的数据名为SV4.grh )
议论:对照 0°、 45°和 90°的变异图,发现90°的曲线相对于其余两个比较缓和,而 45°的在距离为 250 左右时开始降落, 0°整体体现上涨的趋向。
( 2)应用 ILWIS 软件供给的各样变异函数模型对数据进行拟合,并进行拟合
优度比较,确定最优模型。
详细的操作过程以下:
翻开LogTotal_Spatcorr,在表菜单中选择新的图,在新图的对话框中选Distance column for X-axis和SemiVar column for Y-axis。
而主要变异函数模型有:球状模型(Spherical Model) 、指数模型(Exponential Model) 、高斯模型(Gaussian Model) 、有理二次模型(Rational quadratic model) 、波涛模型 (Wave Model) 等等。
在 LogTotal_Spatcorr的table图中选择Add Graph-变异函数模型
在对话框中,以Spherical Model为变异函数模型,分别用0.091 、 0.22 、 150 为 Nugget、Sill 、 Range,点击 OK。
在图的操作标签中选择增添图,在与前方相同的 Nugget、Sill 、Range分别选择Circular Model 、Exponential Model 等模型,可是用不一样的颜色显示模型。
经过对照上图各个模型的拟合度发现, Rational Quadratic Model,即有理二次模型的拟合度比较好,接下来就是模型的合适度查验。
(其保留的模型拟合度数据名为SemiVar)
议论:合理的 Nugget、Sill、Range值的选用很重要,决定模型的拟合程度。
变异函数模型的合适度查验
在上面的LogTotal_Spatcorr表中打开Columns 菜单选择半变异函数(SemiVariogram)操作,在对话框中,选择距离为 Column 和 Rational Quadratic Model 模型, Nugget, Sill and Range值分别为0.091、0.220、50。
输出柱名为 SemiCol_Dist ,连续两次点击OK
重复上述操作,用AvgLag 为 Distance column、输出柱名SemiCol_Avg。
把这两个新输出的 column 做图,分别 SemiCol_ Dist 对 Distance和SemiCol_Avg 对 AvgLag
(其保留的数据名分别为:SemiCol_ Dist 和 SemiCol_Avg )
在属性表中输入? G_Gam_Sqr = SQ(SemiVar-SemiCol_Avg)?、? Mean_G = AVG(SemiVar) ? 、‘ G_Avg_Sqr = SQ(SemiVar-Mean_G) ’命令
最后在属性表中输入? R2 = 1-SUM(G_Gam_Sqr) / SUM(G_Avg_Sqr)?命令
因为
因此 R2=0.7 仍是能够的,即有理二次模型拟合度最优,至此达成模型合适性检
验。
经过模型拟合度的合适性查验,最后采纳有理二次模型( Rational Quadratic Model )进行空间插值。
(3)应用 ILWIS 软件,采纳确定的变异函数模型进行空间内插,分
析结果。
对于空间内插,这里采纳克里金插值,详细的操作过程以下
:
双击 Operation-list中的Kriging操作
在对话框中选择 LogTotal ,在 SemiVariogram 中选择上一步确定的最优模型Rational Quadratic ,其 Nugget、Sill 、 Range和 Rational Quadratic 的相同。
选择一般克里金插值,限制距离、点数最小值、最大值这里都选择默认值,输出栅格图LogTotal_king ,WJZBD为地理参照制,选择偏差图( Error Map ),点击SHOW。
对照图 LogTotal_king和LogTotal_king_Error,可发现二者有显然的不一样之处。
把点图 LogTotal 加载到偏差图上
认真在偏差图上发现预计最好的点和最差的点。
四、收获与感想
经过学习空间统计学这么课程,自己收获许多。
在以前本科阶段计量地理的基础深入认识了统计学这门课程,忽然见发现我们平常接触的很多课程都会波及到空间统计学的知识内容,其空间统计学的应用领域是及其宽泛的。
初步认识了统计学中间各样插值方法,如怎样利用克里金插值计算其余点的预计值及预计方差,以及怎样在 Excel 表计算等等。
固然自己学的仍是最基础的东西,可是相信此后还会有时机接触更多对于空间统计学的知识内容。
在学习过程中间理论知识收获好多,就是实践操作的环节比较单薄,而对于那些本科不是地理专业的同学来说,因为本科阶段没有接触过计量地理学这么课程,因此在学习空间统计学这门课程时比较费劲。
请谅解我在这老师您提个小小的建议,就是希望老师在此后的讲课过程中间多加入些实践操作的内容。