GIS空间分析原理与方法个人总结复习资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章地理空间数据分析与GIS
1.地理空间数据处理与建模
地理空间数据分析是:(地理学和地理信息科学领域),它通过研究地理空间数据及其相应分析理论、方法和技术,探索、证明地理要素之间的关系,揭示地理特征和过程的内在规律和机理,实现对地理空间信息的认知、解释、预测和调控。

2.1地理空间数据挖掘概述
按照不同的挖掘任务,地理空间数据挖掘可以分为预测模型发现、聚类、关联规则发现、序列模式发现、依赖关系发现、异常值分析和趋势发现等。

地理空间数据挖掘系统包括三大支柱模块:地理空间数据立方体、联机分析处理(OLAP)模块和空间数据挖掘模块.
2.2地理空间数据挖掘典型方法:
⑴地理空间统计方法:分析地理空间数据的统计方法,主要是基于空间中邻近的要素通常比相离较远的要素具有较高的相似性这一原理。

ⅰ.与传统分析有两大差异:①空间数据间并非独立,而是在多维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同的相关程度;②大多数空间问题仅有一组(不规则分布空间中)观测值,而无重复观测的资料。

ⅱ.地理空间统计模型大致可分为三类:①地统计;是以区域化变量理论为基础,以变差函数为主要工具,研究空间分布上既具有随机性又具有结构性的自然现象的科学。

根据离散数据生成连续表面,通过空间自相关进行空间预测。

②格网空间模型:用以描述分布于有限(或无穷离散)空间点(或区域)上数据的空间关系。

③空间点分布形态:在自然科学研究中,许多资料是由点(或小区域)所构成的集合。

由于形成机制不同,空间点分布形态具有随机、丛聚或规则等不同类型。

⑵地理空间聚类方法:地理空间数据聚类是按照某种距离度量准则,在大型、多维数据集中标识出聚类或稠密分布的区域,从而发现数据集的整体空间分布模式。

该方法把空间数据库中的对象分为有意义的子类,使同一子类内部的成员有尽可能多的相同属性,而不同的子类之间差异较大。

⑶地理空间关联分析:地理空间关联分析利用空间关联规则提取算法发现空间数据库中空间目标间的关联程度.GIS数据库是典型的空间数据库,从GIS数据库中挖掘空间关联规则是理解GIS模型和将GIS数据转化成知识的一种有效方法。

关联的规则包括:相邻,相连, 共生,包含.表示空间对象之间的拓扑关系、空间方位、排列次序以及距离信息.
⑷地理空间分类与预测分析:根据已知的分类模型把数据库中的数据映射到给定类别中,进行数据趋势预测分析的方法。

预测是利用历史数据记录自动推导出对给定数据的推广描述,实现对未来数据的趋势分析。

ⅰ.分类和聚类算法的差别在于:①聚类算法是根据一定要求将对象聚为一个集合,最后得到的分布模式是聚类之前未确知的;②分类算法则是根据已知分布模式的属性要求,将数据库对象归入相应的分类中。

ⅱ.分类和回归都可用于预测,空间回归规则与空间分类规则相似,也是一种分类器,其差别在于空间分类规则的预测值是离散的,空间回归规则的预测值是连续的。

⑸异常值分析:若一个数据库包含的数据目标与通常的行为或数据模型不一致,则这些数据目标被称为异常值。

绝大多数数据挖掘方法把异常值作为噪音或例外数据,然而,在很多情况下这将会导致重要隐含信息的丢失。

基于计算机的异常值分析方法主要有三种:基于统计的异常值分析;基于距离的异常值探测;基于偏差的异常值探测。

3.1空间分析:是集空间数据分析和空间模拟于一体的技术方法,通过地理计算和空间表
达挖掘潜在空间信息,以解决实际问题。

ⅰ.空间分析的本质特征包括:探测模式;研究关系并建立模型;提高适合于所有观察模式处理过程的理解;改进预测和控制能力。

空间分析的研究对象:空间分析主要通过对空间数据和空间模型的联合分析来挖掘空间目标的潜在信息。

空间分析研究的主要目标有:认知。

解释.预报.调控.
ⅱ.GIS环境下空间分析框架:一类是基于点、线、面基本地理要素的空间分析,通过空间信息查询与量测、缓冲区分析、叠置分析、网络分析、地统计分析等空间分析方法挖掘出新的信息;另一类是地理问题模拟,解决应用领域对空间数据处理与输出的特殊要求,地理实体和空间关系通过专业模型得到简化和抽象,而系统则通过模型进行深入分析操作。

ⅲ.GIS环境下空间分析方法分为如下六个方面:
①确定性空间分析:分析处理确定性空间数据或解决确定性空间问题的方法,它是高级空间分析的基础。

算法基本上是基于经典数学方法建模的
②探索性空间数据分析:(Exploratory Spatial Data Analysis,ESDA)是利用统计学原理和图形图表相结合对空间数据的性质进行分析、鉴别,用以引导确定性模型的结构和解法的一种技术,本质上是一种“数据驱动”的分析方法。

研究数据的空间相关性与空间异质性,在知识发现中用于选取感兴趣的数据子集,以发现隐含在数据中的某些特征和规律。

相对于传统的统计分析而言,ESDA技术不是预设数据具有某种分布或某种规律,而是一步步地、试探性地分析数据,逐步地认识和理解数据。

EIL:探索性归纳学习方法=数据聚焦EDA+数据泛化AOIL+Rough集
③时空数据分析:挖掘系统沿时间变化的规律。

数据结构、数据操作和完整性约束三部分组成。

目前,较典型的时空数据模型概括起来有以下四种:(1)把时间作为新的维数;
(2)面向对象建模;(3)将时间作为属性附加项;(4)基于状态和变化建模。

④专业模型集成分析:
⑤智能化的空间分析:可以兼容大规模现实世界问题中的不精确性和不确定性,能够达到易加工、鲁棒性、可编程、低成本、快速和精确(与人类操作接近)处理空间数据的目的。

智能化空间分析方法经历了从决策树、基于知识的专家系统到基于智能计算的分析方法的发展历程。

⑥可视化空间分析:分析空间对象的空间分布规律,进行空间对象的空间性质计算,表现数据的内在复杂结构、关系和规律。

目前,可视化空间分析已由静态空间关系的可视化发展到动态表示系统演变过程的可视化 .
第二章GIS空间分析基础
1.空间分析地理对象的空间位置、空间形态、空间格局、空间关系等特征信息需要通过空间坐标系统、空间尺度、空间数据结构和空间数据模型等来表达与描述,地理空间问题需要通过空间计算、空间推理等方法来获取与求解。

2.ⅰ.空间:是一个复杂的概念,具有多义性,既有与时间对应的含义,也有“宇宙空间”的含义。

ⅱ.欧氏空间:是对物理空间的一种数学理解与表达,是GIS中常用的一种重要空间。

欧式空间擅长平面二维空间目标的空间方位、规模的表达。

欧氏平面的基本变换类型为:①全等变换:形状和尺寸;②相似变换:形状; ③仿射变换:相似性;④投影变换:投影性质。

⑤拓扑变换:拓扑特征.
ⅲ.拓扑空间是另一种理解和描述物理空间的数学方法,也是GIS中常用的重要数学空间。

而拓扑空间则是描述空间目标宏观分布或目标之间相互关系的有效方法。

拓扑关系(Topological Relation)是不考虑距离和方向的空间目标之间的关系。

包括:
相邻;邻接;关联;包含.
在拓扑空间中,欧氏平面可以想象成由理想弹性模型做成的平面,它可以任意延伸和收缩,但不允许折叠和撕裂。

若空间目标间的关联、相邻与连通等几何属性不随空间目标的平移、旋转、缩放等变换而改变,这些保持不变的性质称为拓扑属性,变化的称为非拓扑属性。

3.地理空间是指物质、能量、信息的存在形式在形态、结构、过程、功能关系上的分布方式、格局及其在时间上的延续。

它是上至大气电离层,下至地幔莫霍面的区域内物质与能量发生转化的时空载体,是宇宙过程对地球影响最大的区域,它被定义为具有空间参考信息的地理实体或地理现象发生的时空位置集。

绝对空间(属性描述的空间几何位置的集合,由一系列不同位置的空间坐标组成)和相对空间两种形式(具有空间属性特征的实体集合,由不同实体之间的空间关系构成).
4.地理网格系统是一种以平面子集的规则分级剖分为基础的空间数据结构,具有较高的标准化程度。

它能由粗到细、逐级地分割地球表面,将地球曲面用一定大小的多边形网格进行近似模拟,再现地球表面,其目的是将地理空间的定位和地理特征的描述一体化,并将误差控制在网格单元的大小范围内。

ⅰ.地理网格既可以类似于栅格数据用最小单元网格来表达空间对象,还可以像矢量数据那样用网格点代替传统的坐标点对来表达空间实体的几何特征,因此出现了两种类型的地理网格。

一类是用于存储区域信息的网格系统(区域网格系统),另一类是用于存储位置信息的网格系统(位置网格系统).
ⅱ.地理坐标网格系统也存在明显的缺陷:
*由于网格单元面积不等造成统计分析的复杂性;
*网格的面积变形、形状变形以及内点位置误差由赤道向南北极逐渐递增;
*网格系统的最顶端和最底端的网格形状实际上并不是显示在平面上的方形而是三角形;
*地理坐标网格系统的方形网格单元具有复杂的邻接特性,每一个格网都有四个与之共边的、且中心点等距的邻接四边形,同时它还有四个与之共顶点的、且与中心点不等距的四个邻接四边形,这种复杂的邻接关系不利于模拟应用。

5.地理空间数据特征:多尺度\多维结构\时空特征\不确定性\海量性
6.空间分布与格局:地理对象通常可以抽象为点目标、线目标、面目标三类
•空间分布分析
*通常采用分布密度、均值、分布中心(几何中心、分布重心)、离散度、空间集聚度以及粗糙度等指标进行空间分布格局的描述;
*通过空间分布检验来确定地理对象的聚集、分散、均匀、随机等分布类型;
*用空间聚类分析方法反映分布的多中心特征并确定这些中心;
*通过趋势面分析反映现象的空间分布趋势等。

7.资源配置是在资源总量不足的背景条件下,将有限的资源重新进行时空分配,使稀缺的资源的功效最大化,从而保证社会经济和生态效益最优化。

8.空间关系与影响:空间关系包括:距离、方向、连通、拓扑
空间相互影响:利用状态变量和影响因素之间的关系类比建立数学模型,并用实测数据回归获得参数,然后进行分析预测。

它一般应用于社会经济领域的问题.空间关系分析的必要性:略9.空间动态与过程:*时空数据的分类和时间量测*基于时间的平滑和综合*变化的统计分析、时空叠加*时间序列分析以及预测分析
第三章空间量测与计算
空间量测与计算是指对GIS数据库中各种空间目标的基本参数进行量算与分析,如空间目标的位置、距离、周长、面积、体积、曲率、空间形态以及空间分布等。

3.1 空间量测尺度
ⅰ.维度:空间目标分为实体与现象,实体描述空间中的静态物体,一般是以0维、1维、2维、3维、分数维存在;现象描述空间物体发生发展过程,一般是以3维和4维,即2维+时间维和3维+时间维的形式存在。

空间维的划分还存在高维空间,但在GIS空间量测中只考虑与空间量测关系密切的0维、1维、2维、3维、4维以及分数维。

(不同空间维之间的转化主要取决于用户根据不同的需要所确定的空间尺度,有时也受制于技术条件和客观条件) ⅱ.比例尺:决定了空间数据的密度、空间坐标的精确有效位和相应影像数据的空间分辨率,空间维。

比例尺越大,其所承载的空间信息越多,在进行空间量测时所能够量测的信息也就越多,所得到的量测值越精确。

ⅲ.属性数据:在GIS中,属性数据是指与空间位置无直接关系的特征数据,它是与地理实体相联系、经过抽象的地理变量,通常可将其分为定性和定量两种形式。

①定性属性数据包括名称、类型、种类等用以表述空间实体性质方面的特征,多用字符、符号表示;②定量属性数据包括数量、等级等用以表述空间实体数量方面的特征,多用数字形式表示。

字符形式的属性类别数据采用逻辑关系处理,而数字形式的属性数字数据通常采用数学关系处理。

③属性数据的量测尺度由粗略至详细大致可分为命名量、次序量(不同次序之间的间隔大小可以不同)、间隔量(不参照某个固定点,按间隔表示相对位置)及比率量(有真零值而且量测单位间隔相等的数据,可加、减、乘、除)等四个层次。

④命名量、次序量、间隔量、比率量的区别和联系
(1)数据量测尺度的差别不是事物本质的差异,而是人们对事物观察角度的差异。

数据从不同的侧面反映了事物的本质,由于“侧面”的不同,数据的量测尺度会有所不同。

简单地说,土壤按土质好坏可以统计为土地等级资料,即为次序量尺度,也可以按土壤的结构和成分统计为土壤类型资料,即为命名量尺度。

(2)属性数据的不同量测尺度之间可以转化。

根据现实需要可以将一组统计好的数据进行量测尺度转化,这种转化只能按比率量→次序量→间隔量→命名量方向进行,因为从命名量到比率量描述事物的能力越来越强,越来越精确。

比率尺度数据如果不考虑可计算操作性,就成为间隔尺度数据,间隔尺度数据经过分级处理就成为次序尺度数据,而次序尺度数据不考虑其“序”就是命名量尺度数据,这个转换过程中,信息的丢失和“忽略”是必然的,因此其逆向变换是不可能的,但通过间接方法,如分布密度、面积比等可以实现定性变量的定量化。

3.2基本几何参数量测(位置、中心、重心、长度、面积、体积和曲率)
ⅰ.位置:在矢量数据结构中,由于其位置直接由坐标点来表示,所以位置是明显的,但属性是隐含的;在栅格数据结构中,每一个位置点都表现为一个单元(Cell或Pixel),属性是明显的,而位置是隐含的。

点\线\面(线目标表示)\体(面和线目标表示)
绝对位置:以经纬网为参照确定的位置可以说是一种绝对位置。

通常利用角度量测系统,另外,一个参照点或坐标系中坐标原点确定的位置.相对位置:…..
位置精度是指数据集(如地图)中物体的地理位置与其真实地面位置之间的差别.
ⅱ.中心测量:空间量测的中心多指几何中心
ⅲ.重心测量:是描述地理对象空间分布的一个重要指标。

从重心移动的轨迹可以得到空间目标的变化情况和变化速度。

重心量测经常用于宏观经济分析和市场区位选择,
ⅳ.长度测量:距离量测:最短、最大、重心距离。

距离实际情况:函数距离(棋盘距离、曼哈顿) 曼哈顿距离的度量性质与欧氏距离相似,都保持对称性和三角不等式成立;两者不同的是,在讨论空间邻近性时,不同点间距离的排序有很大差异。

当坐标轴变动时,点对之间的距离就会不同,因此曼哈顿距离只适用于讨论具有规则布局的城市街道等相关问题。

*若障碍物对空间目标物产生的阻抗值小于某一临界值,则为相对障碍物;若障碍物的阻抗值大于或等于这一特征值,则空间目标物的运动被完全阻止,障碍物变为绝对障碍物。

ⅴ.面积量测:多边形边界分解为上下两半,其面积是上半边界下的积分值与下半边界下的积分值之差。

将三维曲面投影到二维平面上,计算其在平面上的投影面积。

ⅵ.体积量测:在对地形数据处理时,当体积为正时,工程上称之为“挖方”;体积为负时,称之为“填方”---以基准面积(三角形或正方形等)乘以格网点曲面高度的均值,得到基本格网的体积,各个基本格网的体积累积之和就是区域总体积
3.3地理空间目标形态量测
1.线状地物:绝对和非绝对线状。

直线和曲线两种;面状。

2.空间完整性是空洞区域内空洞数量的度量,通常使用欧拉
函数量测。

欧拉函数是关于碎片程度及空洞数量的一个数值
量测法。

3.4 空间分布计算与分析
空间分布的研究内容主要有两个方面: 分布对象和分布区域
1.点模式的空间分布
点模式的描述参数有分布密度、分布中心、分布轴线、离散度、样方分析、最近邻分析等
①分布密度:分子为分布对象的计量,分母为分布区域的计量。

均一(规则)、随机和簇状。

*如果每个均一的样方包含相同数量的点对象,则整个研究区分布具有均一性,这种检验分布性的标准型方法称为样方分析。

--将观测得到的频率分布和已知的频率分布或理论上的随机分布作比较,判断点模式的分布类型。

*QA对分布模式判别产生影响的主要因素有:样方的形状,采样的方式,样方的起点,大小等,这些因素都会影响到点的观测频次和分布。

*最邻近分析:先测出每点与其最近点间的距离,然后将量
测值与所测距离的均值进行比较。

这种统计方法仅涉及计算
每对最近点间距离的平均值,平均最近邻距离提供了空间分布中点之间距离的量度或点之间的距离指数。

最邻近距离法:最邻NNI近指数测度:检验最邻近指数显著性方法:
②分布中心:可以概略表示点状分布对象的总体分布特征、中心位置、聚集程度等信息。

几何中心、加权平均中心、中位中心以及极值中心等。

核密度分析法:在研究区域中使用滑动的圆形区域来统计出落在圆域内的事件数量,在除以圆的面积,就得到估计点S处的事件密度。

KDE中的边缘效应:在KDE中,靠近研究区域R边界的地方会产生扭曲核估计的边缘效应③分布轴线和离散度:离散点群在空间的分布趋势或走向可以用分布轴线来确定。

离散度是反应分布对象聚集程度的空间分布参数,它是分布中心和分布轴线的补充。

2.线模式的空间分布
线密度:对线要素也要进行密度分析,用某区域内线的长度之和除以该区域面积总和即可得到某一区域的线密度,单位是m/m2,或km/km2。

最近邻分析以线中点的位置来代替线,忽略线的长度,对各中心点进行最近邻统计。

密度估计值:(n-1)*l/n*a
连通度:线状物体在空间中形成网络,因此研究线状物体之间的连通性极为重要。

线状物体连通度是指线划要素在构成网络时的连接性以及从一处到另一处的连通程度,它是对网络复杂性的一种量度。

3.区域模式:离散区域分布和连续区域分布
一种是与点模式完全相同的多边形数量密度;一种是和点模式稍微有差别的面积密度,它的方式是先求出多边形的面积,然后计算各类多边形的面积与研究区域总面积的比值,得出的结果是百分比而不是点模式的密度比。

第四章
一、空间表达
*空间表达是基于地理认知理论,对复杂地理客观世界的等级、层次特征及多种性质的地学过程和现象进行科学抽象和描述的方法,是科学理论和现实世界之间的一座桥梁。

*客观世界的抽象:首先通过人类的感知系统对客观世界进行地理空间的认知,并将其抽象概括为地理问题,最后再用计算机表示,将空间数据集成与管理,建立客观世界的数字模型。

*地理空间的表达形式:
1.数据结构:
①矢量数据结构是通过记录坐标方式,利用欧几里德几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据表达方式。

②栅格数据结构是指将空间分割成有规则的网格,在各个网格上给出相应的属性值来表示地理实体的数据表达形式。

③矢量与栅格数据区别:矢量方式表达的地理数据
位置精度较高,具有显示地建立目标的空间关系的
能力,适于几何转换及拓扑关系描述,图形输出效
率较高,适于几何转换及拓扑关系描述,图形输出
效率较高,但叠加分析的算法复杂,空间分析效率
低;栅格表达方式具有叠加分析的简单算法,空间
分析效率高的优点,但无法满足拓扑关系分析的要
求,图形输出效率也很低。

2.空间参考系统:地图制图和GIS数据共享的基础,保证同一地理信息系统内(甚至不同地理信息系统之间)的数据能够实现交换、配准和共享。

包括坐标系统和地图投影系统。

3.图形表达:显示了地理实体和现象的特征(数量和质量)、分布(组合)及规律。

4.时空尺度与比例尺:在不同空间尺度下,对地理目标抽象表达的信息密度差异很大,而空间数据在不同的观察层次上所遵循的规律以及体现出的特征也不尽相同。

比例尺反映了空间数据的空间尺度特性。

*空间表达的意义:地理空间表达为地理科学研究与现实世界架设了桥梁,使得人类不断地向自身认知的极限挑战,也促使人们从更加开阔的视野、更多的视角来研究和认识地球表层特征空间。

二、空间数据转换格式
*意义:空间数据获取的手段; GIS空间数据处理的重要任务; 实现数据共享的方法之一.
*栅格结构数据中混合像元的处理:1:面积占优;长度占优;中心点法;重要性法。

2:缩小栅格单元面积。

*栅格结构数据的编码方法:
1.直接栅格编码:简单直观,是压缩编码方法的逻辑原型(栅格文件);
2.链码:效率高,接近矢量结构,边界运算方便,无区域性质,区域运算难;
3.游程长度编码:大程度压缩,最大限度的保留,易编码解码,适合于微机;
4.块码和四叉树编码:区域性质,可变的分辨率,较高效率,四叉树编码可以直接进行大量图形图象运算,效率较高,是很有前途的编码方法。

三、地理空间坐标变换
*意义:GIS实现多源数据无缝集成的基础;GIS空间分析的基础;GIS输出显示成果的需要。

*坐标系转换方法:仿射变换(六参数变换),相似变换(4个参数:平移、旋转、缩放)。

相关文档
最新文档