GIS中的数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、GIS中的数据分析
第1节空间数据分析
地理信息系统(GIS)与—般的计算机辅助制图(CAM/CAD)系统的主要区别在于GIS具有空间数据的分析、变换能力。除一些基本的变换功能如数据更新、比例尺变换,投影变换外.主要的空间分析和变换功能为地理数据的拓扑和空间状况运算,属性综合运算,几何要素与属性的联合运算等。为了完成这些运算,GIS一般都以用户和系统交互的形式提供以上分析处理能力。应指出,栅格数据结构与矢量数据结构的空间分析方法有所不同。一般来说,栅格结构组织数据的空间分析方法要简单一些。
下图以分级结构形式概括的各种空间分析类型和方法:
图: GIS空间分析方法
一、综合属性数据分析
GIS中属性数据一般采用关系型数据库管理,因此,关系数据库中各种分析功能都可以对属性性数据进行分析。
(一)数学计算
属性数据中的数字型数据可以进行“加”、“减”、“乘”、“除”、“乘方”等数学运算,以产生新的属性值,如人口数/图斑面积(km)=人口密度。
(二)逻辑运算
逻辑运算的基本原理是布尔代数,这种逻辑分析几乎可以在所有
的空间分析中得到应用。它按属性数据的组合条件来检索其他属性项目或图形数据,以及进行空间聚类.
(三)单变量分级分析
属性的单变量分级分析是把单个属性作为变量,依据布尔逻辑方法分成若干个类别。这种分析方法,可进行属性数据的合并式转换,把复杂的属性类别合并成简单的类别,以实现空间聚合
(四)多变量统计分析
多变量统计分析主要用于数据分类。在GIS中存储的数据具有原始的性质,以便用户可以根据不同的使用目的,进行任意提取和分析,特别是对于观测和取样数据.随着采用的分类和内插方法的不同,得到的结果有很大的差异, 因此,在大多数情况下, 首先是将大量未经分类的属性数据输入信息系统的数据库,然后要求用户建立具体的分类算法,以获得所需要的信息。
1.变量筛选分析
随着现代数据收集系统的不断改进,在一个取样点上常可以收集到几十种原始变量。在这些变量中有许多是相互关联的,可以通过寻找一组相互独立的变量,使多变量数据得到简化,这就是变量筛选分析。常用的变量筛选方法有主成分分析法、主因子分析法和关键变量分析法等。
主成分分析是以取样点作为坐标轴,以属性变量作为矢量矩阵,研究属性变量之间的亲疏关系。
主因子分析是以属性变量作为坐标轴,以取样点作为矢量矩阵,
通过以相似系数建立相关矩阵来研究取样点之间的亲疏关系。
关键变量分析则是利用同性变量之间的相关矩阵,通过由用户确定的阀值,从数据库变量全集合中选择
一定数量的关键独立变量,以消除其它
冗余的变量。
2. 变量聚类分析
所谓变量聚类分析就是一系列数据
观测点的属性交量,按其性质上的亲疏
远近程度进行分类。
二、缓冲区分析
缓冲区(BUFFER)分析即根据数据库中的点、线、面实体,在其周围建立一定宽度范围的缓冲区多边形(如下图)。这是GIS空间分析的基本功能之一。例如,断层影响带.
特征要求缓冲区宽度不同时的处理: 在进行缓冲区分析时,经常发生不同级别的同一类要素具有不同的缓冲区大小。例如,在城市土地地价评估时,沿主要街道两侧的通达度、繁华度的辐射范围大.而小街道则较小.这与要素的类型和特点有关。在建立这种缓冲区时,首先应建立要素属性表,根据不同属性确定不同的缓冲区宽度,然后再产生缓冲区.
三、空间合成叠置分析
空间信息(多边形网络叠置层)的合成叠置,就是把同一地区、同一比例尺的两幅或两幅以上的图层重叠在一起,产生新的空间图形或空间位置上新的属性(加、减、判别等)。叠置后产生的新的图形属性就是原叠置相应位置处的图形对应属性的函数,可用下述关系式表达:
U=f (A、B、C… )
式中A、B、C…表示原叠置层的图形的属性.f函数取决于各层上的属性与用户需要之间的关系。
(一)包含分析
包含分析主要用于确定点、线、面之间的相互联系,如确定某区域内矿井的个数,这是点与面之间的包含分析。
(二)多边形叠置
参加叠置分析的两个图层应都是矢量多边
形结构。若需进行多层叠置,也是两两叠置后
再与第三层叠置,依次类推。其中被叠置的多
边形为本底多边形,用来叠置的多边形为上覆
多边形,叠置后产生具有多重属性的新多边形
(右图)
多边形叠置的目的是通过区域多重属性的模拟,寻找和确定同时具有几种地理属性的分布区域;或是按照确定的地理指标,对叠置后产生的具有不同属性级的多边形进行重新分类或分级。
(三)栅格数据的叠置分析
栅格数据的叠置,有三种主要变换类型的函数关系,即点变换、区域变换和邻域变换。
四、网络分析
网络是一系列相互联结的弧段.形成物质、信息流通的通道。例如;水从水库流向各种水渠;从发电厂经电网向用户供电;城市的道路网均构成网络.
网络分析的主要用途是:选择最佳路径;选择最佳布局中心的位置。所谓最佳路径是指从始点到终点的最短距离或花费最少的路线;最佳布局中心位置是指各中心所覆盖范围内任一点到中心的距离最近或花费最小;网流量是指网络上从起点到终点的某个函数,如运输价格,运输时间等。网络上任意点都可以是起点或终点。
第2节数字地面模型(DTM)与地形分析
一、DTM的概念与作用
数字地面模型是描述地面诸特性空间分布的有序数值阵列.
二、DTM的表示方法
1.数学分块曲面表示法
这种方法把地面分成若干个块,每块用一种数学函数,如博立叶级数多次多项式、随机布朗运动函数等,以连续的三维函数高平滑度地表示复杂曲面,并使函数曲面通过离散采样点。
2.规则格网表示法
规则格网表示方法是把DTM表示成高程矩阵,它来源于直接规则矩形格网采样点或由规则或不规则离散数据点内插产生。由于计算机对矩阵的处理比较方便.特别是以栅格为基础的GIS系统中高程矩阵已成为DTM最通用的形式。
3.不规则三角网(TIN)表示法
不规则三角网(TIN)是专为产生DTM数据而设计的一种采样表示系统。它克服了高程矩阵中冗余数据的问题,而且能更加有效地用于各类以DTM为基础的计算。因为了DTM可根据地形的复杂程度来确定采样点的密度和位置,能充分表示地形特征点和线,从而减少了地形较平坦地区的数据冗余。TIN表示法利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点(各三角形的顶点)连接成相互连续的三角面(在连接时,尽可能地确保每个三角形都是锐角三角形或是三边的长度近似相等),如下图。