对地理信息系统数据结构与数据组织管理之分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对地理信息系统数据结构与数据组织管理之分析摘要:本文基于笔者多年从事地理信息系统的相关工作经验,以地理信息系统矢栅数据结构及数据组织管理为研究对象,探讨了地理信息系统数据模型、数据结构、数据组织与管理方法。
关键词:地理信息系统;数据结构;数据组织管理
现代地理信息系统的普遍的发展趋势是以数据仓库形式构筑一个规模庞大的并行数据库系统,具有海量的数据存储与管理能力,数据库的主体是地理实体的各种时态下的属性信息数据,而地理实体的空间位置数据虽然是地理信息处理的基础,但是相对而言,空间数据库在系统数据库中所占份额并不大。
与一般的地理信息系统不同的是,我们开发的电信线路网络gis 系统采用的就是关系型数据库(oracle)和gis软件相结合的方式。
由于最常用的系统功能是显示当前电信设备,因此有效的组织电信要素数据数据库是比较重要的。由于gis的数据是海量的,系统在图形处理速度上的快慢是一个gis系统成功与否的重要标志。因此,我们采用了背景图和电信设备、线路分开组织、统一管理的方式。背景图存储地形图的空间和属性数据;而关系数据库存储电信设备及线路的空间和属性数据。
由于地理信息库数据结构是地理信息处理技术的基础,地理信息数据库结构设计是整个系统设计成败的关键所在。合理的数据结构能提高整个系统信息处理的效率,简化系统编程,增强地理信息库对异常情况的容错能力,从而达到提高整个系统实时性、可靠性
的目的。
设计合理的系统空间数据库的结构有两方面的意义:其一是提高对操作的响应速度,其二是缩小系统数据库的体积,使之能存储在容量有限的设备中。图形数据采用矢量数据结构。
一、gis空间数据模型与数据结构
根据所采用的数据结构的不同,gis数据模型可分为矢量型、栅格型以及栅格与矢量混合型。一般来说,栅格型gis的数据结构简单,易于实现面域数据的处理,如求面域的面积、周长,作面域的扩张、收缩、叠加,以及求弧段的交点等。但它不便于作面向实体的处理,不便于记录特征之间的相互关系,且数据存储需占较大空间;而矢量型gis的数据结构则较为复杂,但它擅于表达特征之间的相互关系,如面域的相邻关系,弧段的相交关系,以及点对线的归属关系,线对面的归属关系等,并且易于以实体为单位对数据进行处理,它的数据存储也只需较小的空间。只是对于栅格型gis所擅长的面域方面的处理,用矢量数据结构来实现时,则需要较复杂的处理过程和较多的处理时间。随着计算机的发展,处理速度的飞速提高,数据的处理时间问题变得不再那么突出,而人们对数据所能表达的内容的要求却越来越高,因而更多的地理信息系统采用了矢量数据结构作为其主要数据结构。
矢量数据易于实现面向实体的操作,这里的实体是现实世界中的个体在数据世界中的映射。在二维数据世界里,面状实体用来表达平面投影为面状的物体,如居民地、林地、水域等;线状实体则
表达平面投影长宽相差非常显著,并且对其面积不作为重点考察的物体,如各种管线、道路,以及小比例尺地图上的河流、通路等;点状实体用来表达投影面积可忽略不计的物体或示意点,如小比例尺地图上的居民点、港口、机场等。
1.栅格数据结构
在栅格数据结构中,空间被规则地划分为栅格(通常为正方形)。地理实体的位置和状态是用它们占据的栅格行、列以及取什么值来定义的。实体的空间位置就是用其在栅格中的行号、列号来表示;实体的属性就用单元的取值来表示,这样输入、输出、储存、处理都比较方便。在靠近事物边界的位置,按四舍五入原则决定单元取值。基本单元的大小代表了栅格型地图(空间)数据库的分辨率。一般地图是用点、线,面来表达空间事物,点在网格中占据一个基本单元,线由一系列单元连接成锯齿状折线,面的边界也是锯齿状的。
用栅格结构表示的地表特征是不连续的,在栅格结构中,地表被分成相互邻接、规则排列的矩形方块(有时也可以是三角形或菱形、六边形等),每个地块与一个栅格单元相对应,栅格数据的比例尺就是栅格大小与地表相应单元大小之比。
2.矢量数据结构
空间数据一般由点、线、面组成,在矢量数据结构中,所有这些空间要素都是以点的形式表示的,最常用的是二维笛卡尔平面直角坐标系,折合平面解析几何对物体的描述十分相似。一个点有一
对坐标(x,y)表示,没有形状也没有大小。简单的线用一串有次序的坐标表示,对精度要求高的曲线可用多条很短的直线来拟合,也可用圆弧或更复杂的数学函数和直线混合起来表示。面是用线围起来的封闭的不规则多边形。虽然矢量坐标点的分辨率比栅格模型中的最小基本单元的分辨率要高得多,但实际使用时也要受存储量的限制。如小比例尺地图数据库中的河流不能表现出实际的宽度变化;大比例尺地图数据库中的房屋边界,也往往略去一些小的转折。另外坐标点用什么做基本单位,保留小数点后几位,也是有限制的。
在矢量型的gis软件中,定义多边形比定义点、线要复杂。早期的gis软件或计算机地图制图系统常把多边形的边界看作是线的简单闭合,这种方法可称为“环”状多边形编码或数据结构,这种结构比较简单,但不能表达边界和多边形之间的关系,以及相邻多边形之间的关系,而且公共边界要定义两遍,制图是容易产生重复绘制的问题,且数据冗余度较大。
二、 gis数据的组织与管理
1.空间数据的组织
目前,通常的方法是用“层”的概念来分别存储不同专题的空间信息。即每一层存放一种专题或一类信息,并有一组对应的数据文件。在具体的数据库设计时,分得粗好,还是分得细好,必须根据应用上的要求、计算机硬件的存储量,处理速度以及软件的限制来决定。一般来说,分得过细不便于操作人员记忆,处理上比较麻烦;分得过粗不利于某些特殊要求的分析、查询。例如,把不同性
质的地下管线合在同一层上,当需要单独查询、显示其中一种管线时,只能根据管线的属性来区分,这比单独用一层存放一种管线要花费更多的处理时间,数据更新也是分开方便。但是,若经常要同时显示几种管线时,若用分开存放的方式,需要同时对几个层操作,这时又可能是合起来方便。
2.空间数据的管理
一般的事物管理用的dbms不适合直接管理空间数据,常见的原因有以下几点。
2.1不提供有关空间位置的查询功能。如要查询某幢房子有哪些公共设施
管线通道它附近,这幢房子在土地使用规划图上允许做什么用等等,一般的obms很难做到,再复杂的分析更难。
2.2没有复杂的图形显示功能。空间查询、分析的结果不只是文字报告图形显示更重要,一般的dbms不具备这一能力。
2.3存储、处理空间数据不够经济。空间数据模型的内部结构比较特殊,而一般的事物管理用的obms大都是表状的关系型数据结构。