4数据结构
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
曲阜师范大学 王萍
12
(2)线实体
2013-8-11
曲阜师范大学 王萍
13
• 串(string)由相互连接的一系列线段组成的没 有分支线段的序列,它可与自身或其他线相切。
• 弧(arc)由数学表达式确定的点集组成的弧状
曲线。
• 链(link)两个节点之间的拓扑关联。
2013-8-11
曲阜师范大学 王萍
显的优越性。然而在某些操作时,必须把游程长度编码和
块码解码,转换为基本栅格结构进行。
2013-8-11
曲阜师范大学 王萍
43
• ④四叉树编码
• 四叉树又称四元树或四分树,是最有效的
栅格数据压缩编码方法之一,绝大部分图
形操作和运算都可以直接在四叉树结构上
实现。
2013-8-11
曲阜师范大学 王萍
44
分辨率也高,而不需表示许多细节的部分则分级少,分辨率低,
因而既可精确表示图形结构又可减少存储量; • 栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容 易; • 多边形中嵌套异类小多边形的表示较方便。
• 缺点
• 转换的不确定性,用同一形状和大小的多边形可能得出多种不同 的四叉树结构,故不利于形状分析和模式识别。
曲阜师范大学 王萍
26
• 1. 定义
• 栅格结构是最简单、最直接的空间数据结构,是 将地球表面划分为大小均匀紧密相邻的网格阵列, 每个网格作为一个像元或像素由行、列定义,并 包含一个代码表示该像素的属性类型或量值,或
仅仅包括指向其属性记录的指针。
• 基于连续覆盖
• 边数从3到N的规则铺盖,方格、三角形和六
根节点
3 1
4
2
终止节点 叶子节点
曲阜师范大学 王萍
2013-8-11
45
• 采用四叉树编码时,为了保证四叉树分解能不断
地进行下去,要求图像必须为2n×2n的栅格阵列,
n为极限分割数,n+1为四叉树的最大高度或最大
层数。
• 上图为23×23的栅格,因此最多划分3次,最大层
数为4。
• 对于非标准尺寸的图像需首先通过增加背景的方
2013-8-11 曲阜师范大学 王萍 9
• 2. 特点
• 用离散的点描述空间对象与特征,定位明显,属
性隐含。定位是根据坐标直接存储的,属性则一
般存于文件头或数据结构中某些特定的位置上。
• 用拓扑关系描述空间对象之间的关系。
•
• •
面向目标操作,精度高,数据冗余度小。
输出图形质量好,精度高。 与遥感等图象数据难以结合。
2013-8-11
曲阜师范大学 王萍
2
•
地理空间的特征实体包括点(point)、线(line)、 面(polygon)、曲面(surface)和体(volume)等多种类 型,如何以有效的形式表达它们,关系到计算识 别、存储、处理的可能性和有效性。 • 基于计算机的地理信息系统不能直接识别和 处理各种以图形形式表达的特征实体,要使计算 机能识别和处理它们,必须对这些特征实体进行 数据表达。
2013-8-11 曲阜师范大学 王萍 50
2013-8-11
曲阜师范大学 王萍
51
矢量与栅格数据结构的比较
2013-8-11
曲阜师范大学 王萍
5
• 空间数据编码是空间数据结构的实现,即将根据
土地信息系统的目的和任务所搜集的、经过审核
了的地形图、专题地图和遥感影像等资料,按特
定的数据结构转换为适合于计算机存储和处理数
据的过程。
• 由于土地信息系统的数据量极大,一般采用压缩
数据的编码方式以减少数据的冗余。
(4)百分比法
2013-8-11
曲阜师范大学 王萍
32
• 栅格数据的比例尺就是栅格大小与地表相 应单元大小之比。 • 若栅格尺寸较大,会存在形态上的畸形, 还可能包括属性方面的偏差。
2013-8-11
曲阜师范大学 王萍
33
• 4. 编码方法 • (1)直接栅格编码
• 直接编码就是将栅格数据看做一个数据矩阵,逐行(或逐 列)逐个记录代码,可以每行都从左到右逐个进行像元记 录,也可以奇数行地从左到右而偶数行地从右向左记录, 为了特定目的还可以采用其他特殊的顺序。
2013-8-11
曲阜师范大学 王萍
6
一、矢量数据结构
矢量结构
2013-8-11
曲阜师范大学 王萍
7
• 1.定义
• 土地信息系统中的矢量数据结构,即通过记录
坐标的方式尽可能精确地表示点、线、多边形 等地理实体。 • 矢量数据提供的坐标位置比栅格数据用行、列 号所表达的位置更精确。
2013-8-11
2013-8-11
曲阜师范大学 王萍
3
道 河
湖泊
居民地
2013-8-11
曲阜师范大学 王萍
4
当对特征实体进行数据表达时,关键又看如何表达空间 的一个点,因为点是构成地理空间特征实体的基本元素。 如果采用一个没有大小的点(坐标)来表达基本点元素时, 称为矢量表示法;如果采用一个有固定大小的点(面元) 来表达基本点元素时,称为栅格表示法,它们分别对应 矢量数据模型和栅格数据模型,代表着从信息世界观点 对现实世界空间目标的两种不同的数据表达方法,其在 功能、使用方法及应用对象上都有一定的差异,这在一 定程度上反映出GlS表示现实世界的不同概念,也是人 类悟性的产物。
• ①链码
2013-8-11
曲阜师范大学 王萍
37
• 优点: • 链式编码对线状和多边形的表示具有很强的数 据压缩能力,且具有一定的运算功能,如面积 和周长的计算等,探测边界急弯和凹进部分等 都比较容易,类型矢量数据结构,比较适于存 储图像数据。 • 缺点: • 对叠置运算如组合、相交等则很难实施,对局 部修改将改变整体结构,效率较低,而且由于 链码以每个区域为单位存储边界,相邻区域的 边界则被重复存储而产生冗余。
2013-8-11
曲阜师范大学 王萍
21
对任何一条线段,用其两 端的节点及相邻面域来表示; 利用这种拓扑关系来组织数据, 可以有效地进行数据存储正确 性检查,同时便于对数据进行 更新和检索。
2013-8-11 曲阜师范大学 王萍 22
• POLYVRT数据结构
二、 栅格数据结构
2013-8-11
14
• (3)多边形
• 坐标序列法
• 拓扑结构编码法
2013-8-11
曲阜师范大学 王萍
15
坐标序列法
实体数据结构
由多边形边界的x、y坐标对集合及说明信息组成, 是最简单的一种多边形矢量编码。
2013-8-11 曲阜师范大学 王萍 16
拓扑结构编码法
• • • • • • 唯一标识 多边形标识 外包多边形指针 邻接多边形指针 边界链接 范围
2013-8-11
曲阜师范大学 王萍
38
• ②游程长度编码
特征值
长度
2013-8-11
曲阜师范大学 王萍
39
特 征 值
位 置
2013-8-11
曲阜师范大学 王萍
40
• 游程长度编码在栅格压缩时,数据量没有明显的 增加,压缩效率较高,且易于进行检索、叠加合 并等操作,运算简单,适用于机器存储的容量小、 数据需大量压缩,而又要避免复杂的编码解码运 算增加处理和操作时间的情况。
2013-8-11 曲阜师范大学 王萍 30
• 2. 特点 • 属性明显,定位隐含,即数据直接记录属 性的指向或属性本身,而所在位置则根据 行列号转换为相应的坐标,也就是说,定 位是根据数据在数据集中的位置得到的。
2013-8-11
曲阜师范大学 王萍
31
• 3. 决定栅格单元代码的方式
(1)中心点法 (2)面积占优法 (3)重要性法
较好的解决了空间关 系查询等问题,但增 加了算法的复杂度
2013-8-11
曲阜师范大学 王萍
17
树状索引编码法
点文件 点号 1 2
… 15
坐标
x1,y1 x2,y2 x15,y15
…
线号 起点 Ⅰ 6 Ⅱ 5 Ⅲ 6 Ⅳ 12
2013-8-11
终点 5 6 5 12
点号 6,1,2,3,4,5 5,6 6,7,8,9,10,11,5 12,15,14,13
曲阜师范大学 王萍
多边形文件 多边形号 边界线号 1 Ⅰ,Ⅱ 2 Ⅱ,Ⅲ 3 Ⅳ
18
采用树状索引以减少数据冗余并间接增加
邻域信息,方法是对所有边界点进行数字化,
将坐标对以顺序方式存储,由点索引与边界 线号相联系,以线索引与各多边形相联系, 形成树状索引结构。
2013-8-11
曲阜师范大学 王萍
19
数据结构
第4讲
• 描述地理实体数据本身的组织方法,称为内部数 据结构。空间数据结构是指适合计算机系统存储、 管理和处理的地学图形的逻辑结构,是地理实体 的空间排列方式和相互关系的抽象描述。 • 对同样的一组数据,按不同的数据结构去处理, 得到的可能是截然不同的内容。只有充分理解地 理信息系统所采用的特定数据结构,才能正确地 使用系统。
2013-8-11
曲阜师范大学 王萍
34
• 特点
• ①简单,直观。
• ②数据量大,数据冗余严重。
• ③是压缩逻辑编码的数学原型。
2013-8-11
曲阜师范大学 王萍
35
• (2)压缩编码方法
• 链码、游程长度编码、块码、四叉树
编码等 • 无损编码、有损编码
2013-8-11
曲阜师范大学 王萍
36
2013-8-11
曲阜师范大学 王萍
20
• DIME(双重独立坐标地图编码,Dual Independent Map Encoding)编码系统 • DIME是美国人口调查局在人口调查的基础
上发展起来的,它通过有向编码建立了多
边形、边界、节点之间的拓扑关系,DIME
编码成为其它拓扑编码结构的基础。
度较快。
• 常规四叉树编码:
• 记录叶结点和中间节点。
• 线性四叉树编码:
• 只存储最后的叶结点信息,包括位置,深度, 结点值。所谓深度是指四叉树的第几层上, 由深度可推知子区的大小。
2013-8-11
曲阜师范大学 王萍
49
• 优点
• 容易而有效地计算多边形的数量特征; • 阵列各部分的分辨率可变,边界复杂部分四叉树较高即分级多,
法将图像扩充为2n×2n的图像。
2013-8-11 曲阜师范大学 王萍 46
2013-8-11
曲阜师范大学 王萍
47
• 另一种是采用从下而上的方法建立。对栅格数据按 如下的顺序进行检测。如果每相邻四个网格值分别
相同则进行合并,逐次往上递归合并,直到符合四
叉树的原则为止。这种方法重复计算较少,运算速
角形是最常用的。
• 把空间看做像元的划分,每个像元都与分类
或者标识所包含的现象的一个记录有关。
• 现象分类的界限沿着栅格像元的边界线。
2013-8-11
曲阜师范大学 王萍
28
2013-8-11
曲阜师范大学 王萍
29
点用一个栅格单元表示; 线状地物用沿线走向的一组相邻栅格单元表示,每个栅格单元 最多只有两个相邻单元在线上; 面或区域用记有区域属性的相邻栅格单元的集合表示,每个栅 格单元可有多于两个相邻单元同属一个区域。
Baidu Nhomakorabea
曲阜师范大学 王萍
8
• 对于点实体,矢量结构中只记录其在特定坐标系下的
坐标和属性代码。
• 对于线实体,在数字化时即进行量化,就是用一系列 足够短的直线首尾相接表示一条曲线,当曲线被分割 成多而短的线段后,这些小线段可以近似地看成直线 段,而这条曲线也可以足够精确地由这些小直线段序
列表示。
• 多边形被看作是由一系列多而短的直线段组成,每个 小线段作为这个区域的一条边。有外多边形和内多边 形。
2013-8-11
曲阜师范大学 王萍
41
• ③块码 • 块码是游程长度编码扩展到二维的情况, 采用方形区域作为记录单元。
2013-8-11
曲阜师范大学 王萍
42
• 优缺点
• 块码具有可变的分辨率,即当代码变化小时图块大,区域
图斑内部的分辨率低;反之,分辨率高,以小块记录区域
边界地段,以此达到压缩的目的。因此,块码跟游程长度 编码相似,随着图形复杂程度的提高而降低效率,就是说 图斑越大,压缩比越高;图斑越碎,压缩比越低。 • 块码在合并、插入、检查延伸性、计算面积等操作时有明
2013-8-11
曲阜师范大学 王萍
10
• 3. 编码方法 • (1)点实体
• 点是空间上不可再分的地理实体。
• 包括由单独一对x,y坐标定位的一切地理或制
图实体。 • 还应存储其他一些与点实体有关的数据来描述 点实体的类型、制图符号和显示要求等。
2013-8-11
曲阜师范大学 王萍
11
2013-8-11
• 树状索引编码消除了相邻多边形边界的数据冗余 和不一致的问题,在简化过于复杂的边界线或合 并相邻多边形时可不必改造索引表,邻域信息和 岛状信息可以通过对多边形文件的线索引处理得 到,但是比较烦琐,因而给相邻函数运算、消除 无用边、处理岛状信息以及检查拓扑关系带来一 定的困难,而且两个编码表都需要以人工方式建 立,工作量大且容易出错。