线性四叉树
地理信息系统gis相关知识点
第一章:绪论1,阐述GIS定义:地理信息系统(GIS)是由计算机硬件、软件和不同方法组成的系统,该系统设计用来支持空间数据采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
2、GIS在信息系统中的地位与分类。
由于地球是人类赖以生存的基础,所以GIS是与人类的生存、发展和进步密切关联的一门信息学科与技术,受到人们越来越广泛的重视。
GIS按其范围大小可以分为全球的、区域的和局部的三种。
3、简述GIS与相关学科的关系。
1)GIS与CAD,CAM之间的关系:◆坐标参考系统;◆处理图形、非图形数据;◆空间对象空间相关关系的建立和处理;◆CAD不能建立地理坐标统和完成地理坐标◆变换;◆CAD处理多为规则图形,而GIS为非几何图形;◆CAD图形功能强而属性处理能力若,而GIS图形与属性的操作比较频繁,且专业化特征比较强;◆GIS的数据量比CAD大得多,数据结构、数据类型复杂,数据之间联系紧密;◆CAD不具备地理意义上的查询和分析能力。
2)GIS与管理信息系统的关系:υ对属性数据进行管理和处理;✓对图形数据进行存储;✓GIS对图形和属性数据共同管理、分析和应用;✓MIS一般只处理属性数据,对图形数据以文件形式进行管理,图形要素不能分解、查询,图形与数据之间没有联系;✓管理地图和地理信息的MIS不一定就是GIS,MIS在概念上更接近DBMS。
3)GIS与遥感信息处理系统的关系:●遥感强调信息提取,是GIS的重要信息源,;●反之,GIS可以为遥感数据的分类等处理提供参考依据;●遥感图象信息处理系统是专门用于对遥感数据进行处理的软件,主要强调对遥感数据的几何处理、灰度处理和专题信息提取,具有较强的制图功能,可设计丰富的符号和注记,虽有空间叠置分析空能,但由于缺少实体空间关系的描述,难以进行空间实体的空间关系查询、属性查询及网络分析等;⎫面向位置的特征⎫遥感图象处理系统不能看作是GIS。
4) GIS与机助制图,地图数据库的关系:⏹CAC是GIS的主要技术基础;λ强调空间数据的处理、显示与表达;⏹主要区别在于空间分析能力;⏹GIS包含数字制图系统的全部功能 地图数据库若空间分析能力较强,可升格为GIS,而GIS若空间分析能力较弱,则退化为地图数据库。
线性四叉树
二、线性四叉树的编码方法
1.
•
线性表法
对栅格数据按行顺序进行扫描, 顺序计算每个格网单元的MD 码, 这 需要开辟大小为 字节的线性表, 用于存储格网单元的MD 码及其属性。在提取格网单元的属性值和计算格网单元对应的MD 码后, 存入该表, 并对表按MD码的大小进行升级排序, 然后检查区域内相邻4 个栅格单元( 或子区) 的属性值。若相同, 则合并,仅记录最小的MD 码 及其属性。
二、线性四叉树的编码方法
3.线性四叉树快速动态编码
该方法用栈来代替线性表或数组, 在提取格网单元后, 直接检测其属性值、 生成MD 码, 并同步地对已检测过的格网单元进行合并, 动态地建立四叉树。
线性四叉树快速动态编码的原理
四叉树动态编码的原理是以动态栈来代替静态的线性表或数组。在顺序提取 格网单元属性值的过程中, 利用栈������ 先进后出������ 的特点, 通过压缩栈中的记 录来建立四叉树。当完成对栅格数据的遍历和对栈的压缩后, 栈内记录就是所要 求的线性四叉树编码结果。把栈内记录写成文件, 就实现了对栅格数据的线性四 叉树编码。动态编码的过程可用图1 来表示。
一、线性四叉树的定义
基于十进制的Morton码
它的计算方法是, 首先将区域的行、列号转换成二进制数Ib,Jb, 然后由下式得到M码。 M=2*Ib+Jb
一、线性四叉树的定义
线性四叉树的生成方法存在两种方案
•一种仍采用自顶向下的分割方法, 即按常规四叉树分割方法进 行, 且直接产生码Morton码的。 •另一种方案采用从底向上的合并方法, 首先按一种特殊的扫描 方式, 即按码的升序排列方式, 依次检查每四个相邻码对应的格 网值, 如果相同则合并为一个大块, 否则将这四个格网记盘, 内 容包括码、深度和属性值第一轮合并完成以后, 再依次检查四 个大块的值此时仅需检查每个大块中的第一个值, 若其中有一 个值不同或某子块已记盘, 则不作合并, 而记盘, 循环下去直到 没有能够合并的子块为止。
(不全)武大真题回忆版
1998一、选择1、世界上第一个地理信息系统产生于:A.中国B.美国C.加拿大D.澳大利亚2、判断点是否在多边形内常用:A.空间内插B.半线理论C.平板技术D.维数变化3、空间集合分析主要完成:A.地形分析B.缓冲区分析C.逻辑运算D.叠置分析4、以线性四*树表示8*8的栅格矩阵时,第6行第5列位置处的栅格的MORTON码值为:A.57B.39C.54D.365、建立空间要素之间的拓扑关系属于____功能A.空间分析B.图形分析C.空间查询D.地图整饰二、简述在栅格数据中提取多边形边界的一般方法三、地理信息系统中的数据输入包含几项内容?输入过程中可能产生的误差有几种?四、图画题给出一个四*树要求画出栅格矩阵,并用线性四*树和二维行程编码表示七、简答题1、地理坐标2、地图投影研究的主要内容3、地理信息系统中的地图投影配置应遵循的原则八、介绍两种商用GIS基础软件的主要特性和适应的场合九、某城市由于人口增长较快,原有的地下基础设施已经不能满足要求,为此须重新进行规划,目的是为了满足今后10—20年内城市人口发展的需要。
现用GIS辅助规划其要求是:1、能随时知道任意地方的地下管线的各类指标2、能随时了解那些管线需要重新建设3、能随时了解任意区域的人口指标4、管线应铺设在道路的两侧、单侧或中央。
5、管线铺设时应距离附近的建筑至少10米6、管线铺设和指标计算应结合地形进行7、输出规划成果,主要包括人口分布图和规划后的底下综合管线图现提供如下条件:1、规划区域的地形图及属性数据2、规划区域的道路图及属性数据3、规划区域的地下综合管线现状图及属性数据4、规划区域的人口分布规划图及属性数据5、规划区域的建筑分布分布图几属性数据6、已提供了由人口计算相应管线的负载的全套公式7、已提供了计算管线各种指标的公式8、所有的图件都已经入库根据以上的条件,设计用地理信息系统实现上述规划要求的方法,分别说明其中使用了哪些数据和GIS的那些主要功能。
GIS三版总复习答案
第一章绪论1、信息(Information):是用文字、数字、符号、语言、图像等介质来表示事件、事物、现象等的内容、数量或特征,从而向人们(或系统)提供关于现实世界新的事实和知识,作为生产、建设、经营、管理、分析和决策的依据。
2、信息的特点1)信息的客观性2)信息的适用性3)信息的传输性4)信息的共享性3、数据:数据是通过数字化或直接记录下来的可以被鉴别的符号,用以定性或定量地描述事物的特征和状况。
4、数据处理:即对数据进行收集、筛选、排序、归并、转换、存储、检索、计算,以及分析、模拟和预测等操作。
5、数据与信息关系:信息与数据是不可分离的,即信息是数据的内涵,而数据是信息的表达。
也就是说数据是信息的载体。
6、地理信息:是地理数据所蕴含和表达的地理含义。
7、地理信息的特点:1)空间分布性2)具有多维结构的特征3)时序特征十分明显8、地理数据:是与地理环境要素有关的物质的数量、质量、分布特征、相互联系和变化规律的数字、文字、图像和图形等的总称。
9、地理信息系统:是由计算机硬、软件和不同方法组成的系统,该系统设计来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
10、简述GIS的构成。
它的的基本功能有哪些?硬件系统、软件系统、空间数据库、应用模型、用户基本功:数据采集与编辑、数据存储与管理、数据处理与变换、空间分析和统计、产品制作与显示、二次开发和编辑。
11、GIS与其它系统的区别 GIS有别于DBMS(数据库管理系统),GIS具有以某种选定的方式对空间数据进行解释和判断的能力,而不是简单的数据管理,这种能力使用户能得到关于数据的知识,因此,GIS是能对空间数据进行分析的DBMS,GIS必须包含DBMS。
GIS有别于MIS(管理信息系统),GIS要对图形数据和属性数据库共同管理、分析和应用,GIS 的软硬件设备要复杂、系统功能要强;MIS则只有属性数据库的管理,即使存贮了图形,也是以文件形式管理,图形要素不能分解、查询、没有拓扑关系。
线性四叉树
及其属性。
编码流程图
Morton码=0
行列号(i,j)
提取栅格
是
完全相同
Morton=Morton+4 否
左上角栅格入栈
四个栅格均入栈
是
压栈
否
移动栈顶指针 是
Morton码<N*N 否
结束
二、线性四叉树的编码方法
2. 伪码法
• 从表1 可以看出, MD 码正是自下而上合并生成四叉树过程的序编号, 按自
线性四叉树
• From:GIS • Date:2013-11-12
线性四叉树
1
线性四叉树的定义
2
线性四叉树编码方法
3
线性四叉树的作用
一、线性四叉树的定义
• 线性四叉树只存储最后叶结点信息, 包括叶结点的位置、 大小和灰度。
• 线性四叉树叶结点的编号需要遵循一定的规则,这种编号 称为地址码,它隐含了叶结点的位置和深度信息。最常用 的地址码是四进制或十进制的Morton码。
二、线性四叉树的编码方法
1. 线性表法
•
对栅格数据按行顺序进行扫描, 顺序计算每个格网单元的MD 码, 这
需要开辟大小为
ห้องสมุดไป่ตู้
字节的线性表, 用于存储格网单元的MD
码及其属性。在提取格网单元的属性值和计算格网单元对应的MD 码后,
存入该表, 并对表按MD码的大小进行升级排序, 然后检查区域内相邻4
个栅格单元( 或子区) 的属性值。若相同, 则合并,仅记录最小的MD 码
历完后, A 数组各单元均得到相应的值, 且其下标恰为升序的MD 码。这种方
法与线性表法相比, 减少了MD 码的排序过程, 在运行速度上有所提高, 但其
地理信息系统名词解释
名词解析1、地理系统、地理信息流、地球空间信息学:地理系统:指某一个特定时间和特定空间的,由两个以上相互区别又相互联系、相互制约的地理要素或过程所组成,并具有特定的功能和行为,与外界环境相互作用,并能自动调节和具有自组织功能的整体。
地理信息流:它是由于物质和能量在空间分布上存在着不平衡现象所产生的,它依附于物质流和能量流而存在,也是物质流和能量流的性质、特性和状态的表征和知识。
它是地理系统的纽带,有了它地理系统才能运转。
地球空间信息学:采用以3S技术为代表的空间信息技术、计算机技术和现代通信技术为主要手段,研究地球空间目标与环境参数信息的获取、分析、管理、存储、传输、显示和应用的一门综合和集成的信息科学与技术。
2、地理实体与地理目标;地理实体:指自然界、自然现象和社会经济事件中不能再分割的单元,是一个概括性的、复杂的、具有相对意义的概念或术语。
具有空间特征、属性特征和时间特征。
地理目标:实体在地理数据库中的表示。
地理目标的表示方法随比例尺、目的等情况的变化而变化,例如,对于城市这个地理实体,在小比例尺上可作为一个点目标,而在大比例尺上将作为一个面目标。
地理目标在地图上是以地图符号的形式来表示的。
3、地理信息和地理数据的联系与区别?地理数据:是各种地理特征和现象之间的关系的符号化表示,包括空间位置特征、属性特征和时态特征三个基本特征部分。
地理信息:是有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知识,是与地球表面空间位置相关联的信息,是地理数据的解释。
联系与区别:信息与数据是不可分离的,是形与质的关系。
数据是信息的表达、载体;而信息是数据的内涵。
4、数据源与数据集;数据源:GIS的数据源,是指建立的地理数据库所需的各种数据的来源,主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。
数据集:一个结构化的相关数据的集合体,包括数据本身和数据间的联系。
数据集独立于应用程序而存在,是数据库的核心和管理对象。
地理信息系统课后习题部分答案
地理信息系统概论课后习题部分答案第一章1、什么是地理信息系统GIS它与一般计算机应用系统有哪些异同点答:地理信息系统:是由计算机硬件、软件和不同的方法组成的系统,该系统设计支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题; GIS 脱胎于地图学,是计算机科学、地理学、测绘遥感学、环境科学、城市科学、空间科学、信息科学和管理科学等众多学科交叉融合而成的新兴学科;但是,地理信息系统与这学科和系统之间既有联系又有区别: 1 GIS 与机助制图系统机助制图是地理信息系统得主要技术基础,它涉及 GIS 中的空间数据采集、表示、处理、可视化甚至空间数据的管理;地理信息系统和数字制图系统的主要区别在于空间分析方面; 一个功能完善的地理信息系统可以包含数字制图系统的所有功能, 此外它还应具有丰富的空间分析功能; 2GIS 与 DBMS数据库管理系统 GIS 除需要功能强大的空间数据的管理功能之外,还需要具有图形数据的采集、空间数据的可视化和空间分析等功能;因此,GIS 在硬件和软件方面均比一般事务数据库更加复杂, 在功能上也比后者要多地多; 3GIS 与 CAD 系统二者虽然都有参考系统,都能描述图形,但 CAD 系统只处理规则的几何图形、属性库功能弱,更缺乏分析和判断能力; 4GIS 与遥感图像处理的系统遥感图像处理的系统是专门用于对遥感图像数据处理进行分析处理的软件; 它主要强调对遥感栅格数据的几何处理、灰度处理和专题信息提取; 这种系统一般缺少实体的空间关系描述, 难以进行某一实体的属性查询和空间关系查询以及网络分析等功能; 2、地理信息系统有哪几个主要部分组成它的基本功能有哪些试举目前广泛应用的两个基础地理信息系统软件为例,列出它们的功能分类表,并比较异同点1系统硬件:包括各种硬件设备,是系统功能实现的物质基础; 2系统软件:支持数据采集、存储、加工、回答用户问题的计算机程序系统; 3空间数据:系统分析与处理的对象,构成系统的应用基础; 4应用人员:GIS 服务的对象,分为一般用户和从事建立、维护、管理和更新的高级用户; 5应用模型:解决某一专门应用的应用模型,是 GIS 技术产生社会经济效益的关键所在;3、试说明地理信息系统的基本分析功能与应用模型之间的区别和联系是什么答:地理信息系统分析功能是基于现有数据按照一定规律或者参数进行计算得出的结构, 这些规律和参数就可以构成一个应用模型, 比如降雨量计算模型和风力强度计算模型等; 但应用模型很多是专业领域的模型, 其表现可以是参数表格也可以是图标或计算公式, 不利于地理信息这种要与地理坐标想联系, 并且需要特殊的可视化效果的信息分析与表达; 因此要构建适合于地理信息分析和表达的应用模型就要吧如气象农业等行业应用模型转变或者结合地理信息做成与空间信息想连接的模型应用于分析;4、根据你的了解,阐述地理信息系统的相关学科及关联技术,并就地理信息系统基础理论的简历和发展问题,发表你的意见和观点答:地理信息系统与其他相关学科系统间的关系 1GIS 与地图学 GIS 是以地图数据库主要来自地图为基础,其最终产品之一也是地图,因此它与地图有着极密切的关系;GIS 是地图学理论、方法与功能的延伸, GIS 与地图学一脉相承,它们都是空间信息处理的学科,地图学强调图形信息传输,而 GIS 则强调空间数据处理与分析,地图学与 GIS 之间的联系是通过地图可视化工具与他们的潜力来增强 GIS 的数据综合和分析能力; 2GIS 与一般事务数据库 GIS 离不开数据库技术; 数据库技术主要通过属性来管理和检索, 但一般没有空间概念, GIS 恩能够处理空间数据; 3GIS 与计算机地图制图计算机地图制图技术的发展对 GIS 的产生起了有力的促进作用, 的出现又反过来为地图 GIS 制图提供了现代化的先进技术手段;数字地图是 GIS 的数据源,也是 GIS 的表达形式,计算机地图制图是GIS 的重要组成部分; 4GIS 与计算机辅助制图CAD GIS 处理的多为自然目标,CAD 处理的多为规则几何图形及其组合;GIS 的属性库内容结构复杂,功能强大,图形属性的相互作用十分频繁,且多具有专业化特征;5、地理信息系统课应用于哪些领域根据你的了解论述地理信息系统的应用和发展前景答:现今地理信息系统已应用于测绘与地图制图、资源管理、城乡规划、灾害监测、环境保护、国防、宏观决策支答:空间数据的拓扑关系是明确定义空间结构关系的一种数学方法,在 GIS 中,它不但用于空间数据的编辑和组织,而且在空间分析和应用中都具有非常重要的意义; 意义: 1根据拓扑关系,不需要利用坐标或者计算距离,就可以确定一种地理实体,相对于另一种地理实体的空间位置关系; 2利用拓扑数据有利于空间要素的查询;3可以利用拓扑数据作为工具,重建地理实体;3、试比较矢量与栅格数据结构各有什么特征答:矢量数据的特点:用离散的点、线、面织成的边界或表向来表达空间实体,用标识符表达的内容描述空间实体的属性;描述的空间对象位置明确,属性隐含;矢量数据之间的关系表示丁空间数据的拓扑关系; 栅格数据的特点:用离散的量化的网格值来表示和描述空间目标;具有属性明显、位置隐含的特点;数据结构简单,易于遥感数据结合,但数据量大;几何和属性偏差;面向位置的数据结构,难以建立空间对象之间的关系; 1栅格数据结构类型具有“属性明显、位置隐含”的特点,它易于实现,且操作简单, 有利于基于栅格的空间信息模型的分析,而采用矢量数据结构则麻烦的多; 2但栅格数据表达精度不高,数据存储量大,工作效率较低;因此,对于基于栅格数据结构的应用来说, 需要根据应用项目的自身特点及其精度要求来恰当地平衡栅格数据的表达精度和工作效率两者之间的关系; 3另外,因为栅格数据格式的简单性不经过压缩编码 ,其数据格式容易为大多数程序设计人员和用户所理解,基于栅格数据基础之上的信息共享也较矢量数据容易; 矢量数据具有“位置明显,属性隐含”的特点,数据表达精度较高数据存储量小,较高分辨率,便于进行网络分析,但在多辨析跌至和抠门那个键均值处理等操作比较苦难;4、请简述平面控制网和高程控制网在 GIS 中的应用答:平面控制网用以确定在地球上得平面位置通常是地理经纬度坐标;高程控制网利用空间某点高于或低于基准面的垂直距离来提供地形信息;5、什么是 4D 数据它们与矢量和栅格数据之间具有什么联系答:4D 数据是指:数字线画图数据DLG 、数字栅格数据DRG 、数字高程模型数据 DEM 、数正射影像数据DOM; 数字线画图数据DLG:是现有地形图要素的矢量数据; 数字栅格数据DRG :是现有纸质地图经计算机处理后得到的栅格数据文件; 数字高程模型数据DEM :是艺术字形式表达的地形起伏数据,也是矢量数据;数正射影像数据DOM :是对遥感数字影像,经像元进行投影差改正、镶嵌,也是一种栅格形式的数据;6、什么是游程编码游程编码的压缩效果与哪些因素有关答:游程编码是逐行将相同值得栅格合并, 记录合并后栅格的值及合并栅格的数量即游程 ,其目的是压缩栅格数据量,消除数据间的冗余;游程编码的压缩效果主要取决于栅格数据的性质级与原图的复杂成反比,变化多得部分有游程数就多,变化少的部分游程数就少,图件越简单压缩效率就越高;7、什么是栅格四叉树结构请比较常规四叉树与线性四叉树的区别答:栅格四叉树结构是指将空格键区域按照四个象限进行递归分 n 次,每次分割形成 2n2N 个子象限中的属性数值都相同为止,该子象限就不再分割; 常规四叉树与线性四叉树的区别:常规四叉树:常规四叉树每个节点通常储存 6 个量,即 4 个子节点指针、一个父节点指针和一个节点值;常规四叉树可采用子下而上的方法建立,对栅格按莫顿码顺序进行检测,这种方法除了要记录叶节点,还要记录中间节点;常规四叉树在处理上简便灵活,而且当栅格矩阵很大,存储和处理整个矩阵较困难时,可用常规四叉树存储法;线性四叉树:线性四叉树每个节点只存储 3 个量,即莫顿码、深度或节点大小和节点值; 线性四叉树编码不需要记录中间节点的、0 值节点,也不适用指针,仅记录非 0 值也节点, 并用莫顿码表示叶节点的位置; 线性四叉树比常规四叉树节省存储空间;由于记录节点地址, 既能直接找到其在四叉树中的走向路径, 又可以换算出他在整个栅格区域内的行列位置, 压缩和解压缩比较方便,各部分分辨率可不同,即可精确地表示图形结构,又可减少存储量, 易于进行大部分图形操作和运算;8、什么是 TINGrid 和 TIN 在表达曲面数据的时候各有什么特点答:Grid 规则网格和 TIN 不规则三角网都是表示数字高程的两种方法; Grid 规则网格通常是正方形,也可以是矩形、三角形等规则网格;规则网格将区域空间切分为规则的格网单元,每个格网单元对应一个数值;数学上可以表示为一个矩阵,在计算机实现中则是一个二维数组;每个格网单元或数组的一个元素,对应一个高程值; TIN 不规则三角网是将离散分布的实测数据点连成三角网, 网中的每份三角形要求尽量接近等边形状,并保证由最近邻点构成三角形,即三角形的边长之和最小; 特点: Grid 规则网格:可以很容易地用计算机进行处理,特别是栅格数据结构的地理信息系统; 它还可以很容易地计算等高线、坡度坡向、山坡阴影和自动提取流域地形,使得它成为数字高程模型DEM最广泛使用的格式;规则格网的缺点是不能准确表示表面网格所代表的地形的结构和细部:在地形平坦的地方, 存在大量的数据冗余;在不改变格网大小的情况下, 又难以表达复杂地形的突变现象;此外,规则格网的数据量通常比较大,给数据管理带来了不便,需要进行压缩存储;如果采用无损压缩难以达到很好的压缩效果,如果要保证压缩效果,只能采用有损压缩,即牺牲了地形的细节信息; TIN 不规则三角网:减少了规则格网带来的数据冗余,同时在计算效率和表达精度方面也有其优越性; 不规则三角网的数据存储方式比规则格网复杂, 不规则三角网与规则格网不同之处是随地形起伏变化的复杂性而改变采样点的密度和决定采样点的位置, 因而它能够避免地形平坦时的数据冗余, 又能按地形特征点如山脊、山谷线、地形变化线等表示数字高程特征;第三章1、比较空间内插的移动拟合法、局部函数和按距离加权法等;P108答:移动拟合法:是只对每一个待插值点 P 用一个多项式曲面拟合该店附近的表面,从而计算出该点的高程值;3、试述克里金内插法的基本原理、优点及实施过程答:原理:将被插值的莫要素例如地形要素当做一个区域化地变量来看待;所谓区域化的变量就是介于完全随机的变量和完全确定的变量之间的一种变量, 它随所在区域位置的改变而连续地变化,因此,彼此离得近点之间有某种程度上的空间相关性,而相隔比较远的点之间在统计上看是相互独立无关的; 优点:实施过程:首先是利用那些摇摇用来插值的离散点集合建立一个变量图, 变量图通常包括两部分,一个是根据实验获得的变量图,另一个是模型变量图; 其次将变量图用来计算 Kriging 方法中的权重;4、请举例说明常用的矢量和栅格数据的转换方法矢量转栅格:矢量转栅格:内部点扩散法,即由多边形内部种子点向周围邻点扩散,直至到达各边界为止;复数积分算法,即由待判别点对多边形的封闭边界计算复数积分,来判断两者关系;射线算法和扫描算法, 即由图外某点向待判点引射线, 通过射线与多边形边界交点数来判断内外关系;边界代数算法, 是一种基于积分思想的矢量转栅格算法, 适合于记录拓扑关系的多边形矢量数据转换,方法是由多边形边界上某点开始,顺时针搜索边界线,上行时边界左侧具有相同行坐标的栅格减去某值, 下行时边界左侧所有栅格点加上该值, 边界搜索完之后即完成多边形的转换; 栅格转矢量:即是提取具有相同编号的栅格集合表示的多边形区域的边界和边界的拓扑栅格转矢量关系,并表示成矢量格式边界线的过程;步骤包括:多边形边界提取,即使用高通滤波将栅格图像二值化;边界线追踪,即对每个弧段由一个节点向另一个节点搜索;拓扑关系生成和去处多余点及曲线圆滑; 答:矢量向栅格转换方法:矢量向栅格转换处理的更笨任务就是把点、线或面的矢量数据, 转换成对应的栅格数据,这一过程叫做栅格化;栅格化可以分别针对点、线和面来进行,点的栅格化是线和面栅格化的基础; 转换方法:立矢量数据的平面直角坐标系和栅格行列坐标系之间的对应关系;点的栅格化:矢量坐标x,y ,转换后的栅格但愿行列值I,J ;线的栅格化:线的栅格化先分解成折线的每一个线段的栅格化,对应一条线段的栅格化,先使用点栅格化地方法,栅格化线段的两个端点,然后再栅格化线段中间的部分;面得栅格化:基于弧段数据的栅格化方法与线段栅格化地方法类似,基于多边形数据栅格化地方法,这种方法是以非拓扑的实体的实体多边形作为栅格化地处理单元, 将一个多边形的内部栅格单元赋予多边形的属性值,基于多边形数据的栅格化方法包括:内点填充法、边界代数法和包含检验法等; 栅格向矢量的转换方法:栅格数据结构向矢量数据结构转化又称为矢量化;矢量化方法:1 二值化, 想根据栅格数据建立一个阈值, 再根据这个阈值将不同的数据灰度严肃哦到 2 个弧度形成二值图;2细化,是消除线画横断面栅格树的差异,使得每一条线只保留代表其轴线或周围轮廓线位置的单个栅格的宽度;细化又可分为“剥皮法” ,和“骨架法”两大类; “剥皮法”:实质是从曲线的边缘开始,每一次剥掉等于一个栅格宽的一层,直到最后留下彼此连通的由单个栅格点组成的图形; “骨架法”3跟踪法:是讲细化处理后的栅格数据转换为从节点出发的线段或闭合的线条,并以矢量形式存储线段的坐标; 栅格数据的矢量化方法:1首先在栅格数据中收索多边形边界弧段相交处的节点位置; 2接着从收索出得节点里任选一个座位其实跟踪节点,顺着栅格单元属性值不同的两个栅格单元之间进行多边形边界弧段的跟踪,记录每一步跟踪的坐标,直到另一个节点为止; 3最后将各宗得到的弧段数据连接组织成多边形;6、试述 GIS 空间拓扑关系编辑的功能及具体算法P106 、空间拓扑关系编辑的功能及具体算法答:1多边形连接编辑功能:首先要找出要编辑多边形相关的所有记录,其次找在找出的记录中,检查当前编辑的多边形所处的位置:如果带编辑的多边形在左多边形位置,将之与处于有多边形位置的多边形号相交换, 同时也将该记录的节点号位置作相应的交换, 反之则该记录的所有数据顺序不作改变;随后,从经过代码位置转换的记录中,任取一个起始节点作为起点,顺序连接各个节点,必要时可对记录的前后顺序作调整,是的连接的节点能自行封闭;如节点不能闭合则必须改正出错得记录; 2节点连接编辑功能:首先从弧段文件中找出与当前编辑的节点相关的所有记录;其次在找出的记录中,检查当前编辑的节点所在的位置:如果待编辑的节点在起始节点位置,将之与处于终止节点位置的节点号相交换, 同时也将该记录的多边形号位置作相应的交换反之则该记录的所有数据项顺序不作改变;再者,从经过代码位置转换的记录中,任取一个左多边形作为起点,顺序连接各个多边形,同样必要时可对记录的前后顺便作调整,使得连接的多边形能首尾呼应;7、仿射变换的原理及其误差纠正的方法答:放射变化是几何纠正的常用方法,放射变换后的特性直线变化后任是直线,平行线变化后任是平行线,不同方向上的长度比发生变化;8、请简述地图投影的分类及作用答:地图投影实质是将地球托球体面上的经纬度线间按照一定的数学法则转移到平面上, 在地球椭球面和平面之间建立点与点之间函数关系的数学方法;地图投影分类:按地图投影的构成方法可分为: 1几何投影:方位投影、圆柱投影、圆锥投影按球面与投影免得几何位置不同可风为正轴投影、横轴投影和斜轴投影; 2非几何投影:伪方位投影、伪圆柱投影、伪圆锥投影、多圆锥投影按地图投影变形性质可分为:等积投影、等角投影、任意投影第四章1、空间数据库的概念及其组成部分有哪些 P110答:空间数据库主要是为 GIS 提供空间数据的存储和管理方法;空间数据库由三个部分组成:空间数据库存储、空间数据库管理系统、空间数据库应用 ;2、空间数据库的设计有哪些主要的步骤和内容答:空间数据库的设计要经历一个由现实世界到信息世界,再到计算机世界的转化过程;具体步骤和内容为:1需求分析:即用系统的观点分析与某一特点的空间数据库应用有关系的数据集合;2概念设计:把用户的需求加以解释,并用概念模型表达出来;3逻辑设计:空间数据库逻辑设计的任务是, 把信息世界中的概念模型利用数据库管理系统所提共的工具映射为计算机世界中伟数据库管理系统所支持的数据库模型,并用数据描述语言表达出来;4物理设计:数据库的物理设计指数据库存储结构和存储路径的设计,即将数据库的逻辑模型在实际的物理存储设备上加以实现,从而建立一个具有较好性能的物理数据库;3、语义数据模型中的实体—联系模型的图示中有那些基本元素答:.实体—联系模型由 1实体:实体是对客观现存的其独立作用的食物的一种抽象; 2联系:联系是实体见有意义的相互作用或对应关系;3属性:属性是对实体和联系特征的描述;4、什么是关系数据模型其中的基本概念,如元组、属性、关键字、模式、关系数据库、关系完整性等的含义分别是什么答:关系数据模型是将用户对数据的视图与其物理实现分割开来, 从而使得关系模型十分有利于数据库的设计; 基本概念含义:元组:每个实例对应于表中的一行,在关系镇南关叫做元组,相当于通常的一个记录;域:表中的列表示属性,叫做域,相当于通常记录中的一个数据项;属性:关键字:关系中的某一属性组,若它的唯一地标识了一个元组则称该属性组为候选关键字;关系模式:关系数据库:一系列关系的集合构成一个关系数据库;关系完整性:关系的正确性相容性和有效性; 5、在关系数据模型设计中,函数依赖和范式的含义是什么函数依赖:是由数学理论派生的术语,它表征一个属性集合的值,对另一属性值集合的依赖性; 范式:由于关系的属性之间存在着多种关系依赖特性当用关系模式表达时, 一些不良的语义特性就可能造成数据存储的冗余及由此造成的数据操作的异常, 所以提出了必须遵循的一些规范化形式,称范式;6、面向对象数据模型中的基本概念, 如对象、消息、继承、重载、多态、概括、聚集的含义是什么答:对象:人们对世界上的事物的认识形成概念使我们可以感知和推理世界上的事物,这些概念运用到的事物称为对象;消息:是对象与对象之间相互请求或相互协作的唯一途径;类:是对一组对象的抽象描述,它将改组对象所具有的共同特征集中起来,以说明改组对象的能力和性质;继承:是对具有层次关系的属性和操作进行的共享的一种机制;重载:一个类型上可以才能在使用名的方法,当出现这种方法时,必须按照某种明显的方式区分它们,将这种特性称为重载;多态:是只同一个消息可以根据发送消息对象的不同采用多种不同的行为方式;概括:是吧举有相同特征和草做的类归纳在一个更一般的超类中;聚集:聚集反映了潜逃对象的概念,仙桃对象是有一些其他对象组成的,他是用来描述更高层次对象的一种形式;7、什么是空间数据库索引主要的空间数据库索引有哪些答:所谓空间数据库索引就是依据空间实体的位置形状或空间实体的某种空间关系, 按一定的顺序排列的一种数据结构;主要的空间数据库所以有:范围索引、格网空间索引、四叉树空间索引;8、什么事空间元数据空间元数据的作用是什么答:空间元数据是指在空间数据库中用于描述空间数据的质量表示方法, 空间参考和管理方法等特征的数据, 是实现空间信息共享的核心标准之一;空间元数据的作用是帮助空间数据的使用者查询所需的空间信息进行空间数据的共享,进一步处理空间数据;第五章1、试解释缓冲区分析和叠合分析概念,并举例说明这两种空间分析方法的用途答:缓冲区分析是指在点、线、面试题的周围,自动建立的一定宽度的多边形区域或带状区域;叠合分析是指在相同的空间坐标系统条件下, 将同一地区的两个不同地理特征的空间。
Quadtree(四叉树)Octree(八叉树)
Quadtree(四叉树)Octree(⼋叉树)四叉树(Quadtree)或四元树也被称为Q树(Q-Tree)。
四叉树⼴泛应⽤于图像处理、空间数据索引、2D中的快速碰撞检测、存储稀疏数据等,⽽⼋叉树(Octree)主要应⽤于3D图形处理。
对游戏编程,激光雷达点云处理等会很有⽤。
四叉树和⼋叉树实际上是⼆叉树在⼆维和三维的引申。
四叉树四叉树的定义是:它的每个节点下⾄多可以有四个⼦节点,通常把⼀部分⼆维空间细分为四个象限或区域并把该区域⾥的相关信息存⼊到四叉树节点中。
这个区域可以是正⽅形、矩形或是任意形状。
四叉树的每⼀个节点代表⼀个矩形区域(如上图⿊⾊的根节点代表最外围⿊⾊边框的矩形区域),每⼀个矩形区域⼜可划分为四个⼩矩形区域,这四个⼩矩形区域作为四个⼦节点所代表的矩形区域。
插⼊插⼊函数⽤于将节点插⼊到现有的四叉树中。
该函数⾸先检查给定节点是否在当前四边形的边界内。
如果不是,则⽴即停⽌插⼊。
如果它在边界内,我们根据其位置选择适当的⼦节点来包含该节点。
时间复杂度O(Log N)其中N是距离的⼤⼩。
查询搜索函数⽤于定位给定四边形中的⼀个节点。
还可以修改它以返回离给定点最近的节点。
这个函数是通过取给定的点,与⼦四边形的边界进⾏⽐较并递归实现的。
时间复杂度是O(Log N) N是距离的⼤⼩。
代码1// C++ Implementation of Quad Tree2 #include <iostream>3 #include <cmath>4using namespace std;56// Used to hold details of a point7struct Point8 {9int x;10int y;11 Point(int _x, int _y)12 {13 x = _x;14 y = _y;15 }16 Point()17 {18 x = 0;19 y = 0;20 }21 };2223// The objects that we want stored in the quadtree24struct Node25 {26 Point pos;27int data;28 Node(Point _pos, int _data)29 {30 pos = _pos;31 data = _data;32 }33 Node()34 {35 data = 0;36 }37 };3839// The main quadtree class40class Quad41 {42// Hold details of the boundary of this node43 Point topLeft;44 Point botRight;4546// Contains details of node47 Node *n;4849// Children of this tree50 Quad *topLeftTree;51 Quad *topRightTree;52 Quad *botLeftTree;53 Quad *botRightTree;5455public:56 Quad()57 {58 topLeft = Point(0, 0);59 botRight = Point(0, 0);60 n = NULL;61 topLeftTree = NULL;62 topRightTree = NULL;63 botLeftTree = NULL;64 botRightTree = NULL;65 }66 Quad(Point topL, Point botR)67 {68 n = NULL;69 topLeftTree = NULL;70 topRightTree = NULL;71 botLeftTree = NULL;72 botRightTree = NULL;73 topLeft = topL;74 botRight = botR;75 }76void insert(Node*);77 Node* search(Point);78bool inBoundary(Point);79 };8081// Insert a node into the quadtree82void Quad::insert(Node *node)83 {84if (node == NULL)85return;8687// Current quad cannot contain it88if (!inBoundary(node->pos))89return;9091// We are at a quad of unit area92// We cannot subdivide this quad further93if (abs(topLeft.x - botRight.x) <= 1 &&94 abs(topLeft.y - botRight.y) <= 1)95 {96if (n == NULL)97 n = node;98return;99 }100101if ((topLeft.x + botRight.x) / 2 >= node->pos.x) 102 {103// Indicates topLeftTree104if ((topLeft.y + botRight.y) / 2 >= node->pos.y) 105 {106if (topLeftTree == NULL)107 topLeftTree = new Quad(108 Point(topLeft.x, topLeft.y),109 Point((topLeft.x + botRight.x) / 2, 110 (topLeft.y + botRight.y) / 2));111 topLeftTree->insert(node);112 }113114// Indicates botLeftTree115else116 {117if (botLeftTree == NULL)118 botLeftTree = new Quad(119 Point(topLeft.x,120 (topLeft.y + botRight.y) / 2),121 Point((topLeft.x + botRight.x) / 2, 122 botRight.y));123 botLeftTree->insert(node);124 }125 }126else127 {128// Indicates topRightTree129if ((topLeft.y + botRight.y) / 2 >= node->pos.y) 130 {131if (topRightTree == NULL)132 topRightTree = new Quad(133 Point((topLeft.x + botRight.x) / 2, 134 topLeft.y),135 Point(botRight.x,136 (topLeft.y + botRight.y) / 2));137 topRightTree->insert(node);138 }139140// Indicates botRightTree141else142 {143if (botRightTree == NULL)144 botRightTree = new Quad(145 Point((topLeft.x + botRight.x) / 2, 146 (topLeft.y + botRight.y) / 2),147 Point(botRight.x, botRight.y));148 botRightTree->insert(node);149 }150 }151 }152153// Find a node in a quadtree154 Node* Quad::search(Point p)155 {156// Current quad cannot contain it157if (!inBoundary(p))158return NULL;159160// We are at a quad of unit length161// We cannot subdivide this quad further162if (n != NULL)163return n;164165if ((topLeft.x + botRight.x) / 2 >= p.x)166 {167// Indicates topLeftTree168if ((topLeft.y + botRight.y) / 2 >= p.y)169 {170if (topLeftTree == NULL)171return NULL;172return topLeftTree->search(p);173 }174175// Indicates botLeftTree176else177 {178if (botLeftTree == NULL)179return NULL;180return botLeftTree->search(p);181 }182 }183else184 {185// Indicates topRightTree186if ((topLeft.y + botRight.y) / 2 >= p.y)187 {188if (topRightTree == NULL)189return NULL;190return topRightTree->search(p);191 }192193// Indicates botRightTree194else195 {196if (botRightTree == NULL)197return NULL;198return botRightTree->search(p);199 }200 }201 };202203// Check if current quadtree contains the point204bool Quad::inBoundary(Point p)205 {206return (p.x >= topLeft.x &&207 p.x <= botRight.x &&208 p.y >= topLeft.y &&209 p.y <= botRight.y);210 }211212// Driver program213int main()214 {215 Quad center(Point(0, 0), Point(8, 8));216 Node a(Point(1, 1), 1);217 Node b(Point(2, 5), 2);218 Node c(Point(7, 6), 3);219 center.insert(&a);220 center.insert(&b);221 center.insert(&c);222 cout << "Node a: " <<223 center.search(Point(1, 1))->data << "\n";224 cout << "Node b: " <<225 center.search(Point(2, 5))->data << "\n";226 cout << "Node c: " <<227 center.search(Point(7, 6))->data << "\n";228 cout << "Non-existing node: "229 << center.search(Point(5, 5));230return0;231 }⼋叉树⼋叉树是⼀种树状数据结构,其中每个内部节点最多可以有8个⼦节点。
地理信息系统名词解释
名词解析1.地理系统、地理信息流、地球空间信息学:地理系统: 指某一个特定时间和特定空间的, 由两个以上相互区别又相互联系、相互制约的地理要素或过程所组成, 并具有特定的功能和行为, 与外界环境相互作用, 并能自动调节和具有自组织功能的整体。
地理信息流:它是由于物质和能量在空间分布上存在着不平衡现象所产生的, 它依附于物质流和能量流而存在, 也是物质流和能量流的性质、特性和状态的表征和知识。
它是地理系统的纽带, 有了它地理系统才能运转。
地球空间信息学:采用以3S技术为代表的空间信息技术、计算机技术和现代通信技术为主要手段, 研究地球空间目标与环境参数信息的获取、分析、管理、存储、传输、显示和应用的一门综合和集成的信息科学与技术。
2.地理实体与地理目标;地理实体: 指自然界、自然现象和社会经济事件中不能再分割的单元, 是一个概括性的、复杂的、具有相对意义的概念或术语。
具有空间特征、属性特征和时间特征。
地理目标:实体在地理数据库中的表示。
地理目标的表示方法随比例尺、目的等情况的变化而变化, 例如, 对于城市这个地理实体, 在小比例尺上可作为一个点目标, 而在大比例尺上将作为一个面目标。
地理目标在地图上是以地图符号的形式来表示的。
3.地理信息和地理数据的联系与区别?地理数据: 是各种地理特征和现象之间的关系的符号化表示, 包括空间位置特征、属性特征和时态特征三个基本特征部分。
地理信息:是有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知识, 是与地球表面空间位置相关联的信息, 是地理数据的解释。
联系与区别:信息与数据是不可分离的, 是形与质的关系。
数据是信息的表达、载体;而信息是数据的内涵。
4.数据源与数据集;数据源: GIS的数据源, 是指建立的地理数据库所需的各种数据的来源, 主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。
数据集:一个结构化的相关数据的集合体, 包括数据本身和数据间的联系。
与栅格编码有关的编码形势
如图所示的8×8栅格矩阵为例,对其进行块码编码 (1,1,1,0),(1,2,2,4),(1,4,1,7),(1,5,1,7),(1,6,2,7),(1,8,1,7), (2,1,1,4),(2,4,1,4)。(2,5,1,4),(2,8,1,7), (3,1,1,4),(3,2,1,4),(3,3,1,4),(3,4,1,4),(3,5,2,8),(3,7,2,7), (4,1,2,0),(4,3,1,4),(4,4,1,8), (5,3,1,8),(5,4,2,8),(5,6,1,8),(5,7,1,7),(5,8,1,8), (6,1,3,0),(6,6,3,8), (7,4,1,0),(7,5,1,8), (8,4,1,0),(8,5,1,0) 从上表可知,栅格数据可用22个1单位方块,6个4单位方 块及两个9单位方块来描述。
即假设一点的坐标为(i,j),则其邻域坐标,东为(i,j+1),东 南为(i+1,j+1),南为(i+1,j),西南为(i+1,j-1),西为(i,j-1), 西北为(i-1,j-1),北为(i-1,j),东北为(i-1,j)。因此,对连续线上 的一个已知点,只要搜索8个方向总可找到它的后续栅格点,并可 用图3-11(a)所定方向代码来表示。反之,已知所定点的方向代码亦 可知道其前趋点的坐标位置。
(0,1)表示属性值为0的栅格终止点为第一列,(4,3)表示属性值为4的栅 格终止点为第3列,(7,8)表示属性值为7的栅格终止点为第7列。因此,从游 程终止值可容易算出每个属性值所占栅格数。这里属性值为7的栅格数为8-3=5, 依此类推。
块码(Block Code)
块码是游程编码的一种变异,它以正方 形区域为单元对块状地物的栅格数据进行编 码,其实质是把栅格阵列中同一属性方形区 域各元素映射成一个元素序列。 块码的编码方式为:行号、列号、半径、 代码。行号和列号表示正方形区域左上角栅 格元素所在行号及列号;半径表示正方形区 域行(或列)方向的栅格元素数;代码表示该 正方行区域的属性值。
GIS原理课件4.8四叉树编码
36
2
37
2
38
0
39
0
栅格数据
00
0
00 00
0
00 22 00 00 00
11
1
11 22
2
22 22 00 00 00
44
4
44 44
4
44 44 44 44 44
44
4
44 44
4
44 44 44 44 44
将按照二M进D码制顺的序行,列检号查相两邻两四交个叉单元的属性值, 再相同将则其合转并换,为存储十最进小制M数D码及属性值,不同则存储所有单元。
MD码 0 4 8 12 16 20 24 28 32 33 34 35 36 37 38
……
属性值
0 1 0 2 4 4 4 4 2 2 0 0 2 2 0 ……
栅格数据
00
0
00 00
0
00 22 00 00
0
00
11
1
11 22
2
22 22 00 00
0
00
44
4
44 44
4
44 44
4
44 44
MD码 0 4 8 12 16 32 33 34 35 36 37
…… 48 52 56 60
属性值
0 1 0 2 4 2 2 0 0 2 2 …… 4 4 4 4
栅格数据
00
0
00 00
0
00 22 00 00
0
00
11
1
11 22
2
22 22 00 00
0
00
4444
44
4444
线性四叉树快速动态编码及其实现
结点的编码( 即地址码) 遵循一定的规则, 隐含了 叶结点 的位置信息和 大小。地址码 可以按四进
制、八进制数编码, 但为了使用方便, 通常采用十 进制数的 Morton 码( 简称 M D 码) 。对 8 8 栅格 数据, 其 MD 码编码规则如表 1 所示。 1. 1 线性表法[ 2]
2. 1. 1 提取格网单元 按 MD 码的顺序, 依次从栅格数据中以 2 2
的窗口( 如图 1 中栅格数据上的粗线框所示) 提取 4 个格网单元的属性值, 这 4 个单元所对应的栅
格数据的行列号由 M D 码反 求。由于 M D 码是 由行 号 和列 号的 二 进制 数 两两 交 叉组 合 的结 果[ 3] , 因此可以由 M D 码的二进制数采用位运算 规则分解出行列号( 如图 2 所示) , 其中奇位和偶
从表 1 可以看出, MD 码正是自下而上合并 生成四叉树过程的顺序编号, 按自然数顺序的线 性表扫描即可产生四叉树。事先开辟一个大小为 2n 2n 的 一 维 数 组A ( 需 要 2n 2n 字 节 的 内
存) , 按行号顺序对栅格数据进行扫描, 把行、列号 转换成伪码, 由伪 码计算对应的 M D 码, 并将格 网属性值直接赋给以 MD 码 为下标的 A 数组单 元, 即 A ( MD ) = V ( i , j ) 。当对所有的格网单元 遍历完后, A 数组各单元均得到相应的 值, 且其 下标恰为升序 的 MD 码。这种方法 与线性表法 相比, 减少了 M D 码的排 序过程, 在 运行速度上 有所提高, 但其他缺点依然存在, 仍然需要大量的 内存和运行时间。
对栅格数据按行顺序进行扫描, 顺序计算每 个格网单元的 MD 码, 这需要开辟大小为5 2n 2n 字节的线性表, 用于存 储格网单元的 M D 码 及其属性。在提取格网单元的属性值和计算格网
空间数据结构与数据编码(3-2)
3、计算P2点的行列值
行号:I=1+INT[(Ymax-Y)/ΔY] =1+INT[(300-103)/1]=198
P2
列号:J=1+INT[(X-Xmin)/ΔX] =1+INT[(53-0)/1]=54
P1
直线经过的行范围:198-201
4、 199行中心处同直线相交的y值:
y=ymax-△y(i-1/2)=300-199*1+1/2=101.5
优点:直观,这种编码方式处理方便。 缺点:数据没有压缩,数据量大
4、栅格数据结构及编码
2、栅格数据压缩编码
栅格数据压缩编码方法:行程编码、块码、链码、四叉树编码等。
目的:用尽可能少的数据量记录尽可能多的信息
4、栅格数据结构及编码
2、栅格数据压缩编码
栅格数据压缩编码类型:信息无损编码(信息保持编码)、信息有损编码(信息
X
②扫描算法/ 边界点跟踪法 (顺正逆负)
第一步:边界弧段栅格化 第二步:从边界上某一 点栅格单元开始按顺时 针方向跟踪边界上各栅 格,对多边形中岛则按 逆时针方向跟踪,将跟 踪的每个栅格分别赋予 R,L,N。
L L L
N N N N L R
L
N N R R L L
R
R R N N N N
L
L L
空间数据结构和数据编码(3-2)
4、栅格数据结构及编码
直接栅格编码 Freeman链码(边界编码) 游程编码(行程编码) 块码(二维行程编码) 四叉树编码
第三章
4、栅格数据结构及编码
1)直接栅格编码ps73图3-22
直接栅格编码:将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录
空间索引-四叉树
空间索引-四叉树前⾔作为程序员,应该都对⼆叉树都不陌⽣,我们都知道⼆叉树的变体⼆叉查找树,⾮常适合⽤来进⾏对⼀维数列的存储和查找,可以达到 O(logn) 的效率;我们在⽤⼆叉查找树进⾏插⼊数据时,根据⼀个数据的值和树结点值的对⽐,选择⼆叉树的两个叉之⼀向下,直到叶⼦结点,查找时使⽤⼆分法也可以迅速找到需要的数据。
但⼆叉树只⽀持⼀维数据,如⼀个标量数值,对地图上的位置点这种有xy两个⽅向上的信息却⽆能为⼒,那么是否有⼀种树能够⽀持⼆维数据的快速查询呢?四叉树介绍四元树⼜称四叉树是⼀种树状数据结构,在每⼀个节点上会有四个⼦区块。
四元树常应⽤于⼆维空间数据的分析与分类。
它将数据区分成为四个象限。
今天要介绍的四叉树可以认为是⼆叉查找树的⾼维变体,它适合对有⼆维属性的数据进⾏存储和查询,当然四叉树存储的也不⼀定是⼆维数据,⽽是有着⼆维属性的数据,如有着 x,y 信息的点,⽤它还可以⽤来存储线和⾯数据。
它有四个叉,在数据插⼊时,我们通过其⼆维属性(⼀般是 x,y)选择四个叉之⼀继续向下,直⾄叶⼦结点,同样使⽤“四分法”来迅速查找数据。
四叉树的⼀般图形结构如下:聪明的⼩伙伴⼀定想到了适合存储和查询三维数据的⼋叉树,它们原理是⼀致的,不过我们暂不讨论。
分类四叉树常见的应⽤有图像处理、空间数据索引、2D中的快速碰撞检测、稀疏数据等,今天我们很纯粹地只介绍它在空间索引⽅⾯的应⽤。
根据其存储内容,四叉树可以分为点四叉树、边四叉树和块四叉树,今天我们实现的是点四叉树。
根据其结构,四叉树分为满四叉树和⾮满四叉树。
对于满四叉树,每个节点都有四个⼦结点,它有着固定的深度,数据全都存在最底层的⼦结点中,进⾏数据插⼊时不需要分裂。
满四叉树在确定好深度后,进⾏插⼊操作很快,可是如果⽤它来存储下图所⽰数据,我们会发现,四叉树的好多叉都是空的,当然它们会造成内存空间的⼤量浪费。
⾮满四叉树解决了此问题,它为每个结点添加⼀个“容量”的属性,在四叉树初始化时只有⼀个根结点,在插⼊数据时,如果⼀个结点内的数据量⼤于了结点“容量”,再将结点进⾏分裂。
四叉树编码的原理
四叉树结构的基本思想是将一幅栅格地图或图像等分为四部分,逐块检查其格网属性值(或灰度),如果某个子区的所有格网值都具有相同的值,则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。
这样依次地分割,直到每个子块都只含有相同的属性值或灰度为止。
从下而上的合并算法:如果每相邻四个网格值相同则进行合并,逐次往上递归合并,直到符合四叉树的原则为止。
这种方法重复计算较少,运算速度较快。
从上而下的分割算法:需要大量的运算,因为大量数据需要重复检查才能确定划分。
当矩阵比较大,且区域内容要素又比较复杂时,建立这种四叉树的速度比较慢。
②阵列各部分的分辨率是可变的,边界复杂部分四叉树较高即分级多,分辨率也高,而不需表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存贮量;②结点之间借助指针联系,每个结点需要用六个量表达:四个叶结点指针,一个父结点指针和一个结点的属性或灰度值。
②线性四叉树叶结点的编号需要遵循一定的规则,这种编号称为地址码,它隐含了叶结点的位置和深度信息。
最常用的地址码是四进制或十进制的Morton 码。
①常规四叉树除了记录叶结点之外,还要记录中间结点。
③这些指针不仅增加了数据贮存量,而且增加了操作的复杂性。
常规四叉树主要在数据索引和图幅索引等方面应用。
③栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容易;①容易而有效地计算多边形的数量特征;为了保证四叉树能不断的分解下去,要求图像必须为2n*2n 的栅格阵列,n 为极限分割次数,n+1是四叉树的最大高度或最大层数。
①线性四叉树则只存贮最后叶结点的信息。
包括叶结点的位置、深度和本结点的属性或灰度值。
(1)常规四叉树(2)线性四叉树④多边形中嵌套异类小多边形的表示较方便。
四叉树的生成算法:四叉树结构分类:四叉树编码的特点:基于十进制的Morton 码及四叉树的建立 :2.2.4 四叉树编码(quad-tree code)[四叉树分割演示]十进制的Morton 码实际上是II 、JJ 中的二进制数字交叉结合的结果,即设十进制表示的行、列号在计算机内部的二进制数字分别为:[上一根节][下一根节][回节目录][根节目录]在生成的线性四叉树表中,仍存在前后叶结点的值相同的情况,因而可以采取进一步的压缩表达,即将格网值相同的前后结点合并成一个值,形成二维行程编码(Two Dimensional Run Encoding ,简称 2DRE )表。
兰州大学地信概论复习内容
地理信息系统概论复习内容第一章:地理信息系统概论数字地球:1998年美国副总统戈尔提出“数字地球”概念,即一种可以嵌入海量数据、多分辨率和三维的地球。
数字地球是对真实地球及其相关现象统一性的数字化重现和认识,其核心思想是用数字化手段统一处理地球问题和最大限度地利用信息资源。
虚拟现实GIS:一种最有效的模拟人在自然环境中视、听、动等行为的高级人机交互技术,主要通过虚拟建模语言(virtual reality model language, VRML)把GIS数据转换到VR中,为人们提供一个逼真的模拟环境。
地理信息科学:关于围绕地理信息系统技术的应用, 防碍其成功实施, 或在其潜在能力的理解中出现的一般性问题的研究。
1、说明GIS在几个不同发展阶段的标志性技术是什么,它们的出现如何促进GIS 的发展?答:(1)60年代GIS处于起步阶段: 1963年,R.F.Tomlinson首次提出GIS 这一术语,并建立了世界上第一个地埋信息系统——CGIS,用于处理大量土地调查资料;稍后,哈佛大学计算机图形学与空间分析实验室研制出SYMAP系统,这是一个通用的地图制图软件包,但竭力发展空间分析模型及开发相应的软件;1968年国际地理联合会(IGU)成立了地理数据收集和处理委员会,对促进地理信息系统的发展起了很大作用。
60年代,探索时期(GIS思想和技术方法的探索)人们关注什么是GIS,GIS能干什么。
(2)70年代GIS处于巩固发展阶段:由于计算机技术及其在自然资源和环境数据处理的应用,不同规模、不同专题和不同类型的地理信息系统在发达国家纷纷研制成功,如美国森林调查局--美国林业资源信息显示系统。
1976年,美国喷气推动实验室--影像信息系统IBIS。
1978年,ERDAS成立。
GIS的功能并没有得到很大发展,数据库的规模还比较小。
这期间,发展研究的重点是空间数据处理的算法,数据结构和数据库管理这三个方面。
(3)80年代GIS普及和推广:在发达国家,如加拿大、日本、英国开始将地理信息系统用于国土规划,支持资源和环境管理决策,人们把GIS与RS解决全球性问题,如全球沙漠化,全球可居住地评价,核扩散问题等。
空间数据结构
第五章空间数据结构数据结构即指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。
地理信息系统空间数据结构是指空间数据在系统内的组织和编码形式(GIS数据结构也可称为图形数据格式),它是指适合于计算机系统存储、管理和处理地理图形的逻辑结构。
GIS中,空间数据一般有着较为复杂的数据结构,目前,主要有两种数据模型表示空间数据,即矢量数据模型和栅格数据模型。
4.1 栅格数据结构4.1.1概述栅格数据是计算机和其它信息输入输出设备广泛使用的一种数据模型,如电视机、显示器、打印机等的空间寻址。
甚至专门用于矢量图形的输入输出设备,如数字化仪、矢量绘图仪及扫描仪等,其内部结构实质上是栅格的。
遥感数据也是采用特殊扫描平台获得的栅格数据。
栅格数据就是用数字表示的像元阵列,其中,栅格的行和列规定了实体所在的坐标空间,而数字矩阵本身则描述了实体的属性或属性编码。
栅格数据最显著的特点就是存在着最小的、不能再分的栅格单元,在形式上常表现为整齐的数字矩阵,因而便于计算机进行处理,特别是存储和显示。
4.1.2编码方案以图4-1为例,介绍几种编码方法的编码思路、方案和特点。
图4-1 栅格数据结构1. 游程长度编码地理数据往往有较强的相关性,也就是说相邻象元的值往往是相同的。
游程长度编码的基本思想是:按行扫描,将相邻等值的象元合并,并记录代码的重复个数。
游程长度编码的数据结构: 行号,属性,重复次数。
图4-1的游程长度编码为:1,A,4,R,1,A,6…对于游程长度编码,区域越大,数据的相关性越强,则压缩越大。
其特点是,压缩效率较高,叠加、合并等运算简单,编码和解码运算快。
2. 块式编码块式编码是将游程扩大到二维情况,把多边形范围划分成若干具有同一属性的正方形,然后对各个正方形进行编码。
块式编码的基本思想:由初始位置(行列号)、半径和属性代码组成。
图4-1的块状编码为:(1,1,3,A),(1,5,1,R),(1,6,2,A),…块状编码对大而简单的多边形更为有效,对一些虽不较多的复杂多边形效果并不好。
3.8 四叉树数据结构--2019.6.29--zyy
四叉树数据结构武汉大学遥感信息工程学院余长慧常规四叉树线性四叉树四叉树分割的基本思想1如果某个子区的所有格网都含有相同的值,则子区不再分割;否则,把子区再分割成四个子区域;把一副图像或一副栅格地图(2k x2k ,k>1)等分成四部分,逐块检查其格网值。
递归分割,直到每个子块都只含有相同的灰度或属性值为止。
12345671112131415191617188910常规四叉树2结点:父结点指针,四个子结点指针,本结点灰度或属性值常规四叉树方法:记录叶结点外,还要记录中间结点;结点之间的联系靠指针表达,也叫指针四叉树。
增加了存储量和操作的复杂性。
3线性四叉树线性四叉树方法:只存储叶结点的信息结点:位置、大小和格网值叶结点的位置信息:遵照一定的规则对叶结点编号,这种编号称为地址码四叉树分解过程3线性四叉树线性四叉树的编码地址码:隐含叶结点的位置信息四进制Morton码十进制Morton码(1)基于四进制的Morton码及四叉树的建立线性四叉树3方法1:自上而下分裂建立四叉树,过程中逐步产生Morton 码方法2:首先计算每个格网的Morton 码,然后扫描自下而上合并,建立四叉树方法1:分解过程(自上而下)第一步01编码方向23方法1:分解过程(自上而下)第二步01 2310111213 2021222330313233方法1:分解过程(自上而下)第二步101112132021 22233031 3233方法1:分解过程(自上而下)第三步101112132021 222330313233303133方法1:分解过程(自上而下)第四步303133方法2:合并方法(自下向上)将二维矩阵元素的下标转换成Morton 地址码四进制Morton 码的计算方法:当>时当时2log ()b k 0(,2)10II kk I MOD I ⎡⎤⎣⎦==∙∑k I II=k 1(/2)K I INT I -=0k = 0k (a )将十进制的行列号转换成二进制数MOD :取余函数,INT :取整函数,II :十进制行号,I b :二进制行号,J b :二进制列号,k :中间循环变量。
栅格压缩编码和常见文件压缩方法的异同2
栅格压缩编码和常见文件压缩方法的异同一、关于栅格数据压缩编码栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。
每一个单元(象素)的位置由它的行列号定义,所表示的实体位置隐含在栅格行列位置中,数据组织中的每个数据表示地物或现象的非几何属性或指向其属性的指针。
一个优秀的压缩数据编码方案是:在最大限度减少计算机运算时间的基点上进行最大幅度的压缩。
在栅格文件中,每个栅格只能赋予一个唯一的属性值,所以属性个数的总数是栅格文件的行数乘以列数的积,而为了保证精度,栅格单元分得一般都很小,这样需要存储的数据量就相当大了。
通常一个栅格文件的栅格单元数以万计。
但许多栅格单元与相邻的栅格单元都具有相同的值,因此使用了各式各样的数据编码技术与压缩编码技术。
其栅格数据存储压缩编码方法主要有:直接编码、链式编码、游程编码、块式编码、四叉树编码。
(1)直接栅格编码::是最简单最直观而又非常重要的一种栅格结构编码方法,通常称这种编码为图像文件或栅格文件。
直接栅格编码是将栅格数据看作一个数据短阵,逐行或逐列逐个记录代码。
可每行从左到右逐个记录,也可奇数行从左到右,偶数行从右到左记录,为特定目的也可采用其它特殊顺序。
通常称这种编码的图像文件为栅格文件,这种网格文件直观性强,但无法采用任何种压缩编码方法。
图2.1 (c)的栅格编码为:4,4,4,4,7,7,7,7;4,4,4,4,4,7,7,7;4,4,4,4,9,9,7,7;0,0,4,9,9,9,7,7;0,0,0,9,9,9,7,7;0,0,0,9,9,9,9,9;0,0,0,0,9,9,9,9;0,0,0,0,0,9,9,9。
可用程序设计语言按顺序文件或随机文件记录这些数据。
(2)链式编码:由某一原点开始并按某些基本方向确定的单位矢量链。
基本方向可定义为:东=0,南=3,西=2,北=1等,还应确定某一点为原点。
其特点:对多边形的表示具有很强的数据压缩能力;具有一定的运算功能,如面积和周长计算等;叠置运算如组合、相交等则很难实施,有效地压缩了栅格数据,尤其对多边形的表示最为显著,比较适于存储图形数据。