空间数据基本理论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.空间地理数据的基本特征
要完整地描述空间实体或现象的状态,一般需要同时有空间数据和属性数据。如果要描述空间实体或的变化,则还需记录空间实体或现象在某一个时间的状态。所以,一般认为空间数据具有三个基本特征:
⑴空间特征表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示。
⑵属性特征表示现象的特征,例如变量、分类、数量特征和名称等等。
⑶时间特征指现象或物体随时间的变化。
位置数据和属性数据相对于时间来说,常常呈相互独立的变化,即在不同的时间,空间位置不变,但是属性类型可能已经发生变化,或者相反。因此,空间数据的管理是十分复杂的。
有效的空间数据管理要求位置数据和非位置数据互相作为单独的变量存放,并分别采用不同的软件来处理这两类数据。这种数据组织方法,对于随时间而变化的数据,具有更大的灵活性。
2.如何在计算机内部用数字形式描述客观事物或现象
对地理信息进行数字化描述,就是要使计算机能够识别地理事物的形状,为此,必须精确地指出空间模式如何处理,如何显示等。在计算机内描述空间实体有两种形式:显式描述和隐式描述。在计算机中的显式表示,就是栅格中的一系列像元。隐式表示是由一系列定义了始点和终点的线及某种连接关系来描述。
计算机对地理实体的显式描述也称栅格数据结构,计算机对地理实体的隐式描述也称矢量数据结构。栅格和矢量结构是计算机描述空间实体的两种最基本的方式。
在栅格数据结构中,整个地理空间被规则地分为一个个小块(通常为正方形),地理实体的位置是由占据小块的横排与竖列的位置决定,小块的位置则由其横排竖列的数码决定,每个地理实体的形态是由栅格或网格中的一组点来构成。
在矢量数据结构中,地理实体的形状和位置是由一组坐标对所确定。矢量数据结构对地理实体的描述类似于地图对地理信息的描述,一般也把地理实体分为点、线、面三种,每种实体有不同的编码方法。
3.栅格结构数据的特点有哪些,栅格数据有哪些获取手段
栅格结构的显著特点是:属性明显,定位隐含,即数据直接记录属性的指针或属性本身,而所在位置则根据行列号转换为相应的坐标,也就是说定位是根据数据在数据集中的位置得到的。由于栅格结构是按一定的规则排列的,所表示的实体的位置很容易隐含在格网文件的存储结构中,在后面讲述栅格结构编码时可以看到,每个存储单元的行列位置可以方便地根据其在文件中的记录位置得到,且行列坐标可以很容易地转为其他坐标系下的坐标。在格网文件中每个代码本身明确地代表了实体的属性或属性的编码,如果为属+性的编码,则该编码可作为指向实体属性表的指针。由于栅格行列阵列容易为计算机存储、操作和显示,因此这种结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便。
栅格结构表示的地表是不连续的,是量化和近似离散的数据。在栅格结构中,地表被分成相互邻接、规则排列的矩形方块(特殊的情况下也可以是三角形或菱形、六边形等),每个地块与一个栅格单元相对应。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。在许多栅格数据处理时,常假设栅格所表示的量化表面是连续的,以便使用某些连续函数。由于栅格结构对地表的量化,在计算面积、长度、距离、形状等空间指标时,若栅格尺寸较大,则造成较大的误差,由于在一个栅格的地表范围内,可能存在多于一种的地物,而表示在相应的栅格结构中常常是一个代码。也类似于遥感影像的混合象元问题,如Landsat的MSS 卫星影像单个象元对应地表79米*79米的矩形区域,影像上记录的光谱数据是每个象元所对应的地表区域内所有地物类型的光谱辐射的总和效果。因而,这种误差不仅有形态上的畸形,还可能包括属性方面的偏差。
栅格结构数据主要可由四个途径得到,即
①目读法:在专题图上均匀划分网格,逐个网格地决定其代码,最后形成栅格数字地图文件;
②数字化仪手扶或自动跟踪数字化地图,得到矢量结构数据后,再转换为栅格结构;
③扫描数字化:逐点扫描专题地图,将扫描数据重采样和再编码得到栅格数据文件;
④分类影像输入:将经过分类解译的遥感影像数据直接或重采样后输入系统,作为栅格数据结构的专题地图。
4.栅格结构数据的编码与压缩有哪些方法,各自有何特点
在地理信息系统的空间数据结构中,栅格结构的编码方式主要有直接栅格编码、链码、游程长度编码、块码、四叉树码等。
直接栅格编码是最简单直观而又非常重要的一种栅格结构编码方法,通常称这种编码的图像文件为网格文件或栅格文件,栅格结构不论采用何种压缩编码方法,其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序。
对压缩编码而言,目前有一系列栅格数据压缩编码的方法,如键码、游程长度编码、块码和四叉树编码等。其目的,就是用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有损编码之分。信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息,信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系统中多采用信息无损编码,而对原始遥感影像进行压缩编码时,有时也采取有损压缩编码方法。
链码(Chain Codes)又称为弗里曼链码[Freeman]或边界链码,链码可以有效地压缩栅格数据,而且对于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界将被重复存储而产生冗余。
游程长度编码(Run-Length Codes)是栅格数据压缩的重要编码方法,它的基本思路是:对于一幅栅格图像,常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。其方法有两种方案:一种编码方案是,只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数,从而实现数据的压缩。事实上,压缩比的大小是与图的复杂程度成反比的,在变化多的部分,游程数就多,变化少的部分游程数就少,图件越简单,压缩效率就越高。另一种游程长度编码方案就是逐个记录各行(或列)代码发生变化的位置和相应代码,游程长度编码在栅格压缩时,数据量没有明显增加,压缩效率较高,且易于检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。
块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。
四叉树又称四元树或四分树,是最有效的栅格数据压缩编码方法之一,绝大部分图形操作和运算都可以直接在四叉树结构上实现,因此四叉树编码既压缩了数据量,又可大大提高图形操作的效率。四叉树将整个图像区逐步分解为一系列被单一类型区域内含的方形区域,最小的方形区域为一个栅格象元,分割的原则是,将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。四叉树通过树状结构记录这种划分,并通过这种四叉树状结构实现查询、修改、量算等操作。四叉树编码具有可变的分辨率,并且有区域性质,压缩数据灵活,许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。
5.矢量结构数据的特点有哪些,矢量数据的获取手段有哪些
矢量结构的特点是:定位明显、属性隐含,其定位是根据坐标直接存储的,而属性则一般存于文件头或数据结构中某些特定的位置上,这种特点使得其图形