空间数据分析第二章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.1地理世界的概念模型与数据模型

2.2空间数据的性质

2.3空间数据的不确定性

2.1 地理世界的概念模型与数据模型

空间数据的特殊性质使得很多传统的数据分析方法和技术不能够直接应用于空间数据的分析,大量基于GIS的空间分析技术与传统的数据统计分析技术有着本质的不同,其原因在于这些分析方法和技术是基于空间数据性质的。

2.1.1 地理世界的概念模型--对象和场

人类一般以两种观念认识世界,一种认为世界由离散的实体构成,另外一种认为世界是连续的场。于是,离散的对象和连续的场就构成了表示地理世界的两种基本方式,它提供了概念层次上地理世界的认知模型。

离散实体又称为对象,通过其独特的局部化特征相互区别,并通过其拥有的特定属性的个体被识别。其重要特征是对象可被计数。

维数是离散实体的显著特征,在离散的世界观中,实体自然地被抽象为点、线和多边形(面)3种类型。

离散对象观将现实世界作为一个能够容纳概念对象、基本对象和复合对象的空间。

在离散对象方法中,空间对象的几何形态及其属性特征共同构成地理信息的完整表示,其属性信息是所描述的地理实体的特性,不因为这个实体位置的不同而改变。

离散对象也可以用来表示连续变化的场,如用等高线表示地形的连续起伏等。在每一条线上要素点的值处处相等;线的稀疏密集表示空间变化的梯度。

场的观点--用连续表面描述地理现象的方法。它认为世界被很多变量描述,每一个变量在任何可能的位置都是可量测的。

连续场描述的是在空间—时间框架下地理变量的空间变化。

场的表示:在数字世界中完全地表示连续空间是不可能的,所有表示连续世界的空间数据模型都是某种程度的近似,这些模型包括规则的空间点、不规则的空间点、等值线、规则单元格、不规则三角网,以及多边形等

不规则多边形表示场是经常使用的一种近似技术,是典型的用适量数据模型表示连续场的技术,植被覆盖类型、土壤类型和气候类型区等地理场经常使用不规则多边形表示。

在这种情形下,需要多边形不重叠并完整地覆盖所研究的空间范围。Voronoi多边形是经常使用的表示地理场的模型,它又称为Thiessen多边形。Voronoi多边形与Delauney三角形密切相关,根据一组空间点,可首先构造Delauney三角形,然后对三角形的边进行垂直等分即可导出Voronoi多边形。

V oronoi多边形常用于气象和水文中,这是在假设观测点代表最邻近的空间位置的基础上,快速构造观测点所代表的空间区域的方法。

但Voronoi多边形的大小主要依赖于观测点分布的疏密,并且可能存在一个观测点不合理地代表了一个很大的区域,而其中的数值处处一致。

这一模型表示场的适合性受到点分布合理性的制约,在样本点的疏密程度变化合理的区域中场的表示好;而样本极度稀疏的区域将会忽视其空间变化。

总之,离散对象和连续场概念模型是建立在两种地理世界认知观的基础上,它反映了地理世界的复杂性及认知的复杂性。基于离散对象和连续场,GIS实现了两种有效的空间数据模型,即矢量数据模型和栅格数据模型。

2.1.2 GIS空间数据模型——矢量和栅格

离散对象和连续场提供了关于表示地理世界的两种不同的概念视图,但是两者都不能解决任何地理现象数字化表示问题。

以数字形式表示地理数据的方法是栅格和矢量。原理上,两者都可以用编码场和对象,但是在实践中栅格与场、矢量与对象之间形成了强烈的联系。

1.栅格数据

在栅格表示中,地理空间被划分成矩形单元格矩阵,通常使用正方形单元格。所有的地理变化通过对单元格赋予性质或属性来表示。单元格也被称为像素。

当信息以栅格形式表示时,每个单元格都有一个数值描述其属性特征,单元格内部的细节变化信息都丢失。

常用的编码方式有:最大份额法、中心点法。

2.矢量数据

在矢量数据表示中,所有的线通过点之间的直线连接。

为了获取以矢量形式表示的区域对象,只需要形成多边形顶点的点被获取。这种方法比较简单,并且比栅格表示的效率更高,因为栅格表示多边形需要列出所有的单元格。

为了在栅格中精确地表示一个区域,就必须使用非常小的单元格,单元格的数量会成比例地增加。

2.1.3 属性数据的测度

属性是描述实体特征的变量。地理信息中属性的范围极其广泛,有些属性是自然或环境的而另外一些是社会或经济的。

区分属性信息的测度类型很重要,因为它规定了支撑量测的数字系统的规范性质,并决定了什么样的算术运算有效,以及使用什么样的统计过程。

从量测层次上可将属性数据分为离散尺度的或连续尺度的,定性的或定量的。虽然这两种分类方法对数据的性质给出了区分,但是不足以明确地定义变量的运算分析方法。

一般划分为名义、序数、间距、比率等属性。其中前两种属于离散尺度和定性的层次,后两者属于连续尺度和定量的层次。

1)名义属性:是最简单的属性类型,即对地理实体的测度,本质上是对地理实体的分类。名义属性包括数字、文字,甚至颜色。即使名义属性是数值的,对其应用算术运算也是没有意义。

2)序数属性:序数属性定义的类型之间存在等级关系。在序数属性中,属性值具有逻辑顺序。序数属性遵循明确定义的顺序,无论相继的属性之间的间距已知或未知。序数数据本质上是一种分类等级数据,即类型必须分为不同的等级。序数数据可以进行优先级的比较运算。

对名义和序数数据能够进行分类计数,所以常被称为离散变量,或定性变量。

3)间距属性:是一种对地理实体或现象的数量测度方法。间距属性测度的是一个值对于另一个值差异的幅度,但不是该值和真实零点之间的差值。由于间距属性的数值测度不是基于自然的或绝对的零点,因此数量关系的运算受到限制。

间距属性值之间的加减算术运算是有效的,但是乘法和除法是无效的。间距属性数据还可以使用均值、标准差等进行描述。

4)比率属性:是数值和其真实零点之间的差异幅度的测度。两个比率数值之间的加减乘除算术运算都有效。对于比率属性的数据可以实施各种数学运算。

间距属性和比率属性是在连续尺度上的数据测度,可以是所定义的连续区间上的任何位置上的数值。

二者之间的重要区别是间距数据没有自然的起点(或其量测的起点是相对的),而比率数据定义在绝对的起点上。

在地理分析中必须注意属性数据的类型特征,因为不同的属性测度规定了可应用

相关文档
最新文档