空间不确定性研究综述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

空间不确定性研究综述

摘要:介绍了空间不确定性的概念,对空间不确定性的研究内容进行阐述说明并归纳总结其研究方法,对不确定性研究的发展趋势进行分析。

关键词:空间数据;不确定性;GIS;研究

1 空间不确定性问题概述

空间数据质量的不确定性研究伴随着GIS 的问世而开始,由于人类测量与表达能力的局限性,描述数据的模型只能是对客观实体的一种近似,此外各种空间操作、处理等又会引入新的误差和不确定性,可以说误差的存在是各类观测与分析数据的基本特征。这往往导致空间特征和空间过程很难被准确确定,从而直接关系到对GIS产品的质量控制,影响了空间数据的反演、多尺度和多角度数据分析和应用建模的效果,影响决策结果的质量。因此,在GIS初步形成和产品化时,就提出了空间数据的不确定性问题,且被国际上列为地理信息科学界重大基础理论研究课题之一。

在不确定性理论提出的早期,不确定性与误差是近义词,二者在多数情况下可以相互通用。误差指统计意义下的偏差或错误,而数据不确定性主要指数据“真实值”不能被肯定的程度。从这个意义看,数据不确定性可以看作是一种更广义与抽象的误差,它既包含随机误差,也包含系统误差和粗差;既包含可度量的误差,又包含不可度量的误差以及数值上和概念上的误差。

不确定性可划分为四类,分别是随机性、模糊性、未确定性和灰色性。随机性的特点是可重复观察,在观察之前知道所有可能的结果,但不知道到底哪一种结果会出现。模糊性是指事物的概念本身是模糊的,即一个对象是否符合这个概念难以确定。就像“一粒”和“一堆”是有区别的两个概念,它们的区别是渐变的,两者之间并不存在明确的界限,这种不确定性就是模糊性。未确定性是指纯主观上的、认识上的不确定性。灰色性是指由于事物的复杂性和噪声干扰,人们只能把握部分信息或信息的大致范围,而不知其全部信息或确切的信息量。

2 不确定性的研究内容

空间数据不确定性的产生来源十分复杂,空间对象本身可能具有不稳定性,在空间数据的获取、存储、传输、分析等过程中会引入更多复杂的不确定性。如在数据获取过程中,仪器精度限制、测量方案完善程度、环境的复杂性、观测员的能力水平、空间分析方法与模型表达的多样性等均会造成空间数据的不确定性。

根据实际应用中的需要,对地理空间数据不确定性的研究又可细分为:位置不确定性、属性不确定性、时域不确定性、逻辑一致性、数据完整性、数据不确定性的传播以及不确定性的可视化表示等[1]。地理空间数据不确定性研究的核心就是建立一套不确定性分析和处理的理论体系和方法体系。

2.1位置不确定性

位置不确定性指表示空间实体的真实位置与实际位置之间的差别,空间实体的位置通常以二维或三维坐标表示,相应的,位置不确定性常用坐标的精度来表示。近年来,空间数据位置不确定性成了研究热点,主要集中在数据源不确定性

的研究;点、线、面元不确定性模型的研究、不确定性可视化和不确定性传播模型的研究。

2.2属性不确定性

属性不确定性是指在采集、描述和分析客观实体的过程中,实体属性的量测或分析值围绕其属性真值随机地在时间或空间内的不确定性变化,是属性误差的空间延伸。

属性不确定性可分为定量和定性两种,如土地面积的不确定性(定量)和植被分类的不确定性(定性),一般取决于属性数据的类型[2]。属性不确定性主要来自于属性的定义、数据源、数据建模和分析过程中引入的不确定性,其中涉及到问题较多,包括难以确定的实体与实体间的边界,定义模糊的实体关系,空间分析中的不确定性及其传播,不确定性查询,度量不确定性等。

2.3时域不确定性

时域不确定性是指在描述地理现象时,时间描述上的差错。数据的时间精度涉及数据的现势性,大多数采用元数据管理的方法。

如对于每一幅遥感影像数据来说,无疑是同一瞬间的。但对于由多幅遥感影像拼接镶嵌起来的数据,则可能出现不同时段的遥感数据,时间可以相差若干天、若干月和若干年。在同一数据集中,或同一幅专题图中,出现不同时段的数据就可能造成不确定性。

2.4逻辑一致性

逻辑一致性是指数据结构内部的一致性,尤其是指拓扑逻辑上的一致性。包括数据结构、数据内容、空间属性与专题属性, 以及拓扑性质上的内在一致性。在GIS中,几何要素拓扑关系上的内在不一致性是逻辑一致性研究的重点。

2.5数据完整性

空间数据的完整性是指对于给定的目标,GIS 空间数据库能够完整表达的现象,包括数据范围、数据的分层、实体类型、属性数据和名称等各方面的数据的完整性。数据完整性如何是相对于所要完成或达到的目标而言的。

2.6数据不确定性的传播

GIS数据在输入、存贮、投影变换、格式变换、编辑、数据重组、数据处理、数据分析与分数以及数据制图及输出过程中,都能产生误差或不确定性。这些不确定性还能随着数据流的过程传递与积累。此外,在数据格式转换过程中,误差是普遍存在的。例如从栅格数据到矢量数据的相互转换过程中,不同模型计算所得的数据存在较大的差别,因此数据格式转存有明显的不确定性[3]。另外,在多种数据叠加过程中,出现不符合的现象也是常有的,往往会出现新的“斑块”或双线条等问题,因此具有明显的不确定性。

2.7不确定性的可视化表示

不确定性的可视化研究是进人年代以后随着计算机技术的发展而兴起的。目前主要采用灰度方法、彩色加三维的方法,通过采用直观的二维、三维图形或

其他灵活的形式,把抽象的空间数据不确定性的大小及分布转换为人的视觉可以直接感受的具体图形,以利于用户对数据质量的认识[4]。

3 不确定性的研究方法

3.1基于概率论及数理统计的不确定性研究

这方面的理论主要有概率论、证据理论、空间统计学。概率论主要用于处理由于随机误差而产生的不确定性。在概率论中,不确定性被描述成在给定某些观测值的条件下某一假设成真的条件概率。

证据理论是对传统概率论的一个扩展。该理论的一个基本策略是把一个证据集合分解成一系列不相关的证据集合,在这些证据集合中分别作判断,最后利用Dempster结合规则将这些判断结合起来。证据理论可以利用结合规则和两两比较的方法分析不确定性。其最大弱点在于,不能就矛盾证据或不同假设之间具有的微弱支持问题提出解决办法。

空间统计学过去称为地学统计学或地质统计学,它是关于不确定性和有限信息条件下进行分析、评价的学科[5]。它强调空间预计概率方向的作用,运用空间自协方差结构、变异函数或与其相关的自协变量,或局部变量值的相似程度来描述空间属性的不确定性,把统计变量理解为重要的信息源,以改善在有限观测量条件下的空间属性数据预测。

3.2基于模糊集合及粗集理论的不确定性研究

模糊数学以模糊集合为基础,用模糊可行区间表示数据非统计不确定度。其优点在于处理不确定性的能力,如土地分类中土壤渐变区域的处理、基于自然语言的空间查询等。而弱点是没有严格证明的过程,它所处理的对象是可能性而不是概率。因此,模糊数学常用于处理不确定性中的不准确性而非随机性,如两线状地物连接处的不确定性、场模型中确定域与模糊域目标间拓扑空间关系的描述等。

粗集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗集理论不排斥不确定性,力求按照实体的原形来研究实体,非常适合用于不确定影像分类、模糊边界划分、属性不确定性及评定属性的绝对不确定性和相对不确定性、简化属性依赖和属性表等。

3.3 基于云理论及信息熵的不确定性研究

云理论是一个分析不确定信息的新理论,包括云模型、不确定性推理和云变换三部分。云在空间由系列云滴组成,具有期望值、熵和超熵3个数字特征。期望值完全是一个定性的概念;熵是定性概念模糊度的度量,其值越大,概念越模糊;超熵反映云滴的离散程度,其值越大,隶属的随机离散度越大。以云理论为基础提出了云方法,它用期望值、熵和超熵这3个数字特征描述整个云团,实现定性和定量的转换,适用于空间关联规则的挖掘、空间数据库的不确定性查询及地理空间数据中模糊性和随机性为一体的属性不确定性问题。

熵是信息论中的一个基本概念,是用以度量信息源不确定性的惟一量,非常适合用来对测量结果的不确定度进行评定。利用熵理论评定测量数据的不确定性方法主要有2种:

(1)直接根据样本的信息熵计算测量值的不确定度;

相关文档
最新文档