基于本体的空间数据集成技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于本体的空间数据集成技术
郭黎,崔铁军,刘灿由,田新林,张威
郑州测绘学院
陇海中路66号
450052
gl_750312@
摘要:本文简单论述了地理本体的基本概念、结构。介绍了地理本体的建模方法。提出了基于地理本体的空间数据集成框架,地理本体集成采用基于公共属性模板的多本体向标准本体集成的混合构架,进而实现数据的集成。最后以水系要素中的“干出滩”类为例进行了实例研究,形象地展现了地理本体的集成过程及其数据的转换。在解决数据语义异构性方面,地理本体的构建发挥了重要的作用。基于本体的空间数据集成技术可以很好地实现不同数据之间的集成与共享。
索引关键词:地理本体 地理概念 语义 地理本体建模 地理本体集成
引言
从20世纪90年代末开始,本体概念及其思想引起了地理信息科学研究者的注意,许多国际学术组织和研究机构开展了一系列相关研究计划,地理信息科学界的许多国际学术会议也设立了与本体相关的讨论主题。在地理本体基础理论研究方面,主要对地理本体理论构成、地理本体的人文调查与实验研究、地理本体的信息学研究,特别是地理本体的形式化描述语言和工具及本体创建和集成方法等方面进行了广泛而深刻的思索与探讨,并将地理本体理论与方法研究成果应用于地理信息集成、地理信息检索、道路寻找和智能体系统设计与开发、社会及生态环境研究等多个应用领域。 目前地理本体的应用研究主要集中在以下四个方面:(1)地理信息(数据)集成;(2)地理信息(数据集)发现与检索;(3)道路寻找系统研究;(4)其他应用研究。
不同地理信息(数据)的集成是近年来地理信息科学研究的一个主要内容,作为共享地理概念模型或地理认知模型的形式化说明,地理本体为地理数据提供了形式化语义说明,对于解决地理数据的语义异质性和实现语义层次上的互操作具有很大的潜在优势,通过地理本体可以在集成地理数据时将数据的语义也集成过来。由于地理本体的这种优势,在GIS领域,已经有一些学者开始探讨基于本体的空间数据集成框架和方法。
1地理本体及地理本体建模
1.1 地理本体的基本概念
地理本体是指特定地理空间信息领域概念化模型或学科感知世界的明确的形式化规范说明。所谓的信息领域,是指共享同一数字地理信息语言和空间要素定义的人群。相同的信息领域共享相同的世界观和抽象模型、要素表达和元数据。也就是说,地理本体是与特定地理空间信息领域相关联的。概念化模型不同于通常意义上的概念模型,指的是人们对地理现实世界的多个抽象层次,包括地理认知世界、地理概念世界、地理空间世界、地理尺度世界及地理投影世界,等同于所谓的学科感知世界。因此,地理本体既可以是地理认知模型或概念模型的显式形式化,也可以是逻辑层次或表达层次上地理模型明确的形式化说明。
1.2 地理本体的构成
一个完整的地理本体应由概念或类、概念之间的关系、公理和实例四个组成部分或元语构成。
地理本体用于表示地理领域中的各种不同种类的事物,这些具有相同属性的地理实体或现象的集合在地理本体中被表示为“地理概念” 或“地理类型”。地理关系指地理领域中不同的地理概念之间某种性质的联系。地理概念之间的关系包括两大类,即语义关系和空间关系。在地理本体中,公理指地理学领域中公认的地理规律、地学知识以及施加于地理概念及地理概念之间关系之上的一些规则或约束条件,以便进行地理推理,并保证地理本体的一致性和完整性,是地理本体的一个重要组成部分。地理实例是指地理本体中概念或类的具体例子,也称为个体,如“长江”是“河流”概念的一个实例。
1.3 地理本体的建模方法
地理本体建模是指根据特定的目的和应用需要,将地理领域中非形式化的地理知识(包括地理学家的经验知识、文本形式的地理学知识等)和地理空间模型通过一定的形式化方法来明确描述领域中各种概念(类)及其之间的关系、实例和公理,从而建立形式化地理本体的过程。
2基于地理本体的空间数据集成方法研究
2.1 目前地理空间数据集成存在的问题
目前地理空间数据的集成研究主要集中于物理实现和逻辑模型层次上的集成方法,是从数据本身入手来研究数据集成,是一种微观的数据集成研究。数据是信息的外在表现,只有赋予了人的解释或理解即语义才有意义。而现有的许多地理空间数据集成方法都存在一个共同的缺陷,即无法集成数据的语义,不能将源数据的含义完整地转换和集成到目标数据中。
2.2 基于地理本体的空间数据集成方法
地理本体集成是基于地理本体的空间数据集成方法的核心和关键。本论文采用所有本体都向某个标准本体集成方案(图2-1),即通过比较数据生产者地理本体与数据使用者地理本体中的概念之间的关系,并根据一定的规则在这两个本体的概念之间建立映射关系的过程。
图2-1 地理本体集成方案——向标准本体集成
(1)地理概念语义关系的确定
地理本体集成是以不同本体中概念之间的语义映射关系为基础的,概念之间语义关系的确定至关重要。概念内涵是在概念层次上区别不同地理概念的关键,因此,地理本体集成中概念语义关系的确定也是以概念内涵的比较为基础的。本体集成中来自两个不同本体的地理概念之间的语义关系主要有等价关系、父概念/子概念关系(包含关系或上义/下义关系)、交叉关系和不交关系四种。
(2)地理概念的集成规则
对于上述四种语义关系,有以下几种集成规则:
A、等价关系的集成规则;
B、父概念/子概念关系的集成规则;
C、交叉关系的集成规则。
在集成本体时,用户可以根据具体情况选择不同的集成规则,相应地可以产生不同的数据集成结果。
2.3、集成过程中的数据抽取与转换
地理本体集成的最终目的是将数据生产者的地理空间数据集成到数据使用者的地理空间数据库中,从而服务于各种应用任务。而地理本体的集成只是实现了概念层次上的语义关系映射,即定义了源本体中各个概念与目标本体(标准地理本体)中各个概念的语义等价、包含或包含于、交叉和不交关系,并没有实现空间数据的集成。
地理本体是独立于地理空间数据集的,即地理本体和空间数据是分别存储的。因此,根据语义映射关系来实现底层空间数据的抽取和转换,从而最终实现地理空间数据的集成,必须在地理本体与相应空间数据集之间建立关联。存在两个层次的关联关系:地理本体与空间数据集之间的关联关系及地理概念或类型与类或子类之间的关联关系。
有两种途径可以建立本体和数据集之间的关联关系:一是在地理空间数据集的元数据中明确指出其对应的地理本体名称或存储路径;二是在地理本体中明确指出使用该本体的地理空间数据集或要素类。地理概念或类型与类或子类的关联关系也在地理本体中定义。地理概念用概念名、内涵、外延、自然语言定义和标识码CID来描述,其中标识码的作用就在于建立地理概念与相应地理空间数据集或要素类中各个类或子类之间的关联关系。
在建立这两个层次的关联关系后,源地理本体的概念与目标地理本体的概念之间的映射关系就确定了。源地理空间数据集向目标(集成)地理空间数据库中集成的约束条件,规定了源地理空间数据集的各个要素被抽取和转换到目标地理空间数据库的哪个要素类或子类中。
3水系本体的建立与集成示例
3.1 水系本体的创建
我们选取了水系中的“干出滩”类做实例演示。源数据的分类分级采用地方的《1:5万矢量地形要素(DLG)内容及分类代码表》,标准地理本体采用《军用基础地理信息要素分类与编码》。
由于采用了不同的分类体系,两种数据中相同的地理概念之间或不同的地理概念之间会出现包含、交叉等关系,因而在数据转化过程中存在语义冲突。
首先,我们基于《军用基础地理信息要素分类与编码》为水系要素建立了目标本体SHOAL1,其对应的结构体系如图3-1A,基于《1:5万矢量地形要素(DLG)内容及分类代码表》建立了源本体SHOAL2,其对应的结构体系如图3-1B。