基于GIS空间数据挖掘技术的应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于GIS空间数据挖掘技术的应用研究摘要:本文介绍了空间数据挖掘的概念,分析了基于gis的空间数据挖掘的流程,详细介绍了空间数据挖掘在gis中的应用和可视化方法,最后提出gis空间数据挖掘的存在问题,阐述了技术的发展前景。

关键词:gis 空间数据挖掘可视化

中图分类号:p2 文献标识码:a 文章编号:1672-3791(2013)02(b)-0015-02

1 空间数据挖掘的概念

空间数据包括了空间属性数据和非空间属性数据,空间属性描述了空间拓扑关系和方位、距离等关系,空间属性数据按照空间索引结构存储和查找。空间数据挖掘(spatial data mining,sdm)指的是从空间数据库中抽取隐含的知识、空间关系或非显式地存储在空间数据库中的其它模式等[1]。从空间数据中提取信息,提取的信息包含了复杂的空间关系,因此空间数据挖掘与其他数据挖掘方法上有其独有的特点。空间数据挖掘需要综合数据挖掘与空间数据库技术。空间数据挖掘可用于对空间数据的理解,空间关系和空间与非空间数据间关系的发现,空间知识库的构造,空间数据库的重组和空间查询的优化。

空间数据是地理信息系统的重要数据,可以是地表在地理信息系统中的二维投影,也可以是多维的立体数据。由于雷达、卫星、

传感器等技术的飞速发展,空间数据的数量、大小和复杂性都在快速地增加,出现gb,tb甚至于pb级的海量数据,获取实质性有用的数据,就需要空间数据挖掘技术。所以空间数据挖掘就是处理空间数据的技术方法,是挖掘出隐藏在空间数据库中的非显性知识、空间关系等。gis从本质说是一个空间数据管理系统,将空间数据挖掘技术应用于gis,是将gis中的数据转化成知识的有效方法。

1989年8月,在美国底特律市召开的第一届国际联合人工智能学术会议上,首次出现了从数据库中发现知识(knowledge discovery in database,kdd)的概念。1994年,在加拿大渥太华举行的gis国际学术会议上,李德仁院士首次提出了从gis数据库中发现知识(knowledge discovery from gis,kdg)的概念,并系统分析了空间知识发现的特点和方法,认为它能够把gis有限的数据变成无限的知识,使gis成为智能化的信息系统。1995年,在加拿大召开的第一届知识发现和数据挖掘国际学术会上。又出现了数据挖掘(data mining,dm),后又相继出现了数据发掘、数据开采、数据采掘、知识提取、信息发现等。同时,李德仁院士也把kdd 进一步发展为空间数据挖掘和知识发现,系统地研究或提出了可用的理论、技术和方法,并取得了很多创新性成果,奠定了空间数据挖掘和知识发现在地球空间信息学中的学科地位和基础[2]。

2 空间数据挖掘的流程

空间数据挖掘是空间数据库中知识发现过程的一个基本步骤。

数据挖掘步骤是通过将有趣的模式提供给用户,或作为新的知识存放在知识库中这种与用户或知识库交互的方式来进行的知识发现

过程的其中最重要的一步,因为它可发现隐藏的不为人知的模式。它由以下步骤组成。

(1)数据清理:通过填写空缺的值。平滑噪声数据,识别、删除孤立点,并“清理”不一致数据。

(2)数据集成:对多种数据源进行集成。

(3)数据选择:从数据库中检索与任务相关的数据。

(4)数据变换:通过汇总或聚集等操作将数据变换成适合数据挖掘的形式。

(5)数据挖掘:使用智能的方法来提取数据模式。先对数据挖掘的目标和知识类型进行确定,然后根据所需要的知识类型选择合适的挖掘算法,最后从数据库中按照选定的挖掘算法获得所需的知识。

(6)模式评估:通过某种兴趣度量来评估真正有趣的知识模式。

(7)知识表示:通过知识可视化表示技术向用户展示挖掘的知识通过对以上过程不断地循环操作,可以对所挖掘出来的知识进行不断求精和深化。

而面向gis的空间数据挖掘的过程大致可分为:确定挖掘内容、数据获取、数据预处理、挖掘方法选择、过程处理、挖掘知识应用。具体流程如(图1)所示。

首先用户提出问题,系统接受用户的要求,将其转化为gis数据库模块的输入参数。挖掘向导接受用户的命令,触发空间数据挖掘核心模块。用户则根据需要选择挖掘技术,对预处理后的数据进行挖掘。挖掘后的知识再通过提取反馈给用户。

3 空间数据挖掘在gis中的应用

空间数据挖掘技术与地理信息系统(gis)的结合具有非常广泛的应用空间。数据挖掘与gis集成具有三种模式:其一为松散耦合式,也称外部空间数据挖掘模式,这种模式基本上将gis当作一个空间数据库看待,在gis环境外部借助其它软件或计算机语言进行空间数据挖掘,与gis之间采用数据通讯的方式联系。其二为嵌入式,又称内部空间数据挖掘模式,即在gis中将空间数据挖掘技术融合到空间分析功能中去。第三为混合型空间模型法,是前两种方法的结合,即尽可能利用gis提供的功能,最大限度的减少用户自行开发的工作量和难度,又可以保持外部空间数据挖掘模式的灵活性。

利用空间数据挖掘技术可以从空间数据库中发现如下几种主要类型的知识:普遍的几何知识、空间分布规律、空间关联规律、空间聚类规则、空间特征规则、空间区分规则、空间演变规则、面向对象的。目前,这些知识已比较成熟地应用于军事、土地、电力、电信、石油和天然气、城市规划、交通运输、环境监测和保护,110和120快速反应系统等资源管理和城市管理领域。在市场分析、企

业客户关系管理、银行保险、人口统计、房地产开发、个人位置服务等领域也正得到广泛关注与应用,实际上,它正在深入到人们工作和生活的各个方面。

4 基于gis空间数据挖掘结果的可视化

空间数据挖掘是面向更具可视化要求的地理空间数据的知识发现过程。可视化能提供同用户对空间目标的心理认知过程相适应的信息表现和分析环境,可以考虑将空间数据挖掘过程置于可视化的环境之下。可视化与空间数据挖掘的结合促使数据挖掘经历了一个数据可视化——挖掘算法的应用——挖掘结构的验证和可视化表达——挖掘算法的进一步改进和完善的循环往复的提高过程,可视化在其中扮演着重要的角色。

而基于gis空间数据挖掘的可视化主要表现为与gis相关的各类地图及其各类符号和要素。gis平台中常用的可视化方法主要包括以下几点。

(1)基本查询技术:包括地图缩放、平移、视点选取等基本的空间查询与选择技术。

(2)色彩:利用人们对色彩的视觉敏感程度很高的特点,是用色彩来反映数据的变化趋势(如地貌中的分层设色)、突出反映某些分布规律或者数据的本身特征(不饱和数据表示不确定性)等。在交互可视化中应该给予用户充分的自由来选取各种色彩模式用于描述数据,用户可以任意调整色相、亮度和饱和度等,系统环境

相关文档
最新文档