遥感影像数据挖掘研究进展_周小成
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
遥感影像数据挖掘研究进展
周小成,汪小钦
(福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福州350002)
逐一细化成精细类别,通过加入决策函数一步一步地进
行分类。典型的决策树方法有分类回归树(CART)、ID3、
C5.0等。与传统的单层最大似然法分类器相比,决策树可
以在不同的分类等级与节点上采用不同的特征子集,甚至可
以采用不同的分类器;可以选用较少的特征,避免高维数据
带来的系列问题[14]。在实际中,一般类别都交错分布,在这
种情况下,可以采用空间分割聚类的方法,即分割线两边在
当前情况下具有最大的对比度,子集内可以有多个类型分
布而不再要求分割到单个的类别[15]。
利用数据挖掘技术从GIS和遥感影像中发现知识,可以
改善土地利用分类的精度。Huang[16](1997)等用C4.5算法
从GIS数据和SPOT多光谱图像数据中提取知识进行湿地
分类。Eklund,et al.[17](1998)在土壤盐碱度分析中,采用
C4.5归纳学习算法从TM图像和地图数据提取到相关知
识。布和敖斯尔[18](1999)提出了基于知识发现和决策规则
基础的盐碱地GIS和遥感分类的方法。Deren LI[19](2000)
提出了空间对象尺度和像素尺度两个学习尺度用于从空间
数据中归纳学习。用C5.0归纳学习算法发现有关空间分布
模式和形状特征规则,然后用总结的模式对图像重新分类。
通过与单纯Bayes分类结果的比较,总体分类精度大大提高。
潘永生[20](2002)利用改进的决策树算法和修剪算法对乳腺
疾病图像进行数据挖掘,证明了决策树算法在医学图像数据
挖掘领域有着广泛的应用前景。
2.2.2利用空间知识规则辅助分类
利用空间数据挖掘理论挖掘的空间关联规则、空间特征
规则、空间聚类规则等空间知识规则可以提高遥感解译的可
靠性、精度和速度[21]。如森林迹地海拔高于100m,居民地
和道路相连等。王雷[22](2001)利用遥感影像分类获取的地
物类型分别与坡向叠加,生成坡向直方图。发现旱地偏东向
的频率较高,居民地则是偏南向的频率较高。这种方法提高
了遥感非监督分类的效率与可靠性,有助于地学规律的发现
与描述。杨存建[23](2001)通过对不同类型居民地的遥感影
像特征、光谱特征和空间关系分析,从而发现居民地的光谱
特征知识、空间关系知识,建立了基于知识的遥感图像居民
地信息提取模型。Brodley C.E.[24](2002)提出了利用高维
遥感数据在土地覆盖分类时融入领域知识的新方法。利用统计学和机器学习领域最新的理论,采用一个被称为推进(boosting)的技术,它允许对类别成员进行充分的评估。该
方法允许基于辅助信息对分离性很差的类别进行区分。
对于在特征空间中寻找特征模式,由于样本集之间互相
重叠或者由于离散样本相互干扰的原因,往往很难获取细节性和过程性的分布结构,从而影响结果的精度和解释力。骆剑承[25](1999)提出了空间逐步寻优的数据挖掘方法(SOMM)。SOMM应用于遥感影像特征挖掘中,考虑了遥感影像的地学特征,在模型中融合了地学知识,在其所建模型
中含有地学特征,从分类结果看,用SOMM分层分类法比传统的一般统计分类方法分类精度高[26]。遥感图像理解中的结构模式识别是实现图像理解极具优势的方法,GIS属性数据融入遥感图像理解具有重要意义,它们要求系统具有知识获取和知识处理的能力。专家系统也具有解决问题的能力, 但由于知识获取的困难,必须借助数据挖掘技术。神经网络和进化计算均具有上述功能,它们的结合更能发挥各自的优势,并能较好地解决GlS数据融入遥感图像处理的问题[27]。基于自组织地图(SOM)人工神经网络算法,Evangelou I.[28] (2001)提出了一种用于图像数据挖掘和知识发现的方法,能够使我们获得经过简化的图像数据空间的图片。
2.3图像聚类
Soh Leen-Kiat等[29~30](1998,1999)建立了一个通用
的研究遥感影像数据挖掘模型。应用该模型实现了一个全自动挖掘遥感影像的技术,它通过非监督聚类学习有意义的类别或模式。Soh Leen-Kiat(1999)还研究了一个集成数据
库知识发现和数据挖掘到传统图像处理算法的分割方
法[31],该方法可用来分析和分割非结构的卫星影像中的自然景观。图像的类别数目可自动被确定。该方法已经成功应用到ERS1 SAR、TM、NOAA超高分辨率辐射仪(AVHRR) 数据中的自然景观分类中。此外,Chunyu Zhao(2001)探讨
了空间数据挖掘中粗集理论的应用可能性和基于数学形态学遥感图像聚类方法[32]。聚类方法是用于热点目标识别的重要方法。Tay,Seng Chuan[8](2003)提出了不同的方法来
去除伪热点。在获取热点和对其分类时用聚类和Hough变换来确定目标的模式。如果是火灾,那通常不会以规则的模式如直线来蔓延,依据这一模式来判断伪预警点。并且示范了利用空间数据挖掘技术从NOAA影像上获取热点目标时剔除伪预警点的方法。利用遥感信息挖掘技术可用于疾病监测和防治。可配合地面监测,研究病原体或媒介的可能孽生地。利用历史遥感资料结合疾病的既往分布,预测疾病未来潜在的疫区[9~10]。
Aldridge[11](1998)在粗集理论支持下,利用RS-GKDD
(Rough Set Based Geographic Knowledge Induction)方法对新
西兰Dunedin附近的滑坡影像进行了研究,发现了高程、岩
性与滑坡之间的显著关系。马建文[12](2001)在遥感弱信息
和临边效应信息提取方面做了大量的研究,认为基于傅立叶
变换和小波变换在遥感影像数据挖掘方面具有很好的应用
前景。通过不同空间时间序列和不同探测机理的遥感数据
融合,增强遥感图像的几何、时间和光谱分辨率,提高对目标
的识别能力也已成为数据挖掘的热点问题[13]。
2.4空间关联规则挖掘
遥感影像中“深层知识”,如空间位置分布规律、空间关
联规则、形态特征区分规则等,必须通过运算和学习才能挖
掘出来。图像数据库中的空间关联规则挖掘与事务数据库
中的存在着一些差异。一个图像可以包含多个对象,每个对
象可以有许多特征,如颜色、形状、纹理、关键字和空间位置。
这样可能存在大量的关联。利用多级分辨率挖掘方法可大
大降低总体数据挖掘的代价,而又不损失数据挖掘结果的质
量和完整性。这是一种在大型图像数据库中挖掘关联的高
效方法。
59
2005.3综述遥感信息
法来压缩多光谱可视化信息到利于管理的尺寸。Soh,
Leen-Kiat[29~31](1998,1999)等设计了一个海冰分割系统
-ASIS(Automated Sea Ice Segmentation)。该系统集成了图
像处理、数据挖掘和机器学习方法来确定ERS和
RADARSAT SAR图像上海冰的实际类别数。ASIS能够用
作一个预处理工具,帮助分析海冰图像以及作为人工分类海
冰图像的一个基础。Hinke,T.H.[51](2000)指出了一系列
对于遥感数据挖掘系统的需求,并且设计了一个称为ADAM
的数据挖掘系统。系统具有目标独立挖掘、矢量数据(以多
光谱或融合数据为代表)关联规则挖掘、纹理特征间关联规
则挖掘几个遥感数据挖掘功能。Marchisio,Giovanni B.[52]
(2000)设计一个了多光谱图像融合GIS数据的挖掘系统。
数据挖掘和信息恢复模块借助GIS数据从遥感影像上获取
信息。Durbha,Surya S.[53](2002)分析了模拟大气、场景和
传感器参数的可视化遥感数据挖掘的发展。通过修改这些
领域现有的模型,在软件环境中利用IDL开发完成了一个可
视化遥感挖掘系统。一个图形用户界面能够使用户利用预
定义的菜单交互式选择不同土地覆盖类型(如水体,农田,土
壤等)以及生成可视化场景。系统可以表示一个模拟的
Landsat ETM,SPOT XS和最新的QuickBird传感器数据。
4小结
根据以上研究进展的分析,可以看出,遥感影像数据挖
掘是一个有着广阔应用前景的研究领域。遥感影像数据挖