基于决策树的土地分类方法案例研究

合集下载

基于决策树的土地分类方法案例研究

基于决策树的土地分类方法案例研究

基于决策树的土地分类方法案例研究作者:张成强周国祥齐红超来源:《科技资讯》 2013年第24期张成强1 周国祥2 齐红超3(1.山东日照市莒县国土资源局山东济南 250001; 2.济南军区司令部第二部山东济南250001; 3.北京中科九度有限公司北京 100000)摘要:以鲁中地区为例,利用卫星遥感影像数据,探讨了基于决策树算法的土地分类方法,结果表明,基于决策树算法的土地分类方法可以自动生成分类规则,效率高,周期短,对于当前大面积土地综合利用的研究具有重要意义。

关键词:决策树鲁中地区土地覆被中图分类号:P23文献标识码:A 文章编号:1672-3791(2013)08(c)-0203-02土地利用的变化,反映的是人类为满足社会经济发展需要,不断调配各种土地利用的过程。

因此土地利用/覆被变化(LUCC)研究一直是全球土地研究的重点内容[1]。

随着社会发展进程的不断加快,传统的实地调查和定位观测已经跟不上土地资源变化的节奏。

通用做法是利用遥感(RS)和地理信息系统(GIS)相结合的方法进行分析处理,而对大范围地域的土地覆被分析需要大量的遥感数据及辅助数据的处理、集成、解译过程[2],因此对高效率、高精度的遥感自动分类算法的需求非常迫切。

近年来,机器学习算法由于其在效率和分类精度的优势开始取代传统的监督和非监督算法[3]。

决策树算法和人工神经网络是机器学习算法中比较典型的算法,他们在利用遥感图像对土地覆被分类中各有特点:决策树算法在分类规则上速度较快,而人工神经网络算法的精度较高[4]。

本文通过利用C5.0决策树算法对鲁中地区的土地覆被进行了分析研究,在数据的处理方面选择了原始波段数据、纹理数据、非监督分类数据作为决策树算法的原始数据,选择了2071个样本点,对样本点进行分类学习,之后学习得到的分类规则对整个研究区进行分类1 研究区概况鲁中地区,面积大约 6.5万平方公里,整个地区南低北高,西侧为鲁西北平原,东侧为潍、沐河谷底和漫长海岸,北临莱州湾,南面与苏北平原接壤,省内四分之三的山地以近圆形集中于该区,属于一种典型的中尺度地形,具有特殊的研究价值。

基于NDVI的决策树分类方法研究

基于NDVI的决策树分类方法研究

基于NDVI的决策树分类方法研究严玉奎【摘要】20世纪80年代以来,随着城镇化进程的快速发展,我国土地利用结构发生了明显的变化.及时准确地掌握土地利用状况有利于有关部门根据土地利用现状做出合理的规划和正确的决策,有利于促进经济和社会的协调发展.本文针对石河子垦区地物覆盖的特点,综合分析了不同覆盖类别区域的时序NDVI特性以及他们之间的差异性,选择最能反映土地覆盖情况和有效区分不同地类的两期TM影像,解算制作NDVI亮度图.利用均值滤波器对NDVI亮度图进行平滑处理,降低噪声.根据不同地物时序NDVI的差异选择适当的阈值进行决策树分类.精度评价结果表明该方法能够简单有效的区分不同覆盖类型的地类,特别是季节性变化差异较大的地区.【期刊名称】《北京测绘》【年(卷),期】2016(000)003【总页数】6页(P85-89,84)【关键词】NDVI;均值滤波;决策树;分类【作者】严玉奎【作者单位】中材地质工程勘查研究院有限公司,北京100102【正文语种】中文【中图分类】P237土地资源是人类赖以生存和发展的物质基础。

随着科学技术的大幅度进步和经济水平快速提高,人类对土地的利用强度不断增强,导致了地表生物地球化学循环水温过程和景观动态的快速变化,土地利用成为当前人类活动对全球变化的重要影响因素。

土地覆盖变化及其时空规律研究已经成为当前全球变化研究的热点问题[1]。

遥感能够快速、准确地获取大范围地表变化信息,已经成为当前土地覆盖变化研究的主要手段。

NDVI( Normalized Difference Vegetation Index , 归一化植被指数)作为一个重要的遥感参数,能够敏感地反映出植被生长状况、生物物理化学性质及生态系统参数的变化,在一定程度上反映了像元所对应区域的土地覆盖类型的综合情况,因而在在土地覆盖遥感研究中植被系数常被用于土地覆盖的分类、描述植被生长状况、植被光合能力、叶面积指数 ( LAI) 、现存绿色生物量和植被生产力等。

基于决策树的耕地质量评价研究

基于决策树的耕地质量评价研究

基于决策树的耕地质量评价研究摘要:本文介绍了决策树的基本概念以及决策树在耕地质量评价中的意义,并以汕尾市陆河县为例,用决策树建立了陆河县耕地质量评价模型,耕地质量模型的建立为陆河县的耕地质量评价以及改进陆河县的耕地质量、提高耕地质量水平具有一定的现实指导意义。

关键词:耕地;评价;决策树中图分类号:f301.21文献标识码: a 文章编号:决策树是一树状结构,它从根结点开始,对数据样本进行测试,根据不同的结果将数据样本划分成不同的数据样本子集,每个数据样本子集构成一子节点。

在决策树的生成过程中包含了下列思想:在构造树的每层时,选择一个具有最高信息增益的属性,使得依据该属性的值,将对象集被剖分成几个不相交的子集。

每个子集表示为树的一个子节点,以该属性的相应值标识到这些子节点的弧。

耕地质量评价是对区域耕地资源质量的综合评定,其评价过程不仅复杂,而且具有很强的技术性。

针对不同耕地区域,各个评价属性权重确定大多掺入了人为因素,从而影响了评价结果的准确性。

基于决策树的耕地质量评价,将克服传统的耕地评价方法中人为因素过多的缺点,提高耕地评价的效率和准确性;另外将决策树模型用在耕地评价中也具有鲜明的生产实践意义。

一、本地区的决策树耕地质量的控制1.目标数据集的创建目标数据集的创建工作主要包括:耕地评价单元的划分、确定评价因素和建立评价数据库,目标数据集是从评价数据库中导出的耕地属性数据。

评价单元的划分是依据陆河县2004年土地利用现状分幅图(1:10000)的土地利用现状图,在mapgis系统环境下从土地利用现状图中分离提取出县耕地图斑,作为工作底图,将选定的参评因素图与工作底图进行叠加,得出的最小图斑即为评价单元,最终确定30281个图斑为陆河县耕地评价单元。

在采集数据后,需要对图形数据和属性数据输入建库,形成图形数据库和属性数据库,并对其分别管理,其中图形数据库采用层次型管理方法;属性数据和统计数据则采用关系模型管理。

基于ENVI的决策树方法在土地利用分类中的应用

基于ENVI的决策树方法在土地利用分类中的应用

基于ENVI的决策树方法在土地利用分类中的应用秦臻;汪云甲;王行风;阚俊峰;李晓霞【摘要】Taking Shenfu Dongsheng mine in north of Yulin Shenmu County,Shanxi Province as a study case,and with the support of ENVI software, Landsat ETM image was used to analyze the spectral characteristics of the image and its value of NDVI,NDBI,NDWI. And this image was transformed with tasseled cap to determine the threshold value for different lands and build a decision tree. Then,the classification results were obtained and the role of decision tree in remote sensing data classification was evaluated.%以陕西省榆林市神木县北部神府东胜矿区为研究区,利用Landsat ETM 影像,在ENVI软件的支持下,分析了影像的光谱特征及NDVI,NDBI,NDWI特征值,并对影像进行缨帽变换,确定各地类的综合阈值,建立决策树模型,得到分类结果,并且评价了决策树分类在遥感数据分类中的作用.【期刊名称】《金属矿山》【年(卷),期】2011(000)002【总页数】4页(P133-135,140)【关键词】遥感影像;决策树模型;缨帽变换;土地分类【作者】秦臻;汪云甲;王行风;阚俊峰;李晓霞【作者单位】中国矿业大学;江苏省资源环境信息工程重点实验室;国土环境与灾害监测国家测绘局重点实验室;中国矿业大学;江苏省资源环境信息工程重点实验室;国土环境与灾害监测国家测绘局重点实验室;中国矿业大学;江苏省资源环境信息工程重点实验室;国土环境与灾害监测国家测绘局重点实验室;中国矿业大学;江苏省资源环境信息工程重点实验室;国土环境与灾害监测国家测绘局重点实验室;中国矿业大学;江苏省资源环境信息工程重点实验室;国土环境与灾害监测国家测绘局重点实验室【正文语种】中文遥感影像分类是影像分析的一项重要内容。

决策树的形式算法及其在地理信息学中的应用

决策树的形式算法及其在地理信息学中的应用
的思路 。
方面 : 是提 高 分 类 精 度 ; 是 尽 量 减 小 树 的大 小 ; 一 二 三是 降低 计算 复杂 性 , 中最 为 重 要 的是 对 分 类 精 其 度 的提 高 , 著 名 的 B gig和 B ot g技 术 。 目 如 a gn os n i 前 对 决策 树 的研 究 仍 在进 行 , 逐 渐 转入 实用 , 并 出现 了一批 实 用 的基 于 决策 树 的商 业 分析 软件 。 1 .决策 树 算法 的总 体 框 架
设有 一 训 练 数 据 集 合 D = { , , , } Dl D2 … D ,
二 、 策树基 本算法 决
决策 树 的起 源 可以追 溯 到 H n 等人 在 2 ut 0世纪 6 0年 代 研 究 人 类 概 念 建 模 时 建 立 的 学 习 系 统 C Sl。2 L_ 0世 纪 7 J 0年 代 末 Q iln提 出 的 I 3算 una D 法 【是 最 早 的 决 策 树 算 法 之 一 。人 们 在 实 践 中 发 2 1 现, 随着训 练 数 据 集 的增 大 , 能会 出 现 数据 失 真 、 可 数据 缺 失 、 续 数 值 的数 据 区 间划 分 等 问题 。为 了 连 解决 这 些 问题 , 人们 研 究 出 了不少 优 秀 的算法 , 为 最
了树 — — 叶结 :

据 广
Gi X) a ( 可以确定最大的 G i( 值 ,以它作为 n a X) n 树 的 根结 点 , 法递 归 地 调用 这 种 方 法来 确 定 各 子 算
E X) ( 为用属性 作 为结 点进行分类所需 的信息
量 , 果对 应 把 c分 成 clc , , ,等 n个子 如 , 2 … c
集合 , X)可这 样 计算 E(

基于决策树的土地利用分类方法研究

基于决策树的土地利用分类方法研究

o c re c tie rm h rtp i cp o o e t he h e h l s ee td fo te c aa trsi au s c u r n e Marc sfo tef s rn ia c mp n n ,t n t rs od Wa s lce rm h r ce t v e i l h i c l
新 疆 农业科 学
2 0 ,6 2 :3 4 4 0 94 ( )4 0— 3
Xni gA r u ua S i cs i a gi l r c n e jn ct l e
基 于 决 策树 的土地 利 用 分类 方 法研 究
余 晶 蒋平安 高敏 华2 , ,
(. 1新疆农业大学草业与环境科学学院, 鸟鲁木 齐 805 ; . 30 22 新疆大学资源与环境科学学院, 鸟鲁木齐 80 4 ) 306
c mp n ns we e e ta td fo S t ma e,txu e ifr t n wa c u rd b a so sn a e e o o o e t r xr ce rm p 一5 i g o e tr nomai s a q i y me n fu ig Gr yI v lC o e _
Байду номын сангаас
S u y o nd Us a sfc to s d n De iin e eh d t d fLa e Clsi a in Ba e o cso Tr eM t o i
Y ig ,L G Pn U J ‘J ig—a G n—h n n , AO Mi u
比较 , 结果表明 , 决策数分 类较最 大似然 法分 类的精度提高 了 5 6 % , ap .6 K pa系数提高了 7 8% 。说明决策 . 9 树 分类 能够灵活、 有效运用纹理 等辅助信息 , 更好地 区分光谱特 征相似 的 目标地物 , 具有更高的准确性。

基于决策树的遥感影像分类方法研究

基于决策树的遥感影像分类方法研究

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.
·18 ·
地域研究与开发
第 22 卷
质用于进一步地有效细分类 。这就是决策树分类器特 NOAA/ AV HRR 的 NDV I 数据 ,以实现全球植被分类 ,
摘要 : 基于决策树分类算法在遥感影像分类方面的深厚潜力 ,探讨了 3 种不同的决策树算法 ( UD T、MD T 和 HD T) 。首先对决策树算法结构 、算法理论进行了阐述 :具体利用决策树算法进行遥感土地覆盖分类实验 ,并把获得 的结果与传统统计分类法进行比较 。研究表明 ,决策树分类法相对简单 、明确 ,分类结构直观 ,有诸多优势 。
种相关因素 。这些因素包括 : (1) 判别函数如何处理不
同类型数据 ; (2) 如何处理缺失值 ; (3) 用于衡量分割适
宜度的分割标准以及在多特征决策树中用于内部结点
特征选择的特殊算法的确定[11] 。
事实上 ,决策树分类器的特征选择过程不是由“原
级”到“终级”的顺序过程 ,而是由“终级”到“原级”的逆
第1期
李 爽等 : 基于决策树的遥感影像分类方法研究
·19 ·
的关系使得 MD T 较 UD T 在运行过程中表现出更多优 点 : 第一 ,在 MD T 每个内部结点处的分类判决规则可 以使用多种不同的数学方法 ,如最小二乘法 ; 第二 ,由 于 MD T 内部结点处每次分割依靠一个或多个数据特 征 ,因此 ,MD T 中数据的特征选择可以使用顺序前向 选择 ( Sequential forward selection) 和 顺 序 后 向 剔 除 ( Sequential backward elimination) 等不同的算法[14] 。文 章研究 MD T 算法的特征选择更注重于局部特征选择 而非全局特征选择 ,也就是说在每一特定的内部结点 处进行特征选择并用于结点分割而不是就整个 MD T 进行特征选择 ,因为在每个内部结点处 ,随数据集的空 间分布特征不同所需采用的分类特征也不同 。但由于 MD T 内部结点处的判决规则的复杂性 , MD T 较 UD T 更难于解释 。

基于MODIS数据的决策树分类方法研究与应用

基于MODIS数据的决策树分类方法研究与应用

基于MODIS数据的决策树分类方法研究与应用刘勇洪;牛铮;王长耀【期刊名称】《遥感学报》【年(卷),期】2005(009)004【摘要】介绍了目前国际上流行的两种决策树算法--CART算法与C4.5算法,并引入了两种机器学习领域里的分类新技术--boosting和bagging技术,为探究这些决策树分类算法与新技术在遥感影像分类方面的潜力,以中国华北地区MODIS250m分辨率影像进行了土地覆盖决策树分类试验与分析.研究结果表明决策树在满足充分训练样本的条件下,相对于传统方法如最大似然法(MLC)能明显提高分类精度,而在样本量不足下决策树分类表现差于MLC;并发现在单一决策树生成中,分类回归树CART算法表现较C4.5算法具有分类精度和树结构优势,分类精度的提高取决于树结构的合理构建与剪枝处理;另外在决策树CART中引入boosting 技术,能明显提高那些较难识别类别的分类准确率18.5%到25.6%.【总页数】8页(P405-412)【作者】刘勇洪;牛铮;王长耀【作者单位】中国科学院,遥感应用研究所,遥感科学国家重点实验室,北京,100101;中国科学院,遥感应用研究所,遥感科学国家重点实验室,北京,100101;中国科学院,遥感应用研究所,遥感科学国家重点实验室,北京,100101【正文语种】中文【中图分类】TN911.73【相关文献】1.基于MODIS影像的森林类型决策树分类方法研究 [J], 吴梓尚;林辉;孙华;林欣2.基于MERSI和MODIS数据的2种监督分类方法比较研究 [J], 王馨凝;李国春3.基于 CART 决策树方法的 MODIS 数据海冰反演 [J], 张娜;张庆河4.基于MODIS时序数据的Landsat8影像选取及面向对象分类方法的农作物分类[J], 刘明月;王宗明;满卫东;毛德华;贾明明;张柏;张淼5.基于MODIS时序数据的Landsat8影像选取及面向对象分类方法的农作物分类[J], 刘明月;王宗明;满卫东;毛德华;贾明明;张柏;张淼;;;;;;;;;因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于决策树的土地分类方法案例研究
摘要:以鲁中地区为例,利用卫星遥感影像数据,探讨了基于决策树算法的土地分类方法,结果表明,基于决策树算法的土地分类方法可以自动生成分类规则,效率高,周期短,对于当前大面积土地综合利用的研究具有重要意义。

关键词:决策树鲁中地区土地覆被
土地利用的变化,反映的是人类为满足社会经济发展需要,不断调配各种土地利用的过程。

因此土地利用/覆被变化(LUCC)研究一直是全球土地研究的重点内容[1]。

随着社会发展进程的不断加快,传统的实地调查和定位观测已经跟不上土地资源变化的节奏。

通用做法是利用遥感(RS)和地理信息系统(GIS)相结合的方法进行分析处理,而对大范围地域的土地覆被分析需要大量的遥感数据及辅助数据的处理、集成、解译过程[2],因此对高效率、高精度的遥感自动分类算法的需求非常迫切。

近年来,机器学习算法由于其在效率和分类精度的优势开始取代传统的监督和非监督算法[3]。

决策树算法和人工神经网络是机器学习算法中比较典型的算法,他们在利用遥感图像对土地覆被分类中各有特点:决策树算法在分类规则上速度较快,而人工神经网络算法的精度较高[4]。

本文通过利用C5.0决策树算法对鲁中地区的土地覆被进行了分析研究,在数据的处理方面选择了原始波段数据、纹理数据、非监督分类数据作为决
策树算法的原始数据,选择了2071个样本点,对样本点进行分类学习,之后学习得到的分类规则对整个研究区进行分类
1 研究区概况
鲁中地区,面积大约6.5万平方公里,整个地区南低北高,西侧为鲁西北平原,东侧为潍、沐河谷底和漫长海岸,北临莱州湾,南面与苏北平原接壤,省内四分之三的山地以近圆形集中于该区,属于一种典型的中尺度地形,具有特殊的研究价值。

鲁中地区主要包含济南、淄博、东营、泰安、莱芜五个城市,随着城市发展步伐的加快,城市土地利用格局也随之发生很大变化。

2 数据获取预处理
在数据源的处理上,由于传统的监督、非监督分类方法在数据的选择上只能是原始波段数据和通过波段运算后获取的特征数据,还可以包干GIS数据及经过非监督分类后的初始数据等。

本文选择了2013年鲁中地区30m分辨率ETM影像,时间为5月20号,ETM影像共有8个波段,包含可见光波段1-5、7,全色波段8,两个近红红外波段6-1,6-2,本文只研究了可见光波段,通过这些波段,将原始波段的DN值转化成地物的表观反射率数据。

本文采用均值、方差、均匀比、对比度、非相似度、熵、角二阶矩、相关度等八个特征作为统计量。

对于非监督分类数据,采用在多光谱图像中搜索自然相似光谱,请将其分类组成的数据集群。

3 分析方法
3.1 工作流程
C5.0算法对地面覆被的分类主要分两个步骤:一是通过机器学习生成决策树,并建立相应的决策规则;二是决策规则对遥感影像图进行覆被分类。

本文通过See5.0软件生成分类规则,之后利用NLCD 制图工具,利用分类规则对鲁中地区进行了覆被分类。

其流程如图1所示。

3.2 波段组合与变量选择
遥感图像中有5个原始波段数据,波段合成的步骤是将5个原始波段数据与8个纹理波段、非监督分类数据进行波段合成,而后对合成波段进行采样,本身决策树算法的输入参数可以有DEM、坡度、坡向、地温土壤类型等等,但由于鲁中地区处于平原地区,坡度、坡向等数据对结果影响不大,因此没有使用。

3.3 土地分类与样本采集
鲁中地区的地形分类,主要包括耕地、林地、建设用地、水域。

另外,由于鲁中地区地处平原,交通道路比较发达,因此,道路在分
类中也可作为一项分类标示进行分类;水域包含河流、湖泊,但是鲁中地区水域有个需要重点关注的点是黄河水域的光谱特征有异于湖泊的光谱特征;鲁中地区草地面积较少,且特征不明显,与林地不好区分,因此,将两者归为一类。

在对地物覆被采样时,样本点的分布要均匀。

3.4 决策规则的构建
决策树算法自从被提出,到如今已经涌现出很多决策树的机器学习算法。

本文采用的是Quinlan的C5.0决策树算法,该算法是在C4.5基础上的改进算法。

该算法用两种修剪方法来构建决策树,一种是前剪枝,一种是后剪枝。

它比C4.5的运算速度更快,树的结构更简单。

当前See5.0软件中集成了C5.0算法,本文决策树学习将样本点作为输入数据,得到决策规则,决策树是有多条决策规则形成的树状决策规则的集合,由于机器学习的决策规则较多,决策树结构会比较庞大,所以本文无法用图形方式将决策树展现。

4 分类结果及精度评价
4.1 覆被分类
本文对影像图土地覆被的分类采用了NLCD制图工具,该工具集成了C5.0算法,可以读入See5.0软件的分类规则,而后运用规则对影像图进行分类,分类结果如图2所示。

4.2 精度分析
在土地覆被分类过程后,通常对分类结果进行精度分析,分类精度从一定程度上反映了分类模式的科学性和有效性,通过精度分析,可以对分类模式进行改进,进而进一步提高分类精度。

本文通过对影像图进行解译,随机选取了2071个像元点构建混淆矩阵,通过混淆矩阵方法对分类精度进行了评价,结果如表1所示。

由分析结果可以看出,分析精度较高的是水域、林地和耕地,分精度较低的是道路,道路分类精度低的原因是在30M分辨率的遥感影像中,道路的光谱特征不明显,与其周围的覆被不好区分,因此造成样本像元点混淆较多,因此误差较大。

对于道路的测算,需要更高精度的影像图来进行分类。

5 结论
本文利用决策树算法对鲁中地区的土地覆被进行了分类探索,研究通过手工采取样本点,而后利用决策树C5.0算法对样本进行学习,并生成分类规则,而后利用分类规则对样本进行了分类。

通过研究,得出以下结论:
与传统的方法相比,决策树算法可以不用手工制定分类规则,算法可以通过机器学习,自动生成分类规则,效率高,周期短,对于当前大面积土地综合利用的研究具有重要意义。

但该方法也有其不足之处:决策树算法对于样本的选取依赖性强,不同的样本点,在同一幅
影像图下其分类规则可能差异很大,必须仔细的选取具有代表性的样本点,才能得到较高精度的分类结果。

参考文献
[1]李秀彬.全球环境变化研究的核心领域——土地利用/土地覆被变化的国际研究动向[J].地理学报,1996,51(6):553-557.
[2]赵建辉.基于1∶50000西部无图区土地覆盖分类应用研究[J].测绘与空间地理信息,2012,35(1):183-184.
[3]Muchoney D,Williamson J.A Gaussian Adaptive Resonance Theory Neural Network Classification Algorithm Applied to Supervised Landcover Mapping Using Multi2temporal Vegetation Index Data[J].IEEE Transactions on Geoscience and Remote Sensing,2001,39(9):1969-1977.
[4]杨曦光.基于决策树方法的海岛土地利用分类研究[J].国土资源遥感, 2012,93(2):117-118.。

相关文档
最新文档