树叶分类数字图像处理在树叶识别中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像处理研究报告
数字图像处理在树叶识别中的应用
侯杰:土木系
侯晓鹏:林科院
苏东川:航院
张伟:精仪
指导教师:马慧敏教授
日期:2007.12.30
数字图像处理在树叶识别中的应用
一、课题意义及背景
1 课题背景
植物的识别与分类对于区分植物种类,探索植物间的亲缘关系,阐明植物系统的进化规律具有重要意义。因此植物分类学是植物科学乃至整个生命科学的基础学科。然而,由于学科发展和社会等原因,全世界范围内目前从事经典分类(即传统的形态分类)的人数急剧下降,且呈现出明显的老龄化趋势,后继乏人,分类学已经成为一个“濒危学科”(Buyck,1999)。这不仅对于植物分类学本身,而且对整个植物科学和国民经济的发展带来重大的不利影响。目前植物识别和分类主要由人工完成。然而地球上仅为人所知的有花植物就有大约25万种,面对如此庞大的植物世界,任何一个植物学家都不可能知道所有的物种和名称,这就给进一步的研究带来了困难。在信息化的今天,我们提出的一种解决方案是:建立计算机化的植物识别系统,即利用计算机及相关技术对植物进行识别和管理[1]。
2 课题意义[2-3]
(1)人工进行植物叶形的分类难度很大。这种传统的判别方法要求操作者具有丰富的分类学知识和长期的实践经验,才能开展工作。要做到准确和快速地识别手中的植物是非常困难。并且相应人才极为短缺。
(2)仅为人所知的有花植物就有大约25万种,面对如此庞大的植物世界,任何一个植物学家都不可能知道所有的物种和名称。建立植物识别系统和数据库十分必要。
(3)植物学研究人员在野外考察时, 时常需要获取植物叶片面积等参数。(4)叶子面积大小对植物的生长发育、作物产量以及栽培管理都具有十分重要的意义。
因此,基于计算机图像处理识别技术的树叶图像识别技术对于植物学,农业
科学等都具有重大意义。
二、相关理论综述
1 图像预处理
(1)边缘检测[4]
图像的边缘是指图像局部亮度变化最显着的部分,即在灰度级上发生急剧变化的区域。从空域角度看,二维图像上的边缘相邻像素灰度从某一个值跳变到另一个差异较大的值。其灰度变化曲线呈现奇异信号波形:阶跃信号或屋脊形脉冲信号。
图像边缘信息是图像的重要特征,也是计算机视觉和图像识别的基础。对树叶的边缘进行检测是树叶识别的基础,从二维数字图像上可得到的所有树叶的特征都基于其轮廓信息的。因此对树叶边缘信息检测情况的好坏直接影响到最终的处理结果。
对于边缘的检测常常借助于空域微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘。灰度边缘是灰度值不连续(或突变)的结果,这种不连续常可利用求一阶和二阶导数方便地检测到。已有的边缘检测方法,主要有一次微分(Sobel 算子、Roberts算子等)、二次微分(Laplace算子等)和模板操作(Prewitt 算子、Kirsch 算子、Robinson 算子等)等。
Sobel算子:Sobel 边缘算子的掩模模板是两个3×3的卷积核。Sobel边缘算子强调中心像素的4-邻域对其的影响,而削弱4个对角近邻像素对其作用。它是有方向性的,在水平方向和垂直方向上形成最强烈的边缘。
G x
G y
Roberts算子:Robert 边缘算子是一种局部差分算子,采用两个2 ×2 的掩模模板对图像的边缘进行检测。
G x G y
Prewitt算子:Prewitt算子与Sobel算子的方程一样,只是常量c=1。
G x
G y
Gauss-Laplace算子:Laplace算子是二阶微分算子,具有各项同性,只需要一个卷积核进行计算即可。Laplace算子精度高,但是同时对噪声更敏感,因此在检测之前一般先进行平滑,把高斯平滑滤波器和Laplace锐化滤波器结合起来形成Gauss-Laplace算子。正因为如此,本文首选该算子预处理图像。常用的Gauss-Laplace算子是5×5模板,如下图所示。
Gauss-Laplace算子
(2)图像平滑
在对图像进行边缘检测以及后续的处理时,由于噪声的影响会使得处理结果不够准确。噪声点和周围像素点灰度值差异较大,空间频率比较高,因此可以利用空间滤波的方法抑制图像的高频分量,使噪声点的影响减小,即平滑处理。
图像平滑一般采用的方法有均值滤波和中值滤波两种。
均值滤波:对模板内的所有像素点的灰度值取均值或加权均值。
中值滤波: 对模板内的像素点的灰度值排序,取中间值作为返回值。
两种滤波方法各有特点。相较来说,中值滤波对图像的细节保存更好一些。同时,模板大小的选取对平滑的结果也有很大的影响,模板越大则处理后的图像越模糊,细节损失越多,对图像的边缘也有不利的影响。
综合图像的特点,边缘检测选用Gauss-Laplace算子作,图像平滑选用5×5平滑模板,中值滤波选用8×8模板。
(3)Otsu最大类间方差法自适应图像分割[5]
最大类间方差法是由Otsu在1978年提出的。它从一维灰度直方图角度出发,利用类别方差作为判据,选取使类间方差最大的灰度值作为最佳阈值。
最大类间方差阈值分割法的基本思路是将图像的直方图以某一灰度为阈值将图像分成两组并计算两组的方差,当被分成的两组之间的方差最大时,就以这个灰度值为阈值分割图像。
Otsu最大类间方差法计算简单,速度快,稳定有效,我们采用此法对树叶图像进行阈值分割。Otsu法求取图像最佳阀值g的公式如下:
式中:
()
p i:灰度值为i的频率;
0()
w t:目标部分比例;
1()
w t:背景部分比例;
0()
u t:目标均值;
1()
u t:背景均值;
u:总均值。
2 图像特征提取[3-4]
图像特征提取是影响图像识别效果的关键环节,需要充分考虑图像的尺度及特征的种类、稳定性和个数的选取。对于本课题,图像尺度最初取树叶最大高度对应300像素,认为图像可识别的特征长度是最大高度的1/100,即3个像素,则像边界点采样频率为每3像素取1个。但通过试算得知,一般模版尺度也基本是3个像素,这样在前处理中的平滑运算会消除图像的一些边界特征,并且在图像缩放中,在图像边界局部也会产生2到3个像素级别的误差,即误差的级别与特征长度较近,容易引起特征提取错误,把局部误差毛刺提取成边界特征。另外,特征尺度主要与树叶周长直接相关,取其为最大高的固定百分比也是不合适的,应该直接与树叶周长相关,而不是最大高度,因为图像周长特性比最大高度要稳定的多,比如叶柄的直、曲对树叶周长影响很小,而对树叶最大高度影响较大。正因为最大高度不稳定,最后取消了第五个特征(最大高度/周长)对于识别的贡献,对于所有树叶该值均取为常数零。也就是说,如果图像特征不稳定,则增加特征个数对于识别效果是不利的,反之则有利。通过不断调试,图像总体尺度取树叶周长对应2000个像素,可识别的特征长度取为10,即总尺度的1/200。所提取得图像特征如下:
(1)roundness:归1化圆形度
2 4
C
A
评价树叶整体外形与圆形的近似程度,用于提取图像的“胖瘦”特性。(2)ratio_anl_Nside:拐点平均间距与周长比
描述树叶周边凹凸性的尺度,此值越小则表示树叶周边凹凸越尖锐。(3)Ninflexion:拐点数
理论上应为树叶周边凸包个数的两倍,实际由于最小特征尺度的选取和