基于颜色直方图及贝叶斯分类器的制茶工艺的鉴别

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于颜色直方图及贝叶斯分类器的制茶工艺的鉴别

摘要:本文介绍了基于颜色直方图及贝叶斯分类器的制茶工艺的鉴别,主要是

采集够多的样本图片,提取各类的颜色直方图,并按HSV量化,主要借助于H

分量的直方图分布采集相关数据,用贝叶斯公式进行先验概率和后验的计算,应用最小错误概率贝叶斯分类器,判别某一个未知样本属于哪一类的茶。

关键字:颜色直方图贝叶斯公式最小错误概率 HSV分量

1 引言

人们大都根据茶的香味、茶水润口程度来判断茶叶质量的优劣,一般优质上等茶叶是色香味俱全,且茶水润滑,饮后有口回甘。颜色是最直观的一个特征,基于颜色的鉴别比较直观也是一般人员力所能及的。

基于颜色直方图鉴别是指利用计算机对采取的茶叶样本提取样本图的颜色直方图,并分别按照HSV分量进行量化,提取量化后颜色直方图H分量的分布状况,结合最小错误概率贝叶斯分类器,以后验概率和前验概率的相似程度,判定未知样本所处的质量等级。

借鉴颜色直方图及贝叶斯分类器,本人利用Matlab设计了一些基于颜色直方图及贝叶斯最小错误概率分类器的算法,选取已知样本图,提取各个样本图的颜色直方图,基于各颜色直方图H分量的量化情况得到的特征参数并未贝叶斯分类器提供必要的数据。以实地采集的成品茶叶样本来进行颜色直方图绘制及特征显示还有概率分布统计进行制茶工艺的鉴定,事实证明算法的实现有一定的实用性。

二基于颜色直方图及最小错误概率分类的茶叶质量鉴别原理通过图1中的颜色直方图和H分量图,我们可以看到不同的样本图处于不同质量等级的茶叶直方图各异,并且H分量直方图也相同,若能大量提取各个质量等级大部分的样本直方图及H分量,提取到的大量数据,进行概率的统计,均值、方差的求解,接下来利用最小错误概率的贝叶斯分类器大致上能够统计出各个质量等级的概率分布,能够初步验证未知样本大致所处的质量等级。实现原理及过程如图1所示。

图1 基于颜色直方图及最小错误概率的茶叶质量鉴别原理及过程

整个过程主要是要采取大量的样本,进行颜色直方图H分量的提取量化,及其概率分布图的统计,然后通过参数估计过程以最小错误概率的贝叶斯分类器求出未知样图的概率与已知类别中概吕最接近的等级概率。从而初步判定样茶大致属于哪个质量等级。

三基于HSV的图像颜色直方图

颜色直方图颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。

当然,颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。

HSV分量的量化和提取,我先对HSV各分量进行必要的解释:HSV色彩模型从CIE三维颜色空间演变而来,它采用的是用户直观的色彩描述方法,它跟孟塞尔显色系统的HVC 球型色立体较接近。(如图HSV 色彩六棱锥)只不过HSV色彩模型是一个倒立的六菱锥,只相当于孟塞尔球型色立体的一半(南半球),所以不含黑色的纯净颜色都处于六菱锥顶面的一个色平面上。在HSV六菱锥色彩模型中,色相(H)处于平行于六菱锥顶面的色平面上,它们围绕中心轴V旋转和变化,红、黄、绿、青、蓝、品红六个标准色分别相隔60度。色彩明度(B)沿六菱锥中心轴V从上至下变化,中心轴顶端呈白色(V = 1),底端呈黑色(V = 0),它们表示无彩色系的灰度颜色。色彩饱和度(S)沿水平方向变化,越接近六菱锥中心轴的色彩,其饱和度越低,六边形正中心的色彩饱和度为零(S = 0),与最高明度的V = 1相重合,最高饱和度的颜色则处于六边形外框的边缘线上(S = 1)。(1) 色相、饱和度与六棱锥色平面(H和S)

色平面(H、S)的基础是CIE色度图的x、y色平面(2) 明度与六棱锥中轴色(v)色明度(V)的基础是 CIE三维颜色空间的亮度因素Y。

计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。这个过程称为颜色量化(color quantization)。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法,例如向量量化、聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量(维度)均匀地进行划分。相比之下,聚类算法则会考虑到图像颜色特征在整个空间中的分布情况,从而避免出现某些bin中的像素数量非常稀疏的情况,使量化更为有效。另外,如果图像是RGB格式而直方图是HSV空间中的,我们可以预先建立从量化的RGB空间到量化的HSV空间之间的查找表(look-up table),从而加快直方图的计算过程。

我先搜集各个质量等级的足够多的茶叶样本,对其进行颜色直方图的提取,一般我对茶叶质量进行等级划分,分为四个等级:优质、良好、一般、劣质,各个等级茶样的典型H分量直方图分别如下:

以H分量为特征参数,将颜色量化为若干个小的颜色区间,每个小区间成为直方图的一个bin。提取完特征参数后,需要根据所提取的特征参数进行概率的统计,及等级的确定。当有未知茶样图并进行验证时,需提取颜色的特征参数,然后与模板进行比较,根据一定的相似性准则求得该茶样本属于哪一类质量等级。

成功提取特征参数后并统计好了各类样本的等级概率,接下来将应用贝叶斯分类器来检验未知样本的质量等级。

四贝叶斯分类器

贝叶斯分类的基础是概率推理,就是在各种条件的存在不确定,仅知其出现概率的情况下,如何完成推理和决策任务。概率推理是与确定性推理相对应的。所谓确定性推理是指类似如下的推理过程:如有条件B,就一定会有结果A,如条件B 不存在,则结果A 一定不成立;现出现了结果A,则条件B 一定存在。在这个推理过程中,时间之间的因果关系是一种概率关系,推理是在结果已知的情况下,反推其条件出现的概率,也称为“逆概率推理”。如果对上述概率推理过程的内容用条件概率来表示,即为:已知条件B 出现时结果A 会发生的条件概率= P( AB)/P(B) 需要推导结果A已经发生时,条件不存在的概率,即=?

贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN。

贝叶斯分类器是用于分类的贝叶斯网络。该网络中应包含类结点C,其中C 的取值来自于类集合( c1 , c2 , ... , cm),还包含一组结点X = ( X1 , X2 , ... , Xn),表示用于分类的特征。对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为x = ( x1 , x2 , ... , x n) ,则样本D 属于类别ci 的概率P( C = ci | X1 = x1 , X2 = x 2 , ... , Xn = x n) ,( i = 1 ,2 , ... , m) 应满足下式:

P( C = ci | X = x)

= Max{ P( C = c1 | X = x) ,

P( C = c2 | X = x ) ,

.

.

.

P( C = cm | X = x ) }

而由贝叶斯公式: P( C = ci | X = x) = P( X = x | C = ci) * P( C = ci) / P( X = x) 其中,P( C = ci) 可由领域专家的经验得到,而P( X = x | C = ci) 和P( X = x) 的计算则较困难。

相关文档
最新文档