基于熵的图像二值化算法设计-二维最大熵分割
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1设计目的与要求
1.1 设计目的
(1)熟悉和掌握MATLAB程序设计方法。
(2)学习和掌握MATLAB图像处理工具箱。
(2)了解图像分割和图像二值化的原理。
(3)掌握图像二值化技术阈值的选取。
(4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。
1.2 设计要求
(1)了解图像变换的意义和手段。
(2)熟悉最大熵和二值化的基本性质。
(3)通过本实验掌握利用MATLAB编程实现数字图像处理。
(4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。
2 设计方案
2.1 图像二值化
图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。在不同的应用中,阈值的选取决定着图像特。 征信息的保留。因此,图像二值化技术的关键在于如何选取阈值。
2.2 最大熵原理
最大熵原理:最大熵原理是在1957 年由E.T.Jaynes 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不止一个。我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。
图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下:
O :t
i N N (0<=i<=t) (3.2.1)
B :
t
i N N N - (t+1<=i<=255) (3.2.2)
其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰度级从0~t 的像素点总和,N 为
图像总像素点,t 为假定灰度阈值T 。
)
l og()(
t
i
t i N N N N H ∑-= (0<=i<=t) (3.2.3) )
log()(
t
i
t i B N N N N N N H ---=∑ (t+1<=i<=255) (3.2.4)
令 H=HB+Ho .则根据最大信息熵理论在已知条件下要对图像做出分割的最佳决策即为最接近实际图像分割的理想决策。
2.3 图像分割的研究背景
在一幅目标图像下,人们往往只是关注其中的一个或者几个目标,而这些目标必然会占据一定的区域,并且与周围其他目标或背景在一些特征上会有相应的差别。但是,很多时候这些差别会非常的细微,以至于人眼很难发觉,这就需要用一定的技术对图片做一些处理。而计算机图像处理技术的发展,很好地解决了这一难题,使得人们可以利用计算机技术来协助理这些信息,例如指纹识别、车牌识别以及医学影像的鉴别操作等方向。
图像分割是图像识别的基础,其通过一些必要的算法把图像中有意义的部分或特征提取出来,将图像分为若干有意义的区域,并形成数字特征,这些区域对应图像中的不同目标。这些具有某种特征的单元成为图像的基元,这种经过处理的基元更容易被快速处理。
目前,数以千计的研究文献和文章提出了许许多多的图像分割算法,不同种类的图像、不同的应用要求和应用领域所需要提取出的图像特征是不相同的,所以并不存在普遍适用的最优方法,只能根据图像特征选择与值相适应的方法。
2.4 图像分割的基本原理
图像分割是根据图像的直方图和结构特性或者一些具体的应用需求将图像划分成两个或多个互不相交的子区域的过程,这些子区域是在特定意义下的具有相同属性的像素的连通集合。例如,一幅图像中不同目标物体所占的图像区域、背景所占的背景区域等都属于这样的连通集合概念。
对图像分割的定义有多种不同的解释,人们普遍接受的是通过集合定义的图像分割。用集合R 表示整个图像区域,那么对整个图像的分割可以等价于将集合R 分成n 个满足以下准则的区域:
;
R R R R R n =Y Y Y Y (321)
是相连的;R 时,n ,,3,2,1i 当i ⋯=∀i,
;
,有,对Φ=≠∀j i R R j i j i I
=
≠∀)(,有,对j i R R P j i j i Y false ;
n true。
2
,
=
i
对
3
1
,
R
=)
,
(
P
,
,
⋯
i
目前提出的图像分割方法很多,在此分为三种不同的途径对其进行分类:
(1)以物体的的边界为对象进行分割;
(2)先检测边缘像素,再将边缘像素连接起来形成分割;
(3)以区域为对象进行分割,根据图像的灰度、色彩、变换关系或组织结构等方面的特征相似性来划分图像的子区域并将各像素划分到特定区域。
上述这些方法是互补的,不同的场合使用不同的方法,或者综合各个方法已达到最佳的分割效果。
3 设计内容
3.1 先将彩色图像转换为灰度图像
灰度图(Grayscale)是指只含亮度信息,不含色彩信息的图像,就像我们平时看到亮度由暗到明的黑白照片。因此,要表示灰度图,就需要把亮度值进行量化。通常划分成0到255共256个级别,0最暗(全黑),255最亮(全白)。
BMP 格式的文件中并没有灰度图这个概念,但是我们可以很容易地用BMP 文件来表示灰度图。方法是用256色的调色板,只不过这个调色板有点特殊,每一项的RGB 值都是相同的,也就是说RGB 值从(0,0,0),(l ,l ,1)一直到(255,255,255)。(0,0,0)是全黑色,(255,255,255)是全白色,中间的是灰色。这样,灰度图就可用256色图来表示。
灰度图使用比较方便。首先RGB 的值都一样;其次,图像数据即调色板索引值,也就是实际的RGB 的亮度值;另外因为是256色的调色板,所以图像数据中的一个字节代表一个像素。如果是彩色的256色图,图像处理后有可能会产生不属于这256种颜色的新颜色,所以,图像处理一般采用灰度图[3]。在本中会介绍将彩色图像转化为灰度图像的方法(图像灰度化处理)。另外,本文所做的程序,如不做特殊说明,都是针对256级灰度图的。
图像灰度化由于实验使用的是彩色数码相机,所以最初输入计算机的是24位真彩色图像,而在本课题的后续研究中,如前面所述,主要是对灰度图像进行处理。因此有必要将24位彩色图像转化为灰度图。
为了用计算机来表示和处理颜色,必须用定量的方法来描述颜色,即建立颜色模型,而颜色模型的基础是建立在色度学理论上的。色度学理论是T.Young 在1802年提出的,其基本内容是:任何色彩均可以由三种不同的基本颜色按不同的比例混合而成,即:
3
21cC bC aC C ++= (4.1)
其中321,,C C C 为三原色(又称三基色),a ,b ,c 为三种原色的权值(三原色的比例或浓度),C 为所合成的颜色,可为任意颜色。
色彩与亮度均是一种视觉感受,这种感受分别产生红、绿、蓝的视觉感受。实验已经证明,由对应三种视敏细胞而产生红、绿、蓝三种颜色作为任何颜色的基本色的理论称为三基色原理。原理指出: