图像处理--采用最大熵方法进行图像分割
图像分割的最大熵方法的改进
信息熵的概念来自于信息论[6], 是对信源中平均产生一个 消息所能消除不确定性的量化描述。给定信源空间 éXù = ëP û n x2 xn ù é x1 其中 0 £ P( xi) £ 1 , 则信 P( x i ) = 1 , ê ú, å ëP( x1) P( x 2) P( x n)û i=1 源 X 的信息熵定义为:
图分为四部分: 背景、 目标、 受噪声干扰的背景和受噪声干扰的目标, 以选取这四部分的信息熵的和最大作为阈值的选取准则。 该方法有三个优点: 尽可能包括背景部分和目标部分; 可以有效地提高对噪声数据的鲁棒性; 不过度地引入噪声和边缘信息。实 验结果表明, 该方法具有较好的图像分割效果。 关键词: 二维直方图; 信息熵; 噪声; 图像分割 DOI: 10.3778/j.issn.1002-8331.2012.01.061 文章编号: 1002-8331 (2012) 01-0212-04 文献标识码: A 中图分类号: TP391
(a) LENNA 图像
1 200 1 000 800 600 400 200 0 300 250 200 150 100 50 灰度值
次数
0
300 250 200 150 100 灰度值 50
(b) LENNA 图像的二维直方图
图 1 LENNA 图像与它的二维直方图
基金项目: 国家自然科学基金 (No.61170161) ; 山东省自然科学基金 (No.Y2008E11) ; 鲁东大学创新团队建设项目 (No.08-CXB006) 。 作者简介: 唐新亭 (1975 —) , 男, 讲师, 主要研究方向为数据挖掘、 图像处理等; 张小峰 (1978 —) , 男, 博士研究生, 讲师; 邹海林 (1962 —) , 男, 教授。E-mail: txtyt@ 收稿日期: 2011-05-04; 修回日期: 2011-07-04; CNKI 出版: 2011-10-13; /kcms/detail/11.2127.TP.20111013.1001.118.html
基于熵的图像二值化算法设计-二维最大熵分割
1设计目的与要求1.1 设计目的(1)熟悉和掌握MATLAB程序设计方法。
(2)学习和掌握MATLAB图像处理工具箱。
(2)了解图像分割和图像二值化的原理。
(3)掌握图像二值化技术阈值的选取。
(4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。
1.2 设计要求(1)了解图像变换的意义和手段。
(2)熟悉最大熵和二值化的基本性质。
(3)通过本实验掌握利用MATLAB编程实现数字图像处理。
(4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。
2 设计方案2.1 图像二值化图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。
图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。
在不同的应用中,阈值的选取决定着图像特。
征信息的保留。
因此,图像二值化技术的关键在于如何选取阈值。
2.2 最大熵原理最大熵原理:最大熵原理是在1957 年由E.T.Jaynes 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。
因为在这种情况下,符合已知知识的概率分布可能不止一个。
我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。
图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下:O :ti N N (0<=i<=t) (3.2.1)B :ti N N N - (t+1<=i<=255) (3.2.2)其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰度级从0~t 的像素点总和,N 为图像总像素点,t 为假定灰度阈值T 。
前景与背景最大熵算法图像分割
H1
H2
T ˆars m [0g ,2]5a H 51 xH 2
很强很完美?
图像 分割
前景与背景分 割
最大熵算法
图像噪声影响 直方图
h(i)
2500.00
2000.00
1500.00 1000.00
Noise free Low noise High noise
500.00
0.00 0.00
i
50.00
100.00
15与背景分割
最大熵算法
如何解决?
图像 分割
前景与背景分割
物体的分布区域是空间连续的
相邻像素应该有相同的分类
图像 分割
很可能是噪声
如何利用这些信息?
前景与背景分割
松弛算法
P(i): 像素i是前/背景的概率
图像 分割
Pi~P pix iel
i1
i2
i3
Pi~FPi1,..P .i,8 i4
i
i5
P pix ie lgi/gmax
i6
i7
i8
像素值
255 P i~ F P i 1 ,.P .i8 .,
P i j ~ F P i x ,P . i , .P . i y . , .
先有鸡?先有蛋?
图像 分割
前景与背景分割
先有鸡?先有蛋?
图像分割
图像 分割
如何分割
需要被分割成不同部分的对象有 什么不同?
第一类图像:前景与背景
图像 分割
前景与背景分割
假设:前景与背景亮度不同
一个暗一个亮
阈值分割
如何求最优分割阈值?
阈值
图像 分割
前景与背景分割
图像分割的熵方法综述
*国家自然科学基金资助项目(No.40971217)收稿日期:2011-10-13;修回日期:2012-07-13作者简介曹建农,男,1963年生,博士后,教授,主要研究方向为遥感、图像分析、地理信息系统.E-mail :caojiannong@126.com.图像分割的熵方法综述*曹建农(长安大学地球科学与资源学院西安710054)摘要对图像分割的熵方法进行较全面地分析和综述,其中包括一维最大熵、最小交叉熵、最大交叉熵图像分割方法等.对Shannon 熵、Tsallis 熵及Renyi 熵之间的关系等进行分析与评述.对二维(高维)熵及空间熵等进行分析与评述.最后指出一维熵与其它理论的有机结合、高维熵模型的计算效率等未来研究方向.关键词图像分割,交叉熵,二维(高维)熵,空间熵,玻耳兹曼熵中图法分类号P 237Review on Image Segmentation Based on EntropyCAO Jian-Nong(School of Earth Science and Resourses ,Chang 'an University ,Xi 'an 710054)ABSTRACTThe image segmentation based on entropy is analyzed and reviewed including one-dimensional maximum entropy ,minimum cross entropy ,maximum cross entropy and so on.The relations of Shannon entropy ,Tsallis entropy and Renyi entropy are analyzed and commented ,and the performance of two dimensional (high dimension )entropy and spatial entropy is also appraised.In conclusion ,it points out the future research direction ,such as the computational efficiency of the high-dimensional entropy model and one-dimensional entropy and other theories integrated.Key WordsImage Segmentation ,Cross Entropy ,Two Dimensional (High Dimentional )Entropy ,Spatial Entropy ,Boltzmann Entropy1引言许多应用中,图像分割是最困难且最具挑战的问题之一.自从20世纪80年代开始,利用熵的概念选择图像分割阈值一直受到研究者的关注.文献[1]首先提出最大后验熵上界法,文献[2]提出一维最大熵阈值法,文献[3]提出二维熵阈值法.在最大熵阈值法中,熵采用香农(Shannon )熵的定义形式[1-10].香农熵满足可加性(Additivity )或者说广延性(Ex-tension ),这一特性忽略了子系统之间的相互作用.Tsallis 熵[11]和Renyi 熵[12]具有非可加性(Non-addi-tivity )或者说非广延性(Non-extension ),它考虑两个子系统之间的相互作用.文献[13]提出最小交叉熵,并不断完善[14],随后产生最大交叉熵算法[15]以及极大交叉熵算第25卷第6期模式识别与人工智能Vol.25No.62012年12月PR &AI Dec 2012法[16],它们具有较好的有效性、合理性和鲁棒性,受到广泛关注[17].文献[18]提出基于高斯分布的最小交叉熵迭代方法.文献[19]提出基于伽马(Gamma)分布的最小交叉熵阈值优化搜索方法.文献[20]提出基于伽马分布的最小交叉熵迭代算法.文献[21]将交叉熵应用于马尔可夫随机场(MRF)能量函数的构造.文献[22]提出基于MRF的空间熵概念.文献[23]用玻耳兹曼熵直接表达灰度变化.基于熵方法的图像分割经历三十多年的研究发展,存在一些值得综合讨论的问题,因此有必要进行梳理与评价,以利于继续深入研究.2图像分割的熵方法文献[24]将图像分割方法分为6类:1)基于直方图形状;2)基于聚类;3)基于熵;4)基于对象属性;5)空间分析:包括高维概率分布和像素共生关系;6)局部方法:调整像素与图像局部特征关系阈值选择,并认为,基于熵的方法是最好的分割方法之一[24].文献[25]将熵方法分为7类:局部熵(Local Entropy,LE);全局熵(Global Entropy,GE);联合熵(Joint Entropy,JE);局部相对熵(Relative Local Entropy,LRE);全局相对熵(Relative Global Entropy,GRE);联合相对熵(Relative Joint Entropy,JRE);最大熵(Maximum Entropy,ME)[1]等.相对熵又称互熵或交叉熵等,本文统一称为交叉熵(Cross Entropy,CE).综合上述观点,本文将熵在图像分割中的应用分为5类:1)基于直方图形状的熵方法;2)基于熵测度的聚类方法;3)基于对象属性熵方法;4)基于熵的空间分析方法:包括高维概率分布的高维熵和基于共生关系的联合熵;5)局部熵方法:调整像素与图像局部熵特征关系的阈值选择.因为聚类和对象属性熵方法中的熵测度可以是任何一种熵形式,所以本文进一步概括为3种基本熵方法:基于全局信息的一维熵方法;基于局部信息的二维(高维)熵方法;交叉熵方法.2.1熵方法概念香农[26-27]定义一个n状态系统的熵:H=-∑ni=1piln(pi),(1)其中,pi是第i个事件发生的概率,并且相关事件的概率满足∑n i=1pi=1,0≤pi≤1.(2)认为获得一个事件的信息增益(Gain in Information)恰好与事件发生的概率相关,所以香农用ΔI=ln(1p i)=-ln(p i),(3)作为信息增益的测度,显然,上式表达的信息增益的数学期望就是H=E(ΔI)=-∑ni=1piln(pi).(4)考虑到,概率为“0”时,式(3)和式(4)均无定义;无知性测度(Measure of Ignorance)或信息增益在统计学上更宜于表示成(1-pi)的形式,文献[28]提出将信息增益表达成ΔI(p i)=e(1-p i),则上式表达的信息增益的数学期望就是指数熵[28]:H=E(ΔI)=∑ni=1pie(1-p i).(5)图1给出状态系统中香农熵和指数熵与事件概率的函数关系,可见香农熵与指数熵在信息增益或无知性测度上是一致的,式(4)和(5)在实践中是等价的,但是后者在概率闭区间中连续.图12个状态系统的概率与标准化熵分布Fig.1Distribution of probability vs.normalized entropy fortwo state systems从式(4)和(5)以及图1,可得熵与概率关系的以下特性:1)具有极高可能性或极低可能性的事件,信息增益的期望必置于两个有限极限值附近;2)当系统中所有事件的概率均等时,熵最大,数学关系如下:H(p1,p2,…,pn)≤H(1n,1n,…,1n);(6)3)当事件发生的概率为0.5时,该事件的熵最大,即对此事件的无知性测度、不确定性最大,或者说,对此事件的信息增益最大,可获得的信息量最大;4)当概率大于或小于0.5时,熵呈下降趋势,即9596期曹建农:图像分割的熵方法综述对此事件的无知性测度、不确定性在减小,或者说,对此事件的信息增益在减小,可获得的信息量在减小.文献[29]对图像分割给出较严密的定义,即将图像细分为其组成区域或对象.图像分割的实质就是寻找直接或间接实现像素对均质区域归属的某种最优化机制.利用熵进行图像分割,就是选择恰当的多个(一个或以上)灰度阈值,将图像的灰度分为多个(二个或以上)集合,这多个集合所对应的所有像素的概率和,分别构成多个事件,这多个事件的信息增益的数学期望就是熵,如式(4)或式(5).显然,此时图像的熵是灰度阈值的函数,通过迭代优化控制,当熵取得最大值时,根据式(6),图像灰度的多个集合的概率最接近,其信息增益最小,或者说信息量变化最小,获得最优化分割.熵的特性是其优化评价的能力,因此,图像分割的熵方法本质,是借助熵对事物信息量的数理异同性测度能力,构造不同的熵函数以帮助确定最优度量或最优控制实现图像分割.2.2熵模型原理2.2.1一维(全局)熵模型基于直方图形状的熵方法可归为一维熵方法,是一种高效经典的熵方法.1)一维熵的两元统计法.根据式(4)或式(5)中的一维(直方图)概率p i 直接构造熵函数,就是一维熵,因为它只依据图像全局直方图信息,又称全局熵(Global Entropy ).假设F =[f (x ,y )]M ˑN 是一幅尺寸为M ˑN 的图像,其中f (x ,y )是空间位置(x ,y )处的灰度值,f (x ,y )∈G L ={0,1,…,L -1}灰度集合.设第i 个灰度级的频数为N i ,则∑L -1i =0N i =MN ,文献[1]、[2]和[30]都将图像F 的灰度直方图看作L 个符号的一次输出,这L 个符号独立对应于图像F 的L 个灰度级.根据式(1),文献[1]定义的图像熵:H =-∑L -1i =0p i ln (p i ),p i =N iN.(7)设t 为分割阈值,P t =∑ti =0p i表示直方图灰度取值在[0,t ]区间内的所有像素的概率和,则图像的后验熵:H'L (t )=-P t ln (P t )-(1-P t )ln (1-P t ).(8)文献[1]用上式的最大化上界为准则选择阈值.由上式可知,图像中的目标与背景被看作两元事件,所以,称其为一维熵的两元统计法.2)一维熵的多元统计法.与文献[1]不同,文献[2]则考虑两个概率分布,一个对应目标,一个对应背景,将目标与背景的熵分别加和,并以其最大值为准则选择阈值,图像的一维后验熵:HᵡL (t )=-∑ti =0p i P t ln (p iP t)-∑L -1j =t +1(p j 1-P t )ln (p j1-P t),(9)由上式可知,图像中的目标与背景被看作两个系列多元事件,所以,称其为一维熵的多元统计法.3)一维熵的泊松分布假设法.除了式(8)和式(9)的算法之外,文献[28]根据文献[31]等的研究,认为如果感光一致,则图像灰度值服从泊松分布.因此,数字图像的灰度直方图将由两个泊松分布混合构成,两个泊松分布的参数λO 和λB 分别对应目标和背景,如图2(b )中的虚线所示.因此,目标与背景的分割问题就是寻找灰度阈值t ,使其满足λB>t >λO ,并通过两个泊松分布的熵之和最大化选择阈值t.两个泊松分布的概率p O i 和p B i 分别由参数λO 和λB 决定,λO 和λB 则由最大似然方法或其它方法预估得到.因此,图像熵H (t )=∑ti =0p O ie 1-p O i+∑L -1j =t +1p B i e 1-p B i.(10)这里选择式(5)计算熵,可避免概率为零时,香农熵无定义,下文类似问题不再说明.根据式(8)对Lena 图像(如图2(a ))进行分割的结果(如图2(b )),阈值为0.25,此时背景与目标像素的概率和分别为0.4992和0.5008,其处于等概率位置.实验表明,式(8)的算法认为,目标与背景像素是同一概率事件的两个状态,当目标与背景像素的概率基本均等,熵取得最大值时,为阈值选取准则,虽然符合熵的第二特性,但不够恰当.其不合理性在于,直方图的灰度等概率分割点,不一定对应图像目标与背景的分割点.与式(8)的观点相反,根据式(11)对Lena 图像进行分割的结果(如图2(c )),阈值为0.46,它认为目标与背景像素是两个相关独立事件,属于目标或背景的像素概率,各自的总熵之和取得最大值时,为阈值选取准则.其合理性在于,独立计算目标或背景的像素概率及其熵,可更客观地测度目标与背景的内部一致性以及外部差异性,符合图像分割的本质特性.根据式(10)采用泊松分布对Lena 图像进行分割,结果如图2(d ),分割阈值为0.32,其阈值介于图2(b )和(c )之间,理论较完善.但是,泊松分布的参069模式识别与人工智能25卷数需要预先估计,需要先验知识为条件,而且泊松分布假设不适合许多实际图像,因此,具有局限性.(a )Lena 原始图像(b )式(8)分割结果(a )Original image Lena(b )Segmentation result of equation (8)(c )式(9)分割结果(d )式(10)分割结果(c )Segmentation result of equation (9)(d )Segmentation result of equation (10)图23种方法分割结果对比Fig.2Segmentation result comparison of 3methods2.2.2二维(局部)熵模型从一维熵原理可知,灰度的概率统计方法是使用熵原理选取阈值的关键,因此,可用高维统计量或条件统计量,计算图像近邻灰度的高维概率或条件概率,获得图像的局部统计特征信息,实现高维熵或条件熵的图像分割[28].1)高维熵(Higher-Order Entropy ).式(6)是一维统计概率p i 的熵,据此可推广,高维统计概率p (L q i )的熵:H (q )=1q ∑ip (L q i )exp (1-p (L qi )),(11)其中,p (L q i )表示与灰度L 有关的q 维统计概率,i 为灰度序号.当q =1时,是一维(全局)熵的表达式,例如式(10)或式(8)和式(9)的指数熵表达式.当q =2时,可得二维(局部)熵的表达式:H (2)=12∑ip (L 2i )exp (1-p (L 2i )).(12)当q >2时,高维统计概率为p (L q i ),可依上式类似方法,构造高维局部熵测度H (q ),或称为q 维局部熵(Local Entropy of Order q ).2)条件熵(Conditional Entropy ).条件熵取决于条件概率的计算,设图像灰度L O k 和L Bk 分别属于目标O 和背景B ,其中k 表示图像空间中任意位置的灰度,基于某种准则的条件概率分别为p (L O k /L B k )和p (L B k /L O k ),则相应的条件熵:H (O /B )=∑L O k∈O ∑L B k∈Bp (L O k /L Bk )exp (1-p (L O k /L Bk )),(13)H (B /O )=∑L B k∈B ∑L O k∈Op (L B k /L Ok )exp (1-p (L B k /L Ok )).(14)图像的条件熵:H (C )=12(H (B /O )+H (O /B )).(15)3)联合熵(Joint Entropy ).文献[28]提出条件熵,文献[25]将条件熵归入联合熵.本文认为从概率的计算过程看,式(16)和式(17)表达目标或背景灰度联合出现的概率,因此,式(18)到式(20)是联合熵表达.文献[25]将式(18)到式(20)归类为局部熵,文献[28]则将条件熵和联合熵都称作局部熵,可见,联合熵与条件熵具有内在联系.局部熵实验,采用图像灰度共生概率(Probability of Co-occurrence of Gray Levels ,PCGL )矩阵,表达二阶统计概率,其它高维统计问题,可依此类推.根据不同空间关系或不同近邻阶数,式(12)中的p (L 2i )可有多种定义方法,本文采用3ˑ3近邻无结构方向区分方法计算PCGL ,则PCGL 矩阵如图3(a )(原始图像为图2(a )).PCGL 矩阵的行、列分别表示灰度从上到下、从左到右逐渐增大.设图像被阈值t 分为两个的灰度区间L O i 和L B i ,其分别属于目标O 和背景B ,则阈值t 将PCGL 矩阵划分为四个区域,如图3(a )中A 、B 、C 、D 区域.基于二维(局部)熵的表达式(14)对图像进行分割,图3(a )中A 、C 区域分别是对应背景与目标的二维局部概率:p Ai ,j=p i ,jP A;0≤i ,j ≤t ;P A =∑t i =0∑tj =0p i ,j ,(16)pCi ,j=p i ,jP C ;t +1≤i ,j ≤L -1;P C =∑L -1i =t +1∑L -1j =t +1p i ,j .(17)则其熵分别为H 2A(t )=12∑ti =0∑tj =0p A i ,j exp (1-p Ai ,j ),(18)1696期曹建农:图像分割的熵方法综述H 2C(t )=12∑L -1i =t +1∑L -1j =t +1p C i ,j exp (1-p C i ,j ).(19)因此,图像分割的二维局部熵:H 2T (t )=H 2A (t )+H 2C (t ),(20)基于上式的二维局部熵分割结果如图3(b ),阈值为0.43.(a )原始图像PCGL 矩阵(a )Matrix PCGL of originalimage(b )式(20)分割结果(c )式(21)分割结果(b )Segmentation result of equation (20)(c )Segmentation result of equation (21)图3局部熵与条件熵分割结果对比Fig.3Segmentation result comparison between local entropy and conditional entropy利用PCGL 矩阵提供条件概率,如图3(a )的B 、D 区域中,阈值为t ko ,kb ,其中ko 和kb 分别表示PCGL 矩阵的行列号,当第kb 灰度属于目标O 时,第ko 灰度出现在背景B 的概率为p (L O k /L Bk ),同理当第ko 灰度属于目标O 时,第kb 灰度出现在背景B 的概率为p (L B k /L Ok ),条件概率分别为p (L O k /L B k )=p Bi ,j =p i ,j P B;0≤i ≤t ,and t +1≤j ≤L -1;P B =∑ti =0∑L -1j =t +1p i ,j ;p (L B k /L O k )=p D i ,j =p i ,jP D;t +1≤i ≤L -1,and 0≤j ≤t ;P D =∑L -1i =t +1∑tj =0p i ,j .则相应条件熵分别为H (O /B )=∑ti =0∑L -1j =t +1p B i ,j exp (1-p B i ,j ),H (B /O )=∑L -1i =t +1∑tj =0p D i ,j exp (1-p D i ,j ).因此,图像分割的条件熵H (C )T (t )=H (O /B )+H (B /O )2.(21)基于上式的条件熵分割结果如图3(c ),阈值为0.13.可见,统计矩阵PCGL 的不同区域,可看作对图像灰度的不同统计方法,A 、C 区域被看作背景与目标的后验联合概率分布,而B 、D 区域则被看作背景与目标的后验条件概率分布.这种垂直划分具有一定误差,因此,近年来产生一些斜分区域的研究(见第4节).2.2.3交叉熵模型原理假设存在两个分布P ={p 1,p 2,…,p N },Q ={q 1,q 2,…,q N },两个分布间信息论意义的距离是D (Q ,P )(以下简称距离),交叉熵可度量两个分布之间的距离,数学关系[32]D (Q ,P )=∑Nk =1q k log 2q kp k.(22)Renyi 特别强调式(22)的信息论意义[33],即当一个分布(Q )替代另一个分布(P )时,式(22)是信息变化量的期望值,使其成为优化计算的前沿热点[34].只要获得某两个分布,就可通过式(22)获得两个分布之间相互替代或逐渐相互替代过程中期望值变化的全部状态值,这些状态特征值就是优化的标志,如最大或最小值,极大或极小值等.当没有先验信息可获得时,通过对p k 设定相同初始估计值,则最小交叉熵方法可看作是最大熵方法的扩展[14],这一结论是极大交叉熵算法[16]的指导思想之一.1)最小交叉熵模型.文献[14]将图像分割过程描述为图像灰度分布的重构过程.设图像函数为f ʒN ˑN →G ,这里G ={1,2,…,L } N 灰度集,N 是自然整数集.图像分割过程就是构造一个函数g ʒN ˑN →S ,这里S ={μ1,μ2}∈R +ˑR +,R +是实正数集合.分割图像g (x ,y )重构如下:g (x ,y )=μ1,f (x ,y )<t μ2,f (x ,y )≥t {(23)分割图像g (x ,y ),通过3个未知参数t 、μ1和μ2的确定,由原始图像f (x ,y )唯一生成.因此,必须构造一个准则,等价确定一套优化参数集t 、μ1和μ2,269模式识别与人工智能25卷使f (x ,y )和g (x ,y )之间尽可能相似,即η(g )≡η(t ,μ1,μ2).这个准则函数,是某种变形测度,例如从原始图像f 到分割图像g 的均方差就是常用测度,最小误差算法[35-36]和Otsu 算法[37]都属于这一类.文献[14]认为,对于正定加性分布(如图像分布),交叉熵测度比均方差测度更适合.此时,图像分割就被转化为使用约束的经典最大熵推理问题,设一个数值集合G ={g 1,g 2,…,g N },则数值集合G 只能由被观测图像F ={f 1,f 2,…,f N },连同所使用的适当约束条件推理得到,它们的分布,可用相同方法通过线性化二维分布得到.g i 和f i 来自图像空间中的相同位置,并且,G 包含的元素只有两个值μ1和μ2.为计算μ1和μ2,文献[14]提出灰度守恒约束准则,认为重构G 的灰度分布应该与F 的灰度密切相关,原始图像灰度F 给出μ1和μ2数值上的约束,则分割图像G 中的两类灰度强度的总和,等于原始图像F 的灰度强度总和.文献[15]和[38]对灰度守恒约束准则提出不同意见,但是,文献[39]在理论上证明这一准则的正确性.据此,这些约束可被概括为g i ∈{μ1,μ2},∑f i <tf i =∑f i<t μ1,∑f i≥t f i =∑f i≥tμ2,(24)其中,μ1和μ2可确定如下:μ1(t )=∑f i<tf i N 1,μ2(t )=∑f i≥tf i N 2,N 1和N 2分别是两个区域(目标和背景)内的像素数.结合式(22)、式(23)和上式,可得η(t )=∑f i <t f i lnf iμ1(t )()+∑f i ≥t f i lnf iμ2(t )(),(25)则阈值t 0=min t(η(t )),其中t 0就是所求阈值.由于式(25)的加和操作,需要在整个图像上进行的,存在重复聚集计算问题,因此对式(25)进行改造,得μ1(t )=∑j =t -1j =1jh j∑j =t -1j =1h j =1P 1∑j =t -1j =1jh j ,μ2(t )=∑j =Lj =t jh j∑j =Lj =th j =1P 2∑j =Lj =tjh j ,η(t )=∑j =t -1j =1jh j lnjμ1(t )()+∑j =Lj =tjh j lnjμ2(t )(),(26)其中h j 是离散图像的直方图函数,对上式η(t )最小化,就可得阈值t 0.2)最小后验交叉熵改进模型.文献[15]提出的最大后验交叉熵方法与文献[14]本质一样.如果用标准交叉熵式(27)取得最小值,则可得最小后验交叉熵分割结果,即文献[14]、[15]的改进方法[39].3)最大交叉熵模型基于最小交叉熵准则的算法,是考虑目标或背景的类内特性.如果考虑目标和背景的类间差异性,则构造的交叉熵函数必然是上凸函数,其最大值可作为分割阈值.据此,文献[15]定义类间差异为图像中所有像素点分别判决到目标和背景的后验概率之间的平均差异.该算法假设目标和背景像素的条件分布服从正态分布,利用贝叶斯公式估计像素属于目标或背景两类区域的后验概率,再搜索这两类区域后验概率之间的最大交叉熵.设用图像灰度值j 表示图像F 在j =f (x ,y )处的像素点,j ∈F ={f (x ,y )ʒ(1,2,…,L )∈M ˑN },其中M ,N 是图像行列号,表示图像灰度集.定义像素点j (j ∈G )基于后验概率p (1/j )、p (2/j )的对称交叉熵:D (1ʒ2;j )=p (1/j )log 2p (1/j )p (2/j )+p (2/j )log 2p (2/j )p (1/j ).(27)考虑到后验概率可能趋于0,会使上式中的对数项奇异化,在保证非负性的前提下将式(27)做如下修正(文献[15]没有给出说明是一个缺陷):D (1ʒ2;j )=13[1+p (1/j )]log 21+p (1/j )1+p (2/j )+13[1+p (2/j )]log 21+p (2/j )1+p (1/j ).(28)然后分别对目标和背景内的像素的交叉熵求取平均值,将两者之和作为总的类间差异,得D (1ʒ2)=∑j ∈1p (j )P 1D (1ʒ2;j )+∑j ∈2p (j )P 2D (1ʒ2;j ).(29)同时假设目标和背景灰度的条件分布服从正态分布:p (j /i )=12槡πσi (t )exp (-(j -μi (t ))22σ2i (t )),其参数由直方图估计,其中类内均值估计同式(26)的μ1(t ),类内方差估计分别为σ21(t )=1P 1∑j =t -1j =1h (j )(j -μ1(t ))2,σ22(t )=1P 2∑j =Lj =th (j )(j -μ2(t ))2.用贝叶斯公式求取后验概率如下:3696期曹建农:图像分割的熵方法综述p (i /j )=P i ·p (j /i )∑2i =1(P i ·p (j /i )),结合灰度直方图重写式(38),得D (1ʒ2;t )=∑tj =1h (j )P 1D (1ʒ2;j )+∑Lj =t +1h (j )P 2D (1ʒ2;j ).(30)搜索使上式最大的值t 就是最优分割阈值.根据式(26)对Lena 图像(如图2(a ))进行分割实验,结果如图4(a ),分割阈值为0.208.根据式(27)对Lena 图像进行分割实验,结果如图4(b ),分割阈值为0.200.根据式(28)对Lena 图像进行分割实验,结果如图4(c ),分割阈值为0.196.可看出,3种方法,虽然对交叉熵的理解角度不同,但是其核心原理具有一致性,所以它们的分割结果非常接近.(a )式(26)分割结果(b )式(27)分割(c )式(28)分割结果结果[15](a )Segmentation result of equation (26)(b )Segmentation result of equation (27)(c )Segmentation result of equation (28)图43种方法分割结果对比Fig.4Segmentation result comparison of 3methods3熵模型评述3.1香农熵模型文献[40]提出最大熵原理,在约束条件下推理未知概率分布,其解存在于给出最大熵的位置(或时间),最初的概念是可以给出最大无偏估计,同时允许约束条件具有最大自由度.随着中心理论的应用与重数(Multiplicity )的研究,已经表明,较高的熵分布具有较高的重数特性,因而也更容易观察[41].对归纳推理来说,当新的信息以期望值形式给出时,最大熵方法是唯一正确的方法[42],给出比传统方法(例如最大似然法)更好的解决方案[43].文献[28]认为式(8)和式(9)假设图像信息完全被直方图所表达,因此,即使不同图像的灰度空间分布不同,但当其具有完全一样的直方图时,将会产生相同分割结果,显然不正确,式(8) 式(10)一维全局熵的共同缺陷主要在于此,它们忽略图像灰度邻域的空间信息,对图像分割的灵活性和准确性都不够,另外,对式(9)的多阈值区间统计将导致计算量按(L -2)!(L -2-k )!k !增加(L 是灰度级,k 是阈值数).文献[25]基于均质(Uniformity )和形状(Shape )性能的算法测试表明,最大熵[2]与局部熵性能相同并且最优,这一结论与本文第2节的实验结果一致,如图2(c )和图3(b ).虽然式(9),被认为优于其它熵阈值算法[43],但是依然不能被广泛接受,并且有时分割性能很差,多有研究者对其进行扩展、改造.文献[44]使用图像的近邻空间关系和联合熵,作为选择阈值的准则.虽然文献[43]在最大熵阈值方法中,保留直方图熵函数,但却引入一套额外启发式原理选择阈值.因此,只要将式(9)与其它处理策略相结合,就可产生许多更有效的算法(见第4节).3.2Tsallis 熵与香农熵模型熵是热力学中与不可逆过程顺序相关的一个基本概念[45-46],它可用来度量物理系统内在的无序性.Tsallis 熵也称为不可扩展熵,其概念首先出现在统计力学中,它的提出进一步促进香农熵在信息理论中的拓展.因为现实世界的信息内容具有重大争议,所以香农的信息论强调信息量的数学表达(不涉及信息的内容),其关键在于给出具有普遍意义的信息量的定义,如式(3).按照布里渊的思想[46],信息的不同的可能性(概率)可和状态数联系起来,从而获得信息与熵的关系.状态数是热力学熵的统计度量,概率则适用于一切具有统计特征的包含信息的事件.可见,信息熵不但来自于热力学熵,而且具有内在联系.Tsallis 熵是传统玻耳兹曼/吉布斯(Boltzmann /Gibbs )熵在具有不可扩展性物理系统中的推广[47].香农重新定义玻耳兹曼/吉布斯熵函数,用来考查系统内所包含信息的不确定性,并且定量地衡量各状态过程所产生信息量的大小,其定义如式(1) (4).但是,式(4)的应用,受限于玻耳兹曼-吉布斯-香农(BGS )的统计学有效范围内.通常将服从BGS 统计学的系统称为可扩展系统.假设一个物理系统,可分解为两个统计独立的子系统A 和B ,子系统事件必须等概率,则复合系统的概率为p A +B =p A p B ,可证明香农熵具有可扩展性(可加性),即满足S (A +B )=S (A )+S (B ),469模式识别与人工智能25卷即一个系统分成若干独立子系统,则整个系统的熵等于若干子系统的香农熵之和.然而,对于呈现远距离交互、长时间记忆以及具有不规则结构的物理系统来说,需要在BGS统计学的基础上进行适当的改进.因此,Tsallis重新定义一种熵,用来描述不可扩展系统的热统计特性[11]:S q =1-∑ni=1(pi)qq-1,(31)其中,n是系统可能的状态数目,实数q衡量系统不可扩展的程度.一个统计独立系统的Tsallis熵,即不可扩展熵:Sq(A+B)=S q (A)+Sq(B)+(1-q)Sq(A)Sq(B).(32)Renyi熵的定义及其不可扩展熵:S α=11-αln∑ni=1(pi)α,(33)S α(A+B)=Sα(A)+Sα(B),(34)其中,n是系统可能的状态数目,α>0.Renyi熵和Tsallis熵不但在形式上,而且在图像分割的阈值选取方法上,都具有特殊的等价关系[12].3.3交叉熵模型文献[14]的交叉熵形式与文献[48]的图像熵很相似,而图像熵推导援引4个公理才得s(f,m)=∫d x(f(x)-m(x))-f(x)ln(f(x)m(x)),(35)其中,f(x)是图像灰度强度分布,m(x)是(被处理)图像f(x)的模型.事实上,如果考虑灰度守恒约束,则式(26)的η(t)与式(35),正好大小相等符号相反,因为式(35)的前两项在对所有类进行积分后消掉.文献[14]的方法是在原始图像和分割图像之间求取最小交叉熵,获得优化结果,Otsu类间方差最大化算法则可从与式(24)相同的约束条件中,利用均方差距离作为两个图像之间的测度推导出来.在这种情况下,准则函数如下:θ(t)=∑f i<t (fi-μ1(t))2+∑f i≥t(fi-μ2(t))2.如果使用直方图进行聚集加和,则这个准则函数:θ(t)=∑f i<t hj(j-μ1(t))2+∑f i≥thj(j-μ2(t))2.上式就是文献[37]所定义的类内方差.上式定义函数的最小化,等价于Otsu算法的准则.文献[15]提出的基于最大类间后验交叉熵准则的二值化阈值分割算法,可根据式(26) 式(30)导出,并且与文献[14]给出的交叉熵形式及文献[48]导出的图像熵相似,实验结果如图4(b)、(c).同时,文献[39]从理论上证明文献[14]、[49]所提方法符合最小交叉熵概念,从而为最小交叉熵方法的广泛应用奠定坚实的理论基础.因为每幅图像都有自身的灰度(平衡)特征,文献[14]不对图像进行任何分布假设,提出图像的灰度守恒准则,更符合图像个性,所以更具一般性.相反,文献[15]的正态分布假设与文献[28]的泊松分布假设一样,都要求直方图具有双峰特征,就直接全图分割而言,对大多数图像不适合.最小交叉熵的灰度守恒条件[14],实质上,是产生相关性时间序列函数的条件.也就是说,图像的每个分割区域,例如目标或背景,都被各自的灰度均值来表示,且都是灰度阈值的函数,即时间序列函数.在图像分割过程中,每个具有特定灰度值的像素的概率测度,就是动态相关实验的结果,其实质是将相似像素归为等概率事件[50].所以灰度守恒条件在一定程度上确保像素近邻空间信息的相关性.3.4熵模型相互关系Tsallis熵引入参数q度量系统的不可扩展性,解决图像区域间相关性而产生的不独立部分的熵表示问题.文献[11]提出基于Tsallis熵的阈值分割方法.文献[51]将Tsallis熵推广到二维.文献[44]提出一种基于二维Tsallis熵的全局阈值方法,由于算法复杂性高且运算时间长,因此,利用粒子群优化算法来搜索全局分割阈值.文献[51]提出Tsallis交叉熵的概念,并研究它的基本性质.文献[52]将Tsallis熵的非广延性应用到最小交叉熵的阈值法中,提出最小Tsallis交叉熵阈值法,既考虑目标和背景之间的信息量差异,又考虑目标和背景之间的相互关系,克服传统最小交叉熵忽略目标和背景之间的相互关系所导致的阈值选择不恰当的缺陷.香农熵强调系统内部的均匀性,在分割算法中就是搜索使目标或背景内部的灰度分布尽可能均匀的最优阈值.交叉熵则是度量两个概率分布之间的信息量差异[32],最初称作有向散度(Directed Divergence),它所构造的熵函数可能是下凹或上凸函数.熵函数的凸性方向与对交叉熵的两个分布理解及定义有关,据此可分别构成最大或最小交叉熵寻优机制.文献[13]提出最小交叉熵图像分割方法,并在文献[14]中得到进一步阐述,其主要贡献在于将交叉熵对图像分割问题进行成功的数学建模.文献[49]利用对称性交叉熵改进文献[14]的方法.文献[38]把原始图像和分割图像的直方图分别作为两个概率分布,利用交叉熵选择阈值.针对文5696期曹建农:图像分割的熵方法综述。
改进的最大熵算法在图像分割中的应用
文章编号 :06— 3 8 2 1 ) 8—0 9 0 10 9 4 (0 1 0 2 1— 4
计
算
机
仿
真
21 月 0 年8 1
改进 的最 大 熵 算 法在 图像 分 割 中的应 用
王 文 渊 王 芳梅 ,
(. 1 楚雄师范学 院计算机科学 系, 云南 楚雄 6 50 ; 7 00 2 .云南 经济管理职业 学院 , 云南 昆明 6 0 0 ) 5 16 摘要 : 研究 图像分割优化问题 , 要求图像分 割速度快 , 清晰度高 。针对传统 的熵值法在理论上存在的不足 , 同时抗 噪能力 差 ,
e t c e t rs h n t re g n t p r t n fs lci g,c o s v ra d mu ai n a e u e o s a c rt eo t l x r t au e ,t e h e e e i o ea i so ee t a f c o n r so e n tt r s d t e r h f p i o o h ma t r s od fr i g e e tt n he h l o ma e s g na i .S mu a in r s l h w t a ei r v d ag r h ,c mp r d w t e t d t n m o i lt e ut s o h tt mp o e oi m o s h l t o a e ih t r i o a h a i l
ma i m n o y i g e e tt n ag rt m,i c e s s s g n ai n ef in y,a d t e a c r c f i g e - xmu e t p ma e s g na i lo i r m o h n r a e e me tt f ce c o i n c u a y o ma e s g h me t t n h s g e t mp o e n ai a al i rv d,w ih s e d p t e s g n ai n s e d o r y h c p e s u h e me t t p e . o
图像处理--采用最大熵方法进行图像分割
数字图象处理课程设计题目:采用最大熵方法进行图像分割班级:电信121学号:3120412014姓名:吴向荣指导老师:王栋起止时间:2016.1.4~2016.1.8西安理工大学源代码:clear,clcimage=imread('C:\Users\Administrator\Desktop\图像课设\3.jpg'); subplot(2,2,1);imshow(image);title('原始彩图')%% %灰度图imagegray=rgb2gray(image); %彩色图转换为灰度图subplot(2,2,2);imshow(imagegray);title('灰度图')%计算灰度直方图分布counts和x分别为返回直方图数据向量和相应的彩色向量count=imhist(imagegray);subplot(2,2,3);imhist(imagegray);title('灰度直方图')[m,n]=size(imagegray);imagegray=fun_maxgray(count,imagegray,m,n);subplot(2,2,4);imshow(imagegray);title('最大熵处理后的图')%% 彩色图% r=image(:,:,1);countr=imhist(r);r=fun_maxgray(countr,r,m,n); % subplot(2,2,1);imshow(r);% g=image(:,:,2);countg=imhist(g);g=fun_maxgray(countg,g,m,n); % subplot(2,2,2);imshow(g);% b=image(:,:,3);countb=imhist(b);b=fun_maxgray(countb,b,m,n); % subplot(2,2,3);imshow(b);b=0;for z=1:3figuretitleName = strcat('第',num2str(z),'通道灰度直方图');titleName1 = strcat('第',num2str(z),'通道最大熵处理后图');a=image(:,:,z);subplot(1,2,1);imhist(a);title(titleName)countr=imhist(a);a=fun_maxgray(countr,a,m,n);subplot(1,2,2);imshow(a);title(titleName1)b=b+a;endfigure,imshow(b);title('彩色各通道处理后叠加图')最大熵方法进行图像分割的子函数:function sample=fun_maxgray(count,sample,m,n)countp=count/(m*n); %每一个像素的分布概率E=[];E1=0;E2=0;L=256;for th=2:L-1 %循环阈值pth=sum(countp(1:th+1)); %计算对应阈值概率if countp(th)==0 %当阈值概率为0跳出当前循环continue;endfor i=1:thif countp(i)==0 %当前像素概率为0,跳出当前循环continue;endE1=E1-countp(i)/pth*log(countp(i)/pth);endfor i=th-1:Lif countp(i)==0continue;endE2=E2-countp(i)/(1-pth)*log(countp(i)/(1-pth)); ende=E1+E2;E=[E e];endth=find(E==(max(E))); %找数组中最大值的阈值%[ma,index]=max(E);for i=1:m %对图像二值化for j=1:nif sample(i,j)>thsample(i,j)=255;elsesample(i,j)=0;e运行结果:其他图片比较:。
快速最大熵多阈值图像分割算法
s n f a t mp o e o a e t o v n in lma i m nr p t o n sa l c o i i c nl i r v d c mp r d wi c n e t a x mu e to y meh d a d i e t a c mmo ae g n r l印 p iai n r q i me t . g i y h o b o d t e e a l t e u r c o e ns
0 引 言
图像分 割就是依据图像 的性质 , 将一 幅 图像 划分 不 同区域
大小 的影 响小 , 可用于小 目标 分割 。但 因为传统 的最大熵 算 法是使用穷举法选取使 目标 函数 取得最 大值 的阈值 , 并且 目标
的过 程。图像 分割是图像处 理 和计 算机 视觉 中的基本 技术 , 是 图像 分析 、 理解 和描 述的关 键步骤 。阈值方 法是一 种重要 的 图 像分 割方法 , 由于其算法 简单 和易于执行 , 图像分 割中得到 了 在 广泛的应用 。如果只是将 图像分 为 目标 和背景 两类 , 么就只 那 需要选取 一个阈值 , 图像 中每个 像素的灰度值与 阈值 比较 , 将 灰 度值 大于阈值的像素为一类 , 度值小 于 阈值 的像 素则为 另一 灰 类 。如果要将 图像 分为多个 目标 , 就需要 选取多个阚值 , 图像 将 中每个像 素的灰度值与 阈值 比较 , 得到分割结果 。
推公式提 出了快速选 取 阈值 的方法 ; 文献 [ ] 7 提出 了一种利 用
粒子群优化算 法提 高选取 阈值速 度 的方法 ; 文献 [ ] 出了一 8提 种利用增量学 习法 ( L 提高选取 阈值 速度 的方法 。本 文 的研 R)
究 目的就是要提 高最大熵算 法 的运算 速度 。文献 [ ] 2 针对 Os t u 算法利用代数运算 的递 推公式 , 出了一种快速 Os 法。受 提 t u算 其思想启发 , 本文针对选取阈值的最大熵算法 , 出了一 种基 于 提 最大熵算法 的快速 阙值 选取算 法 , 能够实 现对图像 的多 阈值 快
图像最大熵
图像最大熵图像最大熵是一种图像处理技术,它是通过应用熵理论来提取图像数据中的有用信息,并将其表示为可以被计算机有效处理的图像信息。
这是一种基于信息理论的非监督式学习技术。
最大熵理论主要认为,在所有可能的假设情况中,有最高熵的情况是最有可能的。
因此,采用图像最大熵技术研究图像信息,可以把主要的信息提取出来。
说到图像最大熵技术,就要从它的基本理论入手。
熵作为一种概念,来源于热力学,是研究物理系统平衡态的一个指标。
它也可以用来衡量系统的不确定性,即系统内的混乱程度。
因此,图像最大熵技术就是通过应用熵理论来提取图像信息,提取出图像内最重要的信息,从而降低图像信息的复杂性,使其能够被有效的处理。
在图像处理中,图像最大熵技术可以用来提取图像中的有用信息,并将其表示为可以被计算机有效处理的图像信息。
一般来说,图像最大熵技术可以用来进行图像分割、图像压缩、图像去噪、图像滤波、图像重建以及图像边缘检测等。
图像最大熵分割是一种基于全局最小熵原则来实现图像分割的技术,它可以用来把一幅图片分解成若干个独立的物体,使用它可以实现不同对象的自动分割。
图像压缩是指使用图像最大熵技术来降低图像体积的技术。
它是把原始图像的熵重新分配后,以实现压缩的一种技术。
图像去噪也使用图像最大熵技术,通过应用最大熵原则,可以消除图像中的噪声信号,从而提高图像的质量。
此外,也可以使用图像最大熵技术进行图像滤波和图像重建。
图像滤波是通过合理地改变图像中的熵,以调整图像中噪声的分布,来消除图像中的噪声的一种方法。
图像重建是一种通过重新分配图像中的熵,以重建受损的图像的技术。
图像最大熵技术也可用于图像边缘检测,图像边缘检测是一种将图像中的不同物体分离开来的技术,它可以把图像中不同物体的边缘信息提取出来。
图像最大熵技术可以用来检测和提取图像中的边缘信息,并且该方法具有很好的鲁棒性,可以有效处理图像中的噪声。
图像最大熵技术在图像处理中的应用十分广泛,它不仅可以用来提取图像信息,还可以用来压缩图像、去噪、分割、滤波、重建以及边缘检测等。
萤火虫算法优化最大熵的图像分割方法
萤火虫算法优化最大熵的图像分割方法吴鹏【摘要】为了提高图像的分割效果,提出一种萤火虫算法优化最大熵的图像分割方法。
获得最大熵法的阈值优化目标函数,采用萤火虫算法对目标函数进行求解,找到图像的最佳分割阈值,根据最佳阈值对图像进行分割,通过仿真实验对分割效果进行测试。
结果表明,该方法可以迅速、准确找到最佳阈值,提高图像分割的准确度和抗噪性能,可以较好地满足图像分割实时性要求。
%In order to improve the effect of image segmentation, this paper puts forward a novel image segmentation method based on firefly algorithm and maximum entropy method. Threshold optimization objective function of maximum entropy method is obtained, and then firefly algorithm is used to solve the objective function and find the optimal segmen-tation threshold of the image. Image is segmented according to the optimal threshold, and the performance is tested by simulation experiment. The results show that the proposed method can quickly and accurately find the optimal threshold value, and can improve the accuracy of image segmentation and anti-noise ability, so it can better meet the real-time require-ments of image segmentation.【期刊名称】《计算机工程与应用》【年(卷),期】2014(000)012【总页数】5页(P115-119)【关键词】萤火虫算法;最大熵法;阈值;图像分割【作者】吴鹏【作者单位】淄博职业学院,山东淄博 255314【正文语种】中文【中图分类】TP3111 引言图像分割是指根据一定的分割原则,把图像分割成若干感兴趣的区域,是图像处理的关键和首要步骤,其分割结果优劣直接影响人们对图像的理解和使用,因此图像分割是计算机图像研究的热点和重要课题[1]。
毕业设计-基于信息熵最大的图像分割研究【范本模板】
毕业设计(论文)任务书第1页第2页第3页第4页基于信息熵最大的图像分割研究摘要图像分割是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义"的区域,使其后的图像分析及识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息.在信息理论中,熵用于度量信息传输的有效性。
本论文主要讨论针对数字图像利用信息熵标准结合阈值迭代法进行图像分割,以提高图像分割的准确性。
设计信息熵算法并程序实现,仿真结果表明编写程序有效,分割效果明显。
关键词:阈值分割迭代法信息熵Maximum entropy-based image segmentation studyAbstractBased on the similarity criterion of the image’ some cha racteristics or characteristics set, image segmentation technique divides the image pixels into groups and partition the image into a series of "meaningful” regions. This technique will greatly reduce the amount of data in the following advanced processing to the image analysis and identification,as will as retain the information about image structure characteristics. In information theory, entropy is used to measure the effectiveness of information transmission。
基于最大熵的模糊核聚类图像分割方法
3 模糊核聚类算法
假设输 入空间的样本 向量 X∈R ,= ,, n,被某一非 i 1 …, 2 线 性 映 射 映 射 到某 一 特 征 空 间 R ,从 而 得 到 O(. x) , ( , O( ) …, x)。模糊核聚类 算法 的 目标 函数为 :
2 研究背景
近 几年 来 ,随着 核方法构造的支持 向量机理论的飞跃发 展 ,学者们尝试着把核方法应用到聚类算法 中来 J 。通过 引 入 Mecr re 核函数 , 使得复杂 的模式分类 问题映射到高维空间 后 ,比在低 维空间里更容 易线性可分。输入空间映射 到特 征
用最 大熵 算法对原始图像进行初步分割 ,求得初始 聚类 中心 ;引入 Me e 核 函数,把输 入空间的样 本映射到高维特征 空间 ,并在特征 空 rr c 间中进行 图像分割。实验结果表 明,该方法能减少迭代 次数,使 分类结果更稳定 ,从而较好地把 目标从背景中分割出来 。
关健诃 : 糊核聚类 ;最大熵 ;特征空 间;图像分 割 模
l8 8
计
算
机
工
程
2 1 年 5月 2 日 01 0
的隶属度 。 , 需要满 足如下约束条件 :
域 中心为 t 背景所在的区域中心为 + 一1 2,这里 £为 / 2, L ) / 图像的灰度级 ;然后把 ( 2@+ —1 2 作为基于最大熵的模 t, L )) / /
糊核聚类图像 分割方法 的初始聚类中心 “ 。 ” () 3选择 核函数及其参数。本文采用可 以将有 限维样本宅
(,・ ( ) v)
其 中, 为高斯核函数的宽度 。 () 4根据式() 5 ,利用聚类中心矩 阵 “ “ 更新隶属度矩 阵,
得 到 u“) 。
python最大熵阈值分割
Python最大熵阈值分割1. 介绍在数字图像处理中,图像分割是一项重要的任务。
图像分割是将图像中的像素划分为不同的区域或对象的过程。
最大熵阈值分割是一种常用的图像分割方法,它基于最大熵原理,通过寻找最佳阈值将图像分割为两个或多个区域。
本文将介绍最大熵阈值分割的原理和实现方法,并提供一个基于Python的示例代码。
2. 最大熵原理最大熵原理是一种信息理论的方法,用于从有限的观测数据中推断概率分布。
在最大熵原理中,我们希望选择一个概率分布,使得它的熵最大。
熵是对不确定性的度量,最大熵原理认为,当我们没有任何先验知识时,应该选择熵最大的概率分布。
在图像分割中,最大熵阈值分割使用最大熵原理来确定最佳阈值。
它假设图像中的前景和背景像素具有不同的灰度分布,并试图找到一个阈值,将这两个分布分开。
3. 最大熵阈值分割算法步骤最大熵阈值分割算法的步骤如下:1.将图像转换为灰度图像。
2.统计图像中每个灰度级别的像素数量,并计算每个灰度级别的概率。
3.初始化阈值为图像的最小灰度级别。
4.计算当前阈值下的前景和背景像素的概率。
5.计算当前阈值下的前景和背景像素的熵。
6.更新阈值为使得前景和背景像素熵之和最大的值。
7.重复步骤4-6,直到阈值不再变化或达到最大迭代次数。
8.将图像根据最终阈值进行分割,将小于阈值的像素标记为背景,大于等于阈值的像素标记为前景。
4. Python示例代码import numpy as npimport cv2def max_entropy_threshold(image):# 将图像转换为灰度图像gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 统计每个灰度级别的像素数量hist = cv2.calcHist([gray_image], [0], None, [256], [0, 256])hist /= hist.sum() # 计算每个灰度级别的概率threshold = 0max_entropy = 0# 初始化阈值为最小灰度级别for t in range(256):# 计算当前阈值下的前景和背景像素的概率foreground_prob = hist[:t].sum()background_prob = hist[t:].sum()# 计算当前阈值下的前景和背景像素的熵foreground_entropy = -np.sum(hist[:t] * np.log(hist[:t] + np.finfo(flo at).eps))background_entropy = -np.sum(hist[t:] * np.log(hist[t:] + np.finfo(flo at).eps))# 计算前景和背景像素熵之和total_entropy = foreground_entropy + background_entropy# 更新阈值为使得熵之和最大的值if total_entropy > max_entropy:max_entropy = total_entropythreshold = t# 根据阈值进行图像分割segmented_image = np.where(gray_image < threshold, 0, 255).astype(np.uint8)return segmented_image# 读取图像image = cv2.imread('image.jpg')# 应用最大熵阈值分割segmented_image = max_entropy_threshold(image)# 显示原始图像和分割图像cv2.imshow('Original Image', image)cv2.imshow('Segmented Image', segmented_image)cv2.waitKey(0)cv2.destroyAllWindows()5. 总结最大熵阈值分割是一种常用的图像分割方法,它利用最大熵原理确定最佳阈值,将图像分割为前景和背景。
图像分割算法研究综述
图像分割算法研究综述一、本文概述随着计算机视觉技术的飞速发展,图像分割作为其中的一项关键任务,日益受到研究者的关注。
图像分割是指将数字图像细分为多个图像子区域的过程,这些子区域在某种特性或计算上呈现出一致性,如颜色、纹理、形状或空间关系等。
这些被分割的子区域能够显著简化或改变图像的表示形式,使其更适合于进行高级的图像分析和理解任务,如目标识别、场景理解等。
本文旨在全面综述近年来图像分割算法的研究进展,分析和评价各类算法的性能与特点。
我们将对图像分割的基本概念和常用方法进行介绍,包括基于阈值的分割、基于边缘的分割、基于区域的分割以及基于深度学习的分割等。
接着,我们将对各类算法的优缺点进行深入探讨,并结合实际应用场景,分析其在不同任务中的表现。
本文还将关注图像分割领域的发展趋势,如多模态图像分割、弱监督学习在图像分割中的应用等。
我们期望通过本文的综述,能够为读者提供一个清晰、全面的图像分割算法知识框架,并为未来的研究提供有益的参考和启示。
二、图像分割算法分类图像分割是计算机视觉领域的一项关键任务,旨在将图像划分为具有相似性质的区域。
根据不同的原理和方法,图像分割算法可以大致分为以下几类:基于阈值的分割方法:这是最简单的一类图像分割方法,它根据像素值的差异来设置阈值,从而将图像分为不同的区域。
这种方法对于背景与前景有明显对比的简单图像效果较好,但对于复杂场景或光照不均的图像则可能效果不佳。
基于边缘的分割方法:边缘分割方法主要依赖于检测图像中的边缘信息,即像素值发生剧烈变化的区域。
常用的边缘检测算子有Sobel、Canny等。
这类方法对于具有明显边缘特征的图像效果较好,但容易受到噪声的影响。
基于区域的分割方法:基于区域的分割方法是根据像素的相似性将图像划分为不同的区域。
典型的算法有区域生长和分裂合并。
这类方法对于具有均匀纹理和颜色的图像效果较好,但对于边界模糊或复杂纹理的图像可能效果不佳。
基于深度学习的分割方法:随着深度学习技术的发展,基于卷积神经网络(CNN)的图像分割方法取得了显著的进展。
图像分割的二维最大熵遗传算法
第14卷第6期2002年6月计算机辅助设计与图形学学报JOU RNAL O F COM PU T ER 2A I D ED D ES IGN &COM PU T ER GRA PH I CSV o l .14,N o.6June,2002图像分割的二维最大熵遗传算法陈 果 左洪福(南京航空航天大学民航学院 南京 210016)摘要 将遗传算法运用于二维最大熵图像阈值分割法.首先对二维阈值坐标进行编码,然后依据二维最大熵准则建立适应度函数,在适当的交叉率和变异率下,最终实现强噪声干扰下图像的有效分割.分割实验表明,文中方法较一维最大熵法具有更强的抗噪声能力,较普通二维最大熵法运算速度更快.关键词 图像分割,遗传算法,熵,二维直方图中图法分类号 T P 391.4;V 233.4;V 263.62-D M ax i m u m En tropy M ethod of I mage Segm en ta tionBa sed on Genetic A lgor ithmChen Guo Zuo Hongfu(C iv il A v ia tion Colleg e ,N anj ing U n iversity of A eronau tics and A stronau tics ,N anj ing 210016)Abstract 22D th resho lds are coded ,then the fitness functi on is established acco rding to the criteri on functi on of 22D m axi m um entropy .F inally the i m age w h ich is disturbed by seri ous no ise is segm ented effectively under the p roper cro ssover rate and m utati on rate .Segm entati on examp les show that the m ethod p ropo sed has greater resis 2tance capability to no ise than 12D m axi m um entropy app roach ,and is faster than the common 22D m axi m um entropy app roach .Key words i m age segm entati on ,genetic algo rithm ,entropy ,22D h istogram 原稿收到日期:2001204220;修改稿收到日期:2001211228.陈 果,男,1972年生,博士后研究人员,主要研究方向为图像处理与模式识别、信号分析与处理、机械振动以及故障诊断等.左洪福,男,1959年生,教授,博士生导师,主要研究方向为摩擦学、铁谱分析、机械设备故障诊断和磨损检测等.1 引 言图像分割是大多数图像分析及视觉系统的重要组成部分,也是图像处理和前期视觉中的基本技术.图像分割的目的就是把图像中的物体与背景分开,将人们感兴趣的目标从图像背景中提取出来,为后续处理提供基础.阈值分割法因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术.熵是平均信息量的表征,20世纪80年代初人们开始考虑用信息论中熵的概念进行阈值选取.1980年Pun [1]首先提出最大后验熵上限法;Johannsen 和B ile [2]1982年提出的最小信息互相关法也采用了图像灰度级的熵,该方法将灰度级范围划分为两部分,并使其在互相关(在信息论意义上)最小处选取阈值;1985年Kapur 等[3]提出最大熵阈值选取法;1989年A butaleb [4]将Kapur 等提出的一维最大熵法推广至二维,即考虑象素的灰度级及其邻域平均灰度级构成的二维直方图;1989年Pal 等[5]引入图像的q 阶局部熵与条件熵的概念,提出选取阈值的最大二阶局部熵法与最大条件熵法;1989年W ong 等[6]介绍了一种考虑均匀性与形状的最大熵阈值选取方法.在这些最大熵法中,Kapur 提出的一维最大熵法和被A butaleb 推广的二维最大熵法最为简洁有效,因此应用最广.当图像的信噪比降低时,应用一维最大熵法将产生很多分割错误.二维最大熵法应用二维直方图,不仅反映了灰度分布信息,还反映了邻域空间相关信息,因此在图像信噪比较小时,二维最大熵法明显优于一维最大熵法.但是,被推广的二维最大熵法只是简单地将一维寻优推广为二维寻优,因此导致运算量按指数增长,耗时太长,难以实用.为此,文献[7]提出了二维最大熵法的递推算法,并以加大存储容量为代价将速度提高了近两个数量级;文献[829]提出了二维直方图的最佳一维投影分割法和F isher 准则下的一维投影分割法,并将其运用于二维最大熵法,计算量基本上与一维最大熵法相当.遗传算法是一种通过模拟自然进化过程搜索最优解的方法[10].隐含并行性和对全局信息的有效利用能力是遗传算法的两大显著特点,前者使遗传算法只需检测少量结构就能反映搜索空间较大的区域,便于实时处理;后者使遗传算法具有较强的鲁棒性,可避免陷入局部最优.近年来,遗传算法已被成功地应用于各种优化问题,遗传算法仿效遗传学中生物从低级到高级的进化过程,将进行的操作应用于一群对搜索空间(或称参数空间)编码的基因串(或称染色体)中,在每一代,遗传算法同时搜索参数空间的不同区域,然后把注意力集中到解空间中期望值最高的部分.通过一群基因串一代又一代地繁殖和交换,遗传算法能搜索到多个局部极值,从而增加了找到全局最优解的可能性.本文在普通二维最大熵法[4,11]基础上,提出一种基于遗传算法的二维最大熵法,运用遗传算法的两大显著特点实现二维最大熵法的快速计算.2 二维最大熵阈值分割综合运用点灰度和区域灰度特征可以较好地表征图像的信息,二维最大熵阈值分割法正立足于此,其具体计算方法如下:以原始灰度图像(L个灰度级)中各象素及其8邻域的8个象素为一个区域,计算出区域灰度均值图像(L个灰度级),这样,原始图像中每一个象素都对应于一个点灰度2区域灰度均值对,则此数据对存在L×L种可能的取值.设n ij 为图像中点灰度为i及其区域灰度均值为j的象素点数,p ij 为点灰度2区域灰度均值对(i,j)发生的概率p ij=n ijN×N(1)其中N×N为图像的大小,则{p ij,i,j=1~L}就是该图像关于点灰度2区域灰度均值的二维直方图.图1所示为图像二维直方图(用灰度表示),从图中可以看出,点灰度2区域灰度均值对的概率高峰主要分布在平面的对角线附近,并且在总体上呈现出双峰状态.这是由于图像的所有象素中,目标点和背景点所占比例最大,而目标区域和背景区域内部的象素灰度级比较均匀,点灰度及其区域灰度均值相差不大,所以都集中在对角线附近,两个峰分别对应于目标和背景.远离平面对角线的坐标处,峰的高度急剧下降,这部分反映图像中的噪声点、边缘点和杂散点.图2为二维直方图的X O Y平面图,沿对角线分布的A区和B区分别代表目标和背景,远离对角线的C区和D区代表边界和噪声,所以应该在A区和B区中用点灰度2区域灰度均值,通过二维最大熵法确定最佳阈值,使真正代表目标和背景的信息量最大.设A区和B区具有不同的概率分布,用A区和B区的后验概率对各区域的概率p ij进行归一化处理,使分区熵之间具有可加性.如果阈值设在(s,t),则P A=∑s-1i=0∑t-1j=0p ij, P B=∑L-1i=s∑L-1j=tp ij(2)定义离散二维熵为H=-∑i∑jp ij lg p ij(3)则A区和B区的二维熵分别为H(A)=-∑s-1i=0∑t-1j=0(p ij P A)lg(p ij P A)=-(1 P A)∑s-1i=0∑t-1j=0(p ij lg p ij-p ij lg P A)=(1 P A)lg P A∑s-1i=0∑t-1j=0p ij-(1 P A)∑s-1i=0∑t-1j=0p ij lg p ij =lg(P A)+H A P A(4)同理,H(B)=lg(P B)+H B P B(5)其中,H A=-∑s-1i=0∑t-1j=0p ij lg p ij,H B=-∑L-1i=s∑L-1j=tp ij lg p ij.由于C区和D区包含关于噪声和边缘的信息,概率较小,所以将其忽略不计,即假设C区和D区的p ij=0.可以得到P B=1-P A,H B=H L-H A.其中,H L=-∑L-1i=0∑L-1j=0p ij lg p ij,则H(B)=lg(1-P A)+(H L-H A) (1-P A).熵的判别函数定义为<(s,t)=H(A)+H(B)=H A P A+lg P A+(H L-H A) (1-P A)+lg(1-P A)=lg[P A(1-P A)]+H A P A+(H L-H A) (1-P A)(6)显然,如果不忽略对远离对角线的C区和D区的概率,则熵的判别函数为<(s,t)=H(A)+H(B)(7)其中,H(A)和H(B)的计算分别如式(4),(5).选取的最佳阈值向量满足<(s3,t3)=m ax{<(s,t)}(8)1356期陈 果等:图像分割的二维最大熵遗传算法3 二维最大熵图像分割的遗传算法将遗传算法同二维最大熵图像分割法联系起来首先要解决两个问题:一是如何将问题的解编码到基因中;二是如何构造适应度函数来度量每条基因串(染色体)对问题的适应程度.如果某条基因串的编码代表的阈值能使分割后的图像熵大,则其适应度就高;反之,其适应度就低.二维熵阈值分割法的目的就是要得到最佳分割阈值(s 3,t 3),使得图像的熵最大,可以直接对二维阈值矢量进行编码.由于在数字图像处理中,阈值的选取范围通常为0~255中的整数,因此采用8位二进制编码比较方便.本文根据二维阈值坐标值的取值范围,将其量化值(用二进制串表示)编码成基因串a ={Α0,…,Α7,Α8,…,Α15},其中,a 中的前8个量化值代表第一个阈值坐标,后8个量化值代表第二个阈值坐标.每个基因串由长度为16个比特位的串组成,此时的搜索空间有2562个点.适应度函数可直接选择二维熵的判别函数<(s ,t ),即f m =<(s ,t )(9)本文构造的基于遗传算法的二维最大熵图像分割法的计算流程如图3所示.其基本过程如下:Step 1.设定种群数目N ,对二维阈值进行二进制编码,并随机产生初始种群.注意,种群数目如果取得太小,遗传算法的性能将变得很差或根本找不出问题的解;如果取得太大,则会增加计算量,使收敛时间增长.种群数目一般取为30~50个.Step 2.对初始种群解码,并根据式(6),(7)和式(9)计算每条基因串的适应度.Step 3.将适应度最大的个体,即种群中最好的个体无条件地复制到下一代新种群中,然后对父代种群进行选择、交叉和变异等遗传算子运算,从而繁殖出下一代新种群的其它N 21个基因串.通常采用转轮法作为选取方法,适应度大的基因串选择的机会大,从而被遗传到下一代;相反,适应度小的基因串选择的机会小,将被淘汰.交叉和变异是产生新个体的遗传算子,若交叉率太大,将使高适应度的基因串结构很快被破坏掉,太小则使搜索停滞不前,一般取为0125~0175;若变异率太大,将使遗传算法变为随机搜索,太小则不会产生新个体,一般取为0101~012.Step 4.如果达到设定的繁衍代数,则返回最好的基因串,并将其作为二维分割阈值,算法结束;否则,回到Step 3继续下一代的繁衍.4 图像分割算例为了验证基于遗传算法的最大熵图像分割法的有效性,我们以一幅典型的真实磨粒图像为例进行分割实验.磨粒图像是通过在显微镜下对铁谱片进行观察,并由CCD 摄像头和图像采集卡所获取的数字图像.对磨粒图像的分割和磨粒目标的提取及识别是智能化铁谱诊断系统的关键技术.磨粒图像一般可以看成是由目标和背景两类象素构成的单阈值图像,图像中的目标即为金属磨粒(如铁、铜、铝及其合金等),对磨粒图像进行分割的目的就是要从图像中提取出我们所感兴趣的磨粒目标,从而为后续的磨粒识别提供基础.由此可见,磨粒图像的分割和目标提取对智能铁谱分析技术非常重要.图4a 为原始磨粒图像,图4b 为原始磨粒图像的一维直方图,图4c 为原始磨粒图像的二维直方图(用灰度表示);图5a 为在原始磨粒图像上叠加服从正态分布N (0,400)的随机噪声后形成的噪声图像,图5b 为噪声图像的一维直方图,图5c 为噪声图像的二维直方图;图6a 为噪声磨粒图像用一维最大熵法的分割结果,图6b 为噪声磨粒图像用本文基于遗传算法的二维最大熵法的分割结果,在本文遗传二维最大熵法中,种群数目N 取为30,基因串(染色体)二进制编码长度为16bits ,交叉率和变异率分别取为0150和011,经过10代遗传后即收敛到最佳阈值.从直方图上看,原始磨粒图像的一维直方图表现出了明显的双峰特性,如图4b 所示.二维直方图沿对角线分布且分布区域很窄,如图4c 所示;但是在噪声污染后,图像的一维直方图的双峰几乎完全被噪声掩盖,如图5b 所示,此时已很难分清直方图上的峰和谷.噪声图像的二维直方图同样沿对角线分布,但其分布区域变得很宽,如图5c 所示,致使目标和背景区域在点灰度轴上的投影产生了很多重叠,使一维直方图上的峰和谷很难辨别.从分割精度上看,对于受噪声影响后的噪声磨粒图像,一维最大熵法的分割结果显然很差,如图6a 所示.由于噪声的影响,使分割后的磨粒目标内部出现许多小洞,而且磨粒边界出现了大量的不连续,同时也导致了许多目标的失落.从图6b 和图6c 不难看出,本文提出的遗传二维最大熵法对噪声磨粒图像实现了最佳的分割.从分割结果可以看出,磨粒目标的内部区域完整,不存在受噪声污染的小洞,磨粒边界完全封闭,几乎没有局部断开的现象;与一维最大熵法相比,磨粒目标失落现象明显减少.由此可见,对于噪声污染下的图像,本文提出的遗传二维最大熵法的分割性能明显优于一维最大熵法;同时,对比图6b ,6c 不难看出,二者的分割结果几乎相同,是否考虑二维直方图上远离对角线的C 区和D 区的概率对分割结果影响很小.235计算机辅助设计与图形学学报2002年从计算速度上看,在种群数为30时,本文的遗传二维最大熵法通过10代遗传后,收敛到最佳阈值,共计算了n1=30×10=300次熵判别函数;但是如果采用简单推广的二维最大熵分割法[4],运用穷举搜索法求取最佳分割阈值,则需计算n2=256×256=65536次熵判别函数.相比之下,本文方法的速度提高S=n2 n1=65536 300≈218(倍).一维最大熵法由于仅考虑一维直方图,所以只需计算256次熵判别函数.显然,本文方法与一维最大熵法相比,计算速度基本相同.文献[8]提出的二维最大熵递推算法尽管速度也很快,但需要的存储空间要大得多,且方法的复杂性也大为增加.文献[4]中A butaleb曾认为穷举搜索法是二维最大熵法求取二维阈值矢量的唯一方法,二维最大熵法以计算时间为代价获取了比一维熵法更佳的分割精度.显然,本文提出的遗传二维最大熵法从根本上否定了A butaleb的观点,本文方法不仅在图像分割精度上达到了最佳,且计算速度也基本与一维最大熵法相同.由此可见,与其它方法相比,权衡其分割精度和计算速度,本文提出的遗传二维最大熵法不失为一种非常实用有效的图像阈值分割方法.5 结 论本文将遗传算法运用于二维最大熵图像阈值分割法,构造出了图像分割的遗传二维最大熵法.并以真实磨粒图像为例,同时叠加服从正态分布N(0,400)的随机噪声,对噪声磨粒图像进行了分割实验.对本文的基于遗传算法的二维最大熵法与一维最大熵法进行比较,结果表明本文方法对噪声图像的分割效果很好,其分割精度明显优于一维最大熵法,而计算速度基本与一维最大熵法相同.所以本文提出的遗传二维最大熵法是一种实用有效的图像阈值分割法.参考文献[1]Pun T.A new m ethod fo r gray2level p icture th resho lding us2ing the entropy of h istogram[J].Signal P rocessing,1980(2):223~237[2]Johannsen G,B ile J.A th resho ld selecti on m ethod using in2fo r m ati on m easures[A].In:P roceedings of the6th I CPR,1982.140~143[3]Kapur J N,Sahoo P K,W ong A K C.A new m ethod fo rgray2level p icture th resho lding using the entropy of the h is2togram[J].Computer V isi on,Graph ics and I m age P rocess2ing,1985(29):273~2853356期陈 果等:图像分割的二维最大熵遗传算法[4]A butaleb A S.A utom atic th resho lding of gray2level p icturesusing two2di m ensi on entropy[J].Computer V isi on,Graph2 ics and I m age P rocessing,1989(47):22~32[5]Pal N R,Pal S K.Entrop ic th resho lding[J].Signal P rocess2ing,1989(16):97~108[6]W ong A K C,Sahoo P K.A gray2level th resho ld selecti onm ethod based on m axi m um entropy p rinci p le[J].T he Insti2 tute of E lectrical and E lectronics Engineers T ransacti ons, 1989,S M C219(4):866~871[7]Zhang Yijun,W u Xueqing,X ia L iangzheng.Fast recurrencealgo rithm of i m age th resho lding using2D entropy[J].Pat2 tern R ecogniti on and A rtificial Intelligence,1997,10(3):259~264(in Ch inese)(张毅军,吴雪青,夏良正.二维熵图像阈值分割的快速递推算法[J].模式识别与人工智能,1997,10(3):259~264) [8]L iL iyuan,Gong J ian,Chen W einan.I m age segm entati onm ethod based on op ti m um1D p ro jecti on of2D gray h is2 togram[J].A cta A utom atica Sinica,1996,22(3):315~322 (in Ch inese)(李立源,龚 坚,陈维南.基于二维灰度直方图最佳一维投影的图像分割方法[J].自动化学报,1996,22(3):315~322)[9]Gong J ian,L i L iyuan,Chen W einan.I m age segm entati onm ethod based on F isher linear segm entati on of2D gray h is2togram[J].Pattern R ecogniti on and A rtificial Intelligence,1997,10(1):1~7(in Ch inese)(龚 坚,李立源,陈维南.基于二维灰度直方图F isher线性分割的图像分割方法[J].模式识别与人工智能,1997,10(1):1~7)[10]D avis L.H andbook of Genetic A lgo rithm[M].N ew Yo rk:van N o strand,1991[11]X ia L iangzheng.D igital I m age P rocessing[M].N anjing:Southeast U niversity Publish ing House,1999.223~228(inCh inese)(夏良正.数字图像处理[M].南京:东南大学出版社,1999.223~228)中国计算机学会全国第四次程序设计语言发展与教学学术会议征文通知全国第四次程序设计语言发展与教学学术会议定于2003年春季在江苏扬州召开.本次会议由东南大学承办,扬州大学、南京大学、武汉大学等院校协办,现将有关事项通知如下:一、征文范围A.程序设计语言历史、现状与发展B.面向对象语言及相关技术C.各类建模语言及其设计、实现与应用D.面向网络应用的程序设计语言(X M L,H TM L,PERL等)E.其它各种新型程序设计语言(包括逻辑型语言、函数型语言等)F.程序设计语言分析、评价与比较G.程序设计语言语法、语义与语用以及形式化描述技术与方法H.并发、并行与实时程序设计语言I.软件开发过程中各类描述语言(包括软件体系结构描述语言等)J.第四代语言与数据库语言K.程序设计语言教学、教材与课件L.各类写作语言与工具M.其它二、征文要求来稿一般不得超过6000字,并且未被其它会议、期刊录用或发表.为了便于正式出版论文集,来稿必须附中英文摘要、关键词与主要参考文献,注明作者姓名、工作单位、详细通讯地址(包括电子邮件地址与电话)与作者简介.欢迎电子投稿,来稿不退,请自留底稿.三、来稿地址南京东南大学计算机科学与工程系 徐宝文 邮编:210096电话:(025)3793977;E2m ail:bw xu@四、重要日期征文截止日期:2002年10月15日录用通知发出日期:2002年11月15日修改稿截止日期:2002年12月15日435计算机辅助设计与图形学学报2002年。
基于最大熵-方差模型的图像分割方法
Z A u — u L imi LN a ' u A o H NG Q n h i, I Gu— n , I B o h a ,H N B 。
( .C lg f o u r X nUn esyo c nea dT cn l y X n70 5 C ia 1 ol eo mp t , i i rt f i c n eh oo , i 10 4, h ; e C e a v i Se g a n
me t t n. na i o
Ke r s: g e me tt n;ma i m ai c t e lse ;ma i m nr p y wo d i ma esg na o i xmu v ra eb we n cu tr n e xmu e to y;trs od h eh l
差 的阈值选择法 0 和基于最小类 内方差 的阈值选择
法 等。
就最大类 间方差而言 , 优点是算法简单 , 目标与 当
图像分割一直是 图像 工程 中的重 点 和热点 , 也是
图像 分析和计算机视 觉 中的难题 。至 今 , 出 的分割 提
背景 的面积相差不 大时 , 能够很 有效 地对 图像进行 分
2 ol eo c ne X nU ie i f c neadT cn l y X 10 4, hn ) .C l g f i c , i nvr t o i c eh oo , i 70 5 C a e Se a sy S e n g n a i
Ab t a t W h n t e a a o h r e n h a k r u d f ra ma e a e mo e d fe e t he p ro ma e t e me n i g y t e s r c : e h r ft e t g ta d t e b c g o n o n i g r r if r n ,t e r nc O s g nt ma e b h e a f a ma i m e we n c a s v ra c t o e l e a i l x mu b t e - ls a i e me d d c i s r p d y.So h v e e r h d t e r lt n b t e n o mai n e t p d v ra c n h n a e r s ac e h a o e we n i f r t n r y a a in e, e i o o n
基于量子最大熵多阈值算法的图像分割研究_张俊娜
激光与红外
No. 5
2013
张俊娜等
基于量子最大熵多阈值算法的图像分割研究
579
本文利用像素信息的最大熵, 结合多阈值分割 图像, 确定图像像素时, 选取符合这些像素但熵值最 在多阈值中通过量子比特信息选择 大的概率分布, 最优阈值, 这样较少运算量并且提高了图像的分割 精度。 2 2. 1 量子最大熵多阈值分割算法 最大熵 0 ~ 255] 把图像的每个像素灰度划分为[ 等级, 统计每个等级图像总像素数为 M, 则: Ni pi = M 255 ) ; N i 为第 i 个等级 其中,∑ p i = 1 , 等级 i∈ ( 0 ,
s =1 n
。1 - ω ij 为选择局部阈值的权
重。当某像点的灰度值与整体阈值 F all 相差较大, 即 F all - F ij 的值较大时, 说明此像点利用整体阈值 就能很容易判断为是背景或目标 , 此时应增大权重, 着重考虑用整体阈值对该点进行分割 。当像点的灰 度值与整体阈值相差较小, 即 F all - F ij 的值较小时, 说明此点利用较难分辨, 此时应减少权重, 着重考虑 用局部阈值对像点进行分割 算法步骤: ( 1 ) 为 F ( s) 选择一个初始估计值, 可以将它取 为图像中最大和最小灰度的中间值 ; ( 2 ) 使用阈值 F ( s) 分割图像, 灰度大于 p i 的像 素组成区域 G1 , 灰度小于 p i 的部分为 G2 ; ( 3 ) 计算 G1 和 G2 区域中像素的各自平均灰度 值 G1 和 G2 ; 2 ^ ( 5 ) 如果 F ( s) 与 F ( s ) 相等或者相差在规定的 范围内, 或者达到规定迭代次数, 则可将作为最终阈 值结果, 否 则 重 复 ( 2 ) 到 ( 4 ) 步 的 操 作, 直至满足 要求。 3 实验仿真 对一幅 1024 × 900 图像进行最大熵阈值分割 所 用 程 序 为 Matlab 7. 0 , 运 行 环 境 : CPU 为 处理 , 3. 6 GHz,内存 2048 MB , 操作系统 Windows XP, 硬 盘为 SATA2 接口。图 1 为原图, 图 2 是像素等级分 布图, 图 3 最大熵多阈值分割图, 图 4 最大熵单阈值 分割图, 图 5 最大熵双阈值分割图。 从图 2 中我们 lena 的图像灰度值主要在 155 左右, 可以看出, 大约 有 2600 个像素点, 根据像素点的数量划分不同区域 后选择最佳阈值。 ^ ( 4 ) 取新的阈值: F ( s) = G1 + G2 槡
(5)(b)图像处理-图像的二值化---最大熵
基于最大熵的阈值选取及图像分割在讲基于最大熵的阈值选取的具体算法之前先来简要介绍下相关原理。
熵:用来描述体系混乱度的物理量。
最大熵原理①:最大熵原理是在1957 年由E.T.Jaynes提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。
因为在这种情况下,符合已知知识的概率分布可能不止一个。
我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。
下面简单解释下最大熵原理:例:一个盒子中有三种小球,白球重量10g/个,红球重量20g/个,黑球30g/个,且三种球的重量占总重的比例分别为p1,p2,p3,盒子中球的平均重量为15g/个。
此时有约束条件为显而易见的是:在上述问题中有三个变量却只有两个约束条件。
此时必有无穷多组解满足已知约束,这些解就构成了一个随机变量的集合,而这个随机变量往往可以用一个概率密度分布函数来表示(显然这样的概率密度分布函数也有多个)。
而我们应该怎么选取呢?若假设满足已知约束条件的集合为A,在已知约束上再增加一个约束后,满足增加后的约束的集合为B,则必有B⊆A,即A出现的概率必然大于B。
这表明熵越大的决策在已知约束条件下出现的概率越大受到的其他位置约束条件越少。
这就是最大熵理论:熵值最大的理论即为最合理决策。
图像分割中最大熵的引入②:在图像分割中若假定以灰度级T分割图像,则图像中低于灰度级T的像素点构成目标物体(o),高于灰度级T的像素点构成背景(B)那么各个灰度级在图像分割后的两区域中的概率如下:O: (0<=i<=t) B:(t+1<=i<=255) 其中ni为图像中灰度级为i的像素点个数,nt为灰度级从0~t的像素点总和,N为图像总像素点,t为假定灰度阈值T。
此时O区熵: (0<=i<=t)B区熵: (t+1<=i<=255)令H=HB+Ho则根据最大信息熵理论在已知条件下要对图像做出分割的最佳决策即为最接近实际图像分割的理想决策。
最大熵阈值分割
最大熵阈值分割最大熵阈值分割是一种常用的图像分割方法,其目标是将一幅图像分割成多个具有相似特征的区域。
该方法通过选择合适的阈值对图像进行二值化处理,从而实现图像的分割。
通过最大熵原理,可以求解出最佳阈值,从而获取最优的分割结果。
1. 最大熵原理最大熵原理是一种概率模型的学习原理,它保守地学习未知模型的分布函数。
最大熵原理的核心思想是,在已知的条件下,选择熵最大的模型分布。
最大熵原理应用于图像分割中,可以用来寻找合适的阈值进行图像二值化,从而实现图像的分割。
2. 最大熵阈值分割步骤最大熵阈值分割方法的实现步骤如下:2.1 图像灰度化首先,将彩色图像转换为灰度图像。
灰度图像只保留一个通道,使得后续的计算更加简洁高效。
2.2 直方图统计对灰度图像进行直方图统计,获得每个灰度级别的像素个数。
可以得到图像的灰度分布情况。
2.3 求解最大熵阈值以直方图的灰度级别为横坐标,像素个数为纵坐标,绘制出直方图。
然后,通过最大熵原理,求解出最佳阈值,使得图像在该阈值下的熵最大。
2.4 图像二值化将图像根据最佳阈值进行二值化处理,得到分割后的图像。
根据像素的灰度值和最佳阈值的大小关系,将像素赋予不同的值或者像素被赋予不同的颜色,以实现区域的分割。
3. 最大熵阈值分割算法实例下面是一个最大熵阈值分割算法的实例,用于将一幅灰度图像分割成黑白两个区域。
import cv2import numpy as np# 图像灰度化def gray_scale(img):return cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 直方图统计def histogram(img):hist = np.zeros(256)for i in range(img.shape[0]):for j in range(img.shape[1]):hist[img[i, j]] += 1return hist# 求解最大熵阈值def find_threshold(hist):total_pixels = np.sum(hist)max_entropy = -1threshold = -1for t in range(256):w0 = np.sum(hist[:t+1]) / total_pixelsw1 = np.sum(hist[t+1:]) / total_pixelsif w0 == 0 or w1 == 0:continueentropy = -w0 * np.log2(w0) - w1 * np.log2(w1)if entropy > max_entropy:max_entropy = entropythreshold = treturn threshold# 图像二值化def binary_thresholding(img, threshold):binary_img = np.zeros_like(img)binary_img[img > threshold] = 255return binary_img# 主函数def main():# 读取图像img = cv2.imread('image.jpg')# 图像灰度化gray_img = gray_scale(img)# 直方图统计hist = histogram(gray_img)# 求解最大熵阈值threshold = find_threshold(hist)# 图像二值化binary_img = binary_thresholding(gray_img, threshold)# 保存结果cv2.imwrite('binary_image.jpg', binary_img)# 调用主函数main()4. 结果展示最终的分割结果将被保存为一副二值图像,其中黑色像素表示分割后的目标区域,白色像素表示分割后的背景区域。
基于遗传算法的最大熵阈值的图像分割_宋家慧
基于遗传算法的最大熵阈值的图像分割宋家慧(东南大学自动控制系,江苏省南京市210096)摘 要 图像阈值分割技术在图像分析和图像识别中具有重要的意义。
最大熵方法具有很多优点,但同时也存在弱点:需要大量的运算时间,特别是在计算多阈值时。
因此需要引入优化算法。
文中将遗传算法用于最大熵阈值的图像分割方法中,分别对一维及二维阈值分割的情况进行讨论,并提出了一种基于改进型遗传算法的最大熵阈值图像分割方法。
通过对几幅经典图像的分割结果对比,表明了基于遗传算法的最大熵阈值的图像分割方法可以有效地提高最大熵图像分割的计算速度,提高图像处理的实时性。
关键词:图像分割,遗传算法,阈值中图分类号:TN911.73收稿日期:2004 11 01;修回日期:2004 12 11。
0 引 言图像分割是图像处理和计算机视觉中基本而且关键的技术之一,其目的是将目标和背景分离,为后续的分类、识别和检索提供依据。
图像分割法包括阈值法、边缘检测法和区域跟踪法等。
其中图像阈值分割是一种广泛使用的图像分割方法。
目前,已有很多阈值分割方法,例如直方图阈值分割、类间方差阈值分割、最大熵阈值分割等。
最大熵阈值分割方法不需要先验知识,而且对于非理想双峰直方图的图像也可以进行分割。
但是在确定阈值时,尤其是确定多阈值时,计算量很大。
遗传算法(Genetic Algorithm)是一类借鉴生物界的进化规律演化而来的随机化搜索算法,是一种具有鲁棒性、并行性和自适应性的优化算法。
本文将以一维最大熵阈值法和二维最大熵阈值法为例,探讨如何利用遗传算法和改进型遗传算法进行最大熵阈值的选取。
1 最大熵阈值分割1.1 一维最大熵阈值分割将Shannon 熵概念应用于图像分割时,依据是使图像中目标与背景分布的信息量最大,通过分析图像灰度直方图的熵,找到最佳阈值。
对于灰度范围为{0,1, ,L -1}的图像,假设图中灰度级低于t 的像素点构成目标区域(O),灰度级高于t 的像素点构成背景区域(B),那么各概率在其本区域的分布分别为:O 区:p i /p t ,i =0,1, ,t ;B 区:p i /(1-p t ),i =t +1,t +2, ,L -1。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图象处理课程设计
题目:采用最大熵方法进行图像分割
班级:电信121
学号:3120412014
姓名:吴向荣
指导老师:王栋
起止时间:2016.1.4~2016.1.8
西安理工大学
源代码:
clear,clc
image=imread('C:\Users\Administrator\Desktop\图像课设\3.jpg');
subplot(2,2,1);imshow(image);title('原始彩图')
%% %灰度图
imagegray=rgb2gray(image); %彩色图转换为灰度图
subplot(2,2,2);imshow(imagegray);title('灰度图')
%计算灰度直方图分布counts和x分别为返回直方图数据向量和相应的彩色向量
count=imhist(imagegray);
subplot(2,2,3);imhist(imagegray);title('灰度直方图')
[m,n]=size(imagegray);
imagegray=fun_maxgray(count,imagegray,m,n);
subplot(2,2,4);imshow(imagegray);title('最大熵处理后的图')
%% 彩色图
% r=image(:,:,1);countr=imhist(r);r=fun_maxgray(countr,r,m,n);
% subplot(2,2,1);imshow(r);
% g=image(:,:,2);countg=imhist(g);g=fun_maxgray(countg,g,m,n); % subplot(2,2,2);imshow(g);
% b=image(:,:,3);countb=imhist(b);b=fun_maxgray(countb,b,m,n); % subplot(2,2,3);imshow(b);
b=0;
for z=1:3
figure
titleName = strcat('第',num2str(z),'通道灰度直方图');
titleName1 = strcat('第',num2str(z),'通道最大熵处理后图');
a=image(:,:,z);subplot(1,2,1);imhist(a);title(titleName)
countr=imhist(a);a=fun_maxgray(countr,a,m,n);
subplot(1,2,2);imshow(a);title(titleName1)
b=b+a;
end
figure,imshow(b);title('彩色各通道处理后叠加图')
最大熵方法进行图像分割的子函数:
function sample=fun_maxgray(count,sample,m,n) countp=count/(m*n); %每一个像素的分布概率
E=[];
E1=0;
E2=0;
L=256;
for th=2:L-1 %循环阈值
pth=sum(countp(1:th+1)); %计算对应阈值概率if countp(th)==0 %当阈值概率为0跳出当前循环continue;
end
for i=1:th
if countp(i)==0 %当前像素概率为0,跳出当前循环
continue;
end
E1=E1-countp(i)/pth*log(countp(i)/pth);
end
for i=th-1:L
if countp(i)==0
continue;
end
E2=E2-countp(i)/(1-pth)*log(countp(i)/(1-pth)); end
e=E1+E2;
E=[E e];
end
th=find(E==(max(E))); %找数组中最大值的阈值
%[ma,index]=max(E);
for i=1:m %对图像二值化
for j=1:n
if sample(i,j)>th
sample(i,j)=255;
else
sample(i,j)=0; e
运行结果:
其他图片比较:
THANKS !!!
致力为企业和个人提供合同协议,策划案计划书,学习课
件等等
打造全网一站式需求
欢迎您的下载,资料仅供参考。