基于遗传算法的医学CT图像数字化处理_齐从谦
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2002-07-15
基金项目:铁道部科研基金资助项目(J98Z126)
作者简介:齐从谦(1945-),男,安徽合肥人,教授.E 2mail :cqqi @
基于遗传算法的医学CT 图像数字化处理
齐从谦,甘 屹
(同济大学机械工程学院,上海 200092)
摘要:应用遗传算法,并在遗传操作中采取实数编码来代替二进制串编码技术,从而获得人体颌面骨CT 图像断层的最佳阈值,以作为对该图像进行数字化处理的主要参数,并使用Matlab 程序予以仿真实现.在此阈值基础上获得其边界曲线.
关键词:医学图像处理;阈值选取;下颌骨;遗传算法
中图分类号:TH 113;TP 242.6 文献标识码:A 文章编号:0253-374X (2004)06-0799-03
Studies on Mandible CT Image Digital Technique Based
on Genetic Algorithm
Q I Cong 2qian ,GA N Yi
(School of Mechanical Engineering ,Tongji University ,Shanghai 200092,China )
Abstract :The optimized threshold of the CT image of the mandible has been selected based on the ge 2netic algorithm by genetic operating with coding in real number instead of coding in binary system.Based on the threshold ,the figure curve of the human ’s lower jaw is obtained ,for the principal parame 2ters of digital processing and the program Matlab is used to simulate ,which is the base to the subse 2quent work of the medical imaging processing.
Key words :medical imaging processing ;threshold selecting ;mandible ;genetic algorithm
随着计算机技术和先进医疗器械、设备的迅速发展,X 射线机、CT 、核磁共振、DSA 等一些先进的检测和诊断手段越来越受到广大医务人员的重视和广泛使用,随之也产生了大量的医学影像和图像及其存储和查询的问题.因此,医学图像、影像的数字化处理和存储,成为医学临床上一个亟待解决的课题.
图像数字处理中的一个基本问题是阈值分割[1],目的是将图像按不同灰度值分割成相应区域以方便后继处理.阈值选取是阈值分割的前提,选取
不当,会影响目标的形状大小,甚至会使目标失落.阈值选取也就是在图像数据中寻优的问题.由于数字图像信息量大,如果不能利用有关知识来缩小搜索空间,则可能产生搜索的组合爆炸.近年来,国内外学者针对这一课题进行了广泛深入的研究,提出了多种阈值选取方法,但这些方法在不同程度上存在着执行效率低、易于陷入局部最优解等问题[2].因此,寻求一种高效的全局最优解的阈值选取方法
一直是人们所关注的问题.遗传算法(genetic algo 2rithm ,G A )是其中特别有效的方法之一[3,4].
第32卷第6期2004年6月
同济大学学报(自然科学版)
JOURNAL OF TON G J I UN IVERSITY (NATURAL SCIENCE )Vol.32No.6
J un.2004
1 遗传算法在阈值选取中的应用遗传算法(G A)是由美国学者H oland于1975年首先提出的.它体现了生命科学与工程科学的相互交叉、渗透和促进.G A受自然界生物进化过程的启示,借鉴自然选择和自然遗传的机理,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最优解.这是一种随机的全局多点搜索算法,主要特点是群体搜索策略和群体中个体之间的信息相互交换.G A从任一初始化的群体出发,通过随机选择、交叉和变异等遗传操作,使群体一代一代地进化到搜索空间越来越好的区域,直至达到最优解点.G A的主要优点是简单、通用、鲁棒性强,适用于并行处理,因而得到广泛应用.
1.1 问题描述
图1是一幅用数码相机获得的人体下颌骨一个断层的CT图像.从图1可观察到,亮度(灰度值)最大的是下颌骨.它与其周围的软组织之间的边界并不明显,有一个灰度值变化幅度平缓的过渡区.要将下颌骨与背景区分开,必须科学、准确地确定其边界曲线,这首先就要选择一个恰当的“阈值”.用MA T2 LAB程序将图1的灰度值量化,其范围是[0,1],可得到其灰度直方图(如图2).在图2中,灰度值接近1的像素在下颌骨处.显然,阈值应当是在靠近1的
峰与谷相交之处.采用G A可确定此阈值
.
图1 人体下颌骨某
断层的CT图像Fig.1 A piece of CT
im age of the
m
andible 图2 图1中CT图像的灰度直方图
Fig.2 G ray b ar graph of
the CT im age
1.2 遗传算法的应用
G A处理过程中包括5个基本要素,即编码、初始群体设定、适应度函数、遗传操作和G A控制参数.这里采用实数编码来代替二进制串染色体,以便更直接地描述问题的性质.
(1)遗传算法的3个操作算子
遗传操作是G A最重要的操作.选择、交叉和变异是遗传算法的3个主要操作算子.
选择操作的目的是从当前群体中选出优良个体,使它们有机会作为父代.选择依据是个体的适应度值.个体适应度越高,被选择的概率就越大.目前普遍采用的选择策略都是以与适应度成比例的概率来进行,比如赌轮策略、最佳保留策略、排序策略等.
交叉操作是遗传算法中最主要的遗传操作.在当前群体中按一定概率随机选出个体作为父代,父代经过杂交产生新的一代.新个体保留了双亲的部分基因,又引进了新基因.变异操作是十分微妙的遗传操作,要和交叉操作妥善配合,目的是挖掘群体中个体的多样性,克服有可能产生局部解的弊病.
遗传算法在搜索最优解的过程中,综合了定向搜索和随机搜索的优点.在遗传搜索的开始阶段,交叉运算因为随机产生的初始群体具有多样性而趋向于在大范围搜索.随着高适值解的获得,交叉运算趋向于在这些解的周围搜索.
选择算子采用适应度比例方法(又称赌轮法或蒙特卡罗法)选择.先计算各个染色体各自的适应度值及所有染色体适应度值总和.在[0,1]区间产生一个均匀分布的伪随机数r.从1号染色体开始,每个染色体的适应度值依次相加,当累加和大于等于r 时,最后加入的那个染色体即为要选择的个体.
交叉算子采用凸交叉中的平均交叉[3].即2个父代个体x1,x2作如下组合,产生子代:
x′1=λ1x1+λ2x2, x′2=λ1x2+λ2x1(1)其中,λ1=λ2=0.5.凸交叉产生的后代在二维空间位于实线段上.
变异算子采用动态变异[3],这是为提高精度,增加细调能力而设计的.对于父代X,若元素x k被选出作变异,则后代X′=[x1,…,x′k,…,x n],其中x′k是按如下2种可能选得的:
x′k=x k+Δ(g,x U k-x k)
或x′k=x k-Δ(g,x k-x L k
)
(2)其中:x′k是[x L k,x U k]中均匀分布的一个随机值.x L k 和x U k通常可取变量x k的上下界,一般可由约束域确定.函数Δ(g,y)返回[0,y]中的一个值,使得Δ(g,y)随g增加而趋于0(g为遗传代数).这个性质使得初始迭代时,搜索均匀分布在整个空间,而后期则分布在局部范围内.Δ(g,y)形式为
Δ(g,y)=y r1-g/G b(3)其中:r是[0,1]中的随机数,G是最大迭代次数,b是确定不均匀度的参数.经计算比较,本文取b为2.
控制G A处理效果的主要参数是群体规模和遗传操作概率.群体规模影响遗传优化的最终结果以及遗传算法的执行效率.群体规模大,可以维持个体
008
同济大学学报(自然科学版)第32卷
的多样性以防止陷入局部解,但会增加计算量,还可能影响个体竞争;而规模太小又限制了遗传算法的优化性能.群体规模一般取10~160,从灰度值大于0.6的像素点中随机抽取10个个体作为初始群体.
(2)遗传操作中的交叉概率和变异概率
交叉概率控制交叉操作的使用频度.高交叉率意味着个体更新快,达到更大的解空间,能降低取得非最优解的概率;但高性能模式遭破坏的可能性增大,并且搜索过多的解空间要耗费资源.交叉率过低,搜索会因探查范围小而迟钝.交叉率一般取0.25~1.00.
变异维持群体多样性,提供初始群体中没有的基因,或找回搜索中失落的基因.太低的变异率可能使一些有益基因不能进入选择;太高的变异率则使搜索趋于随机,子代继承不了父代的优良特性,算法失去自学习能力.变异率一般取0.05~0.30.
针对本研究的特点,并经取不同的数值进行实验比较,本文选取交叉率为0.3,变异率为0.1.停机准则之一是最大迭代次数G=20(在迭代20次后,已经达到理想的收敛结果),准则之二是当前群体平均适应度值和上一代的比值范围在[0.995,1.005]之间(相邻两代比值在此区间趋于收敛).
(3)准最优解的优化———最大类间方差计算
在图像处理中,G A寻优的解可能是最优解,也可能是准最优解.在处理下颌骨CT图像时,在G A 确定的阈值t的基础上,再在[t-0.1,1]之间进行一次最大类间方差计算,以得到最佳阈值.该方法把图像中的像素按灰度级用阈值t分成2类———C0和C1,C0由灰度值在[0,t]之间的像素组成,C1由灰度值在[t,j-1]之间的像素组成(j为图像灰度级数).类间方差用σ(t)2表示,则
σ(t)2=n
1
(t)n2(t)[p1(t)-p2(t)]2(4)式中:n1(t)为C0中包含的像素数;n2(t)为C1中包含的像素数;p1(t)和p2(t)为C0和C1中包含的像素的平均灰度值.t从0~1取值,而使得为最大时的t即为最佳阈值t3,即
t3=arg maxσ2B
t∈{0,1,…,g-1}
(5) 经过遗传算法的计算,得到最佳阈值为0.9686.在图2中,此阈值靠近1的峰与谷的相交之处.按此阈值对图1中下颌骨的CT图像进行二值化,结果如图3所示;再经过数学形态处理,获得边界曲线(图4).与CT图像(图1)中下颌骨比较,结果较理想.获得边界后,就可以进一步对边界曲线进行光顺处理[5].用同样方法处理另一幅人体下颌骨断层的CT图像(图5),得到阈值为0.9176,其二值图和边界曲线如图6a,b所示
.
图3 图1中下颌骨CT
图像二值图
Fig.3 Binary im age
of Fig.
1
图4 图3中二值图的
边界曲线
Fig.4 Edge of the binary
im age of Fig.
3
图5 人体下颌骨另一断层的CT图像
Fig.
5 Other piece of CT im age of the m andible
图6 二值图及边界曲线
Fig.6 Binary im age and the edge
2 结论
(1)在实际应用中,G A能快速有效地搜索复杂、高度非线性的多维空间.当复杂图像的灰度直方图中有多个峰谷时,其能快速选取最佳或准最佳阈值.
(2)在采用G A选取图像阈值时采用实数编码,可避免将图像灰度值转换为二进制串再进行操作,从而缩短编码长度,扩展搜索空间,并且符合思维习惯,易于操作,得到较理想的结果,为医学图像的后继处理打下了基础.
参考文献:
[1] 章毓晋.图像工程[M].北京:清华大学出版社,1999.
[2] 林 瑶,田 捷.医学图像分割方法综述[J].模式识别与人工
智能,2002,15(2):192-204.
[3] 玄光男,程润伟.遗传算法与工程设计[M].北京:科学出版社,
1996.
[4] Higuchi T.Ev olving hardware with genetic learing[A].Proc of S imu2
lated Adaptive Behavior[C].Boston:MIT Press,1993.98-101.
[5] 甘 屹,齐从谦,陈亚洲.基于遗传算法的曲线曲面光顺[J].同
济大学学报(自然科学版),2002,30(3):322-325.
(编辑:陶文文)
108
第6期齐从谦,等:基于遗传算法的医学CT图像数字化处理 。