基于颜色空间自适应阈值分割的白细胞自动分类方法[发明专利]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010946847.4
(22)申请日 2020.09.10
(71)申请人 天津大学
地址 300072 天津市南开区卫津路92号
(72)发明人 董娜 翟梦蝶 常建芳 陈杨
(74)专利代理机构 天津市北洋有限责任专利代
理事务所 12201
代理人 李丽萍
(51)Int.Cl.
G06K 9/00(2006.01)
G06K 9/46(2006.01)
G06K 9/62(2006.01)
G06T 7/11(2017.01)
G06T 7/136(2017.01)
(54)发明名称
基于颜色空间自适应阈值分割的白细胞自
动分类方法
(57)摘要
本发明公开了一种基于颜色空间自适应阈
值分割的白细胞自动分类方法,首先,结合颜色
空间信息的自适应阈值分割方法,用于处理颜色
不均,难以分割的白细胞图片,解决了细胞分割
中通常无法兼顾低计算量与高准确度的问题。
在
完成细胞分割后,从得到的细胞核和细胞的灰度
图像提取了包括几何,颜色和纹理特征在内的大
量细胞特征,并设计了基于CART的特征选择算法
来剔除初始特征集中的冗余特征,从而选择出最
有利于分类的特征子集,大大降低了无用特征对
分类效率的干扰。
最后,本发明中通过引入PSO对
SVM的两个超参数进行优化,
提高了SVM的分类性能。
本发明通过优化白细胞分类过程中的各个阶
段,
成功提高了白细胞的分类效果。
权利要求书1页 说明书8页 附图2页CN 112183237 A 2021.01.05
C N 112183237
A
1.一种基于颜色空间自适应阈值分割的白细胞自动分类方法,其特征在于,包括以下步骤:
步骤一、白细胞的自适应阈值分割:将要分割的白细胞图像从RGB颜色空间分别转换为灰度空间和HSV空间,得到该白细胞的灰度图像和HSV图像,从该灰度图像的灰度直方图中所有波谷处对应的灰度值中选择最小的灰度值作为分割阈值分割得到细胞核的灰度图像;从该HSV图像色调(H)分量的色调直方图中所有波谷处对应的色调值中,根据最后一个波峰和波谷的位置关系确定1至2个色调值作为分割阈值分割得到细胞的灰度图像;
步骤二、白细胞的特征提取与特征选择:首先,从步骤一分割得到的细胞核灰度图像和细胞灰度图像中分别提取如下特征构成白细胞特征,包括:基于图像灰度直方图的颜色特征,基于灰度共生矩阵的纹理特征和基于八链码的形态特征;然后,基于分类和回归树(CART)的特征选择算法得到上述白细胞特征的基尼(Gini)增益指数,最后,根据基尼(Gini)增益指数选择排名前十的白细胞特征组成最优特征子集;
步骤三、引入粒子群优化算法(PSO)优化支持向量机(SVM),构建粒子群优化算法-支持向量机(PSO -SVM)分类器,将上述步骤二得到的最优特征子集输入至所述粒子群优化算法-支持向量机(PSO -SVM)分类器,所述粒子群优化算法-支持向量机(PSO -SVM)分类器的输出即为白细胞的分类结果。
2.根据权利要求1所述的白细胞自动分类方法,其特征在于,步骤三中,构建粒子群优化算法-支持向量机(PSO -SVM)分类器的过程如下:
步骤3-1、粒子群优化算法初始化;
步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练支持向量机,根据所述支持向量机得到的分类准确率计算粒子群优化算法中粒子的适应度值,记录当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的适应度值更优,则更新当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-5重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息,至此完成粒子群优化算法-支持向量机(PSO -SVM)分类器的构建。
3.根据权利要求2所述的白细胞自动分类方法,其特征在于,粒子群优化算法-支持向量机(PSO -SVM)分类器构建完成后,将所述测试集输入至所述粒子群优化算法-支持向量机(PSO -SVM)分类器进行分类,得到测试集的分类结果,用以验证构建所得的粒子群优化算法-支持向量机(PSO -SVM)分类器的分类效果。
权 利 要 求 书1/1页CN 112183237 A
基于颜色空间自适应阈值分割的白细胞自动分类方法
技术领域
[0001]本发明涉及一种图像处理方法,具体涉及一种使用图像处理技术实现对白细胞的自动 分类检测。
背景技术
[0002]免疫系统是人体抵抗病原体入侵的疾病防御屏障,而白细胞则是免疫系统的重要组成 部分,通过吞噬和产生抗体来清除病原体。
白细胞主要分为嗜中性粒细胞、嗜酸性粒细胞、 嗜碱性粒细胞、淋巴细胞和单核细胞5大类[1]。
由于白细胞各有其生理功能,机体发生炎 症或其他疾病时会引起白细胞数量的变化以及各种类型白细胞所占百分比的变化,因而对 血液中白细胞总数及分类个数的统计,对医学诊断、判断是否患病、分析出患有何种疾病 以及严重程度等具有非常重要的意义,医院中对白细胞的检验一直是血检中的重要内容之 一。
传统的白细胞检测主要通过人工镜检和血检仪器两种方法。
但人工镜检检测方法对医 务人员的自身经验要求高、劳动强度要求大,医务人员容易产生视觉疲劳,使主观因素对 结果的影响更大而缺乏客观的衡量标准。
而血检仪器虽然解决了人工镜检效率低下的问题, 但是仪器对测试样本有很高的要求,并且分析仪价格较为昂贵,需要专业人士进行操作及 保养,不利于在乡镇医院和社区医院进行普及应用,因此急需更加高效准确的白细胞检测 分类方法。
[0003]而近年来,在医学图像处理领域,随着成像技术的极大进步与人工智能领域数字图像 处理技术的广泛应用,使用计算机图形学辅助医学诊断成为一大趋势,在宫颈癌细胞识别, 乳腺癌检测,肺癌检测,白细胞分类等多个医疗领域取得了一系列进展[2]。
白细胞图片中 通常包括白细胞,红细胞,血小板等,应用数字图像处理技术对其中的白细胞进行识别与 分类,主要包括以下三个步骤:首先进行图像分割,在白细胞图片中分割出目标白细胞; 然后从中提取出有效特征;最后将特征数据输入到分类器中进行分类计数。
[0004]图像分割的目的就是从白细胞图片中成功地切割出白细胞部分,为后续的特征提取步 骤提供必要的信息,而细胞图像复杂的背景信息以及染色光照等不确定因素会给分割带来 很大困难。
Safuan[3]使用Otsu算法执行分割过程,Osowski[4]开发了一种基于形态学操作 (例如侵蚀,膨胀,平滑和分水岭变换)的细胞分割方法。
虽然他们在细胞核的分割上都 达到了不错的效果,但是当图片模糊或背景信息过多时,这些基础的分割算法无法分割出 完整的白细胞,容易导致细胞质特征的丢失。
Zheng[5]根据凹度分析将K-means聚类与接 触细胞分裂相结合,以生成一个粗糙的WBC区域。
然后,将粗略的分割结果用作自动标签 来训练支持向量机(SVM)分类器,进一步对图像的每个像素进行分类,以获得更准确的 分割结果。
然而虽然这类复杂的分割方法可以提供更准确的分割结果,但是它们要么实施 成本高昂,要么需要大量的计算资源,给整个的分类系统造成了很大的负担。
[0005]细胞分割完成后,如何进行有效的细胞特征提取也一直是研究工作的重点。
一般来说, 对于白细胞的特征提取主要是依据检验科医生的经验来设计特征,比如白细胞的几何形态、 颜色和纹理信息,Osowski等人[6]便从这三个方面提取了164维的特征向量对白
细胞进行分 类,取得了一定的效果。
理论上来讲,提取的特征越多越有可能找到最有利于细胞分类的 有效特征,但是实际上特征数据过多并不能保证更好的分类效果。
因为在提取出的的初始 特征中通常存在许多无效甚至有害的冗余特征,这不仅增加了硬件开销影响了分类效率, 严重的还会降低分类的准确率。
为了解决这些问题并以最少的特征数获得最高的识别精度, 有必要对初始特征进行特征选择。
[0006]分类器训练是白细胞分类过程中的最后一步。
在人工智能领域,常用的分类器有贝叶 斯,卷积神经网络(CNN),随机森林和SVM等。
尽管分类器的类型很多,但由于SVM操 作简单且在非线性问题上具有良好的性能,被广泛应用于各种医学图像分类问题。
虽然传 统的SVM模型已经表现良好,但是在求解最优化问题时仍然存在一些问题,如惩罚因子c 和径向基函数参数σ的大小对SVM的分类性能至关重要,但是由于参数调整过程费时又难 以操作,所以常常被忽略[7]。
[0007][参考文献]
[0008][1]M.Saraswat,K.V.Arya.Automated microscopic image analysis for Leukocytes identification:a survey.Micron,Volume 65,2014,pp.20-33.
[0009][2]S u z u k i K,Z h o u L P,W a n g Q.M a c h i n e l e a r n i n g i n m e d i c a l imaging.Pattern Recognition, 2017,63:465-467.
[0010][3]Alreza,ZKK.Karimian,A.Design a new algorithm to count white blood cells for classification leukemic blood image using machine vision system.2016 6th International Conference on Computer and Knowledge Engineering,2016.DOI: 10.1109/ICCKE.2016.7802148.
[0011][4]Safuan,SNM.Tomari,MRM.Zakaria,WNW.White blood cell(WBC)counting a na lys is in blood smea r imag es us ing va rio us colo r seg men ta tion methods.Measurement,Volume 116, 2018,pp.543–555.
[0012][5]X Zheng,Y Wang,GY Wang,JG Liu.Fast and robust segmentation of white blood cell images by self-supervised learning.Micron,Volume 107,2018, pp.55–71.
[0013][6]Osowski S,Siroic R,Markiewicz T,Siwek K.Application of support vector machine and genetic algorithm for improved blood cell recognition[J] .IEEE Transactions on Instrumentation and Measurement,2009,58(7):2159-2168. [0014][7]Huang Hh,Wang Zj,Chung Wy(2019)Efficient parameter selection for support vector machines.Enterprise Information Systems 13:916-932.
发明内容
[0015]针对上述现有技术,本发明提出一种基于颜色空间自适应阈值分割的白细胞自动分类 方法,可以改善当前在细胞分割,特征选择以及分类器训练中存在的一些问题,以期能够 快速有效地进行白细胞的自动分类计数。
采用本发明的方法能够准确地计算出每张图片中 白细胞的分割阈值,解决了细胞分割中通常无法兼顾低计算量与高准确度的问题。
本发明 中,针对冗余特征问题设计了一种基于分类和回归树(CART)的特征选择方法,用于从大 量的白细胞特征中进行冗余特征的剔除,从而选择出最有利于分类的特征子集,大大
降低 了无用特征对分类效率的干扰。
本发明中通过引入粒子群优化算法(PSO)对SVM的两个 超参数进行优化,提高了SVM的分类性能。
[0016]为了解决上述技术问题,本发明提出的一种基于颜色空间自适应阈值分割的白细胞自 动分类方法,包括以下步骤:
[0017]步骤一、白细胞的自适应阈值分割:将要分割的白细胞图像从RGB颜色空间分别转换 为灰度空间和HSV空间,得到该白细胞的灰度图像和HSV图像,从该灰度图像的灰度直 方图中所有波谷处对应的灰度值中选择最小的灰度值作为分割阈值分割得到细胞核的灰度 图像;从该HSV图像色调(H)分量的色调直方图中所有波谷处对应的色调值中,根据最 后一个波峰和波谷的位置关系确定1至2个色调值作为分割阈值分割得到细胞的灰度图像;[0018]步骤二、白细胞的特征提取与特征选择:首先,从步骤一分割得到的细胞核灰度图像 和细胞灰度图像中分别提取如下特征构成白细胞特征,包括:基于图像灰度直方图的颜色 特征,基于灰度共生矩阵的纹理特征和基于八链码的形态特征;然后,基于CART的特征 选择算法得到上述白细胞特征的基尼(Gini)增益指数,最后,根据基尼(Gini)增益指数 选择排名前十的白细胞特征组成最优特征子集;
[0019]步骤三、引入PSO优化SVM,构建PSO-SVM分类器,将上述步骤二得到的最优特征 子集输入至所述PSO-SVM分类器,所述PSO-SVM分类器的输出即为白细胞的分类结果。
[0020]进一步讲,本发明所述的白细胞自动分类方法,步骤三中,构建PSO-SVM分类器的过 程如下:
[0021]步骤3-1、PSO初始化;
[0022]步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练 SVM,根据所述SVM得到的分类准确率计算PSO中粒子的适应度值,记录当前粒子的局 部最优值和所有粒子的全局最优值;
[0023]步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
[0024]步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的的适应度值更优,则 更新当前粒子的局部最优值和所有粒子的全局最优值;
[0025]步骤3-5、重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息, 至此完成PSO-SVM分类器的构建。
[0026]PSO-SVM分类器构建完成后,将所述测试集输入至所述PSO-SVM分类器进行分类, 得到测试集的分类结果,用以验证构建所得的PSO-SVM分类器的分类效果。
[0027]与现有技术相比,本发明的有益效果是:
[0028](1)阈值分割是图像分割中应用最广操作最简单的分割方法,需要极小的计算代价, 而本发明提出的基于颜色直方图信息的计算分析可以自动选取出最适合细胞分割的阈值。
这样既保证了分割方法的低运算成本,同时又实现了高分割准确率。
观察图3与图4,以人 工分割结果作为参考,本发明最终在细胞核与细胞的分割上分别达到了95.98%和97.57% 的准确率。
[0029](2)特征越多越有可能包括最有利于分类的特征,但是同时也会存在很多无效的冗余 特征,CART特征选择方法可以从原始特征集中选择出对分类最有用的特征。
本发明中分别 使用33种初始特征以及10种选择出的特征进行了分类试验对比,在准确率只降低了不到 0.1%的同时,运行时间减少了大约32%,这证明本发明中的特征选择算法在保证准
确率的 前提下,确实大大较低了运算成本,提高了分类效率。
[0030](3)通过引入PSO算法对SVM的超参数进行全局寻优,有效地提高了白细胞分类过 程的准确率和效率,最终白细胞五分类达到了99.76%的高准确率。
附图说明
[0031]图1是本发明中白细胞分类的总体流程图;
[0032]图2是本发明中白细胞的特征数据二叉树分裂示意图;
[0033]图3是本发明仿真实验中的细胞核的分割结果示意图;
[0034]图4是本发明仿真实验中的细胞分割结果示意图。
具体实施方式
[0035]下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有 任何限制。
[0036]本发明的设计思路是:本发明提出了一种基于颜色空间自适应阈值分割的白细胞自动 分类方法。
首先,本发明对阈值分割算法进行了改进,设计了一种结合颜色空间信息的自 适应阈值分割方法,用于处理颜色不均,难以分割的白细胞图片。
随后,在完成细胞分割 后,提取了包括几何,颜色和纹理特征在内的大量细胞特征,并设计了基于CART的特征 选择算法来剔除初始特征集中的冗余特征。
最后,本发明中引入PSO对SVM的两个超参 数的调参过程进行优化,构建PSO-SVM分类器模型。
相对于现有技术,本发明通过优化白 细胞分类过程中的各个阶段,成功提高了白细胞的分类效果。
如图1所示,本发明所述的 白细胞自动分类方法,包括以下步骤:
[0037]步骤一、白细胞的自适应阈值分割:
[0038]阈值分割是图像分割中的经典方法,它利用图像中要提取的目标与背景在颜色上的差 异,通过设置阈值来把像素级分成若干类,从而实现目标与背景的分离。
本发明结合不同 颜色空间中细胞质和细胞核的差异表现,提出了一种基于颜色直方图的自适应阈值分割方 法。
如在细胞图片的灰度直方图中,其横坐标为灰度级,数值越小表示对应像素颜色越深, 纵坐标为具有相应灰度的像素的数量,该直方图可以近似地视为三峰结构,不同的峰面积 对应于图像的不同部分。
例如,第一个波峰面积应该对应于图像中最暗的部分,即白细胞 的细胞核。
显然,图像的分割阈值应取在波谷对应的灰度值处。
[0039]下面以一张图片为例,描述本发明中提出的自适应阈值计算过程:
[0040]在白细胞图片对应的灰度直方图中,j点为横坐标上的一点,即像素所属的灰度值,使 用两点中心差法计算j点的一阶导数,其中y j是灰度值j的像素数,而d j是j点的导数;[0041]d j=(y j+1-y j-1)/2
[0042]d j=(d j+1+d j+d j-1)/3
[0043]sign(x)是符号函数,其表达式为:
[0044]
[0045]通过查找一阶导数中的向上零交叉来检测波谷点:
[0046]sing(d j)<sing(d j+1)
[0047]通过查找一阶导数中的向下零交叉来检测波峰点:
[0048]sing(d j)>sing(d j+1)
[0049]对初始目标点附近的点进行高斯拟合,以确定最终的波谷点和波峰点。
[0050]使用提出的自适应阈值分割算法来确定每张图片中的分割阈值,本发明中,将要分割 的白细胞图像从RGB颜色空间分别转换为灰度空间和HSV空间,得到该白细胞的灰度图 像和HSV图像,从该灰度图像的灰度直方图中所有波谷处对应的灰度值中选择最小的灰度 值作为分割阈值分割得到细胞核的灰度图像;从该HSV图像H分量的色调直方图中所有波 谷处对应的色调值中,根据最后一个波峰和波谷的位置关系确定1至2个色调值作为分割 阈值分割得到细胞的灰度图像。
[0051]细胞核在灰度图像中通常表现为颜色最深的地方,与其他部分差异明显,因此在灰度 图像中实现白细胞的细胞核部分的分割。
[0052]细胞核分割过程如下:
[0053](1)计算灰度直方图中的所有波谷点相对应的横坐标,即对应的灰度值,然后选择最 小的灰度值作为分割阈值;
[0054](2)利用阈值分割获得细胞核的初步二值图像,然后采用形态学运算,包括腐蚀,膨 胀,填充和删除来完善细胞核形状。
[0055](3)由于随后的特征提取都是基于灰度图像,因此将二值图像用作掩模以最终获得细 胞核的灰度图像。
[0056]而针对整个细胞的分割要更为复杂一点,白细胞的细胞质部分通常容易与背景中红细 胞混淆,在RGB与灰度颜色空间中都较难被分割,但是由于白细胞整体与其他背景部分相 比更偏蓝紫色,它在HSV颜色模型的H分量中有突出表现,所以在色调分量下进行细胞的 分割。
然而,在观察所有白细胞图像之后,发现此时图像中的红细胞表现出两种不同的状 态。
[0057]第一种红细胞的色调偏向具有较大色相值的紫色,而第二种的色调偏向具有较小色相 值的橙色。
因此,针对这两种不同情况,采用了不同的分割策略。
[0058]对于第一种,需要确定两个阈值,当色调值位于两个阈值之间时,被认为属于白细胞。
[0059]对于第二种,只需要一个阈值即可进行分割。
问题的关键是确定图像阈值的数量和值, 利用直方图的峰值进行判断。
[0060]细胞分割的步骤如下:
[0061](1)计算直方图的所有波峰和波谷及其相应的色调值;
[0062](2)如果最后一个波峰出现在最后一个波谷之后的话,则判断为第一种情况,需要确 定两个阈值;
[0063](3)如果最后一个波峰出现在最后一个波谷之前的话,则判断为第二种情况,需要确 定一个阈值;
[0064](4)使用阈值分割获得初步的二值图像,然后进行形态学运算以完善细胞形状。
[0065](5)使用此二值图像用作掩模,以获得完整的白细胞灰度图像。
[0066]二、白细胞的特征提取与特征选择
[0067]细胞分割完成后,基于前人的工作基础,从形态、颜色和纹理方面进行了多组特征的 提取。
然而初始特征集中存在许多冗余特征,这些冗余特征将增加计算成本,从而降低分 类效率。
在本发明中,设计了一种基于CART的特征选择算法应用于白细胞特征选择。
[0068]在前人的工作基础上,从颜色,纹理和形态三个方面进行特征提取,本发明中,从步 骤一分割得到的细胞核灰度图像和细胞灰度图像中分别提取如下特征构成白细胞特征,包 括:基于图像灰度直方图的颜色特征:均值,方差,偏度,峰度,能量和熵;基于灰度共 生矩阵的纹理特征:能量,熵,对比度,相关性和逆差矩;基于八链码的形态特征:面积, 周长,圆形度,长宽比,矩形度和核质比。
最后分别从分割出的细胞核与细胞中提取了上 述特征,共获得了33个白细胞特征。
之后,使用CART特征选择算法从提取的上述的33 个白细胞特征中选择最优特征,得到了所有特征的Gini增益指数,最后,根据Gini增益指 数选择排名前十的白细胞特征组成最优特征子集。
[0069]该算法可以根据特定的测量标准自动选择分类特征并确定节点阈值。
[0070]执行过程如下:CART算法构造的决策树为二叉树,在每个节点上,根据最优特征从现 节点分裂为两个子节点,如果拆分后的数据集达到分类精度要求,便停止分裂。
否则,在 子节点处继续分裂。
[0071]CART使用Gini指数作为拆分标准,它反映了样本数据的“纯度”。
Gini指数值越小, 样品的“纯度”越高,分离样品就越容易。
假设样本集D包含k个类别,p k表示D中第k个 样本的比例,则D的Gini指数Gini(D)计算如下:
[0072]Gini(D)=∑k p k(1-p k)=1-∑k p k2
[0073]如图2所示,如果D根据特征A的某个可能值a被分裂为D L和D R两个样本集,|·|表 示样本集中样本的数量,那么此时,集合D的Gini指数Gini(D,A)定义为:
[0074]
[0075]Gini(D)表示集合D的不确定性,而Gini(D,A)表示根据特征A分割后的集合D的不确 定性。
因此,Gini(D)和Gini(D,A)之间的差可以用于衡量特征A对于集合D的分类效果。
由特征A引起的集合D的Gini系数增益Gain(A)定义为:
[0076]Gain(A)=Gini(D)-Gini(D,A)
[0077]由此可以得出结论,具有较大Gini增益值的特征对集合D的分类更有利,因为特征选 择的本质是减少集合D的不确定性。
可以通过其Gain(A)值判断特征的重要性。
[0078]三、引入PSO优化SVM超参数选择,构建PSO-SVM分类器,将上述步骤二得到的 最优特征子集输入至所述PSO-SVM分类器,所述PSO-SVM分类器的输出即为白细胞的分 类结果。
[0079]PSO的基本概念源自对鸟类觅食行为的研究,通过群体中个体之间的协作和信息共享 找到最佳解决方案。
其数学描述如下:假设搜索空间为M维,共有N个粒子,则第i个粒 子的位置x i和速度v i定义为:
[0080]x i=(x i1,x i2,...,x iM),i=1,2,...,N
[0081]v i=(v i1,v i2,...,v iM),i=1,2,...,N
[0082]在每次迭代搜索的过程中,k是迭代次数,粒子根据以下公式不断更新自己在第k
次迭 代中的速度和位置从而达到寻找全局最优解的目的。
其中ω是惯性因子,c1和
c2是 加速度因子,r1,r2∈[0,1]是随机数,r3是速度约束因子,是第i个粒子经历过的历史最优 位置,是所有粒子经历过的历史最优位置。
每个粒子的位置都是潜在的解决方案,其适 应度值由分类准确率确定。
[0083]
[0084]
[0085]本发明中,PSO被用于SVM超参数c和σ的全局寻优。
首先初始化PSO,将搜索空间 设置为2维,将粒子数设置为30。
惩罚因子c的初始搜索范围设置为[2^cmin,2^cmax], 并且内核参数σ的范围也为[2^σmin,2^σmax],其中cmin=-8,cmax=8,σmin=-8和 σmax=8。
在此范围内迭代更新粒子以搜索最佳参数,根据SVM的分类结果来评估粒子的 适应度,直到达到要求的分类精度或最大迭代次数时结束PSO寻优过程。
通过PSO算法, 可以获得参数c和σ的最优值。
[0086]本发明中,构建PSO-SVM分类器(即PSO-SVM分类器训练)的过程如下:
[0087]步骤3-1、PSO初始化;
[0088]步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练 SVM,根据所述SVM得到的分类准确率计算PSO中粒子的适应度值,记录当前粒子的局 部最优值和所有粒子的全局最优值;
[0089]步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
[0090]步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的适应度值更优,则更 新当前粒子的局部最优值和所有粒子的全局最优值;
[0091]步骤3-5重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息, 至此完成PSO-SVM分类器的构建。
[0092]在白细胞分类的过程中,首先输入训练集来训练分类器,通过重复试验,发现当c = 0.0037和σ=0.0063时,训练效果最佳。
因此,基于该参数组合构建了PSO-SVM分类器模 型。
最后,将测试集输入到训练好的PSO-SVM分类器以获得测试集的分类结果。
[0093]仿真实验
[0094]本发明建立了仿真实验来验证提出算法的准确性和有效性,所有仿真实验均在 MATLAB上完成。
从互联网上收集并制作了自己的白细胞图像数据集。
在经过了初步筛选 和处理后,将图片统一标准化为分辨率201×201的JPG文件。
最终得到了包含500张白细 胞图片的数据集,其中每种细胞100张。
基于此细胞数据集进行了仿真实验。
[0095]为了验证本发明提出的自适应阈值分割方法的有效性,将本发明实验的分割结果与人 工分割结果进行了对比,细胞核的分割结果如图3,细胞的分割结果如图4,从图中可以看 出,本发明的方法分割效果良好,与人工分割结果具有很高的一致性。
另外,本发明引入 了最常用的分割相似性度衡量标准Dice系数,在对细胞核与细胞的分割上分别得到了95.98% 以及97.57%的分割准确率,进一步证明了本发明的分割方法的有效性。
[0096]将提取出的特征数据集输入到PSO-SVM分类器进行白细胞的分类实验。
为了充分利用 样本数据,通过十字交叉验证法将数据集随机分为训练集和测试集,先输入训练集训练分 类器模型,然后输入测试集进行分类测试,最终在500张图片的数据集上使用10种细胞特 征实现了99.76%的分类准确率。
另一方面,为了验证CART特征选择方法对分类效率。