基于颜色信息的显著目标识别与定位
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于颜色信息的显著目标识别与定位
发表时间:2019-02-22T13:39:35.683Z 来源:《防护工程》2018年第32期作者:周辉
[导读] 彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。
国家知识产权局专利局专利审查协作天津中心天津 300304
摘要:彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。本文运用伪彩色图像处理结合阈值处理法和反向投影法对含有三个LED区域的彩色图像进行识别与定位,并比较了它们的优缺点。通过比较发现,阈值处理法处理速度较快,但精度不高。反向投影法检测LED区域定位较准,但是处理时间过长。
关键词:彩色图像;二值化;伪彩色处理;识别定位
1 引言
现如今,彩色图像在图像处理技术方面受到了越来越广泛的关注。在图像处理中,彩色的运用受到两个主要因素的推动。第一,彩色是一个强有力的描绘子,它常常可简化从场景中提取和识别目标的过程;第二,人可以辨别几千种彩色色调和亮度,但相比之下只能辨别几十种灰度色调。第二个因素在人工图像分析中特别重要。文献[1]中高健等人提出了基于彩色的SIFT特征点提取与匹配,很好地解决了形状相似但颜色不同物体的识别与定位。本文基于图像颜色信息,通过伪彩色图像处理结合阈值处理法和反向投影法对彩色图像进行识别与定位,对二者的优缺点进行了比较。
2 彩色模型与伪彩色处理简介
2.1 RGB彩色模型简介
运用彩色模型(也称为彩色空间或彩色系统)的目的是在某些标准下用通常可以接受的方式方便地对彩色加以说明。本质上,彩色模型是坐标系统和子空间的说明,其中,位于系统中的每种颜色都由单个点来表示。
该模型基于笛卡尔坐标系。所考虑的彩色子空间是立方体, RGB原色值位于3个角上;二次色青色、深红色和黄色位于另外3个角上,黑色位于远点处,白色位于离原点最远的角上。在该模型中,灰度沿着连接这两点的直线从黑色延伸到白色。在这一模型中的不同颜色是位于立方体上的或立方体内部的点,且由自原点延伸的向量来定义。
2.2 HSI简介
RGB系统与人眼强烈感知红、绿、蓝三原色的事实能很好地匹配。但是,RGB模型不能很好地适应实际上人解释的颜色。例如,通过用给定的组成其颜色的每一原色的百分比不能给出一辆汽车的颜色,此外,彩色图像并不是由3幅原色图像形成的单幅图像。因此引入了色调、饱和度、亮度模型,即HSI模型。
2.3 伪彩色处理简介
所谓伪彩色处理,就是将图像中黑白灰度级编为不同的彩色,分层越多,人眼所能提取的信息也多,从而达到图像增强的效果。伪彩色图像处理技术不仅适用于航空摄影和遥感图片,也可用于X光片及韵母的判读等处理中。伪彩色图像处理方法有三种:第一种是把真实景物图像的像素逐个地映射为另一种颜色,使目标在原图像中更突出;第二种是把多光谱图像中任意三个光谱图像映射为可见光红、绿、蓝三种可见光谱段的信号,再合成为一幅彩色图像;第三种是把黑白图像,用灰度映射或频谱映射而成为类似真实彩色的处理,相当于黑白照片的人工着色方法。
3 基于颜色信息的显著目标识别与定位
3.1 像素在RGB彩色模型下的表示
在RGB彩色模型中表示的图像由3个分量组成,每种原色一幅分量图像。考虑一幅RGB图像,其中每一幅红、绿、蓝图像都是一幅8比特图像。同样地,每一个图像中的像素也由r, g, b三个值表示,
其中,p代表彩色图像中的像素点,r, g, b分别代表该点的RGB分量。
3.2基于阈值处理的彩色图像分割与定位
彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用。本文中基于RGB空间对彩色图像进行分割。对于给定一个感兴趣的有代表性彩色的彩色样点集,可得到我们希望分割的颜色的平均估计。分割的目的是将给定图像中的每个RGB像素分类,即在指定的区域内是否有一种颜色。
3.2.1 单个LED区域的图像二值化
建立大小为151张含有LED灯的样本库,对样本库进行遍历,得到实验结果如图所示,LED所在区域为红色,设置阈值为r=160,g=147,将在本范围的像素点变为白点,不在此范围内的点变为黑点,从而对彩色图像完成分割,
3.2.2 多个LED区域的图像二值化
实验中采用三种不同颜色的LED,因此赋予了三个LED区域不同的“颜色编号”。然后对每个LED区域分别进行二值化。再分别给每个区域赋予不同的颜色,这样的处理方式,有利于后期对每个LED所在区域进行定位并得到坐标。
3.3 LED区域的定位
3.3.1 单个LED区域的定位
本文中采用统计的方法,在图像二值化后,通过统计图像每行每列白色像素点个数来表示LED区域的位置。原理如图所示,
其中,b(xi)表示在位置xi上像素对应的直方图第b(xi)个bin,直方图共m个bin,qu表示第u个bin的值。
查找的方式就是不断的在输入图像中切割跟模板图像大小一致的图像块,并用直方图对比的方式与模板图像进行比较。
实验平台为Microsoft Visual Studio 2010, 处理器为Intel(R) Core(TM) i5-5200U CPU@2.20GHz,安装内存为4.00GB,64位win8操作系统。最终实验可以正确识别靶标坐标。
5 实验结果对比
利用阈值处理的彩色图像分割被广泛应用,而提高分割的精度一直是一大难题。从实验结果可以看出,采用固定阈值的图像分割对光照变化的鲁棒性不好,接下来会用自适应阈值和卷积神经网络进行图像二值化,希望达到更好的效果。而反向投影法基于HSI空间,对LED 等区域识别比较准确,但是由于搜索次数太多,导致处理的速度较差,后期希望通过图像按块匹配的方法解决这一问题。
参考文献
1.高健, 黄心汉, 彭刚, 王敏, 吴祖玉. 基于彩色的SIFT特征点提取与匹配[J]. s计算机工程与应用, 2007, 43(34): 10-15
2. 林开颜, 吴军辉, 徐立鸿. 彩色图像分割方法综述[J]. 中国图像图形学报, 2005, 10(1): 1-10
3. 代煜, 周海锋, 王萌, 张生, 金纬. 基于HSI彩色空间模型的域替换降噪算法[J]. 计算机工程, 2011, 37(24): 10-15