生物视觉仿生在计算机视觉中的应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2008205214;修回日期:2008207204 基金项目:国家自然科学基金资助项目(60575013);西北工业大学科技创新基金项目
(2008KJ02011)
作者简介:王红梅(19772),女,宁夏灵武人,副教授,博士后,主要研究方向为图像处理、计算机视觉及视觉仿生等(hai pw @nwpu .edu .cn );李言俊(19442),男,河南台前人,教授,博导,主要研究方向为自动控制理论及应用、导弹精确制导、仿生技术、图像处理与目标识别技术等;张科
(19682),男,江西樟树人,教授,博导,主要研究方向为嵌入式系统开发及应用、自动控制理论及应用、成像制导技术与视觉仿生技术等.
生物视觉仿生在计算机视觉中的应用研究
3
王红梅,李言俊,张 科
(西北工业大学航天学院,西安 710072)
摘 要:探讨了生物视觉仿生在计算机视觉中的应用,重点研究了鲎复眼、蝇复眼、人眼视觉及猫视觉皮层的仿生技术。

结果表明,生物视觉仿生为计算机视觉的研究提供了可行和有效的途径。

关键词:生物视觉仿生;侧抑制;对数极坐标变换;脉冲耦合神经网络
中图分类号:TP391 文献标志码:A 文章编号:100123695(2009)0321157203
App licati on of bi o 2visi on bi onics on computer visi on
WANG Hong 2mei,L I Yan 2jun,ZHANG Ke
(College of Astronautics,N orthw estern Polytechnical U niversity,X i ’an 710072,China )
Abstract:This paper discussed the bi o 2visi on bi onics and its app licati on on computer visi on .Researched li m ulus ’s visi on,
flies ’s visi on,hu man ’s visi on and cat ’s visual cortex p ri m arily .Experi m ent results show that bi o 2visi on bi onics p r ovide a fea 2sible and effective app r oach f or the research of computer visi on .Key words:bi o 2visi on bi onics;lateral inhibiti on;l og 2polar transf or m;pulse coup led neural net w ork (PCNN )
近二十多年来,计算机视觉技术已用于目标检测、视觉导航和导弹的精确制导等众多领域,但实际应用中,计算机视觉在目标检测、位置估计、目标跟踪和信息处理的实时性等方面仍存在很大的局限性。

计算机视觉理论的核心是信息处理,目前已有数以千计的图像处理算法,许多视觉任务如边缘检测、空间位置估计和运动跟踪等对于生物来说是非常简单的任务,但对于计算机来说仍是一个尚未很好解决的问题。

因此探索生物视觉仿生在图像处理、目标检测、运动估计及跟踪中的应用具有非常重要的意义,也是国内开展研究工作非常有限的课题。

 鲎复眼仿生技术
对海洋动物鲎的复眼,Hartline 等人曾进行了长达四十多年的研究工作,提出了“侧抑制野”的概念,并因此于1967年获得了诺贝尔医学及生理学奖。

侧抑制是神经系统信息处理的基本原则之一。

它成功解释了马赫带等一系列视觉现象,在视觉信号的预处理和传输阶段,侧抑制原理被认为起着关键的作用。

概括而言,相邻神经元之间存在抑制作用,双神经元的抑制模型如图1所示。

20世纪40年代以来,研究者们根据各自不同的研究对
象,在生理实验的基础上提出了各种数学模型来解释侧抑制引起的现象,如马赫带现象。

这些模型大多采用了墨西哥草帽型曲线、双曲线、高斯曲线等权函数的分布。

侧抑制在图像处理中的主要功能有[1]:a )检测图像的边框,突出边缘,增加反差;b )抑制空间低频部分,相当于高通滤波器,这样很大的输入变化范围压缩到网络本身的动态范围之
内,因而对均匀光照起到亮度水平适应作用,把亮度适应机制
和边框突出机制结合起来;c )对屈光系统所引起的缺陷的成像模糊进行补偿,使模糊的图像又重新变得清晰。

图2是不同算法边缘提取的结果。

其中:a )为原始的红
外图像;b )为侧抑制增强后边缘提取的结果;c )为拉普拉斯—高斯增强后的边缘提取结果;d )为Canny 算子边缘提取的结果。

从实验结果来看,侧抑制网络不仅可以提高图像的相关性,而且所处理的结果比较自然,灰度表现力好,符合人眼的视觉感受,如果将其置于图像处理环节,可以更好地提取图像中的信息。

 蝇复眼仿生技术
几十年来,昆虫的视觉机理一直是许多国家的视觉研究工作者热衷选择的极具诱惑性和挑战性的一个重要课题。

这是因为由较小的神经元组成的昆虫视觉系统虽然简单,但却能出
第26卷第3期2009年3月 
计算机应用研究
App licati on Research of Computers Vol .26No .3Mar .2009
色地完成视觉检测任务,尤其对运动的检测更是如此。

蝇作为具有神经重叠形复眼且能快速运动的双翅目昆虫,能高效、实时地对运动环境进行感知和评估,目前还没有一个人工系统能与之相比。

蝇的复眼是由3000多只小眼组成的两个半球对称地分布在蝇头部的两侧,半球中的每一只小眼都像一个成像制导中的探测器,具有一定的探测角度,但半球中的小眼组合起来就可以探测半球视场中的目标,而左右两个半球合起来便可进行全方位的目标探测。

蝇具有卓越的视觉系统和飞行控制系统,能检测相对于环境的运动,不断地校正以稳定其飞行路线,同时能够对目标定位,并具有跟踪或截击正在飞行的目标的能力。

它们可以识别一些特定视觉图形,甚至可以区别视觉的质地或分辨图像背景。

蝇的这些特殊功能是由两个独立的并行通道完成的,即大场景系统和小场景系统。

大场景系统在视网膜图像的低频偏移情况下产生扭矩响应,所产生的扭矩用于消除在飞行过程中因空气扰动和自身飞行动力失衡等原因所形成的意外偏差,减少相对于环境的旋转,稳定其飞行路线;而小场景系统则在视网膜图像相对高的振动频率下对小的目标产生响应,响应过程中的尖峰在图像背景分辨行为中意味着目标被检测,从而转向环境中的物体以实现对目标的分辨和凝视。

在蝇复眼仿生技术的研究中发现,蝇复眼视觉系统具有近360°的视场角,其视觉的最大特点就是具有大场景系统和小场景系统两个并行信息采集处理通道。

大场景系统获取周边大环境区域的环境特征,控制其飞行路线;而小场景系统完成目标识别与跟踪任务。

但在进一步研究时发现,在同一个导引头中同时建立大场景系统和小场景系统是比较困难的[2]。

 人眼仿生技术
视觉系统完成了人类70%以上的信息获取,是人类最重要的感觉器官。

人的视觉系统包括光学通道和神经通道,在人对周围事物的感知中也起到传感器的作用。

人视觉系统是一个并行的多通道系统,不同的通道分别承担着不同的信息传输和处理功能。

人视觉系统这种复杂的并行结构,在基于特定目标的视觉算法及复杂的多通道特征并行计算方面给出了一个新的启发,可以考虑将这种多通道特征用于多波段成像的智能化信息处理,其典型的应用是双波段成像的图像融合。

此外,在导弹成像制导方面,人眼视觉仿生也有广泛的应用[3],如光电目标信息检测、估计与跟踪技术等,探索将人眼视觉原理中的一些机制应用于图像信息的获取、检测、运动估计和目标跟踪。

目的是提高图像数据处理的效率和质量,改善成像制导导引头在目标检测、运动估计和跟踪中的准确性和抗干扰能力。

人眼视网膜中的感受器单元及节细胞的分布是非均匀的,在窝区高度密集而周边稀疏,因而视觉信息的获取也是非均匀的;同时,视网膜与皮层间的映射也呈现非均匀特征,使得视觉信息的处理也具有非均匀性。

这种空间非均匀信息的获取与处理方式被称为空间变分辨率机制。

配合注意力机制,通过有意识的眼动,人眼总把窝区对准感兴趣的区域。

这就使得人眼在具有广阔视野的同时又具有局部高分辨率,可以使人在对感兴趣的目标保持高分辨率的同时又能对视野的其他部分保持警戒。

这既为解决同一导引头中同时建立大场景系统和小场景系统提供了一条途径,也为多目标跟踪研究提供了一个很好的参考模式,可以较好地解决目标跟踪研究中的视场、分辨率和实时性三者之间有效性的矛盾问题。

图3给出了视网膜单元的非均匀排布。

成像制导,包括红外、可见光和S AR图像制导,是目前公认的先进无人自主式武器的精确制导方式。

成像制导的目标识别方法主要是将武器导引头的实时观测图像与所存储的目标图像进行相似度分析,检测判别出所要攻击的目标,是一个极其复杂的过程。

导引头所存储的目标图像往往是用侦察卫星等其他工具所拍摄的图像,而导引头所实时观测的图像与所存储的目标图像之间往往存在着高度、亮度、旋转角度、距离、拍摄工具等差异,给图像的相似度分析带来很大困难,影响了导引头对目标探测和识别的准确度。

通过对人眼空间变分辨率机制的研究,发现目标的尺度与旋转变化映射到对数极坐标变换阵中则表现为目标区域的横向和纵向的平移[4]。

就目标边缘图而言,尺度与旋转的影响只是目标边缘曲线的平移,目标边缘曲线形状并不改变,而这种平移量通过移位匹配算法可简便得到。

有效利用对数极坐标变换的这种图像尺寸和角度不变性为解决成像制导中的目标识别提供了一种有效的算法。

图4分别给出了目标存在尺度及旋转变化情况下的对数极坐标变换图。

其中:(a)为原始的目标图像;(b)为(a)中的目标放大1.5倍后的图像;(c)为(a)中的目标逆时针旋转45°的图像;(d)~(f)分别为与(a)~(c)对应的对数极坐标变换图。

可以看出,目标尺度变化相当于映射变换图上下移动数个单位,旋转变化相当于映射变化图左右移动数个单位,因而利用对数极坐标变换的尺度和旋转不变性可提高目标识别的精度并缩短识别时间。

 猫视觉皮层仿生
哺乳动物的视觉信息处理过程已经进化到高度完美的阶段。

脉冲耦合神经网络(PCNN)是由Eckhorn为解释猫大脑视觉皮层中实验所观察到的与特征有关的神经元同步行为现象而提出的[5]。

PC NN不同于传统的人工神经网络,它是一种单层神经网络模型,适合于实时图像处理环境。

PC NN是由若干个PC NN的神经元互连所构成的反馈型网络,每个神经元由三个部分组成,即接收、调制和脉冲产生,如图5所示。

可以将其解释为:PCNN神经元接收反馈输入F
ij [n]和链接输入L ij[n];然后在其内部神经元活动系统形成内
部活动项U
ij
[n];当U ij[n]大于动态门限T ij[n]时,PCNN产生
输出时序脉冲Y
ij
[n]。


8
5
1
1
・计算机应用研究 第26卷
PCNN 的原理用数学公式表达为
F ij [n ]=e -αF F ij [n -1]+S ij +V F 6kl
M ijkl Y k l [n -1](1)L ij =e -
αL
L ij [n -1]+V L 6kl
W ijkl Y kl [n -1]
(2)U ij [n ]=F ij [n ](1+βL ij [n ])(3)T ij [n ]=e -αT
T ij [n -1]+V T Y ij [n ]
(4)Y ij [n ]=
1 U ij [n ]>T ij [n ]0 U ij [n ]≤T ij [n ]
(5)
其中:下标ij 是神经元的标号;F ij (n )是ij 神经元在第n 次迭代时的反馈输入;S ij 为神经元的外部刺激;L ij (n )是神经元的链接输入;β是链接系数
;T 为阈值;U ij 是神经元的内部行为;
Y ij (n )则是第n 次迭代时ij 神经元的输出;M 和W 为神经元
之间的连接权系数矩阵;V F 和V L 分别是反馈输入和链接输入的放大系数;T ij 和V T 是变阈值函数输出和阈值放大系数;αL 、αF 和αT 分别为链接输入、反馈输入和变阈值函数的时间常数。

目前,PC NN 已经广泛应用于图像滤波、图像融合、目标检测与识别及图像分割等领域。

当用于图像分割时,PCNN 不同于传统神经网络模型的是它不需要训练就可实现分割。

图6给出了应用脉冲耦合神经网络进行图像分割的结果。

其中:
(a )为原始图像;(b )为图像分割结果。

从图可以看出,采用PC NN 可以获得较好的实验结果。

此外,由于PCNN 是单层神经网络,其图像分割的速度较快。

除了PCNN 外,人们通过将Eckhorn 和Rybak 模型的共性部分加以优化和交叉,得到了交叉视觉皮质模型,即I C M (intersec 2
ting cortical model )模型
[6]
,并将其用于变化检测、图像滤波及
图像分割等领域,取得了较好的结果。

 结束语
经过多年的进化,生物视觉系统具有了许多独特的优势。

本文探讨了生物视觉仿生技术在计算机视觉中的应用,该项研究为计算机视觉中诸多问题的解决提供了新的思路。

参考文献:
[1]王蜂,李言俊,陈鹰.基于侧抑制竞争原理提取图像边缘的方法
[J ].西北工业大学学报,1998,16(4):5362539.
[2]李言俊,张科.蝇复眼仿生技术在全方位成像制导中应用的探索
研究[J ].航空兵器,1999(2):35237.
[3]高阳,李言俊,张科.人眼视觉仿生在光电目标信息检测、估计和
跟踪技术中的应用[J ].航空兵器,2006(1):22225.
[4]王立,李言俊,张科.对数极坐标变换识别算法在成像制导中的应
用[J ].宇航学报,2005,26(3):3302333.
[5]JOHNS ON J L,P ADGETT M L.PCNN models and app licati ons [J ].
I EEE Tra n s on N eu
ra lN e t w o rks,1999,10(3):4802498.[6]徐志平,钟亦平,张世永.用于脉冲噪声图像的交叉视觉皮质模型
滤波[J ].计算机辅助设计与图形学学报,2007,19(6):6982702.
(上接第1147页)大小文字具有较好的识别效果,并对复杂背景
下的文字也起到了很好的分割效果,且有效地抑制了复杂纹理导致的误判。

文中方法只用了灰度信息,原因是大多视频中的色度空间经过采样、压缩,字体边缘不是很清晰。

但使用灰度空间也有一定的问题,即一些文字和背景的灰度并无太大的差别,特别是非人工的文字,相反色度空间上则可能有较好的效果。

因此如何结合亮度和色度上的信息进行更为准确的提取是值得深入研究的课题。

参考文献:
[1]JA I N A K,Y U B.Aut omatic text l ocati on in i m ages and video fra mes
[C ]//Pr oc of the 14th I CPR.W ashingt on DC:I EEE Computer Socie 2ty,1998:149721499.
[2]LY U M R,S ONG J i 2qiang,CA I M in .A comp rehensive method for
multilingual video text detecti on,l ocalizati on,and extracti on [J ].I EEE Tra ns o n C ircu its a nd Sys tem s f o r V i deo Te chno l o gy,2005,15(2):2432255.
[3]L I Hui 2p ing,DOER MANN D ,KI A O.Aut omatic text detecti on and
tracking in digital video [J ].I EEE Tran s o n I m age P r oce s s i ng,2000,9(1):1472156.[4]
CHEN Da 2t ong,ODOBEZ J M ,BOURLARD H.Text detecti on and recogniti on in i m ages and video fra mes [J ].P a tte rn R eco gniti o n,2004,37(3):5952608.
[5]黄剑,赵黎,杨士强.视频文字检测与多尺度定位算法[J ].清华大
学学报:自然科学版,2004,44(1):50253.
[6]W ang Rong 2r ong,J I N W an 2jun,WU L i 2de .A novel video cap ti on de 2
tecti on app r oach using multi 2frame integrati on [C ]//Pr oc of the 17th
I nternati onal Conference on Pattern Recogniti on (I CPR ’04).W a 2shingt on DC:I EEE Computer Society,2004:1052120.
[7]T OR I W AK J,Y OK O I S .D istance transfor mati ons and skelet ons of digi 2
tized p ictures with applicati ons [C ]//Pr oc of Pr ogress in Pattern Recogniti on .1982:1872264.
[8]
P LATT J C .A fast algorithm for training support vect or machines,MSR 2TR 298214[R ].US A:M icr os oft,1998.
[9]COLLOBERT R,BENGI O S .Support vect or machines for large 2scale
regressi on p r oble m s[J ].J ou rna l o f M a chi ne Le a rni ng R e se a rch,2001,1:1432160.

9511・第3期
王红梅,等:生物视觉仿生在计算机视觉中的应用研究。

相关文档
最新文档