视觉检测系统的反馈机制研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将之与阈值向量 r(t)进行比较,得到误差向量 e(t)。比较操作
判断特征向量一个或几个分量是否满足特殊情况。若满足,
e(t)就按照该特殊情况的特殊求差函数确定;若不满足,就直
接求差。
(3)知识库
根据误差向量 e(t) 的所有分量进行推理,做出控制决策
向量 sgn1(t) 和 sgn2(t) 。即:
—197—
式,在专业知识的指导下,加强各模块之间的相互作用,构 成多层交叉的信息融合和反馈机制,提高系统的综合检测能 力和鲁棒性。
计算机图像处理技术的发展,使得计算机很容易从图像 中提取到颜色、亮度、边缘等特征信息,进行定量计算。但 图像信息受到视角、背景、光照、天气、噪声等的影响时, 图像特征量有较大的不确定性,计算机视觉系统的定量计算 很难适应。
【Abstract】Aiming at poor accuracy affected by noise and high complexity of calculating in computer vision theoretical framework guiding vision, a new humanoid vision of the closed-loop system model is put forward, a feedback mechanism and the guidance of high-level knowledge is introduced, and they are applied to vehicle license plate location system. Results show that the system not only can accurately locate vehicle license plate and have high fault tolerance, but also can effectively solve location problem under the circumstance of uneven illumination, depigmentation or complex environments interferences. 【Key words】computer vision; humanoid vision; feedback mechanism; vehicle license plate location
0.195 412
灰度分布密度
(a)晚上补光图像
0 50 100 150 200 255 像素灰度级
(b)晚上补光图像直方图 0.011 622
灰度分布密度
0 50 100 150 200 255 像素灰度级
(c)非晚上补光图像
(d)非晚上补光图像直方图
图 3 2 种类型的图像及其直方图
(2)比较器 比较器接收评价器输出的评价向量 y(t)(车牌特征向量),
—198—
的字符分割使用。 目前的车牌定位方法各有所长,但是存在着计算量大或
定位准确度不高等问题。针对这些问题,文献[3]提出一种基 于分级边缘间距的实时车牌检测方法,与同类方法相比,该 方法限制条件少、速度快、准确率高;但该方法并不能定位 到车牌褪色这一类型的图像。文献[4]提出一种基于修正思想 的车牌图像定位算法,但该方法对于复杂背景干扰的情况也 不能准确定位。为解决以上问题,本文运用上述模型作指导, 提出一种仿人视觉的车牌定位模型。 3.1 仿人视觉的车牌定位模型及实现
向量 e(t) 及其差分 Δe(t) 确定参数调节方向以及调节增量大
小,然后进行调节,同时限定调节次数,若在限定次数内无
法完成,则宣告该方法无效,选择其他方法。
知识库建成“树型”查询结构。其知识用二叉树保存,
根据反馈的信息快速地查询二叉树,找到参数如何调整,然
后调整参数。
(4)控制器
控制器用来增强图像,其接收判断器输出的信号 j(t) 和
第 36 卷 第 1 期 Vol.36 No.1
计算机工程 Computer Engineering
·人工智能及识别技术·
பைடு நூலகம்
文章编号:1000—3428(2010)01—0197—04 文献标识码:A
视觉检测系统的反馈机制研究
2010 年 1 月 January 2010
中图分类号:N945.12
罗三定,孙喜梅
if f (e(t)) > 0 then
sgn1(t) = a and sgn2(t) = b
(1)
这 2 个控制信号分别传递给控制器和感知器,指导其选
择合适的图像处理手段并为该图像处理手段提供参数。由于
同一种图像处理方法在不同参数下会取得不同的效果,采取
以下措施:对于同样的方法选用不同的参数,首先根据误差
本文提出仿人的闭环反馈结构视觉系统模型,使系统具 有适应各种情况的能力,如图 1 所示。
中间结果信息
信息 反馈
信息获取 ...
区域信息获取 理解决策
颜色信息 亮度信息
边缘信息
结果信息 评价
信息选择 方法参数选择 推理与抉择
选择调整
知识库
图 1 闭环反馈视觉检测系统结构
系统视觉分 3 个层次,即底层、中间层和顶层。 (1)底层 底层包括处理模块、分析模块和选择模块。处理模块负 责提取输入图像的颜色、亮度、边缘等特征,并构成特征向 量;分析模块根据上层的反馈信息、特征提取知识,调整处 理策略和参数;选择模块根据分析的结果选择预处理方案, 有选择地做图像增强处理,突出重要特征,排除或抑制干扰 特征。 (2)中间层 中间层的任务是实现对所提取信息的加工,获取目标的 整体信息,为理解决策和学习提供依据。整体信息由一个或 多个区域的描述组成,包括目标区域图像信息、区域的形状、 面积、中心以及多区域之间的关系等描述信息。通过综合底 层输出的特征信息获得特征模型。特征模型是这样一种状态 的集合,该特征状态为在系统性能指标的要求下针对识别问 题对系统输入采样信息空间划分出的各个区域。 (3)顶层 顶层是目标识别层。顶层通过综合底层和中间层的信息 运用知识进行推理,得出基于不同特征的决策,然后对所得 决策进行融合,并对融合结果进行评价。具体理解策略的选 择由知识库中预先确定的先验知识给出,并能根据信息反馈 及评价的结果做出相应改变。 该模型是一种具有二次映射关系的信息处理过程,可用 产生式规则表示为
(中南大学信息科学与工程学院,长沙 410083)
摘 要:针对现有计算机视觉理论框架在指导视觉问题中很难克服精度差、受噪声影响大、计算复杂性高的问题,提出仿人的闭环视觉系 统模型,引入反馈机制和高层知识的指导,并将其应用到车牌定位系统中。研究结果表明,以该模型实现的仿人视觉车牌定位系统容错性 好、准确率高,可以有效地解决光照不均、牌照褪色,以及复杂背景干扰等情况下的车牌定位问题。 关键词:计算机视觉;人类视觉;反馈机制;车牌定位
1 概述
计算机视觉理论和视觉系统技术之间存在较大距离。现 有的视觉系统都是在特定条件或特定知识的指导下,检测特 定目标的特征,完成对特定世界的认知。然而,这种从特定 认知任务出发的视觉系统对开发者的经验和应用条件过分依 赖,适应性和鲁棒性不高。
计算机视觉理论经过 40 多年的发展,相继出现了一些计 算机视觉的理论框架,计算机视觉的研究也从二维发展到三 维,从串行发展到并行。文献[1]的视觉计算理论立足于计算 机科学,系统地概括了心理生理学、神经生理学等方面已取 得的所有重要成果,但该理论并不完善,其所建立的视觉处 理框架基本上是一个自下而上、完全由资料驱动的、单向无 反馈的系统,并没有足够重视知识的应用。另外,视觉研究 是否真的需要重建、信息处理是否全部需要定量完成等,也 是存在的问题之一。相对于前者,Lowe 提出了基于知识的视 觉理论框架;基于后者有学者提出了基于目的的主动视觉理 论框架。基于知识的视觉理论框架尽管引入了反馈,强调高 层知识对视觉的指导作用,但它否认计算视觉理论,认为人 类视觉只是一个识别过程。主动视觉理论框架是根据 Gibson 的生态学理论[2]提出的。主动视觉强调视觉系统应该基于一 定的任务和目的,同时视觉系统应该具有主动感知的能力。 虽然在目的视觉系统框架中以视觉任务为先导,引入了知识 的学习和利用,但是目的视觉理论框架中也缺乏反馈和高层 知识的指导。这种无反馈的结构不符合生物视觉系统,同时 在视觉问题中将很难克服精度差、受噪声影响大、计算复杂 性高的问题,也缺乏对问题和环境的自适应性。
人类视觉感知是一个鲁棒性很强的、能抵御实际中各种 变形和噪声干扰的具有良好容错性的识别系统。英国科学家 Zeki 指出人类视觉系统使用精巧的策略或办法来统一不同性 质的信息,即在几个不同水平上相互作用来多级地处理复杂 的视觉信息,感知周围多彩生动的视觉世界。在物体某些信 息缺失(如褪色、形状残缺)的情况下,人类仍然能够准确无 误地识别物体。这是因为人类有先验知识的指导且在其指导 下能够进行缺失信息的补充或者依据其他信息进行判断。
知识库给出的决策向量 sgn1(t) ,得到各方法中相应的阈值,
完成相应的图像增强工作。其功能包括晚上补光图像和非晚
上补光图像的增强。
由于晚上补光图像的灰度直方图中往往有接近于零的灰
虽然当前人类通过视觉感知世界的机理尚不完全清楚, 在计算机视觉系统理论中引入知识指导、综合、反馈机制却 是非常必要的。 2.2 闭环反馈视觉系统
仿人计算机视觉并不是机械地模仿人类视觉,而是要从 系统的处理目的出发,模仿实现人类识别事物的信息处理模
作者简介:罗三定(1955-),男,教授,主研方向:图像处理,工业 视觉系统;孙喜梅,硕士研究生 收稿日期:2009-11-05 E-mail:ruiping_sun@tom.com
Feedback Mechanism Investigation on Visual Detection System
LUO San-ding, SUN Xi-mei
(School of Information Science and Engineering, Central South University, Changsha 410083)
本文从分析人类视觉的特点入手,给出人类视觉系统的 并行处理机制模型,在分析该模型及计算机视觉与人类视觉
的差别的基础上,提出仿人的闭环视觉系统模型,并将其应 用到车牌分割系统中。
2 闭环反馈视觉检测系统结构
2.1 人类视觉的特点 人类的视觉系统是一个闭环的多重反馈信息处理系统。
作为人类视觉的核心,大脑具有高度的视觉信息理解知识与 智慧,其特点是能够运用丰富的知识、经验与方法,具备针 对性很强的有效信息选择和灵活的处理手段调节能力,能够 在先验知识的指导下对信息进行主动获取、合理利用、适时 取舍、方法试探、分析评价、实时反馈指导。
仿人视觉的车牌定位模型由判断器、比较器、知识库、 控制器、感知器、评价器及原始图像共同构成,如图 2 所示。
判断器 j(t)
r (t)
e(t)
sgn1(t)
比较器 知识库
控制器
原始 图像
增强图像
y(t)
sgn2(t)
评价器
感知器
识别结果
图 2 仿人视觉的车牌定位模型
(1)判断器 判断器输出的结果信号 j(t) 由控制器接收。 通过大量实验发现,晚上车辆补光图像的直方图右侧灰 度分布密度非常小,而其他车辆图像的灰度直方图则无此规 律。如图 3 所示,算法对直方图中 80~255 的灰度值之间的灰 度分布密度取算术平均值 aver,设 fPs _ Y[i] ( i ∈[80, 255] )为 灰 度 分 布 密 度 , fMaxIntensity 为 fPs _ Y[i] 的 最 大 值 , 当 aver < 10 并且 fMaxIntensity! = fPs _ Y[255] 时,判定图像为晚 上补光图像;否则为非晚上补光图像。
IF(特征信息)THEN(控制模式或模态) IF(控制模式或模态的条件)THEN(控制模式或输出)
3 闭环反馈机制在车牌定位中的应用
车牌定位是车牌识别(License Plate Recognition, LPR)中 的关键步骤。它的主要工作是从拍摄的汽车图像中找到车牌 所在的位置,并把车牌从该区域中准确地分割出来,供后续